为GPT5准备?OpenAI推出爬虫GPTBot,还要告“友商”

来源:世展网 分类:AI人工智能行业资讯 2023-08-08 20:11 阅读:10610
分享:

2025年深圳国际人工智能展GAIE

2025-05-22-05-24

距离9

点击↑维科网人工智能→主页右上角→设为星标

一转眼,OpenAI推出GPT-4已经有了半年时间了。秉承着“力大飞砖”的AI顶级理解,还有财大气粗的微软做靠山,GPT-4依然是目前最强的大语言模型。尤其是在前段时间开通“代码解释器”之后,在业内看来,GPT-4已经进阶到“GPT-4.5”了。这就不由得不期待GPT-5何时到来了。虽然在GPT4发布之后,OpenAI的CEO山姆奥特曼表示,短期内不会开发GPT-5。不过从目前种种迹象表明,GPT5可能已经在公司内部开跑了。据美国专利商标局(USPTO)信息显示,OpenAI 已经在7月 18 日申请注册“GPT-5”的商标。有外界猜测,OpenAI注册该商标,可能更多是出于“占坑位”的目的,不代表一定真的有GPT5。而最近OpenAI搞出的一项新功能,让GPT-5的存在更坐实了一些。

为改进AI,OpenAI搞了个GPTBot

为了训练AI,从网络上爬取数据是现在AI公司普遍采取的方法,OpenAI也不例外。为此Reddit、X(原Twitter)等社区和网站一致反对这种“白嫖”行为,并提高了接口的收费标准。既然都已经是公开的秘密了,OpenAI也没打算再藏着掖着,索性公开推出了一项官方爬虫机器人——GPTBot,用来从网络上爬取数据,从而改进AI的能力。GPTBot会以一定的频率访问各种网站,并将网页内容保存下来。据了解,GPTBot将严格遵守任何付费墙的规则,不会抓取需要付费的信息,并且也不会收集能追踪到个人身份的数据。但该爬虫不是“无差别攻击”的,OpenAI还贴心的给了网站们自己选择的机会,主打一个自愿。OpenAI表示,网站运营者可以通过在其网站的 Robots.txt 文件中禁止 GPTBot 的访问或者通过屏蔽其IP地址,来阻止GPTBot从其网站上抓取数据。OpenAI还说,“使用 GPTBot 用户代理(user agent)抓取的网页可能会被用于改进未来的模型,并且会过滤掉那些需要付费访问、已知收集个人身份信息(PII)、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源,“允许 GPTBot 访问您的网站可以帮助 AI 模型变得更加准确,并提高它们的通用能力和安全性。”OpenAI这个时候推出官方爬虫,一方面可能是为了缓解和社区与网站之间紧张的关系,另一方面也许就是为训练GPT-4和GPT-5做准备。

GPT5有了眉目,需要5万张GPU

从OpenAI注册的GPT-5商标来看,GPT-5 将提供文本生成、自然语言理解、语音转录、翻译、分析等功能。不过 OpenAI 曾在今年 6 月初在印度经济时报主办的一场会议上表示“尚未开始训练 GPT-4 的后继者 GPT-5”,OpenAI的CEO山姆奥特曼此前表示,“在我们开始训练 GPT-5 之前,他们还有很多工作要做。我们正在研究我们认为需要的新想法,但我们肯定还没有准备好开始”。虽然掌门人没有肯定GPT-5的存在,但外界对其的猜测始终没停止过,连GPT-5需要多少GPU才能跑得动,都预测了出来。根据网上广为流传的一张图——“我们需要多少张GPU”,业界都对后续的GPT-5需要的算力进行了大致的估算。按xAI创始人,世界首富马斯克的说法,GPT-4 的训练过程可能用到了约 1 万到 2.5 万块英伟达 A100。而GPT-5可能需要 3 万到 5 万块 H100。根据摩根士丹利的估计,GPT-5 大概需要使用 2.5 万个 GPU。而最近的一篇博文透露,OpenAI预计需要约 5 万块 H100 GPU,可能就是为GPT-5准备的。也正是这样,全球的GPU供应陷入巨大短缺。用马斯克的话来说就是,是人是狗,都在抢GPU。山姆奥特曼也表示,OpenAI现在很缺GPU,很多此前计划的进程要“跳票”,希望人们少用点ChatGPT,省点GPU资源。

对“友商”重拳出击

一边忙着搞爬虫,一边为GPU哭穷,另一边又对友商重拳出击,OpenAI一刻也不想停下来。OpenAI名称在外,自然少不了想借着它的名头“碰瓷”的。放在以前,他们可能觉得无所谓,相反这样还能提升自己的知名度。但眼看着这种“碰瓷”越来越多,也为了后续GPT-5能顺利推出,不受外界舆论阻碍,OpenAI不打算装傻了。据彭博社消息,OpenAI 对一家名为 Open Artificial Intelligence(开放人工智能)且拥有域名 www.open.ai 的公司提起诉讼,声称该名称侵犯了 OpenAI 商标,并造成消费者混淆该诉讼称,由总裁 Guy Ravine 领导的开放人工智能公司一直在误导客户,让他们相信自己与 OpenAI 及其流行产品(如 ChatGPT)有关联。开放人工智能公司在 2015 年开始运营后,采用了“Open Artificial Intelligence”的名称。“这种深思熟虑的选择破坏了 OpenAI 在美国专利商标局注册商标的努力。”报道称,该诉讼旨在结束开放人工智能公司未经授权使用“开放人工智能”名称的行为,并寻求适当的法律补救措施。不管如何,对GPT-5的期待还是超越了其他,都在等着看它能不能再次改变世界。

 最新活动

推荐阅读 富士康一季度净利下滑56% 称电动汽车未来多数会走向专业代工反向操作!小米竟宣布不做AI大模型了?阿里云:十年之期已到,创始人回归

云从“国家队”谎言戳破,寄望“从容大模型”救市

马化腾:腾讯不出AI半成品,有些人太急了

传三星电子开发XR芯片,剑指高通

大瓜!涉嫌重婚罪!腾讯前副总裁被拘

寒武纪裁员:软件研发部门为重灾区

戳“阅读原文报名OFweek 2023(第八届)人工智能产业大会

相关AI人工智能行业展会

2026年深圳国际元宇宙及电竞娱乐展MES

2026-03-01~03-03 距离292
64171展会热度 评论(0)

2025年深圳国际人工智能展GAIE

2025-05-22~05-24 距离9
64192展会热度 评论(0)

2025年上海世界人工智能大会WAIC

2025-07-05~07-07 距离53
107333展会热度 评论(0)

2025年郑州世界数字产业博览会WDIE

2025-03-21~03-23 展会结束
52806展会热度 评论(0)

2025年北京全球数字经济大会Global Digital Economy Conference

2025-07-01~07-01 距离49
50097展会热度 评论(0)

2024年苏州人工智能展AIExpo

2024-12-10~12-11 展会结束
76710展会热度 评论(0)
X
客服
电话
13924230066

服务热线

扫一扫

世展网公众号

微信小程序

销售客服

门票客服

TOP
X