点击↑维科网人工智能→主页右上角→设为星标
一转眼,OpenAI推出GPT-4已经有了半年时间了。秉承着“力大飞砖”的AI顶级理解,还有财大气粗的微软做靠山,GPT-4依然是目前最强的大语言模型。尤其是在前段时间开通“代码解释器”之后,在业内看来,GPT-4已经进阶到“GPT-4.5”了。这就不由得不期待GPT-5何时到来了。虽然在GPT4发布之后,OpenAI的CEO山姆奥特曼表示,短期内不会开发GPT-5。不过从目前种种迹象表明,GPT5可能已经在公司内部开跑了。据美国专利商标局(USPTO)信息显示,OpenAI 已经在7月 18 日申请注册“GPT-5”的商标。有外界猜测,OpenAI注册该商标,可能更多是出于“占坑位”的目的,不代表一定真的有GPT5。而最近OpenAI搞出的一项新功能,让GPT-5的存在更坐实了一些。为改进AI,OpenAI搞了个GPTBot
为了训练AI,从网络上爬取数据是现在AI公司普遍采取的方法,OpenAI也不例外。为此Reddit、X(原Twitter)等社区和网站一致反对这种“白嫖”行为,并提高了接口的收费标准。既然都已经是公开的秘密了,OpenAI也没打算再藏着掖着,索性公开推出了一项官方爬虫机器人——GPTBot,用来从网络上爬取数据,从而改进AI的能力。GPTBot会以一定的频率访问各种网站,并将网页内容保存下来。
据了解,GPTBot将严格遵守任何付费墙的规则,不会抓取需要付费的信息,并且也不会收集能追踪到个人身份的数据。但该爬虫不是“无差别攻击”的,OpenAI还贴心的给了网站们自己选择的机会,主打一个自愿。OpenAI表示,网站运营者可以通过在其网站的 Robots.txt 文件中禁止 GPTBot 的访问或者通过屏蔽其IP地址,来阻止GPTBot从其网站上抓取数据。OpenAI还说,“使用 GPTBot 用户代理(user agent)抓取的网页可能会被用于改进未来的模型,并且会过滤掉那些需要付费访问、已知收集个人身份信息(PII)、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源,“允许 GPTBot 访问您的网站可以帮助 AI 模型变得更加准确,并提高它们的通用能力和安全性。”OpenAI这个时候推出官方爬虫,一方面可能是为了缓解和社区与网站之间紧张的关系,另一方面也许就是为训练GPT-4和GPT-5做准备。GPT5有了眉目,需要5万张GPU
从OpenAI注册的GPT-5商标来看,GPT-5 将提供文本生成、自然语言理解、语音转录、翻译、分析等功能。
不过 OpenAI 曾在今年 6 月初在印度经济时报主办的一场会议上表示“尚未开始训练 GPT-4 的后继者 GPT-5”,OpenAI的CEO山姆奥特曼此前表示,“在我们开始训练 GPT-5 之前,他们还有很多工作要做。我们正在研究我们认为需要的新想法,但我们肯定还没有准备好开始”。虽然掌门人没有肯定GPT-5的存在,但外界对其的猜测始终没停止过,连GPT-5需要多少GPU才能跑得动,都预测了出来。根据网上广为流传的一张图——“我们需要多少张GPU”,业界都对后续的GPT-5需要的算力进行了大致的估算。
按xAI创始人,世界首富马斯克的说法,GPT-4 的训练过程可能用到了约 1 万到 2.5 万块英伟达 A100。而GPT-5可能需要 3 万到 5 万块 H100。根据摩根士丹利的估计,GPT-5 大概需要使用 2.5 万个 GPU。而最近的一篇博文透露,OpenAI预计需要约 5 万块 H100 GPU,可能就是为GPT-5准备的。也正是这样,全球的GPU供应陷入巨大短缺。用马斯克的话来说就是,是人是狗,都在抢GPU。山姆奥特曼也表示,OpenAI现在很缺GPU,很多此前计划的进程要“跳票”,希望人们少用点ChatGPT,省点GPU资源。对“友商”重拳出击
一边忙着搞爬虫,一边为GPU哭穷,另一边又对友商重拳出击,OpenAI一刻也不想停下来。OpenAI名称在外,自然少不了想借着它的名头“碰瓷”的。放在以前,他们可能觉得无所谓,相反这样还能提升自己的知名度。但眼看着这种“碰瓷”越来越多,也为了后续GPT-5能顺利推出,不受外界舆论阻碍,OpenAI不打算装傻了。据彭博社消息,OpenAI 对一家名为 Open Artificial Intelligence(开放人工智能)且拥有域名 www.open.ai 的公司提起诉讼,声称该名称侵犯了 OpenAI 商标,并造成消费者混淆。该诉讼称,由总裁 Guy Ravine 领导的开放人工智能公司一直在误导客户,让他们相信自己与 OpenAI 及其流行产品(如 ChatGPT)有关联。开放人工智能公司在 2015 年开始运营后,采用了“Open Artificial Intelligence”的名称。“这种深思熟虑的选择破坏了 OpenAI 在美国专利商标局注册商标的努力。”报道称,该诉讼旨在结束开放人工智能公司未经授权使用“开放人工智能”名称的行为,并寻求适当的法律补救措施。不管如何,对GPT-5的期待还是超越了其他,都在等着看它能不能再次改变世界。 ▲最新活动▼

▲推荐阅读 ▼富士康一季度净利下滑56% 称电动汽车未来多数会走向专业代工反向操作!小米竟宣布不做AI大模型了?阿里云:十年之期已到,创始人回归马化腾:腾讯不出AI半成品,有些人太急了
传三星电子开发XR芯片,剑指高通
寒武纪裁员:软件研发部门为重灾区


戳“阅读原文”报名OFweek 2023(第八届)人工智能产业大会