分享: |
为什么AI的起点是语言模型
图像处理成就了之前的AI四小龙企业,但语言反而才是信息时代走向智能时代的敲门砖。承载世界的知识、思考、沟通和文化靠的也是语言。一个原始部落可能只有800个单词进行简单的沟通,那么它的文明一定不强,因为词汇本身的发明代表着世界认知的维度,词汇之间建立的逻辑关系和表达代表了我们对世界完整的建模。这个模型不是在图像里面,而是通过语言进行承载,语言边界即世界边界,语言是知识文化的载体,词的模型就是世界的模型。
今天的语言模型已经做得非常好了,就算不是100分也是99分。生命建模到现在进展还很少,基因到蛋白质的结构建模,但人体内不是只有一个基因,而是两万三千个基因,中间都有相互的作用,二万三千个基因只代表DNA核糖核苷酸的5%,95%的调控网络没有办法理解其交互的作用。即便把基因变成蛋白质被预测到,蛋白质作为PET3怎样构建身体,使人变得更加健康,其中还有很多未知的事情。
现阶段的共识主要分三个领域:
1.生产力方面,指给企业本身赋能,调用的时候能使知识的推理速度洞悉更多。
2.智能助理这个领域,不再是简单工具调用,更像是伙伴。未来智能助理的身份可能是私人医生、私人律师、搜索助手、购物达人,以人的身份帮助我们,像L1、L2、L3的无人驾驶,现在是CoPilot辅助决策,未来是智能助理时代。
3.没有大模型的支持,元宇宙是做不起来的,Word Model is World Model(词的模型是世界的模型),不仅是文生图、文生视频,甚至能够做到世界的驱动引擎,以游戏行业为代表首先会带来新的颠覆。
AGI下什么职业会被取代简单来讲,坐在电脑前的工作大概率都会被取代,电脑面前坐的时间越长,这个工作就会变得越危险。例如平面设计,现在仅需输入几行指令就能够做到,要是出去采风、采点等跟别人交流的工作就会好很多。程序员也是自己的掘墓人,如果只会坐在电脑面前写代码,回头自己就会取代。
智能时代有一个词叫“端到端”,原来分得很细的工种现在被一个模型彻头彻尾取代。技术行业如到公司内部很多事情也是这样,游戏公司有人负责策划,有人负责美工,有人负责产品,最后很容易变成一个人把一个团队的事情干了。一个人就是一个公司,端到端的分工相对减弱,变得更加扁平,有些率先应用OpenAI技术的公司里面已经开始出现很多裁员。今天的大模型不是工具,而是人类的伙伴。因为工具是做连接、做信息的,而这次已经有完整的语言能力,极好的对语言的沟通能力,能够在中间通过部分学习经验,经过产品化以后可以提供服务。
理想上慢一步,落地上快三步
发布第一款模型时,王小川总结过“在理想上慢美国半步,落地上却快美国三步”。跟OpenAI的人沟通时得知,他们在做GPT-3时需要4千张卡做训练,做GPT-4时需要2万张卡做训练,现在是把1000万颗GPU连在一起训练新的模型——这是在以巨大的规模做设计。
作为全球最大的GPU生产公司,英伟达不计成本地一年生产GPU100万颗,设计1000万颗的连接,然而这在中国是不现实的。我们要考虑投入的现实产出是什么。这样的好处是现在中国落地能力更强,美国工程师推动时,他们对应用导向、产品导向理解得不多,比如对比微信也好、淘宝也好,他们这么好用的软件放在中国其实要弱很多。
我们现在缺少的一些模型技术与美国还有距离。我们应用能力很好,但是模型能力要差一些,模型赶上以后在应用上就会有一个快速的反超。搜索和模型的关系是技术上的问题,我们会给大家提供开源的产品,美国OpenAI今年年初提供了API调用,让大家都很震撼。但更颠覆性的是美国今年Meta做的一个开源项目叫做Llama 2,使得很多企业不用调用昂贵的API,单用一个模型就把自己公司的数据做得更好,形成开源闭源的两个体系改变竞争格局。
我们将于4月10日宣布入场,6月发布第一款7B参数的开源模型,得到业界最顶尖水平的肯定,英文上能跟Llama对标,中文上达到更好的水平。同时,还能在公司里面自己做相应的部署,在不久的Q3、Q4,我们将做智能助理。7月,我们发布了13B参数,达到最好的效果,作为科技强国献礼。8月8日,我们发布53B的模型,尺寸相对比较大,部署起来比较困难,因此我们就没有走开源,而是走了闭源。我们用三个月,发布了三款模型产品,从而推动中国开源模型的进展。
▼精彩视频▲
戳“阅读原文”报名OFweek 2023(第八届)物联网产业大会
电话:13248139830(门票)
![]() |
![]() |
![]() |
![]() |
世展网公众号 |
微信小程序 |
销售客服 |
门票客服 |