行业新闻早知道,点赞关注不迷路!一不留神,大模型领域又变天了?之前谷歌内部泄露的一份文件表示,开源社区将是微软、谷歌这些AI巨头的噩梦,在开源社区面前,大模型没有护城河!虽然有些危言耸听的意味,但是开源大模型的影响力真是不容小觑。他们可以用很少的资源,就能达到闭源大模型80%甚至更高的能力,性价比极高!
作为开源大模型的“先驱者”,Meta一直致力于推动开源大模型发展。而如今,他又往大模型领域扔下了一颗重磅炸弹。近日,Meta联合微软,正式推出了开源版Llama2大模型,Meta更是表示该大模型可以直接免费商用。这让一众业内人士惊呼:大模型格局将发生巨变!Llama2开源,大模型格局巨变
自从Meta发布了自家的“羊驼”大模型之后,大模型开源社区得到了长足的发展。但是一直被称为最强开源的Llama模型,因为开源协议的存在,一直不能够免费商用。而现在Meta和微软联手,推出开源版Llama2,并宣布免费商用,这无疑让整个开源社区为之兴奋。Meta的首席AI科学家杨立昆(Yann LeCun)更是直言:大模型格局即将发生巨变。那Llama2究竟何许人也,能让整个业界都为之惊叹?根据扎克伯格在脸书上的“吹捧”,Llama 2 是 Llama 1 的升级版本,在数据质量、训练技术、能力评估、安全训练和负责任的发布方面有了显著的进步。与 GPT-3 相比,Llama 2 的基础模型更强大,并且微调后的聊天模型可以与 ChatGPT 媲美。此次发布的Llama2共三个版本,根据参数量的不同分为Llama2-7B(70亿参数)、Llama2-13B(130亿参数)和Llama2-70B(700亿参数)。另外还有一个340 亿的参数变体,但并没有发布。
相比于 Llama 1,Llama 2 的训练数据多了 40%,上下文长度也翻倍,达到了4096,并采用了分组查询注意力机制(grouped-query attention)。Llama 2 模型接受了 2 万亿个标记的训练,上下文长度是 Llama 1 的两倍。Llama-2-chat 模型还接受了超过 100 万个新的人类注释的训练。Meta还亮出了Llama 2的测试成绩。在推理、编码、熟练程度和知识测试等测试中Llama 2都优于其他开源模型(咱就是说,这有点不要脸了)。
微软背刺OpenAI,高通也来掺和
扎克伯格把Llama 2吹得再天花乱坠,没有强有力的推广和部署也是一场空。于是,他找来了竞争对手微软和大佬高通。微软在发布自家的Microsoft 365 Copilot的同时,没忘了推一波Llama 2。在新闻稿里,微软称Llama 2将部署在自家的云服务Azure上。
Azure 客户可以在 Azure 平台上更轻松、更安全地微调和部署 7B、13B 和 70B 参数的 Llama 2 模型,此外通过优化可以在 Windows 本地运行。Llama 2 模型与 Azure AI 的结合使开发人员能够利用 Azure AI 的强大工具进行模型训练、微调、推理,特别是支持 AI 安全的功能。微软表示在 Windows 中加入 Llama 2 模型,有助于推动 Windows 成为开发人员根据客户需求构建人工智能体验的最佳场所,并释放他们使用 Windows Subsystem for Linux (WSL)、Windows 终端、Microsoft Visual Studio 和 VS Code 等世界级工具进行构建的能力。而高通这边则宣布,直接让骁龙芯片在不联网的情况下,运行Llama 2的应用和服务。并计划 2024 年在骁龙芯片上开始支持基于 Llama 2 的 AI 服务。高通表示和基于云端的 LLM 相比,在设备上本地运行 Llama 2 等大型语言模型的能力具有许多优势,不仅成本更低、性能更好、不需要连接到在线服务,而且可以提供更个性化、更安全和更私密的 AI 服务。
而Meta为了给自己的大模型开源之路正名,还邀请了一众大佬发表了一篇支持声明。包括英伟达、AMD、HuggingFace、YC、GitHub、 Databricks、Shopify、Zoom等公司的企业高管,还有UC伯克利、MIT等教授,比如CMU教授、MBZUAI大学校长邢波。这么看下来,Meta已经下定决心,要在开源上一条路走到黑了。而开源的Llama 2到底能不能引起行业巨变,还有待时间检验。 ▼最新活动▲

▼精彩视频▲

