分享: |
点击蓝字,关注我们
随着ChatGPT横空出世,生成式预训练大模型(Generative Pre-trained Transformer Model)迅速进入公众视野,持续引发各垂直领域大模型的开发热潮。在自动驾驶领域,大模型的自回归、基于提示词及上下文的技术特征和人类司机驾驶车辆的观测决策行为模式非常相近,具备迁移到自动驾驶领域的天然优势,为完全自动驾驶的研发和量产应用带来新的思路。
为应对人工智能的快速变革,深度探讨人工智能大模型给高级别自动驾驶带来的机遇与挑战,中国汽车工程学会于2023年7月11日下午举办了第六期“汽车科技评论”高端闭门研讨会,围绕“AI大模型应用于自动驾驶的潜力与路径”主题,特别邀请行业高端专家演讲,定向邀请整车企业、自动驾驶相关企业和科研机构的研发团队负责人参与闭门研讨。
研讨会重点从自动驾驶大模型的需求与变革、关键技术挑战两大维度的6个子议题展开深度研讨。
研讨会由中国汽车工程学会副秘书长侯福深开场致辞,并邀请小鹏汽车科技有限公司自动驾驶中心副总经理马君作为会议主席主持随后的专题演讲和议题研讨环节,上海人工智能实验室青年科学家李弘扬、地平线算法平台总架构师穆黎森依次发表主题演讲。
马君
演讲嘉宾李弘扬
穆黎森
此外,一汽集团、东风汽车、长安汽车、上汽集团、广汽集团、北汽集团、长城汽车、吉利汽车、奇瑞新能源、大众中国、日产中国、斯堪尼亚中国等整车企业,地平线、黑芝麻、超星未来、毫末智行、商汤科技、中汽创智、电装中国等自动驾驶相关企业,中国科学院软件研究所、复旦大学、北京航空航天大学、同济大学、天津大学、北京科技大学、华东师范大学等高校及科研机构的相关专家分享了各自在自动驾驶大模型领域的创新与探索,并与参会嘉宾交流了针对研讨议题的看法。
1. “智能涌现”主要来自于海量数据的自回归预训练,自动驾驶大模型的“智能涌现”与文本类大模型结合优化是探索方向。未来随着大模型在图像、雷达等多模态的应用,可能为自动驾驶提供“跃进式”技术路线,从模块化部署走向端到端感知决策一体化。
2. 模块化路线与端到端路线优劣势互补,模块化路线的稳定性、安全性、可解释性更好;端到端的优势则在于潜在性能效果更佳,迭代优化效率更高,可减少中间环节的标注成本。这两种技术路线当前同时在探索,两者可以相互结合,完全端到端或是最终方向。
3. 针对大模型的可解释性差、调整难度大等问题,可通过加强人类反馈学习等方式提升模型的理解能力和性能表现。在实际应用中,建议在自动驾驶的决控和执行方面加强安全冗余设计,如在决策中加入规则模型、建立信息反馈机制等,增强模型的可解释性。
4. 自动驾驶大模型的车端搭载需要软件端和硬件端的协同发力。一方面,调教好的大模型需要通过蒸馏、剪枝、量化等模型压缩手段来降低模型体量;另一方面,车端硬件单元也需要基于Transformer来构建,通过算子融合等手段使得计算密度更高。
5. 大模型训练数据要同时注重"海量"和"有效",一方面需要车端/路端的驾驶数据积累,越多越好;另一方面也需要不断加强对未知/长尾场景的覆盖率,仿真数据将在生成长尾场景数据等方面发挥作用。行业可协同建立数据平台,共同推进模型开发基础支撑能力建设。
6. 训练ChatGPT千亿参数的大模型需要3.5万卡·天的算力,由于图像/点云的信息密度比文本更低,迭代要求更高,自动驾驶大模型训练所需的算力预计会更大。企业可综合考虑数据安全、投资成本、采购能力等问题,选择自建超算中心或与已有的智算中心合作。
以上内容根据现场嘉宾观点整理,不代表最终观点,中汽学会研究团队将尽快形成本次研讨会的最终研究报告,欢迎订阅!
联系人:
陈敏
电话:13810027168(同微信)
邮箱:chenmin@sae-china.org
版权及免责声明:
1、如需转载或摘取,请在文章开头或结尾位置注明:内容来源自【节能与新能源汽车技术路线图】公众号。
2、本报告中的信息均来源于我们认为可靠的已公开资料,但国汽战略院对这些信息的准确性及完整性不作任何保证。本报告所载的建议及预测仅为本报告出具日的观点和判断。在不同时期,国汽战略院可能会发出与本报告所载建议及预测不一致的研究报告。
3、本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,我们将根据您提供的证明材料确认版权并按国家标准支付稿酬或立即删除内容!
联系电话:18513410660
![]() |
![]() |
![]() |
![]() |
世展网公众号 |
微信小程序 |
销售客服 |
门票客服 |