2024电动车百人会丨长城吴会肖:AI时代要积极地去拥抱AI,拥抱大模型

日期:2024-03-17 20:56:08

来源:2024电动车百人会

2024年3月15日,中国电动汽车百人会论坛(2024)在京开幕。围绕“巩固和扩大新能源汽车发展优势”这一核心议题,中国电动汽车百人会论坛(2024)将举办1场高层论坛、1场国际论坛、2场闭门会议、10场主题论坛,全面强化高端前瞻、全球视野、跨界融合的论坛特色。其中,在3月17日下午举办的“智能汽车生态论坛”上,长城汽车产品智能化副总裁吴会肖出席并发表演讲。以下内容为现场演讲实录:

尊敬的各位领导、各位专家、各位朋友,大家下午好!我是来自长城汽车的吴会肖。

回顾中国汽车工业百余年的历史,作为人类工业皇冠上的明珠,汽车一直是各个时代先进技术的集大成者。大工业时代汽车行业主要集中在发动机、变速箱、底盘、车身、流水线生产等结构化的设计和制造领域。20世纪50年代后汽车进入电气化时代,收音机、导航、ABS、EPS、GPS等电子系统开始上车快速发展。2000年后,智能驾驶、智能座舱、网联化、信息化技术快速发展,汽车逐步进入智能化时代。

2023年,AI大模型横空出世并以惊人的速度快速演化,让我们看到智能汽车是否到了新的拐点?智能电动车的上半场是新能源,下半场是智能化。在智能化的领域又有什么新的拐点?我们看到,实际上AI大幕已然拉开,风起于青萍之末,浪成于微澜之间,AI大模型已然成为一股飓风巨浪,我们汽车行业是否正面临从软件定义汽车到AI定义汽车这样一个巨大的拐点。

今天上午新质生产力论坛上,麦肯锡的专家谈到,汽车行业不是对创新非常友好的一个行业,实际上由于汽车产业确实在产业链上极其复杂和丰富,在转型过程中面临非常多的挑战。但是我相信汽车行业人员实际上对于前沿的技术有非常敏锐的触觉,有非常大的推动力度和决心。汽车行业的工作人员应该积极去拥抱这轮变化,为自己正名。

AI定义汽车的时代,长城汽车做了哪些探索和思考,又做了哪些准备,取得哪些进展? 

首先,AI定义汽车。在AI定义汽车的新时代下,长城汽车基于自身前期的积累,快速在智慧行驶、智慧空间方面进行了转型布局。AI领域不得不谈智能驾驶,我们围绕数据驱动全面构建了智能驾驶的研发体系,核心三要素数据、算法、算力三方面全部布局。数据方面已经全面建立了完整的数据闭环体系,在算法方面发布了千亿级别的智能驾驶大模型Drive GPT。在算力层面,长城汽车建立了自己的智算中心,算力规模达到了1.6 EFLOPS,跻身到亿级的算力梯队。本着用国内外最好资源为用户造好车的理念,长城汽车发挥整车集成的作用,和行业里面优秀的软硬件供应商共同合作,着力打造我们的产品。

上周日一段在古城保定行驶的城市NOA视频在网上流传,它可以在保定独有的复杂六道口顺畅地通过,可以在高架桥、闹市街区、乡村小路自由地穿梭。现在我们正在抓紧时间,为我们达成有路就能开、去哪儿都好开的城市NOA产品交付做最终的强化测试和优化。在这儿我也欢迎各位专家到我们公司来做体验,现在即使市面上已经有了一些不错的城市NOA产品,比如在美国开通,在中国还没有开通的特斯拉,比如在面向核心种子用户打开城市NOA的问界车型,以及在众多的城市部分路段开启的小鹏车型,即使有这些非常不错的智驾产品,但是我相信我们长城汽车的NOA方案依然会让各位感到惊艳。

好饭不怕晚,拜托大家再多给我们一点时间,毕竟城市NOA的开城,安全始终是底线,我们一定要坚守这个底线。我们的目标是让长城的城市NOA像坦克300去越野一样,用过的人都说好,想买的人都能买得起。从技术上遥遥领先,到用户的口口相传,我们也共同期待中国城市的NOA市场能够热闹起来。

我们当前在实际的产品开发上的一些进展,今天的课题是AI应用,谈到AI大模型和智能驾驶的结合,我们也从底层逻辑上去思考大模型对于智能驾驶的影响。如何去布局下一代智能驾驶的技术?以往的智能驾驶理念是教机器怎么开车,一般情况下我们都是把复杂的驾驶任务拆解成感知、规划、预测、决策、执行等机器可以理解的单一任务。我们在这个基础上做了大量的探索和迭代升级,才有了今天的transformer + BEV,有了3D占用网络,有了时序的持续预测,有了算法的端到端算法架构。大模型爆发之后,是不是可以另外一个维度上理解这件事情?如果已经有了对世界知识有完整认知的通用大模型,这种情况下怎么去做我们的智能驾驶,这就好像去教一个不会开车的成年人去开车,这个成年人实际上知道所有的交通规则,知道行人、三轮车、自行车、行人,知道什么情况下会有危险,知道什么情况下要刹车,我们只需教会他如何操控车辆,随着驾驶经验的积累,开车技术就会越来越好。未来情况下是不是这样一个基于大模型的智能驾驶算法路径?现在还在学术paper的阶段,我们有理由相信,这是我们未来研发的方向。

在智慧空间模块,主要在空间感知、空间认知和生成式交互三方面做了一些探索。在空间的感知领域,我们自研了多模态的空间感知算法,可以把基于单一场景、单一模态的单一感知任务升级为基于视觉、语音、按键等多种输入相结合的多模态感知,把独立的视觉组件、语音组件升级为基于连续时空信息的智能空间感知,当我们做DMS策略的时候,就可以基于驾驶员更多表情和动作,再加上车辆是不是在稳定驾驶的状态综合判断一个人的疲劳程度,而不仅仅基于他的眼睑开合度,当一个人眼睛特别小的时候,到了车上要么车一直报警,要不然空调猛吹冷风。基于更加多模态的算法来决定我们到底是应该调大音量,增加座椅按摩,调低空调,还是应该提醒休息一下,有不同程度的策略,让驾驶更加安全和舒适。有了多模态,我们坐在后排左侧位置的成员可以指着比较远的玻璃“关闭那个车窗”,而不是“请帮我关闭右排的车窗”,或者麻烦主驾驶员来操作。当小朋友想唤醒语音助手看动画片的时候,这时候视频的源头就会自动切换到适合儿童观看的视频,让交互更加便捷、自然和人性化。这是空间感知领域。

在空间的认知领域,我们还是急于用车的场景,基于座舱的应用,基于用户交互行为的预测和推荐类的算法,升级为利用大模型通用+专识认证能力的应用。

在空间交互方面,我们结合大模型对语音架构进行了升级,实现了智能语音从指令式对话向自然对话的转变。结合大模型文生文能力、文生图能力,RAG检索能力,构建出AI助手、AI懂车专家等等。

以上种种有趣的实践,让我们从整体逻辑上做思考,除了自动驾驶是大体量的AI开发活动,座舱也是,甚至AI大模型对于汽车的直接影响就是智能座舱的体验提升,这个基本上已经形成行业共识。大模型对智能座舱带来什么影响?概括来说,包含多模态的空间感知能力,基于AI大模型的认知能力,以及基于应用场景的智能推荐和基于用户习惯的智能学习。我们做了更多的思考,AI如何像人一样驾驶,如何像人一样构建驾乘空间,如何像人一样对话交互,从驾驶到座舱再到整车的智能,实际AI都发挥了它的巨大作用。

下面一部分介绍长城汽车在企业内部业务运营层面的AI探索。大模型出现以后,对我们业务流程最直接的改变就是生产范式的改变。长城汽车在对生产范式影响最大的代码和图形的领域进行了应用探索,在研发效能提升方面,我们引入了大模型,已经可以实现了代码的生成、代码的补全、代码的注释以及部分生成单元测试功能。在图形设计的领域,自研开发了图文大模型,实现文生图、图生图、语义生图功能,通过语音大模型技术,在少量数据和算力投入的情况下就可以提升我们内部开发人员设计人员的工作效率。实际上相比于AI在产品层面所发挥的作用,我们长城汽车更加看中AI作为生产工具在企业里面所能发挥的作用。

在内部的企业支持和数据层面,汽车的开发是非常复杂的过程,我们通过大模型的能力,实现了面向工程师和设计师的AI知识问答和AI智能数据标注,以我们企业的知识问答为例,长城汽车建立了面向研发领域的向量数据库,完成了多项任务的知识问答工具的研发。在RAG检索增强领域,基于自研的垂域的大模型Embedding大模型,搭建形成通用化的技术架构,在智能客服、标注查询、用户手册、智能诊断等多个领域进行了业务实践。在公司内部组织了一系列活动和竞赛,提升全体员工在AI创新方面的意识,比如AI壁纸大赛、AI编程大赛、AI黑客松等等,通过这些活动让我们的企业和员工共同意识到,其实大模型不是要取代人,大模型是让每个人的工作都更加简单、更加高效、更有精力、更有乐趣、更有价值,个人和企业不会被大模型淘汰,但是会被用大模型的人和企业赶超。作为一家企业,在这样一个AI时代要积极地去拥抱AI,拥抱大模型。

最后再总结一下,在AI时代长城汽车是怎么看待自己的?首先从发展方向上,底层的技术和上层应用一定要并重,一方面加大投入,深耕底层技术,掌握AI的核心技术,与此同时,在AI的上层应用方面门槛一定会越来越低,越来越人性化,越来越简单。基于AI的思路,全面审视,在AI全新大模型的范式下,作为一个AI企业如何去思考?对于我们企业的人员结构、组织架构会有很多新的挑战。在合作生态上,一定要积极拥抱开源共建的模式,一定拥抱Model as a Service生态创新的模式。

我们当前处在智能汽车时代的新拐点,我们把它看成是一个新拐点,看成是一个新的挑战。一花独放不是春,百花齐放春满园。在早春北京,我们共同期待汽车行业百舸争流,精彩纷呈,走向世界,改变世界,让我们人类的出行更加美好。

谢谢大家!

热门文章

关注一下,了解更多精彩内容

微信公众号

总编微博