2023重庆论坛丨百度王博:大模型让智能座舱更智能

日期:2023-06-09 11:16:40

来源:中国汽车趋势网

6月8日,由中国国际贸易促进委员会汽车行业委员会和重庆国际汽车展览会组委会联合主办的“2023中国汽车重庆论坛”,在重庆悦来国际会议中心隆重召开。在6月9日上午,来自百度智能汽车业务的王博出席了以【人工智能带给行业的基于和挑战】为主题的分论坛,并发表了主题演讲。以下为演讲实录:

大家早上好,我是来自百度智能汽车业务的王博,接下来由我跟大家分享一下百度Apollo智能座舱基于大模型的产品和技术探索。这一块主要是我们针对在产品思考上以及在技术思考上的一些实践经验,跟大家做一些分享。

首先我们回顾一下语音交互的发展历程。其实早在10多年前语音就作为智能座舱的一个交互方式首先出现了,但是当时的语音主要是一个智能摇控器,它并不是特别的好用,因为基本上它是一个非常城市化,而且只支持限定语音的摇控器。随着机器学习深入突破,尤其在2018年以后一直到现在我们在各个场景、各个领域、整个座舱上、整个交互方式越来越流畅、越来越顺畅。但是我们会发现它基本上是基于指令式的交互。随着大模型技术的出现,这个语音交付会越来越面向对话式的交付,从命令式到对话式是大模型给语音交互带来的一个变化。

站在当前我们处在一个从上一代的语音交付到下一代真正基于大模型、基于对话式语音交付的一个过渡阶段,在这个时间我们看现在的产品,其实已经处于一个不错的用户体验的状态。首先不管是在座舱的任何一个位置,不管是在座舱任何一个时间点,都可以实现通过语音实现交互,同时整体速度非常流畅,已经达到800毫秒以内,同时我们的全面性,在整个座舱,无论是目之所及的地方都可以都可以由一个语音交互。同时在智能化方面做了探索,虽然大模型在持续探索过程中,但是已经可以给用户带来一个更有体感而且更智慧的交互方式,并且可以成为一个很好的语音助理。

下一代语音模型的发展方向,我们认为一定是从交互式变成一个对话式,在这个过程中发现两个核心的变化点:一是产品体现上之前命令式的交互方式逐渐变成一个对话式的交互方式,意味着我们可以更好的理解用户的意图、更好为他们提供服务,同时在技术上也会出现一个很核心的变化,因为当前语音交互的方式更多是通过一系列人工定义的方式实现对语音的理解、实现对意图的解析,随着大模型的出现,将端到端的解决问题,意味着所有用户的需求都可以被更好的理解,并且可以更好通过一系列科技上的交互方式给予磨损。我们认为现在已经到了通过大模型来提升语音智舱语音交互的一个拐点。这些整体革命的完成,我们认为是需要有深厚的技术积累。百度在整个AI上有长时间很好的基础,首先在基础层有自己的芯片,在框架层有一套架构,同时有基于文心的大模型。在这个上我们又有一系列的行业应用,我们认为大模型将给我们的语音带来三个革命性的进步。第一有非常好的理解能力。原来我们只能设定一系列的用户场景跟用户命令,接下来我们是可以通过大模型来做更好语音理解,在这个基础上还会有一个很好的推理能力,理解之后拥有很好的推理能力,可以很精准实现用户的意图,并且通过大模型带来的创造力帮助用户完成它的诉求,这样一个全能的语音助理就会出现了,它不同于我们现在的语音助理,可以在不同的场景下变成不同的角色,帮助我们完成比如出行导航问题,比如说旅游时导游的问题,比如还可以作为我们的生活助理帮我们安排行程,解决我们一系列的问题。

接下来给大家演示一下我们这一块小度车载智慧增强包的视频,让大家更有体感。

(视频播放)

其实我们认为大模型可以重塑两个关系。第一个关系是驾驶员跟座舱的关系。大模型可以帮助智能座舱给用户提供一个拟人的服务。一方面它可以有一系列通过对话式精准理解驾驶员的诉求,帮助驾驶员完成力所能及的一些工作,同时他可以在堵车的时候,类似这种场景下作为一个情绪疏导员,这种场景我们认为有非常多的畅想空间,并且我们现在已经在实验室完成了一系列的验证,已经具备了量产的能力。同时我们品牌和车主之间的关系也有可能基于大模型进行重塑。因为据统计,中国有4.6亿的驾驶员,车企是不可能为这么多人提供非常千人千面服务的,我们的大模型可以解决这个问题,可以拉进车企和用户之间的关系,并且及时了解他们的诉求、满足他们的服务。这一块通过我们的Promise大模型加上专员来实现的。畅想未来,我们认为大模型一定真正让我们的座舱变得智能,谢谢大家!

热门文章

关注一下,了解更多活动内容

微信公众号

总编微博