天天快看点丨语音交互 + 大模型,更拟人的车机交互何时出现?
2023-06-29 20:20:53 来源: ZAKER科技

在 FF 91 2.0 的发布会上,我们看到了这样一段语音交互。

" 帮我在 Malibu 找一家有户外座位且评价至少 4 星的意大利餐厅,不要披萨店。"这段语音中包含了 5 个具体的指令和明确的筛选项,且没有唤醒词,系统随后也给出了对应选项。

不论真假,出于好奇,AutoLab 在发布会第二天,以相同的条件随机测试部分造车新势力车型的语音交互能力,结果均未能完成。

除此之外,视频的重点在于指令更加符合人与人之间的交流逻辑,这也意味着它足够拟人。而实现这套拟人化语音助手背后的推手,就是赛轮思。


(资料图)

行业数据显示,2022 年中国国内车载语音市场集中度相当之高,仅赛轮思和科大讯飞两家,占比已经超过 70%。科大讯飞大家都很熟悉了,在国内合作的主机厂也很多。

而另外一家赛轮思,想必绝大部分观众都未曾听说,其实苹果的 "Siri" 就是由赛轮思和苹果共同开发的产品。除此之外,赛轮思的服务对象除了国内外的主机厂商和 Tier 1 之外,还包含了像英伟达,苹果这类的科技巨头。

如何看待语音交互未来发展方向,赛轮思又如何应对接下来行业挑战。AutoLab 借赛轮思首席执行官 Stefan Ortmanns 博士这次来中国,在采访中得到了一些答案。

当前语音交互最大的应用场景是基于用户给出的需求,系统做出对应的指令。也就是一问一答,通过还要伴随着固定的唤醒词汇。此前,在理想家庭科技日上,我们看到了大模型运用在语音交互端的实力,可以出口成章,制定旅行计划,更清晰的理解词义。

但随着我们看到大模型的泛化能力和 AI 技术的不断提升,用户对于语音交互的要求也会更高。除了更拟人的交流方式,用户更希望语音助手可以知道自己想要做什么,了解周围发生的情况后,进行智能主动的推荐。

比如说电量不足时,会自动提醒附近的充电站,给出导航指引。又或者接电话时,主动关闭车窗,降低音量等。

通俗而言,就是系统知道你想要做什么,明白你需要什么,而且还没等你问就告诉你要什么,也就是从被动到主动的过程。当然,更简单的词汇就是 " 心有灵犀一点通 "。

赛轮思针对这样的场景需求,推出 Cerence Proactive AI(PAI) 智能主动推荐功能,语音助理可以按场景主动向驾驶者进行智能推荐 / 提醒和主动通知,包括驾驶安全、路线规划、情感交互和生活便利等等。

这些与出行相关的信息,将对优化出行体验起到关键作用。例如,在不安全驾驶情况发生前提醒用户:更改驾驶模式、疲劳预警或预报极端天气,这些均有助于提升驾驶安全,并实现更加先进的语音座舱体验。

当然,这里要指出,并不是所有人都会接受这样的语音交互方式,也会有不少伙伴会觉得聒噪。比如针对导航播报,大部分车型都可以实现详细播报或简洁播报的形式,甚至直接关闭语音提醒。

同理,Cerence Proactive AI(PAI)基于语言大模型的实力,可以学习并识别用户的个人偏好,习惯及反映,并且结合数据反馈,从而让你的语音助手处在你的舒适区内。

具有主动服务能力的语音助手,是 Cerence Co-Pilot AI 虚拟副驾驶解决方案的核心功能。

有了主动式的交流方式,自然也不需要固定的唤醒词汇,尤其是在车内多人的情况下。每人一句 "Hey,XX" 难免显得过于笨拙。针对这一点,赛轮思推出了 Cerence Just Talk,它会识别你所说的话,并且是明确的指令或问题时,才会给到回应。

同时根据用户说话的方式以及关连对话的上下文,知道何时被召唤,从而提供一个更直观的、像真人般的交互体验。

举个例子,你可以直接说导航到东方明珠,我要去 XX 饭店,系统接收到明确指令后,就可以执行相应任务。

这一点当前不少车机都能做到,如蔚来,问界,哪吒等车型,均可以实现无唤醒词。但 Just Talk 更进一步,还能让唤醒词在语音指令不同的位置中,也能得到识别。

现阶段假设我们命名车机名称为 " 老默 ",通常有效的指令是,你好老默,我想吃鱼了。但调整顺序或者改变唤醒词,比如 " 我想吃鱼,老默。" 系统都很难回应识别。但在 Just Talk 当中,你可以说:

" 老默,我想吃鱼了。" 或者是 " 我想吃鱼了,老默。"

系统都可以给出相应指令。而这个功能,很快我们就能在奔驰的全新 E 级上搭载的 MBUX 车机系统上,得到体验。届时,AutoLab 也会持续关注,给大家汇报下实机体验。

除此之外,在采访当中,我们还看到了赛轮思在不同出行领域的语音交互方案。

比如针对两轮车户外出行的语音识别需求,要克服噪音,识别正确的声源;在不方便开窗的前提下,实现和车外人的语音交流;甚至根据用户情绪的变化,优先推荐更快捷的路径指引等等。

Stefan Ortmanns 博士还特意举例,以 Cerence Co-Pilot 为例,在现有成熟平台的前提下,赛轮思的中国团队只需要不到一周的时间就可以实现最终 SOP。即使是从未合作的平台,最快六个月即可实现。欧洲技术配合中国速度,做到及时响应。

总结

新能源市场竞争进入了下半场的智能化挑战,一个好用的,聪明的,拟人的车机交互绝对是用户体验的重点,也更容易被感知到。赛轮思和它的合作伙伴们,还能在语音交互上给我们带来哪些更打动人的细节,我们拭目以待。

END

关键词:
责任编辑: 梅长苏