车载语音最新黑科技 除了辨“音”还会识“相”

浏览量:28 次

汽车智能网联的快速发展以及消费者个性化需求增加,使得车载语音交互在车上的配置率越来越高,更是成为各大厂商智能化的重要卖点。与此同时,高度识别率及人工智能的发展令车载语音系统的开发者们早已不满足于语音拨打电话、发短信、看导航这些基础功能,为博眼球各用奇招,赋予了车载语音更多的可能性和功能,并推动整个语音系统越来越人格化。


 

而在年初的科技大秀美国CES展上,语音识别领域的行业巨头Nuance现场对语音最新技术的呈现再次刷新了笔者对于车载语音的理解,除了语音外,该司的Dragon Drive(声龙驾驶)平台还通过理解驾驶者眼部及头部动作,以及驾驶员的语调、情感等,与驾驶者之间展开助手甚至朋友交流,让整个语音系统更加的人性化、个性化和全面性,使驾驶员和乘客能够享受娱乐、高效、互联和安全的驾驶。

首先,最大的感受莫过于整个语音系统的反应速度和对语义的理解力。在展会现场较为嘈杂的实测环境下,测试者快速用“查询明天上午从北京到上海的航班”“只看东航的”“明天出门要不要带雨伞”等口语化语言快速问询航班及天气,而系统显示屏几乎在1秒之内快速精确呈现相关信息,且在系统说话时,驾驶员可以随时打断更正信息。而在语义理解上,甚至是“我要吃面”此类自然人才理解的语义,系统则会给出相关餐厅信息,甚至可以可以按价格和距离进行排序;一句“我好冷”系统可以自动打开空调…….,这也意味着用户不需要任何学习任何指令语言,跟机器交流只需像对待正常人说话即可。

“许多人认为在智能语音交互中‘云’很重要,实际上对消费者来说操作的便捷性和稳定性最为重要,他们或许不知道云是什么概念,但在体验性上却有较大期待。”Nuance集团高级副总裁蒯文瑞表示。

其次,系统的多感知性,并支持增强现实功能;上述中亦提到Nuance创新技术还将语音识别与驾驶员眼部和头部相结合,可通过眼部头部动作方向与车外兴趣点进行交互,从而使驾驶员能够获得有关营业时间、点评等信息。与此同时,相应的信息能够在增强现实中突出标明,并使用由Saint-Gobain Sekurit开发的透明屏幕显示在智能挡风玻璃上。

第三点是多任务执行,语音系统变身全能小助手。即在司机专注驾驶的同时,语音系统可以跨空间地完成多项复杂的任务操作。如打开车窗、打开空调、听音乐、找停车场等,而随着自动驾驶的快速发展,相信语音技术还有更多的空间有待开掘,如语音控制座椅升降转动、语音解锁车门等。

还有一点是,由“机械交流”到“情感互动”。如今,人们待在车上的时间越来越多,漫漫旅途,如果能有人聊天亦不失为一件趣事儿。Nuance的“声龙驾驶”语音系统庞大的知识量储备使其可以充当导游角色,解答驾驶者的各类疑问如当地风土人情、建筑特色等。也会应要求讲个段子,背首诗来解解闷儿。

记得三年前笔者在有关车载语音方面的采访时,多交流的还是语音和语义的识别能力,而今日,则在关注于其高效、功能。不得不感叹于技术发展之快的同时,也为开发者的个性化创新和智慧由衷点赞。以上这些技术除了代表Nuance外,也代表着车载娱乐系统最新及未来发展方向。而随着自动化驾驶的快速发展,相信车载语音还有更多的能量,正等待我们解锁。

最后再来说下Nuance这家企业,作为最早一批进入语音识别领域的行业巨头,Nuance因早期苹果的Siri采用了其语音技术而声名鹊起,而在汽车行业中,该司在2013年之前几乎垄断了各大国际品牌的车载语音系统,包括宝马、奔驰品牌在内的约3000万辆汽车装有它们的车载语音助手。而今,Nuance Dragon Drive(声龙驾驶)以超过40种语言为当今道路上行驶的超过2.5亿辆汽车提供技术支持。不过近年,随着车载语音交互平台的争夺战日趋白热化,各方势力频频出招,前有亚马逊、Google等国际巨头,后有科大讯飞、百度等国内厂商,在此大背景下,Nuance在技术上的创新力度进一步增强。与其他同行一起,通过携手全球各大巨头车企,共同推动车载语音交互从“命令”、“自然”向“主动对话”时代全面进击。就汽车领域而言,中国第一款互联网汽车荣威RX5便使用了Nuance的技术,该车拥有的会话型语音界面集成了声龙驾驶本地嵌入及云端混合语音识别和基于深度神经网络的自然语言理解技术,可保证在没有4G网络时依旧能实现基本功能,并通过云端收集用户的使用数据用于未来对系统的迭代。 

 

*版权声明:本文为盖世汽车原创文章,如欲转载请遵守 转载说明 相关规定。违反转载说明者,盖世汽车将依法追究其法律责任!

本文地址:http://auto.gasgoo.com/News/2019/02/0301090797I70087051C601.shtml

 
®关于本站文章™ | 若非注明原创,默认 均为网友分享文章,如有侵权,请联系我们™
㊣ 本文永久链接: 车载语音最新黑科技 除了辨“音”还会识“相”