uziu33pllunx83 发表于 2022-11-1 07:50:12

AliOS这个黑科技太惊人了 语音与视觉融合交互

6月28日消息,语音交互大家应并不陌生了,市场上有很多基于语音交互的音箱产品,带有语音助手的手机也都支持语音交互,作为一种更简单的输入方式,我们可以通过说来实现操控,尤其是在汽车上更有用,我们不必分心就能完成各种需求,侧面提升了驾驶安全性。

https://p3-sign.toutiaoimg.com/pgc-image/15301552786527bb27b3856~tplv-tt-large.image?x-expires=1982623136&x-signature=40U%2BvqfzamMwUdpwRI8wL17oRgk%3D

但传统的语音交互只是用说来实现,最近阿里旗下的AliOS开发出一项堪称黑科技的技术,将语音交互与视觉识别结合在一起,堪称未来车辆行驶甚的杀手级应用功能。

AliOS在语音的分区识别、分人识别、方言识别、简化唤醒词、语义理解等方面都日趋成熟。AliOS多模态交互负责人王恺给出了答案介绍,自从车子有了导航以后,大家就很少记地址、路线了,更别提沿途有哪些大楼、商场、餐厅、学校、展览馆。所以,很多车主会开车,但不认路。

所以经常会出现以下的场景:下班的高架路上,左前方有座高楼大屏正在播放《超人总动员2》电影预告片,这时激发了你想看电影的欲望。如果按照现有的导航功能,你得中断当前回家的导航,查找附近电影院,从而大致判断这座大楼叫什么,再导航过去。

而AliOS的这项新科技,只需要你看着那幢楼说:“我想去左前方那幢楼看电影”,导航就立即准确定位到那幢楼,并帮你预定好《超人总动员2》合适场次、座位,甚至帮你找好停车位,预定好周边餐厅。

这种交互的实现,除了语音之外,还加入了语音与视觉图形的融合。目前AliOS已经从系统底层实现这一功能,通过融合车载显示屏导航图像或未来前挡玻璃的AR导航实景图像,当你开车看到的某一地标,你都不需要知道这个地标的名字和准确方位,车子就知道你指的是哪一个地方、想去干吗、能为你提前做什么。

王恺介绍,上述的科技能力将在几个月后正式落地应用。这也是AliOS系统与其他车载系统的不同之处,让车载交互回归本能。
页: [1]
查看完整版本: AliOS这个黑科技太惊人了 语音与视觉融合交互