物联传媒 旗下网站
登录 注册
RFID世界网 >  新闻中心  >  物联网新闻  >  正文

搜狗布局车联网,在“语音交互”上做了大文章

作者:赵悟空
来源:雷锋网
日期:2016-05-16 10:08:57
摘要:为了站住脚跟,百度和高德早就高调的进军了车联网相关领域,作为“第三大”移动端地图,搜狗在此前并没有透漏出什么具体计划,而在2016CES Asia上,搜狗地图发布了一款“搜狗智能导航”,正式布局车联网。

  在中国的地图/导航市场有一个迥异的现象,就是在长时间的竞争中并没有出现科技行业“721定律”的格局,去年年末,“中国移动端地图/导航市场研究报告”给出了一个数据,在2015年底4季度中国手机/导航市场活跃用户份额中,百度和高德的市场份额相当,二者相加超过了70%,而搜狗地图也相比之前稳步增长,占到了10%的市场占有率。这也说明地图/导航市场的竞争还远远没有趋于稳定。

  为了站住脚跟,百度和高德早就高调的进军了车联网相关领域,作为“第三大”移动端地图商,搜狗在此前并没有透露出什么具体计划,而在2016 CES Asia上,搜狗地图发布了一款“搜狗智能导航”,正式布局车联网。

  搜狗地图总经理孔祥来说“搜狗智能导航”将在本搜狗,车联网,语音交互月底到下月初左右正式上线,主要面向开车的用户,虽然手机端会推出App,但更主要的还是针对车机的设计和优化,在车机方面,搜狗会与汽车厂商和汽车后装厂商进行合作,自身暂时并不会推出硬件产品。


  对于“搜狗智能导航”这款新产品特性,孔祥来简单的概括了一下:

  “全语音交互,handfree+eyefree,支持多轮对话。”

  孔祥来说,拥有上述这些特性的综合产品,目前只有搜狗一家在做。相对于其他的竞争对手来说,“搜狗智能导航”的差异点主要在于语音交互技术。

  ▌为何侧重语音交互

  搜狗采用的是纯自主的语音识别和语义理解技术,这项技术和搜狗地图进行了深度的整合,目前已经可以实现在车内完全通过自然语音交互的方式进行拨打电话、发短消息以及各种信息查询等。这些交互都需要语音技术和导航/地图等功能有深度的整合才可以,相对于对手来讲,搜狗所使用的都是自家技术,在整合方面更有优势。

  目前市面上的导航产品,无论是车机还是手机导航,侧重点大都是在导航的准确性和即时性上。孔祥来表示:

  单纯就地图和导航的用户体验而言,现在大家做的都相差不多,只是在一些细节上各有优势,所以搜狗才决心引入语音技术,在这个方向上做出真正让用户感知到差异化的东西。

  而搜狗所做的差异化其中一点就是handfree+eyefree,在开车的时候如果能实现这一交互意义非凡。

  ▌目前导航地图的不足

  雷锋网尝试了包括目前的“搜狗地图”在内的多个手机地图,以及很多车机上的一些导航功能,在交互上都避免不了手动选择的情况,比如你使用一些地图的语音功能,对它说“去火车站怎么走”,它就会给你列出一堆的选项,让你手动选择目的地。


  这种“手动选择”在行驶状态下是不只是方不方便的问题,于安全都有隐患。所以,据了解“搜狗智能导航”在交互上完全可以实现全语音操作,这也是搜狗的侧重点与竞争对手不一样的地方。

  对于这种交互方式,孔祥来向雷锋网表示:

  “在车内场景,语音交互在未来可能是一个非常重要的入口,其重要性或许可类比于浏览器至于PC,所以所表面上看只是交互方式的进步,但未来想象空间巨大”。

  ▌想用"多轮式对话"挽救

  不知道诸位苹果用户在使用Siri的时候有没有这样的困惑:你说了一句话之后,想对的前一句话进行补充,但是Siri并不能联系上下文来理解你的意思,这样你就不能自如的和Siri进行表达。孔祥来概括的“搜狗智能导航”的三个点中的多轮式对话就解决了这样一个尴尬的问题。

  举个简单的例子:

  比如用户说:“我要去清华大学”,

  机器就会问:“清华大学有N个门,你是要去正门吗?”

  这时用户回答:“不,我去南门”,

  机器就会正确地把目的地设置为清华大学的南门。

  注意,这里面用户第二次说去南门的时候,“搜狗导航”对整个对话就有一个上下文的理解能力,它可以知道用户说的是清华大学的南门,而不是某个叫做“南门”的地点。


  百度地图“南门”相关地点

  这个多轮式对话就涉及到了一个语义识别的问题,孔祥来说,目前“搜狗智能导航”的普通场景识别率大概能做到96%以上,POI的语音识别准确率将近99%,但是语义识别相对于语音识别就要复杂的多,搜狗的解决办法是针对车内的若干场景进行分别优化。比如在导航中最常用的设定目的地这一环节上,搜狗会根据用户的表达方式智能地去提示他补充必要的信息,直到确认到精确的目的地为止,这一过程就实现了上面“去清华大学”的对话,搜狗方面称其为“启发式多轮对话”。

  “这个其实很难,因为用户说话的方式千奇百怪,语义理解上不太好掌握。但即使这样,我们现在基本上已经能够做到80%的拦截率了。”

  这个“多轮式对话”并不是搜狗独有的技术,孔祥来告诉雷锋网:

  “所有的语音公司都在朝这个方向做,包括科大讯飞在内。但是这其中有一个比较难的地方就是组织架构的问题。要把这种多轮式对话做好,需要语音团队和地图团队紧密协作、目标一致才有可能快速迭代,但是现在大多数做语音技术的公司并没有很强的地图团队跟他们做如此紧密的合作。”

  ▌离线是否可用

  相信大多数用户都比较关心这个导航离线是否可用,对此,孔祥来表示:

  “导航早就已经是离线在线混合模式了,这个不用担心。目前语音识别也已经可以支持离线在线混合,当然,离线的效果要查一些。另外,语义理解是在云端的,如果没有网络支持,在车机上是不能做到“多轮对话模式”的。不过将来我们也会考虑把一部分语义理解的能力放到前端去,实现一定的语义理解能力。不过现在车机联网已经是普遍趋势了,我们即便要在前端加语义理解功能,也只是为了应急,并不是鼓励用户离线使用。”

  ▌小结

  在搜狗从“智能语音交互”方向打入车联网市场的时候,搜狗输入法在语义理解方面的大数据可能起到了至关重要的作用,目前市面上的地图/导航类技术各家都相差不多,语音识别技术也不是什么新鲜科技,但是把这两者结合做到交互非常好的还比较鲜有。搜狗有“输入法大数据积累”并且能和其地图深度整合,还是具有竞争优势的。不过目前雷锋网(搜索“雷锋网”公众号关注)还没见到产品,产品的真实使用效果和水平如何,还得等“搜狗智能导航”正式推出后才能知道。

人物访谈