关键字:SIRI 语音技术 语义识别
关键的数据收集
5月12日,Nuance在深圳举行了“2012年Nuance移动论坛”,这家以往“隐身”于各大国际公司背后的企业出现在了国内,吸引了深圳诸多厂商的兴趣。Nuance在会上展示了三段不同的Video,这三段Video其中就有大家所熟知的Siri的广告片,另外一段则是Nuance自己的“声龙”系列产品,最后一段则是将语音技术结合手势控制应用到智能电视的场景。通过短片,Nuance不但展示了目前语音技术发展的最新动态和趋势,同时也展示了诸多国际企业所重视的关键点——用户体验,这将是在未来企业竞争中取胜的杀手锏。而Nuance的目标,也就是帮助这些企业提高用户体验。
语音技术的出现显著改变了人机互动的方式,但如果你对Siri有一定的研究,你会发现其实语音识别技术(ASR)只占到其中的20%,真正重要的则是语义识别技术。语义识别能帮助用户更准确地能否搜索出想要的结果。这种技术基于Statistic Language model(语言模型统计),需要大量的数据来完善搜索的结果。同时对于自然语言的理解(NLU技术),也需要数据库的数据,来进行语法的收集。“越多的数据,越容易帮助我们配对用户所需要的内容,了解用户的意图,将意图翻译成行动,效果最终也是取决于本身数据的质量。”Nuance大中华区总经理郑裕庆表示。
郑裕庆,Nuance大中华区总经理
Nuance的Dragon Go凭借在美国的Apple App Store和Android Market两大移动应用平台巨大的下载量而被用户熟知。Dragon Go将Nuance的声龙语音识别和自然语言理解技术与人工智能技术相结合,从而显著简化了搜索移动内容的体验。因此,用户仅凭借语音便能得到他们想要的内容,并能将更多的时间用于浏览而非查找在线内容。也就是说,Dragon Go能听懂用户说的话并能理解用户意图。用户仅需说出一个简单的短语,他们所喜爱和最相关的内容提供商便会显示在眼前,用户能轻松地获取餐厅评述、购买电影票、观看流媒体电影和电视节目、在线购物、查找方向、听喜爱的音乐、还可以通过Expedia预定酒店。