科大讯飞为业界提供语音车载导航完美解决之道
目前国内已推出的具有语音功能的导航产品中绝大部分应用的都是科大讯飞的语音合成技术,实现信息语音播报、语音操作提示等功能,并对于语音识别技术在导航产品中的应用与厂商共同合作进行预研和应用探讨。
作为中国最大的智能语音技术提供商的科大讯飞,在智能语音技术领域有着长期的研究积累,并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。科大讯飞中文语音合成技术在近年来历届国内、国际权威机构的评测中,主要关键技术指标均名列第一,并被信息产业部确定为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。科大讯飞中文语音合成技术2005年在业界首次超过普通人口语水平(普通人口语自然度得分4.0分,讯飞中文语音合成技术自然度达到4.3分)。2003年,科大讯飞获迄今中国语音产业唯一的“国家科技进步奖(二等)”,2005年获中国信息产业自主创新最高荣誉“信息产业重大技术发明奖”。2006年、2007年、2008年连续三届英文语音合成国际大赛(BlizzardChallenge)荣获第一名。2008年获国际说话人识别评测大赛桂冠。科大讯飞已实现了从中文到英文等多语种,从语音合成到语音识别的全面技术领先。
经过多年的研究,公司积累了大量的方言数据库,语音合成技术已经达到不仅能生成标准流畅的普通话,而且可以支持四川话、河南话、湖南话、东北话等几乎全部的主流方言,语音识别技术支持接近普通话的方言,有效解决了语音技术的应用难点。
语音识别技术的应用对硬件设备及软件系统的支持能力会有更高的要求:其一,在硬件配合上,需要更高性能的处理器,区别于一般性能的高品质麦克风和适合录音数据传送的音频电路,以此来保证识别引擎接受数据的完整性和可用性;其二,在导航软件上,需要软件开发商在搜索引擎的接口中加入便于语音识别系统可以调用的数据和命令菜单,以此来实现分类信息搜索、POI搜索和交叉路口搜索等功能。
语音导航的操作非常简单,不过需要具备两个前提:第一,需要导航软件厂商将车载设备可以支持的命令词内容信息告知用户(这些内容可能是在导航菜单界面的功能名称,也可能是用户自行设置的目的地名称及手机联系人的名称等);第二,车载设备商可以在方向盘或车载导航仪上安装一个语音识别启动按键,通过按动识别键启动语音控制系统,用户对着识别麦克说出自己的需求,系统通过识别用户的语言,实现用户的需求。
语音技术在车载导航中的应用,当关闭车窗时,只要是普通话或与普通话相近的方言,讯飞语音一次性识别正确率都可以达到90%以上。此外,语音识别功能的成本已经大大降低,加入的硬件和软件授权费都在厂商和用户的接受范围之内,与语音车载导航的高性能、高附加值相比,可以说是微不足道。
在实际使用中,如用户需要语音导航仪寻找当前所在位置附近的加油站,按动识别键后直接对着麦克风说“导航到附近加油站”,语音导航仪会将搜索到的附近加油站的位置和具体信息通过图形显示和语音回馈给用户。
当用户需要查询某一位置时可以说出此POI的名称,如“家乐福超市”,识别系统便会结合搜索引擎按照由近至远的方式为用户列出附近的家乐福超市的位置信息;另外,用户也可以说出希望去往的某个交叉路口的名称,如“深南大道和农林路交叉口”等找到目的地。
随着智能语音识别技术的不断完善,数据资源的不断积累,用户可以不拘于固定的语言表达方式而用较为自然的语音进行命令输入,如“导航到某某地”这样的命令也可以说成“我想去某某地”、“某某地在哪”或“带我去某某地”等多种表述方式,语音系统都可以正确识别并处理。
总而言之,科大讯飞之所以能够为业界提供完美解决之道,受到厂商的普遍青睐,核心技术的全面领先、长期的研究积累是根本原因,科大讯飞的先发优势和资源积累形成了短期内难以仿效的竞争优势,树立了牢固的市场领导者地位。