随着苹果Siri的出现,语音识别技术开始逐步走进我们的视野。最直观的感受,就是现在移动互联网的应用中越来越多地以语音识别作为新的人机交互手段。
那么语音识别究竟是怎么一回事,它又是怎样被应用并实现其价值的,通过它企业又能获取怎样的增值服务?带着这些疑问,我们走进普强信息技术(北京)有限公司,请被誉为语音识别领域舵手的普强CEO何国涛,和CTO李全忠先生来一一解说。
语音识别技术未来将被普遍应用
语音识别技术,简单地说就是把用户语音转换成文本。它可以适用于不同的领域,例如移动互联网,可以让很多人工密集的呼叫中心实现自动化和智能化,保障信息安全的如声纹识别类,作为大数据挖掘的语音分析系统,以及车联网和教育产品等等。
微信的语音输入就是一个应用例子。未来在我们的日常生活中会越来越多的情况下使用语音识别技术,能够给我们的生活工作带来很多便捷。
语音识别技术应用价值
语音识别技术可以应用于许多不同的领域。现在使用最多的是移动互联网领域,可以直接把语音转换成文字,为用户解决了在小屏幕键盘输入的困难;呼叫中心领域,通过采用语音识别技术,自动化处理大量的重复性工作,例如语音分析、语音IVR导航;导航及车联网,通过智能语音输入,使驾驶人员能够通过语音控制相应的非驾驶操作,让驾驶人员专注驾驶操作,增加驾驶的安全性;教育领域:口语评测;玩具领域:语音控制;声纹识别领域:增强系统安全性能,这是今年语音识别的主要收入增长点;医疗保健领域:应用到电子病历中,可自动实现医生口述病历及医嘱等等。
引领语音识别领域 产品技术成熟
普强目前已经为金融、电信、保险等行业提供高准确度和高性能的电话线信道的 ASR(语音识别)引擎。
移动互联网方面,普强早在2010年7月便与爱帮网推出了语音版的LBS手机应用,这是国内首个基于开放语音云平台下支持多操作系统的手机应用。近年来,随着公司不断的积累,语音识别的技术和产品都相应获得了全方面领先优势的发展。在产品的声学建模上,开发使用了深度神经网络技术;公司研发的语音切分技术及识别结果的置信度算法,不但为企业级应用提供准确的识别结果,同时也提供了精确的说话人分割、时间边界以及识别结果的置信度等信息,这些信息使企业在应用中(例如呼叫中心),更加便捷和准确地利用语音作为主要的交互方式,并且可以进一步挖掘、分析和利用海量语音数据的内容。
普强智能语音分析系统可以广泛应用于客服中心的质检和企业的精准营销中。该产品提供例如热点发现,趋势分析,自动建模等领先的功能。在不断开发新技术的同时,也在企业语音应用的多个领域,(例如保险、银行、证券及电信等的客服中心、增值服务等)积累了海量的数据、模型信息和项目的经验。
目前,普强成熟的产品主要有,千语语音平台,向企业提供语音识别产品和服务;千语语音云平台,为手机互联网应用提供的语音识别云服务;普强智能语音分析系统,为企业提供全方位、多维度的大数据分析(语音,视频,文本数据等)。