主页 > 知识库 > VocalZoom携手科大讯飞提升自动语音识别功能

VocalZoom携手科大讯飞提升自动语音识别功能

热门标签:Win7旗舰版 科大讯飞语音识别系统 苹果 Linux服务器 阿里云 电销机器人 解决方案 铁路电话系统
  VocalZoom与科大讯飞携手打造中国最普及的语音识别系统在噪音环境方面取得突破性进展
 
  • 早期测试显示:VocalZoom的光学传感器能将科大讯飞的声控平台的自动语音识别(ASR)性能平均显着提高50%以上。
  • 最明显的性能增强体现在最高噪音级别环境中,例如:将车窗保持打开状态时驾驶汽车所产生的噪音。
  • 很多公司正在探索将VocalZoom的传感器技术与科大讯飞的“语音云”结合起来,而“语音云”是中国领先的移动云和嵌入式应用程序的智能语音平台。
  作为人机交流(HMC)光学传感器的主要供应商--VocalZoom,其产品可以带来一种更自然、更个性化的、安全的声控体验。今天该公司宣布,它已经与科大讯飞签署了一项协议,将VocalZoom的人机交流(HMC)光学传感器与科大讯飞的“语音云”智能语音技术平台相结合,并进行性能测试;该平台是在中国应用最为广泛的解决方案,拥有数以百万计的用户。初步结果表明,通过向用户耳机和汽车信息娱乐解决方案中加入VocalZoom传感器,科大讯飞的自动语音识别(ASR)功能可以平均得到50%的改善,尤其在嘈杂的噪音环境中得到更多的改善。
  “随着我们不断探索将两种技术融合到语音控制和身份验证的革命性解决方案中,VocalZoom 和科大讯飞打算在本月完成联合测试。我们通过使用更小、更时尚的耳机以及在各种各样的应用程序中的其他解决方案来共享更好的声控体验。”
  科大讯飞高级研究员王海坤(Haikun Wang)表示“根据全球主要基准测试的标准,科大讯飞已经成为最好的声控解决方案,但是当前面临的最大挑战就是在噪音环境中的性能表现。我们相信VocalZoom的技术可以为我们在性能改善方面取得突破性进步奠定基础。” 他续指 “我们已经在多个场景中测试了VocalZoom传感器,其中包括将车窗保持打开状态以及狂风噪声的环境下,在驾驶的汽车内部所产生噪音的场景,而相应的性能改善是相当可观的。”
  使用虚拟助理和汽车语音控制的人机交互的关键是这台机器是否可以完成人们指定的任务,并且足够快速、准确地满足用户需求。即使是最新的降噪法,如今的声学麦克风在这种控制水平下仍旧不能达到足够的声音隔离效果,特别是在嘈杂的环境中。VocalZoom多功能人机交流(HMC)传感器通过收集人在谈话时的其他数据来解决这个问题,例如人在说话时嘴巴、嘴唇、脸颊和喉咙附近的面部皮肤的震动等数据。通过将VocalZoom光学人机交流(HMC)传感器集成到声控解决方案中,并令它着重针对这些领域,可以捕足、测量面部震动的数据,并将其转换为一个独立的、近乎完美的参考信号。系统可以通过这个信号进行运转,而不受噪音水平的影响。
  “能够与科大讯飞合作,显着提高最为广泛使用的自动语音识别(ASR)平台的性能,我们感到非常兴奋,” VocalZoom销售和业务发展副总裁Rammy Bahalul如是说。“随着我们不断探索将两种技术融合到语音控制和身份验证的革命性解决方案中,VocalZoom 和科大讯飞打算在本月完成联合测试。我们通过使用更小、更时尚的耳机以及在各种各样的应用程序中的其他解决方案来共享更好的声控体验。”
  VocalZoom和科大讯飞已经测试了一个解决方案的性能,即在多个不同噪音级别的场景中以及结合音乐、汽车噪音和其他干扰因素的移动汽车内部,对两家公司的技术相结合的解决方案进行了测试。自动语音识别(ASR)性能已经被提高至一个几乎完美的级别,而之前在同样的高强度噪声环境中,理想的声控性能几乎是不可能的。

标签:辛集 湘西 三门峡 安阳 湖州 呼伦贝尔 毕节 邵阳

巨人网络通讯声明:本文标题《VocalZoom携手科大讯飞提升自动语音识别功能》,本文关键词  ;如发现本文内容存在版权问题,烦请提供相关信息告之我们,我们将及时沟通与处理。本站内容系统采集于网络,涉及言论、版权与本站无关。
  • 相关文章
  • 收缩
    • 微信客服
    • 微信二维码
    • 电话咨询

    • 400-1100-266