近年来,我国移动金融服务市场得到迅猛发展,去年全国移动支付规模已超200万亿,购买移动金融理财产品的用户超2亿。面对规模巨大的金融交易,如何保障移动金融交易的安全就成为非常重要的课题。
在此背景下,中国人民银行于前不久发布《移动金融基于声纹识别的安全应用技术规范》,标志着以声纹识别为代表的生物识别技术开始正式为我国的移动金融保驾护航。
捷通华声运用国际领先的深度学习算法到打造出新一代灵云声纹识别技术,拥有超高的识别准确率,响应速度达到毫秒级别,各项性能均大大优于《技术规范》中标准要求。结合最新技术打造的新一代灵云声纹识别能力平台,让企业能快速、便捷拥有私有化的声纹识别能力,可为金融移动支付、移动开户、社保身份验证、公安刑侦等众多领域提供更为安全、可靠、便捷的身份认证服务。
灵云VPR身份认证更安全可靠
声纹识别是从说话人发出的语音信号中提取声纹信息,并对说话人进行身份验证的生物识别技术。与其他识别技术相比,灵云声纹识别在实际应用中具有以下独特优势:
降低侵犯隐私风险:相对于人脸识别而言,具有较低的隐私敏感,泄密风险较低;
更符合用户习惯:声音是人最自然的生物特征,收集、使用更为简单,用户体验更好;
采集成本低:语音采集装置造价低廉,只需电话、手机或麦克风即可;
造假成本高:声纹口令可动态变化,不用担心密码的以往、丢失和窃取问题,造假成本高,非常适合需要远程身份验证的场合。
灵云声纹识别技术采用国际最先进的深度学习算法,响应速度极快,声纹识别准确率超高。通过采用端点检测和噪声消除技术,有效克服了环境噪音对声纹识别准确率的影响,能适应各种工作场合中采集声纹信息的要求,很好的满足不同企业对身份认证设备简单易用、安全可靠、成本低廉、适应性强等要求。
与此同时,捷通华声将国内领先的灵云语音识别技术与声纹识别技术相结合,在身份认证时,不仅能通过声纹特征确认,还能通过语音识别来认证是否为给定的数字串,达到辅助活体验证的功能。
在实际身份认证应用中,灵云声纹识别技术可对说话人进行“一对一认证(确定测试语音是否来自目标说话人)”、“一对多辨识(判定测试语音属于目标说话模型集合中哪一个人)”,并拥有说话人检出、说话人追踪等能力。同时,可根据企业需求提供声纹自由说、动态数字密码、开放文本密码、固定文本密码等文本无关、文本相关、文本半相关多种识别模式,帮助企业对用户身份进行确认。
VPR能力平台为安全保驾护航
捷通华声推出的灵云声纹识别能力平台,可快速、独立部署在客户业务系统内部,为各种应用系统提供声纹识别能力,不仅满足了用户对身份认证信息高保密的要求,还可根据用户具体业务需求,灵活挂接灵云人脸、指纹等多项生物特别识别技术,构建多重生物特征信息相结合的综合身份验证与辨识系统,满足用户业务系统对客户进行多维度、高安全级别身份认证的需求。
在移动金融服务应用上,灵云声纹识别能力平台具有开发挂接简单方便,可平滑移植、安全认证级别高等特点。通过采用了客户端-服务器的体系结构,移动客户端仅作为拾音设备来使用,声纹的注册、验证、变更与注销均在客户的私有化声纹服务器上完成,使得安全性较低的移动客户端不会存储和处理任何声纹信息,进而增强了整个识别系统的健壮性。
如今,声灵云声纹识别能力平台以获取方便、成本低廉、体验友好等优点,已成功应用于手机银行、第三方支付等移动金融领域,并在电信领域呼叫中心中对人员身份的验证、养老社保领域对参保人员身份的验证、司法国安领域对音频资料的声纹鉴定等场景中得以应用,让身份认证变得更安全、更可靠。
AI小课堂
受硬件设备、环境噪声、混合说话、疾病变声、音频质量等因素影响,声纹识别过程难免存在一定的识别错误情况,识别错误分为错误接受和错误拒绝,对应的两个性能指标分别是错误接受率和错误拒绝率。
FAR(错误接受率):又称认假率,是把非本人发出的语音错误判定为本人的概率;
FRR(错误拒绝率):又称拒真率,是把本人发出的语音错误判定为非本人的概率;
EER(等错误率):调整声纹识别系统的阈值,使FAR与FRR相等时的错误率称为等错误率。
在声纹识别中,用户可通过设定不同的阈值对FAR和FRR进行平衡:
对于保证用户体验的场景,如个人手机的声纹锁,则设定阈值越低,此时接受目标说话人的条件越宽松,即FAR越高,FRR越低。
对于安全性要求高的场景,如移动支付验证,设定阈值越高,此时接受目标说话人的条件越严格,即FRR越高,FAR越低。
在实际使用中,需要调整阈值来在安全性和用户体验上达到一个良好的平衡。一般采用检测错误权衡曲线(DET)来反映两个错误率之间的关系:对一个特定的声纹识别系统,以FAR为横坐标轴,以FRR为纵坐标轴,通过调整其参数得到的FAR与FRR之间关系的曲线图,即DET曲线,显然DET曲线离原点越近(及EER越低),系统性能越好。
捷通华声推出的灵云声纹识别技术,关键指标在国内均处于领先地位,在某大型国有银行对声纹供应商的指标中,要求在误识率(FAR)小于0.1%的情况下,在纯数字语音输入时,准确率达到90%以上,而捷通华声的技术指标能远远高于需求。