给我们一个人的声音,我们会告诉你他声音背后的很多密码:健康情况、精神状态、金融实力、个人性格······用人工智能技术,你的声音可以透露出更多的秘密。
以色列公司Voicesense向客户提供了一个有趣的承诺:给我们一个人的声音,我们会告诉你他声音背后的很多秘密。这家公司在个人通话期间使用实时语音分析技术,可以评估其银行贷款是否可能违约,能否购买更昂贵的产品,或者成为最佳的工作伴侣。
据外媒报道,声音数据非常个人化,很难伪造,并且包含了有关人类心理健康和行为的令人惊讶的信息。
有不少公司和研究人员,正在利用人的语音数据,得到人的更多的信息,用于健康监测、精神状态分析、金融服务推销、客户服务等。人们不得不惊叹语音带给人们工作、生活带来的便利,同时语音技术有可能正在一些方面侵害个人隐私,影响大家享受公正公平社会服务。
一、正在大量被收集的个人声音数据
“现在有大量的设备可以捕捉个人的语音,无论是你的手机,还是像Alexa和Google Home这样的东西。”,麻省理工学院麦戈文脑研究中心的研究科学家Satrajit Ghosh说。现在有很多的公司和机构有兴趣为心理健康目的开发语音分析,声音在生活中变得无处不在。
根据商业分析公司IdTechEx的报告,语音技术市场正在迅速增长,预计到2029年将达到155亿美元。
近年来,研究人员和初创公司已经注意到可以从语音中挖掘出丰富的信息,尤其是像亚马逊的Alexa这样的家庭助理的普及,人们在家中与Alexa交谈,数字语音助理越来越多地用于医院,使得消费者越来越习惯于与这些设备交谈。
Alexa是一款完全基于语音指令驱动,无需屏幕的AI语音助理软件,于2015年8月正式向第三方开放。此前,Alexa一直默默无闻地充当着亚马逊另一款产品——智能语音音箱Echo的幕后功臣,为其创造了上市两年累计销量超过550万台的成绩。
根据数据统计,搭载Alexa的硬件品类已经超过7000种。产品品类从电器、手机到机器人、汽车信息娱乐系统,品牌涵盖了LG、华为、GE、福特、大众、联想、优必选等多个领域。半年的时间内,亚马逊让Alexa平台的接入数量增长了6000家。分析师Mark Mahaney预计,在最近的假日季亚马逊卖出了1000万台Alexa设备。
谷歌的智能家居产品——Google Home,注重于音乐娱乐和语音搜索的硬件产品。它内置了处理系统以及谷歌助理,相比苹果的Siri和微软Cortana,Google Home不仅仅进行语音交互,并透过机器学习与人工智能的结合,使其转变成为为智能家居控制中心,或者也可以称之为智能管家。
二、如何从声音数据探究信息?
声音不仅无处不在;它非常个人化,很难假装,并且出现在我们最私密的环境中。
据国外媒体报道,语音分析研究的关键是个人如何说:音调、速度、重点和停顿等,核心是机器学习。技术人员从两组中挑选标记样本,例如,焦虑的人与没有的人,并将数据提供给算法。然后,该算法学会获取可能表明某人是否属于A组或B组的微妙说话符号,并且可以在将来对新样本执行相同操作。
卡耐基梅隆大学(CMU)计算机科学家Louis-Philippe Morency表示,分析结果有时可能违反直觉。他建立了一个名为SimSensei的项目,可以帮助人们用语音检测抑郁症。在一些试图将声音特征与再次尝试自杀的可能性相匹配的早期研究中,Morency的研究小组发现,声音柔和、气喘的人,而不是那些有紧张或愤怒声音的人,更有可能再次尝试自杀。然而,这项研究是初步的。
尽管如此,研究人员已经建立了使用声音来帮助识别从帕金森病到创伤后应激障碍的所有算法。对于许多人来说,这项技术的最大承诺在于语音分析和心理健康的交叉,并希望创建一种简单的方法来监控和帮助那些有复发风险的人。
Companion Mx是一种精神健康监测系统,目前仅适用于医生和患者。患者使用该应用程序记录音频日记。该程序分析这些日记以及呼叫日志和位置等元数据,以确定患者状况,通过评价四个因素——抑郁情绪、兴趣减少、躲避和疲劳,与患者共享,并在仪表板中提供给希望密切关注患者行为的医生。该公司已经对该产品进行了7年的测试,并且有超过1500名患者。结果表明,该技术可以预测抑郁症和创伤后应激障碍的症状,但需要进一步验证。
同时,Voicesense、CallMiner、RankMiner等服务和Companion Mx的母公司Cogito承诺在业务环境中使用语音分析。大多数时候,这意味着改善呼叫中心的客户服务参与度。Voicesense有更大的梦想:贷款违约预测,保险索赔预测,揭示客户的投资风格,人力资源的内部候选人评估,评估员工是否可能离开等,并可以提供关于健康行为、工作行为、娱乐等的预测。
Voicesense语音处理算法每秒测量200多个参数,并且可以在许多不同的语言上准确实现,包括像中国的普通话这样的语言。该计划仍处于试点阶段,但该公司与大型银行以及其他投资者保持联系。“每个人都对这种技术的潜力着迷。”
三、你的声音也是一种数字资产
到目前为止,但很少有人考虑到,我们的声音作为另一种形式的数据,可以告诉我们自己和别人很多信息。所有这些都导致了关于这些信息如何被利用,以及如何使用和保护个人隐私的问题。
德雷塞尔大学(Drexel University)的犯罪学教授Robert D'Ovidio担心,Voicesense设想的一些应用可能具有歧视性。想象一下,他打电话给一家抵押贷款公司,并且他们用你的声音来确定你患心脏病的风险更高,然后你被认为风险更高。“我真的认为,制定消费者保护立法,以防止收集这些。”
华盛顿大学法学院教授瑞安·卡洛指出,存在这样的一些消费者保护措施。语音被认为是一种生物识别措施,而美国的一些州已经制定了保证生物识别安全的法律。与种族或性别等敏感类别信息相关的偏见问题是机器学习技术的特有问题,无论这些技术是用于语音分析还是查看简历,当这些机器学习方法用于面部或语音识别时,人们会感到内心不安,部分原因是这些特征是如此个性化。虽然存在反歧视法律,但围绕语音分析的问题涉及更广泛,即何时可以使用信息以及什么构成歧视,这是我们作为一个社会没有充分努力解决的概念。
很多专家认为,未来发展中,数据,无论采用何种形式,都是一种资产;在数据采集应用中,针对大批量数量应用,数据就像在电子表格或声纹中输入的一堆数字一样,没有特殊的含义,即脱敏;在针对个人时,隐私应该得到保护,至少,在使用个人数据时应该即时得到通知。