神图镇楼!昨天文章一发就有人向我灵魂三连问:
1.AI-CC哪家强?
2.AI-CC企业们现在拼什么?
3.AI-CC企业的同质化/近似化如何区分?
无言以对...我只好引用某个AI学术大神说过的话:
自然语言理解是人工智能的初级!
自然语言理解也是人工智能的终极!
所以,大概率还是要看NLP和NLU的...。。
还是继续书接上文小议联络中心的AI发展方向-1,把联络中心的AI发展方向在员工辅助层和运维管理层说完吧,改天继续唠呗。
我来一句灵魂式的发问:
当我们在讨论员工辅助端的AI的时候,到底是人工为智能还是智能为人工?
先说第一种,我在不同的AI厂家那里都看到一些新的人工为智能式的方案,比如说静默坐席,又比如说人机耦合。
静默坐席就是在训练语音机器人的时,区别于传统的录音模型训练,直接向最优秀人工坐席进行主动式强化学习。当高技能高绩效坐席在与客户交流的时候,通话音频实时码流实时传输给AI来训练语音机器人,通过主动式学习他(她)们的表达方式和应答话术(SOP或者非标),让坐席为人工智能的发育做出进一步的贡献。很美好吗?不,贡献之后会是什么呢?会不会就是取代优秀坐席吗?在智能没有发展到完全尽善尽美的现在,AI实际上并不能100%的完全去替代人工的工作。
真正有温度的永远是人!
共情、复杂理解和非理性应答都不是算法短期可以解决的。
在我看来,这种发展方向远不如另外一种,也就是人机耦合。举例来说就是客户通过网页/APP/微信来与企业进行文字沟通,其实他并不清楚后端为他服务的是人还是机器人。因为后端的一个坐席可能同时管理监控着5-10个机器人的聊天窗口。一旦机器人在应答时出现了Confidence降低的问题,也就是可能出现了复杂短语或者句子的阅读理解的难题或者是答案匹配度不高的情况,人工坐席通过监控发现后进行主动的介入接管,直接与客户进行人工回复,后续再择机选择机器人托管。根据美好的企业宣传,AI在这里可以进一步主动式学习/强化学习/监督学习...。。
那么我们再来说说智能为人工吧,也就是通过AI技术增强了人工坐席的能力,提高坐席的效率和能力,个人判断这可能更加容易让用户接受,让企业买单。坐席辅助系统,可能会是下一个AI-CC领域的当红辣子鸡。它旨在帮助坐席更加迅速的判断用户意图并解答用户问题,同时缩短了通话时间,企业/用户/坐席三方都满意,这个年代很难得了。而它的技术原理呢?客户与坐席之间的通话实时码流传输给ASR语音识别引擎,经过文字转换之后再送给NLP/NLU进行阅读理解,然后根据关键词或热词这种匹配唤醒,适时地从知识库中来取出最合适的答案,并主动推送/弹屏提醒到坐席,从而给客户提供更加优质的服务。
讲究在于适时和合适!
一个比较典型的案例就是车联网呼叫中心。当车主进行通过车机系统进行车联网icall咨询汽车的仪表显示盘的一些问题时,那么联络中心的坐席并不需要经过大量繁杂很专业的培训和冗余式的发问和搜索,而是通过坐席辅助系统就能够一步/几步定位到问题所在并提供相应的解决方案。还有就是向车载导航服务也可以通过坐席辅助系统节省坐席输入时间。
我的个人判断:坐席辅助系统会成为员工辅助层AI应用的主流方式。
当然了技术上实现还有一些复杂性,比如通话怎样实时传送给坐席辅助系统?很多人第一反应就是端口镜像span,那么如果同时还有录音需求和第三方声纹认证的需求以及整体联络中心上云部署的需求...。端口镜像就凉凉了。基于SBC的多路SIP-REC可能就会是唯一的方案。
一说兴起了,所谓Myvoiceismypassword的声纹认证系统其实也是坐席辅助系统的一种变异罢了。国内的商业落地场景也并不太多,通常作为一种辅助手段。不过这里也是有迷思的,比如具体的使用问题。由于客户实际的背景噪声和网络质量,具体在操作来鉴权的难度还是挺大的。通常声纹认证系统会要求一些客户说出特定短语去进行识别,有一些美好的厂商能够做到客户随机说话也能够进行声纹认证,但我相信这毕竟是要耗费大量的资源的。怎么从成千上万的声音库中找出客户声音的特征来匹配?这样的技术难题就需要进一步的优化搜索/匹配引擎。我看到某金融头部客户做了一个比较取巧的应用:贷款信审环节,对正常的用户并不作声纹的认证,对风险识别较高的用户去做定向声纹认证,从XX万个已被标注过的黑名单用户中去进行一个匹配,轻松好多!好人太多,坏人容易抓。
回到这个坐席辅助系统啊,话还没说完呢。
智能话术提醒同样也是坐席辅助系统的一种具象表现形式。再强调下:
讲究在于适时和合适!
那么对于这两点,我们其实想到的是什么呢?其实我们就把坐席辅助的AI问题变成了一个智能知识库的问题。而知识库的发展经过了这么些年的技术不断迭代,产生了诸如知识图谱、图数据库等黑科技,改善了很多,目前还存在两个最大的瓶颈:知识录入的效率和有效阅读理解的问题。
比如客户拍个脑袋:这里有300份产品文档,有pdf,有excel,有word的doc和docx,还有TXT,还有PPT的,你如何帮我有效的转化成知识并录入到知识库中去?答案是并不容易。
有多少人工就有多少智能,甲方乙方一起来。
文字的随意性特别大,区别于语音标注和图像标注由专业第三方数据标注公司来提供服务,文本知识标注是不存在这个行业的。一方面是企业担心由于信息安全不会将企业内部知识交付于第三方公司来去进行数据标注,而数据标注公司也不具备这种强专业性的文字知识标注工作,而且量还不大。所以呢,智能知识库的问题居然演变成了知识的有效录入的问题,而从目前得到的广泛实践来看并没有特别好的方法能够解决这样的问题。我们已经能够看到一些AI企业试图用规范的文档结构塞已有知识来提高效率,但是同样塞的过程还是耗费大量人力。同时我也看到一些比较优秀的客户从知识的生成端就开始着手去打造这样的问题。记得在很多年前华为在产品文档开发时,就已经采用了多标签标注系统的技术来迅速地生成不同版本不同特性不同规格的文档,也许这种技术也会应用在企业知识库搭建和知识编写的过程中。
关于自然阅读理解,我相信短期内是一个比较难以逾越的问题,因为行业知识库的这种特性太强了,每一个行业都会有特定的知识和特定的产品库,这可不是闲聊机器人那种靠寒暄集就能解决的问题。
我个人认为:每个特定行业都应该有一家带头大哥来做智能知识库的能力输出,如果他们愿意输出的话...(Fintech同学请坐下)
由信息转化成知识本身就已经挺难的,能不能用知识根据5W1H来生成问题呢?可能就更难了,那能不能用知识推理并反问问题呢?可能是难上加难了,相信业界的专家能够给出更好的实践。
呃,超纲了啊,最后一点我们来说说智能培训。
人们往往会说坐席培训跟人工智能有什么事情啊?殊不知科技发展速度之快,已经让坐席能够拥有AI培训系统。它旨意通过AI的方式来学习客户与坐席的对话,注意是学习客户不是学习坐席,学习客户的提问方式,提炼出共性。最后用TTS或者真人录音用来去模拟客户去进行一个真实电话的拨打坐席,通过提出不同的问题来检测坐席的回复是否准确符合标准sop。这样子的一种系统呢,有人戏称为坐席养成系统。
联络中心里很大的一块成本就是人力成本,而人力成本中其中很大的一块就是培训成本。智能培训系统有效地切到了运营管理者的一个痛点。目前存在的一个问题就是模拟客户发问同样是需要训练。
我个人认为:智能坐席培训系统方兴未艾!
呃~~洋洋洒洒浑浑噩噩说了几千字,忽然发现字数太多了。改天重新找一个时间去聊一聊联络中心的AI发展之运维管理层,明天我可不写了,手指辛苦。不过您看得也辛苦了!多谢指正!要不,赞赏下?