如何提升智能电销机器人的语义识别准确率,在金融公司中,传统电话销售占公司总销售额的大半部分,电话销售客服中心每天呼出几万通电话,话术都是有迹可循。但传统的电销客服存在流动性大,培养周期长,人力成本高的缺点,如何降低公司的成本又不减少电话销售的份额,是每个金融公司所面临的难题。智能电销机器人的出现,让以上传统销售难题引刃而解。不过,由于智能电销机器人未针对金融场景进行优化和难以实现准确的语义识别等原因,还难以应用于金融领域。
本文提出了一种组合使用文本相似度计算与特征词规则匹配的方法,可以提高语义识别准确率,实现更为友好的人机对话。
传统的语义识别要靠程序开发人员写一些规则来解决语义识别问题。但是,要穷举并制定这些规则对于开发人员来说工作量无法想象。因为在自然语言处理领域中永远有写不完的规则,这时就需要机器人运用自己的学习能力进行推理。TF-IDF词袋模型能根据词的重要程度添加对应权重,更符合对话语义逻辑,但会使原文档转换为高维的稀疏向量,为向量存储和相似度计算带来了很大的困难。其主要技术包含如下:
1、对电销对话语料数据进行清洗,删除对话逻辑不合理的数据,删除语音转文本过程中识别误差过大的数据,保留部分语音转文本过程中的错字,从而提高模型的抗干扰能力。
2、使用python分词工具jieba包对清洗后的语料进行分词,同时删除停用词和低频词。
3、建立词袋模型,依据TF-IDF算法计算各词的重要程度并做加权处理。
4、使用LSI对TF-IDF词袋模型进行降维,剔除小的奇异值,将文档特征空间变为文档概念空间。
5、梳理电销总体流程,提取电销流程中的各个场景,针对不同场景设置多种意图样句。
6、将客户的实时对话数据与各样句比对(概念向量之问使用内积的夹角余弦相似度计算比原来基于原文本向量的相似度计算更可靠),大于设置的相似度阈值即识别为该场景下的对应意图。
7、进行电销的对应话术,完成一轮人机对话。