(1)用户(语音) -大于语音识别:电话机器人不能识别语音,第一步骤是将用户发出的语音转换为字符,该步骤需要依赖于语音识别技术。 仅仅是语音识别,是一种复杂且需要持续投入的技术,因此电话机器人的制造商很多,使用这些大制造商的语音识别技术。
(2)语音识别–(文本)–>自然语言理解:此时,用户说的话已经通过语音识别转换成了文字,而电话机器人拿到文字后,需要利用自然语言理解,来识别用户的意图,通俗的来说就是理解用户在讲什么。
(3)语言识别–(意图)–>对话管理:这时候,机器人已经识别了用户的意图,下面电话机器人就需要决定改如何回复用户的问题了。比如说是继续按照正常对话流程往下走,还是需要先回答用户的疑问?抑或者需要重新把刚才说的话再说一遍?
(4)对话管理–(触发)–>预置话术:此时的机器人已经知道该回复用户的具体内容了,这时候就该组织回复的语言了。而一般来说,这些话术都是预先设置好的,等需要用到这块内容的时候,从这块内容对应的话术中抽取一条出来回复就好。在回答同一个话题时,话术不重复,给用户更好的体验。
(5)事先讲话- (调用) -大于人工录音:当然,如果知道机器人需要回答哪个讲话,就必须调用与这个讲话对应的录音。 结果,我们在打电话。 此时,为了使营销效果更好,大多数客户都选择播放真人录音。 结果,这个效果更真实。 正因为如此,人工录音的效果,很大程度上左右着前端用户接电话时的体验。