本文目录一览:
1、电话机器人是什么?
2、腾讯算法高档研讨员陈松坚:智能问答技能及其运用
3、南京硅基智能的电话机器人产品有哪些优势?
电话机器人是什么?
电话机器人首要便是用来模仿人工通话电话机器人软件架构的一组程序电话机器人软件架构,一般由,CRM体系,语义辨认,转化文字,话术体系,这是软的部分,再加上底层软交换和通讯模块一同,兼并起来便是一套完好的电话机器人体系。
腾讯算法高档研讨员陈松坚:智能问答技能及其运用
跟着人工智能的飞速开展以及广泛落地运用,越来越多的设备将会被植入智能问答技能,人机交互场景随处可见,智能问答在未来将会成为一个十分重要的进口。
腾讯小知凭借着业界抢先的智能AI引擎算法和海量大数据仓库,已将智能问答技能落地施行,而且经过许多的事务检测和优化,常识点匹配度和准确率都已到达90%以上,在2018 年 GITC 全球互联网技能大会上,腾讯小知荣获年度互联网最具价值产品奖。
腾讯小知算法担任人陈松坚也在会场宣布电话机器人软件架构了关于智能问答技能原理及其在To B场景下的运用的专题讲演,从自己的视点为电话机器人软件架构咱们展示智能问答技能的最新作用。
电话机器人软件架构他首要从智能问答是什么,为什么和怎样做的三个问题动身,阐明电话机器人软件架构了他对当时智能问答技能的定位和价值,首要,现阶段的智能问答是信息检索技能的晋级,是突变而未到达突变。可是不管在To B仍是To C的场景下,当时的技能都可以实在处理一些用户的痛点,提高用户体会,是亟待推动和充溢幻想的方向。
在答复怎样做这个问题时,他具体介绍电话机器人软件架构了几种不同的问答机器人的完结途径,包含单轮问答机器人,多轮问答机器人及阅览了解机器人。其间要点论述了单轮问答机器人的完结原理,包含字面匹配,词向量匹配,深度语义匹配,搬迁学习等技能。
尔后他还同享了小知团队将上述技能产品化的经历,包含智能客服机器人和电话机器人两大块,首要同享了当时产品的形状,亮点和实践项目中获得的一些作用。
终究,他简略总结了小知现在完结的作业以及就智能问答的开展提出了自己的几点观点。
--------------------------------------------------------------
以下是讲演稿全文:
各位下午好,很快乐今日能在这儿给咱们做同享陈述。先介绍一下,咱们腾讯小知是致力于为政府和各职业供给一揽子智能问答处理计划的团队,现在现已落地的包含依据文本的智能客服机器人和依据语音的电话机器人等。
在大多数人的认知里,智能问答很或许是以上的3个形象,2011年打败了人类获得问答比赛冠军的waston;2017年被沙特颁发公民身份的机器人sofia;更为咱们熟知的钢铁侠中的机器人管家jarvis。在咱们心目中,智能就意味着可以像真人相同沟通。可是作为从业者,很惋惜地告知咱们,现在的技能还远没有到达这个方针,我以为本质上现在的智能问答技能是对信息检索技能的一次晋级,是突变而未到突变。这个皇冠上的明珠还等待咱们去摘取。
已然问答技能还不老练,那为什么还要投身到这个范畴呢。我想从To B和To C两个视点去答复。对企业来讲,当时的问答技能尽管无法回答杂乱的咨询,可是大部分的简略的头部问题是可以比较好的回答的。从本轮AI大潮NLP赛道的几名种子选手都从智能客服这个方向切入就可以看出企业是的确存在对智能问答的刚性需求。而对普通用户来讲,一方面siri等语音帮手每天都在为用户供给快捷的交互界面,另一方面像amazon echo这一类的智能家居产品也逐渐进入千家万户,成为物联网生态的中心进口之一,这便是智能问答的价值地点。
那怎么完结智能问答机器人呢?咱们先来看最根本的单轮问答机器人的完结原理。
了解搜索引擎的朋友会发现这个架构跟搜索引擎的很相似。单轮问答一般来说便是FAQ问答,是依据事务问答对组成的问答库进行检索匹配。其间FAQ问题集包含多个相似问法供用户问题去匹配。预处理阶段一般会进行文本纠错,标准化和底层NLP特征提取;召回阶段会在倒排索引中召回若干个候选问题(粗排),而终究的匹配阶段会依据各种模型进行匹配打分并回来得分最高的成果(精排)。匹配阶段还会引进其他模块,如常识图谱和拒识模型,目的是辅佐提高匹配的终究准确率。
retrieval中的匹配可以看做是naive solution,词袋+VSM, 挑选候选够用了,可是精排需求更精美的战略,榜首,要运用监督信息做拟合,咱们构建依据问题对的练习语料,拟合是否匹配这个二分类方针。第二,特征上扔掉稀少的词袋模型,而是结构各种相似度来做base scorer,然后运用非线性的抗噪才能强的xgboost来做交融,比方咱们用到词bigram, 字bigram, 中心词,名词等特征调集的相似度。这种办法的优缺点是一体的,由于模型只学习字面相似的特征,因而不受范畴影响,通用性强,合适用在冷启动阶段;但也由于只考虑字面相似,无法处理更深层的语义匹配。
那怎么衡量语义的相似呢。词向量技能的鼓起是语义匹配的条件,所谓词向量,是将孤立的传统的token表明映射到彼此相关的向量空间中,这种相关性,或许说是相似性,是经过词语的上下文的来描绘的。也便是说,上下文越相似的词语,他们的语义就越相似,词向量的欧式间隔就越近。这是很简略了解的,更妙的是,经过对向量进行简略加减运算,可以呈现出概念的联系,比方king-man+woman的成果十分接近于queen, 因而阐明词向量可以必定程度描写语义。那对语句怎么做向量表明呢?一个简略的主意是直接求和均匀,WMD是另一个比较有意思且有用的做法,他将核算语句到语句的相似度建模成一个运送的问题,把语句p的各个词,运送到q的各个词上,也可以说是改换;运送成本是词向量的cosine相似度,而要运送的是各个词在语句中的权重,用线性规划求解一个最优解,即为p到q的间隔。别的还有个有用的办法是SIF,思路是做词向量加权求和,可是突显出语句中非通用的部分,即权重用词频倒数来核算权重,试验作用也很不错。
上面的办法有一个问题便是没有运用有监督信息,所以作用有显着的天花板。下面介绍这个作业是依据深层网络做有监督学习的匹配的,做法也比较简略,首要把语句文本用one-hot编码,假设词典巨细是500K,那编码完长度便是500K维,其实等于是词袋模型,然后输入到一个多层的神经网络去学习,终究得到一个128维的向量作为语句的语义表明,然后用cosine核算两个语句与文档的相似度作为模型输出。这个办法其实是将高维稀少的token特征映射到低维语义空间,跟词向量的思路很相似,只不过练习方针不同,而且这儿运用了深层网络结构。
可是CNN对上下文的处理才能依赖于窗口巨细,远间隔就没办法处理了,因而要考虑另一种网络单元RNN,这种单元是专门为时序模型量身打造的,简略来说,每一时间t上的躲藏状况,或许说第t个词上的语义编码,都由两个输入一起决议,即上一时间的躲藏状况和当时时间的原始输入,而为了处理远间隔传递导致的梯度消失和梯度爆破等问题,RNN有一些变种结构来应对,比方 LSTM和GRU等。
CNN和RNN都是对原始输入进行语义编码的根本单元,编码后的向量就可以接入多层感知机进行相似度核算,假如是直接核算cosine相似度,那便是dssm的晋级版,而更常见的做法是把两个语句的编码向量拼接在一同,再经过一个多层感知机核算相似度,而这种办法统称为表达式建模;
另一种计划考虑到两个语句之间的交互信息对学习他们是否匹配明显更为重要,这一类计划被称为交互式建模,右边是一个典型的比方,他最大的不同是首要对两个语句的一切窗口组合进行拼接和卷积,得到交互信息。然后再进行屡次卷积和池化得到表明。其他的交互方法还包含编码之后,进行交互操作,如作差,点乘等,还有核算attention表明,也是常见的交互方法。
下面介绍咱们的计划,跟上面介绍的模型比较,咱们的计划首要做了两处改动,一个是运用了稠密衔接的网络结构,让rnn层的输入和输出拼接在一同做为下一层的输入,第二个是混合注意力机制,即在核算attention向量进行交互式建模的基础上,添加self-attention向量核算,然后把两个attention向量经过门机制进行交融,这样做一方面引进了问句间的交互信息,一起又增强了对本身的表达建模。
上面的模型是比较杂乱的模型,参数量有5.8M。在实践中运用中练习语料会严重不足,为了处理这个问题,咱们引进了搬迁学习的战略。首要榜首种是多使命联合学习,比方在拟合两个问句是否匹配的一起,也对问句进行分类猜测;别的还可以一起对匹配的问题对做seq2seq的翻译模型练习。这两个战略都证明能有用提高准确率。
而另一个思路愈加直观,即引进其他范畴的语料,所谓多语料搬迁。Fine-tune即参数微调是其间一种做法,即先用通用语料练习网络,固定底层表达层的参数,然后再运用范畴语料调整上层参数;另一种思路参阅了对立学习的思维,即引进一个新的使命“混杂分类器”去判别当时样本是来自源语料仍是方针语料,经过在丢失函数中添加反向的混杂分类丢失项,让混杂分类器尽或许地无法区别样本的来历,然后确保同享了参数的表达网络可以学习到两部分语料中共性的部分。
以上的介绍都是为了完结一个根本的单轮对话机器人,而实践运用中,往往存在需求需求交互的场景,比方查询社保余额,就需求用户供给指定信息,如名字,身份证号,手机号等。这种是所谓使命导向型机器人,而另一种,依据常识图谱的机器人也往往会涉及到多轮交互。这儿简略介绍一下多轮对话机器人的架构,全体上是一个对话办理体系,总的来说是办理会话状况,包含4个模块,分别是输入部分:自然言语了解模块NLU,担任目的辨认和抽取槽位实体,比方这儿匹配到了目的是查询社保余额,抽取到了社保号1234。得到的目的和槽位值会送入到对话状况追寻模块,DST,他担任会话状况的更新,形式化来说是一个函数,输入是当时状况s和当时的query经过NLU处理过得到的目的和槽位值q, 输出新的状况s‘,下一步是把s’送入DPL,对话战略模块,这个模块是依据新的状况s‘输出举动a,一般这个决议计划挑选会依赖于一个外部数据库或常识图谱,终究,由输出部分,自然言语生成模块NLG担任将举动转化为自然言语文本,回来给用户。
前面说到的单轮FAQ机器人,有一个问题是问答准确率依赖于问答库的质量,而问答库的构建耗时吃力,所以针对数据较大的非结构化文档,假如可以直接从中抽取答案,是十分抱负的做法。比方斯坦佛大学开源的drQA,便是依据wikipedia的语料做的一个敞开域上的问答机器人,咱们来看看这种阅览了解机器人的架构暗示,他也是依据检索重排的思路,首要把或许的文段从语料库中摘取出来,然后送入阅览了解模型进行答案定位,打分,排序和挑选得分最高的答案。阅览了解模型与匹配模型是相似的,需求先对问题和候选文段进行编码表明,不同之处在于终究猜测的方针是答案的开始和完毕方位。我地点的团队在上一年,在阅览了解的威望揭露测评Squad v1中获得过榜首的成果,一起参与这个测评的包含了google, facebook, 微软,阿里idst, 科大讯飞等国内外同行。阐明业界对这种技能仍是十分垂青的。
下面同享小知在把以上技能落地产品化的经历。首要咱们来看看小知的全体架构图,中心引擎有两部分,一块是上面要点论述的深度语义匹配模型,另一块是本次同享没有打开的常识图谱引擎,在此之上,咱们构建了FAQ机器人,多轮会话机器人(使命机器人),闲谈机器人等。以下是咱们单轮和多轮机器人的示例。
在咱们实践的落地项目中,得益于深度搬迁模型的语义匹配才能和职业常识图谱的的精准匹配和辅佐诘问,小知机器人可以做到95%左右的问答准确率,而且节省了50%以上的服务人力,实在为政府和企业提高功率和下降成本。
在智能客服的基础上,咱们又打造了依据语音的电话机器人,力主交融智能客服,人工在线客服,工单体系和电话机器人,为客户打造从售前售中售后的全体处理计划。
以下是电话机器人的全体架构图,中心是自然言语了解NLU模块,担任辨认用户发问目的
提取相关实体。依据NLU输出的成果,内置的对话办理引擎会进行流程状况流通和盯梢。
别的,ASR语音辨认和TTS语音组成是不可或缺的重要服务,这三个模块彼此协作,一起完结与用户的交互。
终究对智能问答的未来开展提几点我的观点。现在学术界比较公认的一个方向是,需求更有机地结合模型和规矩,而在问答范畴,规矩的一大组成部分便是常识图谱,包含敞开范畴的常识图谱和专业范畴常识图谱。而更进一步地,咱们需求研讨带有推理性质的事理型常识图谱去描绘范畴内的规矩和常识,让机器人可以处理带有杂乱条件的问题,供给更智能的回复。在我看来,智能问答的一个突破口就在于处理以上三个问题。以上便是今日同享的内容,谢谢咱们。
主讲人介绍:
陈松坚,腾讯数据渠道部算法高档研讨员,有着8 年的 NLP 研制经历,2017 年参加腾讯 TEG 数据渠道部,担任智能客服产品腾讯小知的算法规划和落地。担任过多个智能客服项目,对关闭范畴的智能问答有丰厚的实战经历。
南京硅基智能的电话机器人产品有哪些优势?
南京硅基智能电话机器人的优势有许多的,我给你简略说几个:
1、依据自然言语了解、 支撑打断:经过大数据分析,树立智能决议计划反馈体系,练习适配事务场景的言语模型。
2、人工转接:经过语义辨认和处理功用可对客户的意向进行实时盯梢,主动转接人工跟进,下降客户丢失的概率。
3、定制化:产品选用模块化软件架构,能快速构建适配不同事务场景需求的定制模块。