本文目录一览:
-
1、阿里小蜜的架构设计
-
2、一台移动的小型机器人有哪些结构?
-
3、如何搭建chatbot以及聊天机器人理论框架
阿里小蜜的架构设计
本篇总结了阿里小蜜从2017-2020年的演进过程,更偏向架构体系上的介绍,不对具体技术做详细介绍。具体技术部分会放在后面的文章中。
来自2017年的分享 拆开阿里小蜜的内核,看智能人机交互的实现逻辑
阿里小蜜主要对接的机器人有客服、助理、聊天,根据不同场景的需求采用不同的机器人。后面有说到小蜜主要应用的3大领域场景:智能导购(助理)、智能服务(偏问答)、智能聊天(聊天)。阿里小蜜将对话系统分成两层:
具体思路如下:
通常我们将意图识别作为分类问题来解决;在阿里小蜜中,也存在对话领域语义意图不完整的情况,因此除了传统的文本特征之外,还加入了实时、离线等用户本身的行为以及用户本身相关的特征,通过深度学习方案构建模型,对用户意图进行预测。
另外,在基于深度学习的分类预测模型上,阿里小蜜有两种具体的选型方案:一种是多分类模型,一种是二分类模型。(但是没有详细介绍分别在什么场景下用多分类或者二分类?)对于多分类和二分类的优缺点衡量如下:
主流的智能匹配技术分为如下3种:
智能导购对应的是任务型机器人,技术架构如下:
智能导购的意图理解主要是用户想要购买的商品以及商品对应的属性,相对于传统的意图理解面临的挑战有:
基于以上问题,阿里小蜜通过品类管理和属性管理维护了一个意图堆。以下分别是品类管理和属性管理的架构图,方法都大同小异。
品类识别采用了基于知识图谱的识别方案和基于语义索引及dssm的判别模型:
阿里小蜜的语义索引是结合搜索点击数据和词向量构造的,主要包括下面几步:
我的理解是,语义索引是一种召回方式。
具体样本构造
属性管理的思路可以直接参考品类管理,具体架构图如下:
部分细节需要说明的是,品类关系在智能导购中主要考虑的关系是:上下位关系和相似关系。(补充:在知识图谱构建中实体与实体之间的关系,包括但不限于上下位、顺承、时序等。)
上下位关系计算的2种方案:
相似性计算的2种方案:
这里只总结下阿里小蜜如何定义action、state、reward:
智能服务对应的是问答型机器人,小蜜采用基于知识图谱构建与检索模型。
基本的挖掘框架流程如下:
基于知识图谱匹配的优缺点:
基于检索模型的对话匹配的流程:
检索模型整体流程如图:
智能聊天对应聊天型机器人,目前主要有两种技术:
内容主要来自于 2018 - 阿里小蜜这一年,经历了哪些技术变迁?
算法方面本质上变化不大,新增了一些功能模块。
通过对话管理系统的控制,面向不同的领域场景采用不同的领域技术:
与2017年相比,增加了Rec Bot和MC Bot。另外,随着阿里小蜜平台的扩展,部分领域存在难以获得或者标注数据量不足的问题,因此开始引入迁移学习。
应用背景:(从各分享文章推测,阿里小蜜平台应该是2018年推广到其他业务)
基于机器阅读理解模型的在线问答流程如下图所示:
具体说明:
2019-01 - 未来已来!阿里小蜜AI技术揭秘
整体架构体系上基本没什么变化,相比之前,2019的分享在任务型机器人中新增了slot,应该是在动作判断中采用意图+slot去做决策。
2019-09 - 干货 | 阿里云小蜜对话机器人背后的核心算法
从2019年下半年开始的分享内容有了很大的改动,主要体现在:
内容来自于 2021-01 达摩院Conversational AI研究进展及应用 。由于是2021年初的分享,所以放在了2020年。
2020年的分享与2019年下半年的分享内容比较相似了,持续在技术深度上探索。改动点在:
一台移动的小型机器人有哪些结构?
到目前为止接打电话机器人架构设计,地面移动机器人的行驶机构主要分为履带式、腿式和轮式三种。这三种行驶机构各有其特点[2]。
(1)履带
履带最早出现在坦克和装甲车上,后来出现在某些地面行驶的机器人上,它具有良好的稳定性能、越障性能和较长的使用寿命,适合在崎岖的地面上行驶,但是当地面环境恶劣时,履带很快会被磨损甚至磨断,沉重的履带和繁多的驱动轮使得整体机构笨重不堪,消耗的功率也相对较大。此外,履带式机构复杂,运动分析及自主控制设计十分困难。
(2)腿式
腿式机构具有出色的越野能力,曾经得到机器人专家的广泛重视,取得了较大的成果。根据腿的数量分类,有三腿、四腿、五腿和六腿等各种行驶结构。这里我们简单介绍一种典型的六腿机构。
一般六腿机构都采用变换支撑腿的方式,将整体的重心从一部分腿上转移到另一部分腿上,从而达到行走的目的。行走原理为:静止时,由六条腿支撑机器人整体。需要移动时,其中三条腿抬起成为自由腿(腿的端点构成三角形),机器人的重心便以谌条支撑腿上,然后自由腿向前移动,移动的距离和方位由计算机规划,但必须保证着地时自由腿的端点构成三角形。最后支撑腿向前移动,重心逐渐由支撑腿过渡到自由腿,这时自由腿变成支撑腿,支撑腿变成自由腿,从而完成一个行走周期。
腿式机器人特别是六腿机器人,具有较强的越野能力,但结构比较复杂,而且行走速度较慢。
(3)轮式
轮式机器人具有运动速度快的优点,只是越野性能不太强。现在的许多轮式己经不同于传统的轮式结构,随着各种各样的车轮底盘的出现,实现了轮式与腿式结构相结合,具有与腿式结构相媲美的越障能力。如今人们对机器人机构研究的重心也随之转移到轮腿结合式机构上来了。
本文设计的移动机器人不仅要求具有一般轮式机器人移动速度快、控制简单的特点,还要具有较好的越障能力,因此本文选择轮腿式相结合的轮腿机构作为行驶机构。
2.1.2 驱动形式的选择
驱动部分是机器人系统的重要组成部分,机器人常用的驱动形式主要有液压驱动、气压驱动、电气驱动三种基本类型[3]。
(1)液压驱动
液压驱动是以高压油作为介质,体积较气压驱动小,率质量比大,驱动平稳,且系统的固有效率高,快速性好,同时液压驱动调速比较简单,能在很大范围实现无级调速。但由于压力高,总是存在漏油的危险,这不仅影响工作稳定性和定位精度,而且污染环境,所以需要良好的维护,以保证其可靠性。液压驱动比电动机的优越性就是它本身安全性,由于电动机存在着电弧和引爆的可能性,要求在易爆区域中所带电压不超过9V,但液压系统不存在电弧问题。
(2)气压驱动
在所有的驱动方式中,气压驱动是最简单的。使用压力通常在0.4~0.6Mpa,最高可达1Mpa。用气压伺服实现高精度是困的,但在满足精度的场合下,气压驱动在所有的机器人驱动形式中是质量最轻、成本最低的。气压驱动主要优点是气源方便,驱动系统具有缓冲作用,结构简单,成本低,可以在高温、粉尘等恶劣的环境中工作。其缺点是接打电话机器人架构设计:功率质量比小,装置体积大,同时由于空气的可压缩性使得机器人任意定位时,位姿精度不高。
(3)电气驱动
电气驱动是利用各种电机产生的力或转矩,直接或经过减速机构去驱动负载,减少了由电能变为压力能的中间环节,直接获得要求的机器人运动。电气驱动是目前机器人是用得最多的一种驱动方式。其特点是易于控制,运动精度高,响应快,使用方便,驱动力较大,信号监测、传递、处理方便,成本低廉,驱动效率高,不污染环境,可以采用多种灵活的控制方案。
如何搭建chatbot以及聊天机器人理论框架
聊天机器人究竟是什么?
首先科普一下,了解下聊天机器人究竟是什么?Chatbot又可简称为Bot,指的是聊天机器人,注意这里的chatbot可不是实体的机器人,它是指以聊天界面为基础,可以是文本聊天,也可以是语音聊天,通过聊天解决用户需求的一种服务模式,类似于虚拟助理。
经蛋壳研究院研究了解,Bot并不是一个新玩意,甚至大部分的bot所运用的技术都较为简单。相信大家都曾经有过chatbot的体验(最简单的比如当你短信回复10086几个数字,10086就会把你当月的使用情况发送给你)。没错,chatbot很早就有了。只不过近几年随着移动通讯开始赶超移动社交,以及人工智能和大数据的兴起。Chatbot才开始被视为一种巨大的机会,有可能替换app模式,改变互联网现有的商业模式。并且从今年facebook和微软的发布会可以看到,chatbot都是他们未来重点布局的一个方向。
聊天机器人创业需要避免几个误区
就最近半年来的情形,聊天机器人至少在欧美很受追捧,虽然大量的开发者涌入,但真正做得好的并不多,蛋壳研究院认为95%的细分场景仍旧在空白状态,等着被挖掘建设。医健领域的许多创业者对这一领域尚比较陌生,对这一领域如何切入存在误区。以下几个方面值得注意。
1、聊天机器人技术门槛未必很高
一看到机器人几个字,很多朋友会觉得那就是智能领域,有较高的技术门槛。其实未必。现如今无论是自然语言处理还是AI结合大数据进行智能诊断技术层面都尚未十分成熟,个别创新公司和巨头们确有所建树,但也如大家所担心的技术门槛较高,不是什么人都能玩起来。事实上并非如此,正如本文前面解释的聊天机器人概念及基本工作模式,聊天机器人可深可浅,且有诸多开放技术平台供使用,对人工智能技术的掌握并不需要十分深入。
2、升级交互界面体验是当下Bot的主体价值
还在门外观望的创业者,许多人并不明白Bot的诉求价值是什么。其实,当前聊天机器人模式能解决的核心问题是优化交互界面,以更为人性化的沟通模式全面升级交互体验。核心价值在于界面体验,未必一定升级服务本身的价值。
为什么一些评论家认为Bot可能全面替代App,事实上是从进入界面模式的角度来说得。也就是说以后我们不是打开一个一个App去获取服务,而是打开一个Bot进行对话来获取服务。正如几年前,手机交互模式还主要依赖键盘,如今已全面转向触屏模式。
界面体验的升级看着并没有什么高智能,但却符合人们愿意“懒死”的本性,能躺着就不坐着,能坐着就不站着,动嘴皮子能解决就绝不动手。简单、直接、快捷这些好处多少能少用几个脑细胞,在一个设计妥当的聊天机器人上确实能比App体验更佳。
3、Bot与“导”相关,它可以成为流量入口
简单直接快捷,这些诉求价值点十分适合成为人们获得某项服务的入口,例如导购、导诊、导航类似的目的都会十分匹配Bot,一个有平台聚集性质的Bot可以成为一个新的流量入口。当然许多已经霸占在流量入口上的巨头会想尽一切办法再度霸占入口。这也是为什么Google、苹果、Facebook等等巨头们都在达平台Bot的重要原因。
4、Bot不是被动应答,它可以有很强的主动性
通常人们觉得我向聊天机器人问一个问题,然后Bot被动应答。但其实,Bot也可以根据情景对你进行提问、追问。这一模式更为主动,更易调动用户参与,提高用户黏性。Bot相比网页模式,更易有较强的互动性。
同样作为入口,往往承担着获取数据的职能。从机器获得数据的角度来看,Bot界面要比传统网页模式更为主动。以往传统界面你只能被动等待用户去填入信息,而Bot是可以在时间轴上不断交互的,它可以根据前提设定主动追问,定向追问,也因此更有可能获得更全面,更易结构化的数据。
无论是交互界面、个人数据采集、还是服务导航、流量入口等关键词在数字健康、互联网医疗领域无异也是重要词汇,尤其对2C端模式更是如此。数字健康领域的创业者们根据自身情况不妨想一想如何借用Bot优势提升自身产品的体验,增加卖点,提高用户黏性,提升转化率。同时有必要关注人们对Bot模式的接受度。
国内医健聊天机器人哪些应用场景更务实?
互联网医疗健康领域,过去2~3年间已有大批APP涌入,绝大多数创业团队尚在寻找更成熟可持续的商业模式。聊天机器人有何助益?在大多应用场景下以优化界面为核心价值的聊天机器人很难成为救命稻草,大多只能锦上添花。然而在某些领域,界面升级能匹配关键的价值诉求。蛋壳研究院认为以下几个方面的应用会有点意思。
养老看护切入。老年群体对APP模式接受度差,他们许多人难以适应以往的人机交互界面,聊天机器人界面更易被老年人接受。一定程度作为生活助手,处理紧急情况,起到一定的陪伴作用。然而可能通过B2B2C业务模式来推进会更佳。
快捷百科解答。也许聊天机器人模式会颠覆我们以往查字典类型的知识获取方式了。以往按各种索引查找的模式转化成聊天机器人模式后能显著提升效率,并且在有一定互动问答的模式下,更容易将有关联的知识点全面获取,避免犯下断章取义的错误。尤其在医学健康、营养保健、运动健身类知识领域,许多信息都不是单线条孤立存在的。
分诊导诊预诊。在分级诊疗大政策背景的推动下,能高效配置医疗资源,为医护人员节省精力,降低医疗部门运营成本的产品会有一定接受度。通过聊天机器人界面模式能更好的实现预诊分诊导诊。以往在这一领域深度耕耘的互联网医疗创业公司很多,竞争也十分激烈。仅以聊天机器人模式改进、优化、或新加入竞争不可能改变竞争很格局,也无法解决根本困境。最终仍旧需要多维度比拼。
医疗保健机构客服。将聊天机器人用于客服部分替代人工在许多产业已有应用,医疗保健机构也有较大的客服需求,这与其他产业的客户中心需求类似,但其本质上和医疗健康本身并没有什么关系,也是典型的2B业务。