Solution Design(解决方案设计)是管理学中一个重要的方法论,它为项目管理的需求调研、目标定义、效果保障指明清晰的方向,简单又不失完整,在项目实施过程中也广受架构师、项目经理的欢迎。近年来,随着智能客服的大力推广,企业越来越注重成本和体验。
以电商场景为例,阿里巴巴智能服务事业部推出的个人购物智能客服——阿里小蜜就能够在节省服务成本的同时,为消费者提供优质、贴心的服务。在阿里小蜜的产品设计中,为了保障孵化搭建及应用效果的持续提升,智能客服的核心技术——语义模型也在产品化的过程中设立了人工智能训练师这一角色,主导完成方案设计、模型搭建。相对于算法工程师对AI算法的建立,人工智能训练师则承担着技术连接业务的工作。
今天,我们就为大家揭秘,在智能客服的语义模型搭建中,人工智能训练师是如何连接智能和服务,进行模型搭建设计的。
解决方案设计
语义模型是智能客服的核心,该模型的能力直接影响着智能客服的表现。
如图1,一个智能客服的语义模型是由多个角色的合作共同完成的:人工智能训练师负责数据的收集、标注等;算法工程师使用数据进行机器学习和模型训练。
训练好模型并完成评估后,模型将由研发工程师进行发布和上线;语义模型的迭代更新也遵循这一流程。可以看出,人工智能训练师在该流程中承担着模型数据提供的重要职责,而这项任务可以由解决方案设计方法论指导,分步骤完成。
图1:多个角色合作搭建智能客服语义模型
通常情况下,语义模型搭建需要通过四个步骤来完成解决方案的设计(如图2)。
图2:四个步骤完成语义模型搭建方案设
1、理解客户业务
要设计符合需要的解决方案,需要对当前服务场景有深入的了解。包括:当前服务的核心目标,服务团队的组织架构,终端被服务客户的现状等。这些资料的调研及整理,有助于项目中的各个角色更多地了解服务全链路业务,提供更好的支持。以阿里小蜜为例,需要调研的是阿里巴巴的服务目标、阿里巴巴的客服团队组织架构、阿里巴巴消费者的消费行为、服务诉求信息。
2、定义客户需求
“定义整体项目”,是描述本次模型搭建要做什么、为什么做,并要得到项目发起人的认可,人工智能训练师应在模型设计前明确项目的整体定义。
从全局上定义项目活动,有助于清晰地梳理模型需要解决的问题是什么,为解决方案的设计打好基础。不清晰的项目定义更像是一个idea,比如:“我要做一个能够替代人工客服的智能客服”;而清晰、可实施的项目定义则应是:“目前通过数据分析,阿里巴巴的消费者每天会咨询大量简单、高频重复问题,占比约为80%。这部分可以通过智能客服来回答,以实现部分替代人工的目的。
我需要的项目角色是……,项目成员是……”,一个完整的项目定义应包括目标、背景、目标方案和整体方法、范围、计划框架和组织等。
当然,根据项目的业务范围大小,目标需要有相应的设定。如“目前阿里小蜜在消费者诉求为退款的意图识别中,错误率有50%。这部分需要通过算法模型的优化来解决,以提升智能客服的解决率”也是一个清晰的定义,即便项目的产出物并不像“做一个智能客服”那么宏大。在模型设计中,可以逐步迭代项目的定义目标,并分步骤进行。
需要注意的是,整体项目定义中,项目的背景必须有可信的数据支撑,而项目可实现的数据目标则可以不急于定论,只要有一个清晰的方向即可。这一目标可以在业务需求定义或者是解决方案设计环节完成。
完成项目的整体定义后,即开始罗列需求点,并定义项目的边界。需求点和边界的定义,为项目及其产出物的能力范围设定了清晰的要求,即“有所为有所不为”。确定需求点的过程是一个和客户反复对焦的过程,需要深入客户的业务,全面理解客户的想法,才能把需求挖掘清楚。在这个过程中,人工智能训练师会全面归纳业务场景,然后从场景入手去确定需求点、定义项目边界。
以阿里小蜜为例,人工智能训练师可以基于对服务业务的理解和数据分析,将咨询服务归纳为几种类型的活动,然后明确阿里小蜜的能力范围:
-
支持:简单知识问答,比如流程咨询:“在哪里可以看到我的全部订单”;
-
支持:涉及消费者的任务处理,比如导购任务:“我想挑一个给妈妈用的老人手机”;
-
支持:非业务聊天,即一般性闲聊,如“你好啊”“陪我讲个笑话吧”等;
-
不支持:商家的业务工单处理,如“帮我处理下我店铺的订单退款吧”;
由于阿里巴巴业务复杂,服务的业务范围也非常广,有些需求并非无法实现,只是需要在特定项目周期内确定需求范围及边界,以保障健康的项目迭代。人工智能训练师需要在这个过程中,把项目希望实现的活动全面、清晰地列示,说明清楚哪些是不做的,再附上相应的真实场景原声。根据这样的需求调研和业务解释,算法工程师就可以清晰、高效地了解业务,以便对于需要设计和应用什么样的AI算法模型有一个大致的判断。
需求确认完毕后,人工智能训练师就可以和算法技术团队一起,根据技术能力来初步判断模型可实现的目标。
3、设计解决方案
3.1 资源采集和分析
解决方案的设计需要确定的业务场景,即在项目需求范围内进行深入、细致的资源采集和分析。作为智能客服,算法模型设计和使用效果的提升离不开真实的客户聊天数据,同时对于服务的回答予以判定“对”、“错”,形成标准样本供AI进行学习。
人工智能训练师需要在深度和广度上都全面地采集这部分数据,同时做好分析工作:比如,将服务诉求进行归类,并透视用户诉求的占比分布;或采集现有服务中的问题,并分析问题产生的原因,等等。这样的分析可以方便算法工程师迅速了解现象、原因及严重程度占比,在信息互通及良好协同的基础下,快速给出算法方案的判断。在上一步骤(即需求确认阶段),真实场景原声的收集是一个让技术、产品成员快速了解客户业务的方式,但这种列举仅仅是增加感性层面的认证,对于模型的搭建来说则较为初级和原始。
在统计学上,有一个重要的概念:独立同分布。即随机过程中,任何时刻的取值都为随机变量,这些随机变量服从同一分布,并且互相独立。以淘宝为例,消费者的服务咨询都属于独立行为,不会受到彼此影响,所以在数据采集上,人工智能训练师需要遵循这个原则,以便确保采集的数据和业务实际是一致的。如果采集的数据有偏离,比如闲聊偏多、业务相关问题偏少;或漏采集了某类知识问答,则会影响最终的算法模型表现,或者测试效果和实际使用效果有较大差距。
理想情况下,用于算法模型训练和效果验证的数据应该保持独立同分布,且和实际分布保持统一。然而,在数据采集活动中,往往会遇到资源缺少的情况,在这种情况下遵循独立同分布进行数据采集会有一定的挑战。所以,还需要人工智能训练师运用数据分析的方法,同时借助一些工具,进行数据的清洗或构造,以便使采集到的数据更加接近真实情况下的独立同分布。
3.2 核心能力设计
数据采集、分析完毕后,人工智能训练师需要和算法工程师协同选取和制定模型的核心能力。人工智能训练师从业务上梳理业务对算法能力的要求,算法工程师从模型能力特点上确定适合、匹配的算法模型。以图3为例,人工智能训练师和算法工程师需要紧密配合,共同确定模型的核心能力:
如果服务的问题较为封闭,且有明显的分类性,即用户的咨询集中在几类知识上,且知识之间的差异性较大:比如在某售前场景下,用户关注的问题可能会集中在“是否有库存”、“我应该选什么尺码”、“发货方式是什么”、“付款方式是什么”,这时,较为合适的算法核心能力应为分类算法。
当服务的问题较为开放时,没有特定的类别区分,即用户的问题存在种类多、高发散性的特点,这时,语义相似度算法(无监督)则更为适用。待语义相似度算法模型上线后,如果有人力可以投入机器人回答“正确”“错误”的数据校验,则适合在相似度算法的基础上引入精确排序算法(有监督)。
服务知识为非结构化文本时,即知识并没有被整理成 “知识标题、知识答案”结构时,可能会面临着这些挑战:知识维护人力不足,没有足够的资源投入“知识标题、知识答案”结构的拆解;知识的时效性要求高,比如一小时超短促销活动规则,投入大量人力进行拆解性价比低;知识从获取到发布的周期要求紧迫,对时效性的要求很高。在这个场景下,机器阅读理解技术是解决这些问题的不二之选。
图3:根据业务特点确定模型的核心能力
确定好解决方案的核心算法能力,接下来还需要细化评估当前采集到的数据在搭建核心能力中的使用方法,以及还需要构造、采集和标注哪些数据,用来搭建这一核心能力。
需要指出的是,在弱人工智能时代,虽然算法模型搭建离不开大量的数据积累,但算法的技术进步、人工智能训练师的数据分析工作可以减轻模型对于数据量的依赖,或者将需要的数据量级逐步降低,即并非只有大量的数据标注工作才是算法模型能力提升的唯一道路。
3.3 可行性评估、风险及依赖项沟通
模型设计完毕后,还需要和产品经理、研发人员进行可行性评估,找到相互依赖的合作内容,并互通研发风险。在分析可行性时,要梳理好前期工作中发现的风险、假设、问题和依赖,并制定应对措施和可能的行动计划。
4、方案宣讲沟通
模型设计方案确定后,还需要进行项目核心成员的沟通、宣导,确保项目组成员对算法模型有一定程度的理解,以便更好地投入生产开发。除此以外,还有必不可少的客户宣讲环节。通过科普性讲解,让客户能够走进智能,培养建立一定的客户心智,方便后续的产品使用。
5、展望
不难看出,目前人工智能训练师已在智能语义模型设计中起到了相当重要的作用,其核心能力在于对业务的深入理解、对场景的系统化抽象的总结,以及业务的精准解释表达,连接先进的AI技术和业务场景。
随着智能服务的推广和传播,阿里巴巴在将小蜜系列产品推广至商家、企业、海外服务领域的同时,也将“人工智能训练师”理念持续推广至合作伙伴、服务供应商和服务需求客户中。目前,已有累计超过2万的客服人员在阿里巴巴店小蜜、云小蜜认证系统通过了人工智能训练师的学习和认证,助力智能服务的应用。人工智能训练师越来越深度地参与在智能产品的搭建与设计,我们相信,未来以AI为核心的智能客服等一系列产品的搭建成本将进一步降低,产品的体验也会越来越好。
作者为曹雨菡(戏墨),作者为阿里巴巴集团智能服务事业部高级人工智能训练师;