11月15日-17日,第23届亚洲语言处理国际大会(IALP)在中国上海举行,会议由中文与东方语文信息处理学会(COLIPS)主办、华东师范大学承办。本次会议吸引了来自15个国家和地区约100位大学、研究机构和工业界的研究人员前来参会。小i机器人与阿里巴巴达摩院、复旦大学等知名院校企业一同受邀出席大会,探讨东方语言信息处理领域未来的创新和发展,并围绕知识图谱的建设、应用与发展发表了主题演讲。
知识图谱作为自然语言处理技术的应用之一,在帮助机器理解自然语言方面具有重要意义。小i机器人研究院算法研究员沈大框在大会上提到,知识图谱最早是由Google提出,主要是用来优化现有的搜索引擎。不同于传统的基于关键词检索的搜索引擎,知识图谱基于预先构建的实体属性关系三元组内蕴含的丰富的关联信息,能够更快速有效地反馈准确结果,并提供更丰富的关联参考信息,让搜索引擎从关键词检索向语义检索迈进。
小i机器人研究院算法研究员沈大框
目前,知识图谱主要有自顶向下(top-down)与自底向上(bottom-up)两种构建方式,而这两种构建方式都离不开知识抽取这一步骤。沈大框在此次大会上分享到小i机器人在构建知识图谱的过程中提出了一种基于BERT的管道式的关系抽取方法,可以从各种信息源中抽取三元组关系知识,并集成到现有结构化知识库中。该关系抽取方法先识别句子中存在的关系,然后根据关系抽取句子中的主语和宾语。存在关系识别可以看成一个多标签分类任务,模型使用BERT获取深度语义信息,然后增加CNN网络获取句子的词性与分词信息极大提升了关系识别的准确度。主语与宾语识别模型则采用BERT+CRF序列标注的方式,解决了句子中单个关系多主语或者多谓语的问题。这两种模型结合的使用,使得单句中存在多个复杂关系的抽取的问题迎刃而解。
小i机器人也在运用包括知识图谱相关技术在内的全套解决方案,以认知智能赋能行业企业的智能化升级。小i机器人为行业企业提供的智能客服解决方案便融合了知识图谱的相关能力,能够在行业领域内快速自动地生成背景知识库,辅助客服机器人深度理解用户问题,让客服系统的业务能力得到进一步提升,很好的满足银行业务、信通讯业务、保险业务、电商业务、政府公共服务业务等领域的业务需求。