什么是人工智能?Nuance认为人工智能的本质是要重塑人和科技之间的关系,使人可以用更加自然顺畅的方式与机器进行交流,从而掌握和使用愈加复杂和先进的科技。这也是未来人机交互技术发展的重要趋势。
在之前的文章中我们谈到Nuance在人工智能方面具有四大核心技术,即智能交互技术,个性化,情境化及知识。本文将就这四大核心技术进行更为具体的介绍。
智能交互
智能交互需要运用语音、自然语言理解和对话技术以支持高质量以及类人的协作式对话。这其中包括:
深度自然语言理解。想必大家对自然语言理解技术都有一定的了解。现在大部分的自然语言理解技术能够实现的是从一句话中提取一个指令。但如果一句话中包含了多个主题,甚至语义发生了转折,现在的自然语言理解技术还不是能够很好的理解这样的指令。
例如下面这句指令“我想去一家意大利餐厅,之后再看一个法国电影。”这一句话中至少包含了两个事件,“意大利餐厅吃饭”以及“看法国电影”,这不仅需要技术对两个事件进行关键信息搜索,还需要对两个事件进行先后顺序的排列,这就超出了一般自然语言理解技术的范畴,需要运用深度自然语言理解进行处理。
自然语言生成。现在的语音交互系统大部分是经过提前设计的,需要遵循一个固定的流程,当对话到达某一个固定的阶段,系统的反馈一定是类似的,有的时候甚至是一成不变的。这样的交互并不能够提供和人一样交流的体验。而自然语言生成能够结合用户的个性化信息以及情境化信息做出反馈,而每次的反馈也是不一样的。
例如我们发出指令“导航到附近的洗车中心”,现在我们能够预料的系统反馈基本是会为我们提供一个列表,让我们选择去哪一个洗车中心。而拥有了人工智能之后,系统会结合分析更多的信息,给出“明天有降雨,您确定要洗车吗?”这样更加贴心,类人化的回馈。
个性化和情境化
个性化指的是运用机器学习的用户模式提供了高度针对性的预测和建议。
情境化指的是汽车助手可以根据当前驾驶员和汽车的环境对自己的行为作出调整。二者相结合能够为用户提供更加贴心的使用体验。
当用户发出一个语音指令,指令通过语音识别和自然语言理解之后,这一指令并没有被直接送往内容库和知识库,去寻找相关的答案或者触发相关的操作,在此之前系统会再综合集成用户的个人偏好。例如用户在搜索停车场时,系统就会考虑用户是比较关注价格,还是比较关注距离,以及天气,燃油剩余,地理位置的情境化的信息。之后再给出一个优化的搜索结果。
知识
知识是指系统在原始数据和内容变得相关时提供给驾驶员。
例如在上图“在Texas广场附近找一个停车场”的任务中:
知识负责从传感器、本地数据库、云和其他来源的有价值的情境化信息的融合。
个性化和情境化负责高度针对性的例如“更加便宜”“距离更近”等个性化和情景化的推荐。
智能交互能够让驾驶员很自然表达自己的意图,通过自然语言生成将建议反馈给驾驶员,驾驶员还可以进一步选择改进建议,最终驾驶员确认并触发系统后续行为。
通过智能交互,分析用户个性化以及情境化信息,经过推理引擎,最终结合知识库,Nuance为用户提供了协助式的对话管理。它是基于任务的,具有协助功能,旨在帮助用户简化交互过程,帮助用户更快更有效的找到他们想要的,更符合他们意图的内容或完成相应的操作。这样,在驾驶的过程中,尽量减轻他们的手,眼,大脑思维产生的额外负担,更加方便快捷的完成任务。