在标准化方面,全业务IVR采用W3C标准的VXML脚本技术来进行流程定义。传统的VXML脚本主要设计为呼叫类的自动交互,并具有强大的流程定义能力和第三方业务集成能力,通过对VXML进行简单的升级改造,使之能够同时支持多媒体通道和视频通道,具有非常重要的意义。交互式应答系统的内部构架如下图所示,其主要功能是完成对全业务流程的解析,形成流程模型,并对外给出流程脚本与解析工具。
交互式应答系统的内部构架
根据抽象层次的不同,大致可以把NGN的业务生成技术分为API级、脚本(Script)级和构件/框架级3类。API级的业务生成方法是指基于相应的API规范直接开发业务,与脚本级和构件/框架级的业务生成技术相比,API级的业务生成技术可以获得最大的灵活性。脚本级业务开发比API级业务开发的抽象层次更高,它屏蔽了底层软件的线程控制、资源提供、API调用等复杂的编程问题,更适合对业务流程较为了解而编程能力不强的业务开发人员,而且通过限制脚本语言的能力,还可以确保基于脚本的业务逻辑不能进行一些容易出错的操作,提高了系统的安全性。构件/框架级业务生成方法的主要思路是把API封装成具有一定功能的构件,基于这些构件来搭建更高抽象层次的业务框架,业务的开发基于构件和框架进行。
基于脚本的业务生成技术在电信领域和Internet领域由来已久。传统智能网中业务生成的一个主要思路就是用GUI的SCE(Service Creation Environment,业务生成环境)工具生成符合厂家专用规范的业务脚本,由同一厂家的业务控制点(Service Control Point,SCP)解释执行。但是,传统智能网是一个封闭的体系,业务脚本规范也都是由各个厂家自己制定,这种状况不利于业务的移植。因此,制定统一的业务脚本规范已成为必然的趋势。在Internet领域,HTML、DHTML、JavaScript、ASP、JSP等多种脚本技术为用户提供了丰富的网络应用,而XML的出现又为脚本技术的发展提供了新的方向[2]。XML良好的数据表示能力非常适合描述不同领域的各种业务,而其方便的可扩展性又十分适合业务不断发展的需要。目前出现的基于XML,并针对融合网络业务的脚本语言主要有CPL(Call Processing Language,呼叫处理语言)、VXML和XTML(Extensible Telephony Markup Language,可扩展电话标记语言)。
IBM、Lucent、Motorola、ATT这4家国际巨型公司于2000年提出了一种应用于语音浏览的标记语言——VXML规范。该规范建立于XML规范的基础上,是语音浏览技术的核心。从某种意义上说,它是一种语音数据交换标准。W3C采纳VXML作为W3C的对话标示语言的开发基础,标志着VXML 已成为正式的国际标准。服务商可以利用VXML开发自己的语音服务功能,例如语音电子邮件、实时信息查询、个人语音助理等。同时,它在电子商务领域具有很好的应用前景,电子商务服务提供商可以利用VXML开发自己的语音电子商务平台,从而推动电子商务信息的标准化和互通性。
VXML定义为允许用户与Internet通过语音识别技术进行交互的一种技术。使用VXML,用户可以聆听浏览器输出的音频,这些音频可以是预先录制的,或者是计算机合成的,用户还可以通过自然的讲话或键盘向浏览器提交音频输入。VXML也可以被描述为一种电话组合语言,用于提供电话接入内容和信息的语音应用。VXML是一种高级抽象的语言,开发者仅需少量的培训就可使用,使得快速生成新的应用更加容易,而且隐藏了低级编程问题。VXML也执行逻辑,基于VXML的语音业务的主要组件包括标签、格式和定义内容的规则、解释和呈现音频内容的语音浏览器。VXML平台被广泛应用,许多设备商加入到VXML论坛的会员。
VXML 有以下优点。
①通过在每个文档中指定多个交互式对话,最大限度地减少客户机和服务器之间的交互,通过和执行平台之间一系列的交互对话,用户可以浏览语音服务。
②使得程序员不用理会底层和平台特有的细节,将该领域的程序员从底层编码解脱出来。
③使得用户交互的代码(在VXML中)和业务逻辑(例如CGI脚本)分离,最大限度地将Web开发和Web内容传输的能力带入语音应答系统中。
④提高业务在不同平台的可移植性。VXML对内容提供商、工具提供商和平台提供商来说是一种通用的语言。
⑤它可以很容易地应用到简单的交互中,也可以通过提供一些语言特性来支持复杂的对话。