内容发布更新时间 : 2025/1/7 6:00:39星期一 下面是文章的全部内容请认真阅读。
基于VoiceXML技术的可视化IVR系统设计和实现(一)
上海易谷网络科技有限公司 查玮 2009/09/22
摘要
为了缩短交互式语音应答(IVR: Interaction Voice Response)系统流程开发周期,克服传统IVR系统业务流程编写复杂的困难,同时与VoiceXML技术相结合,本文设计并实现了基于VoiceXML技术的可视化IVR系统。
本文设计的IVR系统,将整个系统分为流程编辑工具、含有VoiceXML标签的Web页面和执行引擎三个部分,完成了总体框架及其核心部分的设计与实现。本文研究了可视化技术的现状和理论,并对传统IVR系统流程编辑工具做了分析与对比,并在此基础上,从灵活、方便以及友好的用户界面的设计原则出发,对IVR系统的流程工具进行了详细的设计与实现。然后,在分析当前Web技术发展的情况下,本文与企业数据业务紧密结合,提出了将业务流程类比成企业门户网站的解决方案。该方案结合OpenVXI开源项目,使用VoiceXML技术,设计并实现了IVR系统的执行引擎。
关键词: 交互式语音应答 可视化系统 VoiceXML
第一章 绪论
1.1 研究背景
呼叫中心(Call Center,又称客户服务中心)起源于发达国家对服务质量的需求,其主旨是通过电话、传真等形式为客户提供迅速、准确的咨询信息以及业务受理和投诉等服务,通过程控交换机的智能呼叫分配、计算机电话集成、自动应答系统等高效的手段和有经验的人工坐席,最大限度地提高客户的满意度,同时自然也使企业与客户的关系更加紧密,是提高企业竞争力的重要手段[1]。
IVR(Interaction Voice Response,交互式语音应答)系统是整个呼叫中心的系统的最前端,它的质量直接影响到整个系统的稳定性。在整个呼叫中心运行过程中,IVR系统的业务流程也在随着客户体验和业务功能需求发生着改变,因此,如何对业务流程方便快捷的修改成了IVR系统必不可少的功能显得尤为重要。相对于传统的脚本式的编辑方法显然不能很好的适应这样的变化,所以可视化的配置方式呼之欲出,应用可视化的业务流程编辑界面可以很好与用户交互,减轻了用户的工作量,同时达到方便快键的目的。
同时,随着IVR系统的发展,其与企业的数据业务结合的越来越紧密。而传统的IVR系统相对于企业后台数据业务服务相对隔离,而且大多数的IVR产品都不能很好的与企
业的业务系统对接,或者是使用了比较繁冗复杂的方法,既浪费了资源,又影响了系统的稳定性。VoiceXML技术的出现,使语音业务与数据业务得到了统一,节省了资源,用户在访问语音业务的时候也可以方便的访问到数据业务。
1.2 国内外研究现状与应用前景
1.2.1 可视化技术的发展现状和应用前景
可视化语言技术比一维文本语言在描述软件组成方面具有优越性.由于图表和图形概念在系统建模中的广泛使用,可视化语言可以应用于需求分析、设计、测试和维护等软件开发的各个阶段[2]。
可视化建模语言简称可视化语言,是采用图形方式对系统/软件进行描述的语言,如目前广为流行的统一建模语言UML、传统的数据流语言和工作流建模语言等,它具有直观、便于理解的优点。可视化建模工具为可视化建模语言的使用提供了工具支持,目前可分为两大类:自由编辑型和语法制导型。自由编辑型允许用户随意建模,相当也图形编辑器,如Microsoft(微软)公司的Visio;语法制导的可视化建模工具在编辑过程中自动引导用户建立语法正确的可视化模型,有利于用户对可视化建模语言的掌握和使用,有着广泛的使用范围。
对于自由编辑型可视化建模工具,在国际市场上,Microsoft公司的Visio和Rational公司的Rose的产品比较有影响和代表性。
Visio是当今最优秀的办公绘图软件之一,它将强大的功能和简单的操作完美地结合在一起。使用Visio,可以绘制业务流程图、组织结构图、项目管理图、营销图表、办公室布局图、网络图、电子线路图、数据库模型图、工艺管道图、因果图、方向图等,因而,Visio被广泛地应用于软件设计、办公自动化、项目管理、广告、企业管理、建筑、电子、机械、通信、科研和日常生活等众多领域。
Rational Rose [3]是一个完全的,具有能满足所有建模环境(Web开发,数据建模,Visual Studio 和 C++)需求能力和灵活性的一套解决方案。Rose 允许开发人员,项目经理,系统工程师和分析人员在软件开发周期内在将需求和系统的体系架构转换成代码,消除浪费的消耗,对需求和系统的体系架构进行可视化,理解和精练。通过在软件开发周期内使用同一种建模工具可以确保更快更好的创建满足客户需求的可扩展的、灵活的并且可靠的应用系统。
语法制导型的编辑器自动生成技术的研究成果主要有GENGED[4]、PROGRES[5]、MetaEdit+[6];国内的研究相对较少,从目前所发表的研究成果看,只有北航软件工程研究所研制的SGEG 系统[7]。以上研究主要基于自动生成器的思想,由于在不同程度上缺乏对语言描述能力、语言解析效率、生成的目标编辑器的灵活性和可扩展性等方面的
综合考虑,所以实用性较弱。
1.2.2 VoiceXML技术的发展现状与应用前景
VoiceXML(语音可扩展标记语言)的出现最早可以追溯到1995在AT&T公司开发的基于XML的电话标记语言(PML)。随后,AT&T、Lucent Technologies以及Motorola公司分别各自着手开发自己的类似于PML的语音标记语言。到了1998年,W3C(world wide web consortium)组织的“语音浏览器”会议上,AT&T和Lucent Technologies分别展现了他们各自的类同PML的标记语言、Motorola和IBM公司分别推出VoxML[8]和
SpeechML[9]、HP和PipeBeach公司也分别推出TalkML[10]和VoiceHTML[11]。AT&T、IBM、Lucent Technoglies、以及Motorola随后成立了VoiceXML论坛,其目的是为了建立一个语音对话应用系统的国际标准。到了2000年,AT&T、IBM、Lucent Technologies、以及Motorola通过W3C协会联合推出语音可扩展标记语言VoiceXML1.0。该标准一经推出,便得到相关行业众多公司的响应。经过两年多的论证和实际系统验证,VoiceXML2.0最终草案在2003年推出。用VoiceXML开发的语音应用系统,不仅可以完全代替传统CTI(计算机电话集成) 系统所能提供的功能,而且还可以使应用系统开发过程极其简单快捷、系统有极高的可扩展性、可维护性、可移植性、可重用性和开放性。其定义了如何使用语音识别、语音合成、互联网访问、数据库访问、语音文件播放、DTMF输入等功能开发一个完整的语音应用系统。
1.3 论文研究内容
随着现代呼叫中心的发展,IVR系统的业务流程也愈趋复杂,在设计过程定义工具的时候简化操作的复杂性,提高产品的易用性是首先应当考虑的。所以图形化的过程定义工具显得尤为必要。同时,人们在呼叫中心业务中,对于语音和数据业务相结合有了强烈的愿望,VoiceXML很好的解决了这个难题,其技术也在这几年有了长足的发展,使得语音和数据业务有了一个良好的耦合。
为了实现简单、易用能和数据业务良好整合的IVR系统,本课题围绕以下几项主要工作展开研究:
1.可视化的基本概念的研究。具体的研究内容包括:可视化技术的定义,可视化建模语言的描述方法,阅读并分析了大量有关可视化技术的资料及学术论文,对可视化技术的概念、特点进行详细的讨论和分析;
2.可视化的过程定义工具的研究。具体的研究内容包括可视化过程定义工具的体系结构和过程定义工具的详细设计和实现;
3.VoiceXML技术的基本概念的研究。具体的研究内容包括:VoiceXML的概述,VoiceXML的基本体系结构和其在IVR系统中的简单应用;