四件套厂家
免费服务热线

Free service

hotline

010-00000000
四件套厂家
热门搜索:
行业资讯
当前位置:首页 > 行业资讯

无限商机VoiceXML语音浏览器技术说明书

发布时间:2020-07-21 18:46:08 阅读: 来源:四件套厂家

一 基于XML的数据浏览技术

Internet 的生命是浏览,基于HTML脚本描述语言的Web 的浏览机制的应用是Internet 广泛普及的基础。

而一种新的脚本描述语言:XML 的出现,为数据浏览技术带来了一种全新的概念。XML 标记语言,将以往的HTML 之类的标记语言所关注于数据表达形式的概念转移到对数据含义和内容的关注上来。HTML 标记语言中,计算机程序可以知道这些数据应该以什么样的方式在屏幕上表现出来,但我们却很难让计算机程序知道,这些数据是什么含义。而在XML 中,其标记的是数据的含义和内容,我们可以轻松的让程序来识别和处理这些数据,并以各种各样适当的形式表现出来。

基于XML 的数据浏览技术可以说是网络时代的又一次数据革命,正如美国微软公司首席执行官史蒂夫.鲍尔默所说:“XML语言将革新人机界面”。

鲍尔默称,XML语言是一种“更坦白的网络语言”,它使得数据在网络上的获取和交流更加灵活便利,并可以通过包括电脑、电视和移动电话等更多的终端设备得到反映。鲍尔默说,“5年内我希望能像和秘书讲话一样地和电脑交流。”

二 VoiceXML :语音浏览

VoiceXML ,是由 IBM 、Lucent、Motorola 、AT&T 四家国际巨型公司于2000年提出的一种应用于语音浏览的标记语言,它建立于XML 标记语言规范的基础之上,是语音浏览技术的核心。而因为其同样是一种XML描述语言,其与数据库、HTML、WML以及其它文档处理和发布系统的资料交换几乎没有障碍。

通过VoiceXML ,可以像建立HTML 的Web 应用一样轻松的建立语音应用系统,而这样的语音应用系统可以为基于VoiceXML 的语音浏览器所广泛支持。语音浏览器通过解析VoiceXML ,与语音识别和语音合成等方式进行人机交互,从而实现说话就可以上网的梦想。而语音浏览器不仅仅可以建立于电话服务器端,其同样可以建立于PC 平台、电视、PDA 等等其他终端上。

通过VoiceXML ,可以很容易地建立新的语音应用和服务,如语音门户、语音Call Center ,语音信息服务、语音电子商务等等。而这些应用或服务可以很容易地和原有的数据系统结合起来,甚至可以轻易地从原有的各类应用中延展出来。而VoiceXML 的语音应用,可以以XML的数据表达形式,与其它的应用系统、数据系统轻易交流。

三 北京无限商机公司的VoiceXML 语音浏览器

我们的VoiceXML语音浏览器,为解决众多需求而设计。其设计层次如下:

在我们的实现中,我们分别设计了控制层、安全层、事务层、会话层、和应用层。并开放了除控制层之外的所有层的开放接口。

iceXML 语音浏览器的组成部分

一个完整的VoiceXML 语音浏览器,由以下几个部分组成:

VoiceXML 解析器语音识别引擎语音合成引擎语音通道

(1).VoiceXML 解析器

VoiceXML 解析器是整个语音浏览器的核心部分。其在语音浏览器中担负控制中心和司令者的脚色。VoiceXML 解析器通过网络协议,如Http 等协议,获取VoiceXML 脚本语言所描述的应用文档(document),解析该应用文档,解释其中各个标志(Tag ),产生相应的控制命令,控制其它部件进行相应的动作,并获取结果,根据结果决定应用的执行方向和顺序流。

(2).语音识别引擎

语音识别引擎是VoiceXML语音浏览器的生命力所在,语音识别使计算机能理解用户的语音命令,产生相应的文字结果,送回VoiceXML解析器做处理。

在VoiceXML 语音浏览器中,语音识别引擎为命令式的识别引擎,其根据有限的语法(grammar)来识别用户的语音信号,产生对应语法定义的识别结果。所以,语法便成为了VoiceXML语音浏览器中的重要概念。在VoiceXML语音浏览器中,语法决定了用户能说什么,如何说,好的语法能带给用户良好的交互感觉,也能从逻辑上提高语音识别引擎的识别率,使整个语音应用的浏览流畅而轻松。

VoiceXML 语音浏览器中,语音识别引擎不仅需要处理对用户语音信号的识别,同时也需要处理对用户按键的识别,按键和语音以同样的机制被处理和传递。

(3).语音合成引擎

语音合成引擎,其处理VoiceXML 解析器将文字转换为语音信号,并通过语音通道播放给用户的命令。VoiceXML 语音合成引擎可以将文字转换成语音文件,也可以转换成语音数据流,或者直接将已事先录制好的语音文件直接播放或以流的方式播放给语音通道。

语音合成引擎的文字转化为声音的品质,决定了用户对系统的直接感觉,流畅自然的合成声音,将使用户感觉良好。如何提高语音合成引擎的合成品质,已成为影响语音应用效果的重要因素。

(4).语音通道

语音通道是在VoiceXML语音浏览器中传输用户的语音(speech)数据信号和合成引擎所产生的声音数据信号的传递通道,其连接物理上的语音采集和播放设备,语音识别引擎的语音输入端、语音合成引擎的语音输出端。

在基于电信平台的语音应用系统中,语音通道的物理设备主要是语音卡、语音信道或者是以数字编码形式所存在的虚拟通道,如IP 的语音编码数据包等。而在PC 平台上,声卡则成为主要的语音通道。

对不同的平台的语音通道物理设备的支持,决定了VoiceXML语音浏览器可实际应用的平台。

iceXML语音浏览器各部分的协作

VoiceXML语音浏览器的协作核心是VoiceXML解析器,其通过建立应用(Application)和会话(Session),获取包含控制命令的文档(Document),根据文档中的标志(Tag)建立对话(Dialog),从而解释各个对话,控制语音识别、语音合成引擎以及语音通道的触发、开启和关闭、挂起等,实现与用户的会话式的交互,并根据对用户反应的识别结果进行导向判断,进行文档之间的转移和应用之间的转移。

3.我们的VoiceXML 语音浏览器的开放机制

在我们的VoiceXML语音浏览器中,我们采用了IBM公司为电信应用而设计的语音识别引擎,L&H公司和中国科技大学讯飞公司的语音合成引擎,以及建立于NMS公司的AG系列语音板卡之上的电信级语音通道。

在我们的VoiceXML语音浏览器中,我们对识别引擎和合成引擎进行了开放性的接口设计,实现了与引擎无关的设计。根据我们的接口,其它开发商可以开发为其它识别或合成引擎的封装模块,从而在我们的VoiceXML语音浏览器中使用其它的识别或合成引擎。

而我们为VoiceXML语音浏览器设计了与语音通道无关的接口设计,其它开发商可以根据接口封装语音通道的模块,实现基于其它语音板卡、IP甚至PC机、PDA 等的语音通道,使VoiceXML语音浏览器可以建立于其它的物理平台之上。

我们的VoiceXML语音浏览器中,所有开发接口以CORBA 规范设计,其它开发商可以用各种编程语言如C、C++、Java 等在不同的平台和操作系统上实现,从而实现了对各种操作系统平台的支持。并且,利用CORBA 的强大的分布式机制,整个VoiceXML语音浏览器可以建立于跨越各种物理平台、操作系统之上的分布式网络中。

4.如何在VoiceXML 语音浏览器上开发语音应用?

在voiceXML 语音浏览器上开发语音应用,如同开发Web应用一样轻松简单。只需要有对XML的知识,就可以开发VoiceXML 应用。基于VoiceXML 的语音应用系统可以很好的和其它已有的Web 应用系统或数据应用系统良好的结合。

开发VoiceXML 语音应用:

无须复杂的C、C++等编程语言无须专门的编程工具基于XML 脚本描述,和WEB 应用开发一样简单利用java script 、ASP 、Perl等描述性语言与VoiceXML的结合,可以建立功能强大的网络应用系统与传统Internet应用系统的轻松集成语音网页取代了传统的CTI流程机制跨越各种操作系统平台的应用开发应用模块和语法模块可轻松定制和重用

在VoiceXML语音浏览器基础的应用开发,改变了传统的CTI系统的开发概念,在这里,开发人员无须关心复杂的流程和模块,无须为数据接口编写程序模块,无须重新建立已有系统的逻辑实现,也无须一次次重复某个模块的开发。建立VoiceXML语音应用系统,就和建立Web 应用一样简单

四 基于VoiceXML 机制的语音应用

1.基于VoiceXML 机制的语音应用的特点

基于voiceXML机制的语音应用有以下几个特点:

以应用(Application )、会话(session )、文档(document)为单位建立应用结构以对话(dialog)为交互单位,逐个完成对话确定流程导向与范围相关的语法激活/禁止机制以语音网页为单位,构建复杂的应用层次

2.自由自在的流程

VoiceXML语音应用系统中强调对话和导向,而不在有固定的流程结构限制。如同用IE 浏览网页一样,我们无法定义清晰的用户可能点击和浏览的顺序,而是以网页为单位,以链接为导向。VoiceXML 亦是以同样的机制来完成整个应用的浏览。

在VoiceXML 语音应用中,用户可以选择所有激活的链接处,象浏览Web 网页一样任意跳转到其它页中去。根据用户的语音命令和对事件的捕获,可以跳转到其他应用、其它文档、甚至其它对话中去。

而利用Java Script 、ASP、Perl等描述语言,VoiceXML应用可以动态的根据用户的选择、预制模板和其它数据环境动态地产生新的应用或文档以及语法定义,实现流程的动态生成,使VoiceXML 语音应用不再受预先制定好的流程规范的限制。

3.无所限制的内容

XML 的机制决定了VoiceXML 脚本语言不仅可以描述数据的式样,其同样描述数据的内容和含义。而只要有共同规范的DTD 定义,VoiceXML 脚本可以轻松的与其它XML脚本交换数据,理解其它XML脚本应用中的数据含义。这就是说,其它的基于XML脚本的Web 应用、数据库系统、数据文档都可以轻松的和VoiceXML脚本结合起来。VoiceXML 应用可以轻松的解释它们的数据内容,并通过适当的表现式样体现出来。

利用Java Script 、ASP 、Perl 等描述语言所建立的程序,可以访问其它各种各样的数据来源,不仅可以产生动态的浏览流程,同样可以产生动态的内容。正如在Web 应用中ASP 所产生的动态网页一样,我们产生的动态VoiceXML语音网页具有同样的浏览自由度和内容自由度。

正如基于VoiceXML 的语音邮件应用所表现的那样,通过主页的导向,根据不同用户的用户ID ,利用Java Script 或ASP等进行对邮件服务器的访问,根据邮件数据、邮件格式和邮件内容会产生不同的VoiceXML 邮件网页。不同的用户所访问到的邮件网页的结构和内容都是不同的。

4.个性定制的体现

不同于传统CTI系统对每个用户的服务都一模一样的方式,VoiceXML应用可以根据用户自己的喜好定制自己需要的内容。根据已有用户的信息数据,如用户的特征,用户选择的项目等,利用模板机制,可以生成完全个性化的应用流程和内容。

在VoiceXML 语音应用系统中,用户不仅可以定制他们各自喜好的服务项目,甚至可以定制他们期望的内容、格式和风格,完全体现自己的个性化。

在基于VoiceXML 的语音门户应用中,用户也可以自己开发编写自己的语音网页,自由体现自我,建立自己的个人语音网站,展示自我个性。

五 应用示例

iceXML 语音邮件

VoiceXML 语音邮件应用,使用户可以通过电话等声音设备收发电子邮件。在基于VoiceXML的语音邮件应用中,用户可以自由的选择性收听邮件、只听标题或内容、顺序浏览、随时删除。利用通讯本功能,用户通过说出姓名即可发送语音形式的邮件,让对方听到自己的声音信息。

iceXML股票查询

基于VoiceXML 的股票查询应用系统,用户无须记住股票代码,只需说出股票名称即可。用户可以选择性定制自己所关心的几支股票,只查询这几支股票的信息。通过更为复杂的模板定制,用户还可以定制他们关心的股票价格、成交量等细节内容,以喜好的风格来听取,用户也可以定制提醒、报警等功能,及时处理。

iceXML 天气查询

基于VoiceXML 的天气查询系统,选择用户所关心的几个城市,随时查询天气情况,以便安排出行、旅游。

iceXML 语音游戏

试试和电脑玩玩猜拳游戏吧,听听电脑赢时的得意和输时的抱怨,看看你能不能几句话说得电脑低头服输?

北京无限商机供稿 CTI论坛编辑

11 限流与过滤

02 SQL语句

获取和操作 DOM 节点