重庆巨佳科技语音网关（VoiceGateway）产品介绍

客户世界 | 2015年7月12日 | 标杆展示 | 评论已关闭 | 1540

||2005-08-25

　　VoiceGateway是TTS与ASR的集成产品，完成TTS、ASR的集成与功能扩展，系统的TTS核心可以支持多个厂家的产品，包括清华、科大、IBM、捷通等厂商的产品。ASR可以采用InfoTalk、Nuance、IBM的产品。VoiceGateway最主要的功能是完成TTS与ASR的集成，将底层变化封装，不管采用那一家的的TTS与ASR产品，都与IVR服务器（VoxServer）无关。其次，VoiceGateway可以多机运行，支持负载均衡控制，可以把TTS，ASR的处理能力提高到成百上千线。各种不同的TTS产生的Voice编码文件还可能由VoiceGateway统一处理、重要编码，然后送到IVR服务器。

语音合成网关

　　语音合成网关是新一代的语音处理中间系统。其核心技术TTS（Text to Speech）系统采用了国内外最新的第二代文语转换技术，支持多语言的语音合成，音速、音质及韵律均可灵活调整，合成质量贴近自然话务播音员。

　　系统接收其他系统模块（如IVR系统）的文字信息，通过TTS合成对应的语音文件，然后传送到相应的系统模块。

　　系统可以与其他网关进行接口，成为系统中的中间件模块。
　　系统支持内建排队功能，支持多模块调用。
　　系统采用中心控制管理，可以扩展到多台主机运行，支持负载平衡技术。

　　语音合成网关将TTS包装成一个开放的系统功能模块，用户不需要了解TTS的具体技术细节，通过语音网关提供的开发工具就可以在自己的程序里实现TTS的功能。语音网关支持多种平台，底层通信建立在TCP/IP协议上，可以运行在复杂的网络环境中。

　　可扩展性：语音合成网关可以运行在任意一台主机上，单主机支持32个并发请求，通过系统的负载平衡控制，可以在网络中加入任意数量的语音网关系统，通过主系统中的中央调度模块，可以根据当前各网关的工作量，把数据处理分配到最佳的语音网关中处理。通过这种系统模式，理论上可以支持任意数量的系统扩展，甚至可以将语音网关扩展到Internet的任意地方。

　　移植性：语音合成网关可以运行在多种系统环境，包括Windows NT/2000、Linux、SCO OpenServer、及Solaris，可以根据用户需求选用。

　　实用性：实际开发过程中，可以采用语音网关的软件开发包（SDK），也可以采用TCP/IP数据包方式调用系统功能。

高可靠性：
　　采用多种容错机制，具有自动恢复功能。

结构说明：
　　在系统应用中，语音网关与其他应用程序处在一个网络中。

　　其他应用程序可以是IVR（交互式语音应答系统）、Email网关，以及其他的各种应用程序。只要采用语音网关的SDK（应用程序开发包）或者符合语音网关底层的SOCKET通信协议，都可以向网关发送中英文语音合成请求。

　　对于任意一个应用程序，当需要语音合成时，只要把文字信息发送到语音网关，语音网关就可以将合成后的语音信息发送回相应的应用程序。在负载平衡的系统中，有时主语音网关需要将合成的数据发送到其他网关进行处理，但对于应用程序而言，不需要知道其中的处理细节，主语音网关会进行相应的控制，当从语音网关把数据处理完成后，会直接把合成的语音数据发送回相应的应用程序。

语音识别网关

　　语音识别正逐步成为信息技术中人机接口的关键技术，语音识别技术与语音合成技术结合使人们能够甩掉键盘，通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

　　识别网关系统集成了中科院自动化所的语音识别引擎，支持非特定人语音，采用有限词汇模式，识别率高达98%以上，达到国内外领先的技术水平。

　　ASR支持自己定义的语法规则，语音识别所需要用到的语法规则，遵循ABNF范式（Augmented BNF）,兼容W3C语法定义。

　　语音识别网关系统把ASR进行封装处理，以网关中间件的方式把功能开放给其他服务系统。封装后的网关系统简化了ASR系统的应用，并对CTI系统做了大量工作，如语音编码处理，语音分析处理。

语音识别网关采用合成网关相同的结构，所有在很多特性上与合成网关相似：

　　系统支持内建排队功能，支持多模块调用。
　　系统采用中心控制管理，可以扩展到多台主机运行，支持负载平衡技术。
　　系统支持多种平台，底层通信建立在TCP/IP协议上，可以运行在复杂的网络环境中。

　　可扩展性：语音合成网关可以运行在任意一台主机上，单主机支持32个并发请求，通过系统的负载平衡控制，可以在网络中加入任意数量的语音网关系统，通过主系统中的中央调度模块，可以根据当前各网关的工作量，把数据处理分配到最佳的语音网关中处理。通过这种系统模式，理论上可以支持任意数量的系统扩展，甚至可以将语音网关扩展到Internet的任意地方。

　　移植性：语音合成网关可以运行在多种系统环境，包括Windows NT/2000、Linux、SCO OpenServer、及Solaris，可以根据用户需求选用。

　　实用性：实际开发过程中，可以采用语音网关的软件开发包（SDK），也可以采用TCP/IP数据包方式调用系统功能。

　　高可靠性：采用多种容错机制，具有自动恢复功能。