重庆巨佳科技语音网关(VoiceGateway)产品介绍

    |     2015年7月12日   |   标杆展示   |     评论已关闭   |    1032

||2005-08-25


  VoiceGateway是TTS与ASR的集成产品,完成TTS、ASR的集成与功能扩展,系统的TTS核心可以支持多个厂家的产品,包括清华、科大、IBM、捷通等厂商的产品。ASR可以采用InfoTalk、Nuance、IBM的产品。VoiceGateway最主要的功能是完成TTS与ASR的集成,将底层变化封装,不管采用那一家的的TTS与ASR产品,都与IVR服务器(VoxServer)无关。其次,VoiceGateway可以多机运行,支持负载均衡控制,可以把TTS,ASR的处理能力提高到成百上千线。各种不同的TTS产生的Voice编码文件还可能由VoiceGateway统一处理、重要编码,然后送到IVR服务器。

语音合成网关

  语音合成网关是新一代的语音处理中间系统。其核心技术TTS(Text to Speech)系统采用了国内外最新的第二代文语转换技术,支持多语言的语音合成,音速、音质及韵律均可灵活调整,合成质量贴近自然话务播音员。

  系统接收其他系统模块(如IVR系统)的文字信息,通过TTS合成对应的语音文件,然后传送到相应的系统模块。

  系统可以与其他网关进行接口,成为系统中的中间件模块。
  系统支持内建排队功能,支持多模块调用。
  系统采用中心控制管理,可以扩展到多台主机运行,支持负载平衡技术。

  语音合成网关将TTS包装成一个开放的系统功能模块,用户不需要了解TTS的具体技术细节,通过语音网关提供的开发工具就可以在自己的程序里实现TTS的功能。语音网关支持多种平台,底层通信建立在TCP/IP协议上,可以运行在复杂的网络环境中。

  可扩展性:语音合成网关可以运行在任意一台主机上,单主机支持32个并发请求,通过系统的负载平衡控制,可以在网络中加入任意数量的语音网关系统,通过主系统中的中央调度模块,可以根据当前各网关的工作量,把数据处理分配到最佳的语音网关中处理。通过这种系统模式,理论上可以支持任意数量的系统扩展,甚至可以将语音网关扩展到Internet的任意地方。

  移植性:语音合成网关可以运行在多种系统环境,包括Windows NT/2000、Linux、SCO OpenServer、及Solaris,可以根据用户需求选用。

  实用性:实际开发过程中,可以采用语音网关的软件开发包(SDK),也可以采用TCP/IP数据包方式调用系统功能。

高可靠性:
  采用多种容错机制,具有自动恢复功能。

结构说明:
  在系统应用中,语音网关与其他应用程序处在一个网络中。

  其他应用程序可以是IVR(交互式语音应答系统)、Email网关,以及其他的各种应用程序。只要采用语音网关的SDK(应用程序开发包)或者符合语音网关底层的SOCKET通信协议,都可以向网关发送中英文语音合成请求。

  对于任意一个应用程序,当需要语音合成时,只要把文字信息发送到语音网关,语音网关就可以将合成后的语音信息发送回相应的应用程序。在负载平衡的系统中,有时主语音网关需要将合成的数据发送到其他网关进行处理,但对于应用程序而言,不需要知道其中的处理细节,主语音网关会进行相应的控制,当从语音网关把数据处理完成后,会直接把合成的语音数据发送回相应的应用程序。

语音识别网关

  语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

  识别网关系统集成了中科院自动化所的语音识别引擎,支持非特定人语音,采用有限词汇模式,识别率高达98%以上,达到国内外领先的技术水平。

  ASR支持自己定义的语法规则,语音识别所需要用到的语法规则,遵循ABNF范式(Augmented BNF),兼容W3C语法定义。

  语音识别网关系统把ASR进行封装处理,以网关中间件的方式把功能开放给其他服务系统。封装后的网关系统简化了ASR系统的应用,并对CTI系统做了大量工作,如语音编码处理,语音分析处理。

语音识别网关采用合成网关相同的结构,所有在很多特性上与合成网关相似:

  系统支持内建排队功能,支持多模块调用。
  系统采用中心控制管理,可以扩展到多台主机运行,支持负载平衡技术。
  系统支持多种平台,底层通信建立在TCP/IP协议上,可以运行在复杂的网络环境中。

  可扩展性:语音合成网关可以运行在任意一台主机上,单主机支持32个并发请求,通过系统的负载平衡控制,可以在网络中加入任意数量的语音网关系统,通过主系统中的中央调度模块,可以根据当前各网关的工作量,把数据处理分配到最佳的语音网关中处理。通过这种系统模式,理论上可以支持任意数量的系统扩展,甚至可以将语音网关扩展到Internet的任意地方。

  移植性:语音合成网关可以运行在多种系统环境,包括Windows NT/2000、Linux、SCO OpenServer、及Solaris,可以根据用户需求选用。

  实用性:实际开发过程中,可以采用语音网关的软件开发包(SDK),也可以采用TCP/IP数据包方式调用系统功能。

  高可靠性:采用多种容错机制,具有自动恢复功能。

责编:admin

转载请注明来源:重庆巨佳科技语音网关(VoiceGateway)产品介绍

相关文章

噢!评论已关闭。