科大讯飞发布InterPhonic 4.0银行专业版合成系统

    |     2015年7月12日   |   文库   |     评论已关闭   |    1159

||2005-12-08

科大讯飞发布InterPhonic 4.0银行专业版合成系统


–新特性抢先预览


| 0 | 2005-12-08


  随着金融业呼叫中心的发展,越来越多的银行在电话银行业务的拓展和推广中推陈出新,从而也引发了语音技术在银行业中的应用热潮。科大讯飞作为语音技术的开发商和语音应用推广的拓荒者,早在2000年以前就开始在银行业中推动语音的应用。在通用领域中,科大讯飞的语音技术一直处于国际领先地位,无论从合成效果的自然度、产品化以及实际应用中都比同类产品有着明显的优势。2005年4月份科大讯飞发布了其最新的多语种语音合成平台InterPhonic 4.0在业界又一次引起了人们对语音应用效果的关注,成为在电信、金融等领域高端应用中的主流产品。InterPhonic 4.0为提升应用效果而设计的灵活的定制架构,加上讯飞在金融领域多年的应用积累,时隔半年,基于InterPhonic 4.0的银行专业版正式对外发布。

  InterPhonic 4.0银行专业版除了具备通用版的所有特性之外,主要针对金融行业特别是电话银行应用当中的词汇量、多音字处理、特殊符号处理、数字/数值、定制音库、预录音等环节进行了功能改进和应用效果的提升,具有以下几种专门为金融行业量身定做的产品特性:


  1. 银行专业版词典
      金融领域的词汇量随着近年来银行业的发展在不断扩大和更新,新业务、新名词的出现层出不穷。科大讯飞在与银行业合作伙伴的合作中广泛收集电话银行实用语料,并采用独有的语料分析和搜索技术对主词典进行添加和修正,使得银行专业版中的词典更适用于金融领域,提高了对金融领域新名词的识别率,使分词断句更加准确。


  2. 多音字规则库
      多音字是汉语中的普遍现象,多音字的正确与否直接影响到语音合成的应用效果。通用领域内的多音字判断与专业领域并不是很一致甚至会有冲突。一些仅在金融领域才出现的多音字现象被提炼成多音字规则,这些规则仅适用于在专业领域的语言环境中。在多音字规则的归纳方面需要大量语料的积累和系统的语法分析工具。科大讯飞公司和中国社会科学院语言研究所建立联合实验室,致力于汉语言的分析和研究,并且在语料收集和数据制作方面具有深厚的积淀。银行专业版的多音字规则库也是在此基础上得到了更完善的补充,多音字自动识别的正确率可达到98%以上。


  3. 银行专业版音库
      定制音库可以更好的覆盖金融领域的语言环境,使得合成出的语句更加流畅自然。采用在主音库上补充定制音库的手段提升合成效果是目前采用大语料库技术的合成系统改善语音合成效果的一个最直接有效的方法。但是受到语料收集和分析能力以及数据制作能力的限制,能够紧跟应用发展而定制出与当前应用环境更为接近的音库的规模、质量和更新周期都必须有一个专业技术队伍来保障。科大讯飞在推出Interphonic 4.0的同时即开始了基于Interphonic 4.0的银行专业版定制音库的制作。目前,Interphonic 4.0 银行专业版已经提供了普通话女声小燕的定制音库,随着应用需求的不断增加,也将会陆续提供普通话男声定制音库和粤语定制音库。


  4. 特殊符号规则库
      在Interphonic4.0的特殊符号集中常用符号的处理已经比较完备了,但是仍有一些特殊符号的使用会根据应用环境的特殊性而与通常环境中的判断规则和读法不一样。Interphonic 4.0银行专业版收集了金融领域常用符号及其出现的语言环境进行分析,对特殊符号规则库进行了调整,从而提高了在金融领域内的特殊符号识别正确率。同时,Interphonic 4.0的定制架构允许对特殊符号的读法和停顿时间进行用户自定义的设置,在银行专业版中已经根据行业特征对这些参数进行了调整,用户一般不需要重新设置特殊符号的默认读法和停顿时间。


  5. 数字数值
      Interphonic4.0的数字数值为了适应电话银行中用户的使用习惯,进行了效果调整,使数字数值的发音更加饱满。使用TTS合成的数字数值首先在清晰度和自然度方面就比原始的录音拼接要高。此外,电话银行业务中对于数字数值的可懂度和准确度要求更高,银行专业版在数字数值方面做了更多的改进,在提高系统默认设置的数字数值可懂度的同时还开放了更多用户可以自主设置的参数。银行专业版中数字数值的报读风格定位于语速较慢、发音饱满、富有节奏感,从而提高了数字数值的可懂度。除了具备Interphonic4.0中的整体语速调节功能外,银行专业版也支持对于数字数值单独进行语速调节和节奏设置,这样不同用户都可以根据自己的需要进行设置便于用户对于较长的账号等数字数值进行核对和记录。


  6. 预录音
      在电话银行业务中很多提示音是固定不变的,在和语音合成系统合成出的语音配合使用时,往往让程序设计者们为这些提示音采用预录音还是采用TTS合成而取舍难定。如果采用预录音当然能够达到最好的自然度,但是不能适应提示音中的变化,一旦提示音有改动预录音不能及时更新就会出现问题。而采用合成的方式来提供提示音,虽然灵活性问题解决了但是自然度又会略逊于预录音。因此如何处理好提示音和语音合成的融合可以考验一个语音合成系统在提升应用效果方面的功能和架构是否完善。银行专业版的预录音功能正是在Interphonic 4.0的定制架构上实现的一个平衡提示音自然度和灵活性的工具。预录音与合成音统一发音人,过渡自然。调用时,不需要特殊标记,系统可自动识别预录音库中已有提示音,并和需要合成的语音一起进行输出。在银行专业版的预录音库中已经包含了近2000条常用中粤语提示音,同时提供提示音添加功能,方便用户随时添加预录音。用户还可向科大讯飞提出定制需求,可根据用户的具体应用进行电话银行菜单预录音。

责编:admin

转载请注明来源:科大讯飞发布InterPhonic 4.0银行专业版合成系统

相关文章

噢!评论已关闭。