科大讯飞InterPhonic 4.0语音合成系统新特性预览

    |     2015年7月12日   |   标杆展示   |     评论已关闭   |    1399

||2005-09-02


  安徽中科大讯飞公司作为业界领先的语音技术提供商,一直致力于为中文语音合成(TTS)行业提供最专业、最重要的技术﹑产品和标准。其中文语音合成技术在2003、2004连续两年国家权威的技术评测中均以大比分领先于竞争对手,囊括了所有关键指标第一名。科大讯飞公司的InterPhonic语音合成产品系列,自面世以来就以其自然流畅的合成效果、丰富灵活的产品功能和稳定高效的产品质量赢得广大客户的一致赞誉,并成为目前中文语音合成市场的主流语音合成系统。2005年5月,科大讯飞公司正式发布了最新的语音合成系统InterPhonic 4.0,该产品在原产品版本基础上效果又有了明显提升,合成语音效果首次超过了一般自然人,相信该产品将会以一贯的品质赢得更多客户的认可。其相对于目前市场应用最多的科大讯飞去年发布的Interphonic3.0合成系统来说,除了继续保持原有的优质效果外,还增添了许多更为个性化的新特性:


高质量的语音合成效果


  InterPhonic 4.0语音合成系统集讯飞公司多语种、多音色语音合成技术的优势于一身,在开放的多语种架构下提供了对普通话、粤语、英文等多个语种的支持,同时也为用户提供了包含沉稳正式、活泼轻快、浑厚柔和的多种发音风格,充分满足了对语音合成技术日益增长的个性化和多语种需求。系统提供的”小燕”音色活泼亲切,在服务类应用中将带给用户更加人性化的体验;”小美”音色甜美清新,提供高品质的广东话合成服务;”小宇”男声淳美浑厚,对中文和英文都能驾轻就熟。新提供的多引擎管理接口对不同语种的系统提供一致化的访问接口,允许用户在服务过程中动态切换使用的音库,以取得更好的语音服务效果。


  讯飞公司的语音合成系统在满足客户对合成语音准确自然的要求之后,更加关注于向具有更强表现力的语音合成效果迈进。InterPhonic 4.0系统能自动识别出文本中包含的疑问、感叹句式,并通过语气和语调在语音中表现出来,从而使合成语音摆脱了正式呆板的形象,给用户更加人性化的感受。为有效提升广东话合成效果,InterPhonic 4.0系统中补充了大量的口语化语料和处理规则,能将正式文本按照广东话实际播报的口语化效果进行转化,从而使广东话的合成更加贴近广东、香港等地区实际应用的需要。


细致周到的优化方案


  科大讯飞公司提供的语音产品一向与实际应用紧密结合,以提供最优质的合成效果,最便捷多样的应用为己任,希望能提供给客户更加完善,最具价值的语音合成解决方案。在InterPhonic 4.0语音合成产品中也体现了讯飞公司对应用的一贯关注。对应用中最重要的动态信息的合成方面,新一代合成技术在效果上有了质的飞跃。在语音合成典型的银行应用环境下,数字和数值是合成的主要内容,也是客户关注的焦点。InterPhonic 4.0系统中针对数字数值的合成进行了专门的优化,发音更加清晰饱满、节奏感更强,能使用户不费力的听清记牢所播报的数字信息。InterPhonic 4.0也针对短语进行了优化,从而使系统在合成单独的词组和短句时,停顿更加合理,语气更加舒缓自然。经过优化之后的数字数值、短语人名等合成效果更加自然、流畅,完全可以达到以假乱真的程度。


全面完善的功能特性


  在目前统一消息、智能网等平台,语音邮件等业务中,客户都有将电子邮件内容或者Internet上共享信息资源合成为语音的需求。InterPhonic 4.0产品充分考虑了客户的应用要求,能够解析MIME格式的Email文本,将MIME格式中的无用信息过滤,把Email中的主题、发件人、收件人、内容和文本附件等信息自动提取出来,从而将用户最关心的内容合成为语音。系统还支持了URI合成的功能,在用户输入需要合成的URI链接时,能主动从Internet下载文本内容,从而更方便了网络上信息资源的使用。

   在语音应用开发中,为了系统的独立性和扩展性,Client/Server方式的体系结构一向是客户的首选。InterPhonic 4.0产品提供了新的网络语音服务平台ISP,该平台改进了原有网络服务程序的功能,能提供更加丰富灵活的服务。ISP平台采用通用的TCP/IP网络通讯协议和集中式的资源管理机制,形成客户端-资源管理器-服务器有机结合的三层结构,提供动态负载均衡功能,系统架构灵活可伸缩。ISP平台加强了网络各组件的管理维护功能,能远程查看和控制各组件的运行状态,并且能自动恢复组件的不正常状态,其稳定性和可用性经受了众多大规模实际应用的检验,确保提供值得信赖的7×24小时不间断自动化语音服务。


  InterPhonic 4.0做为语音市场新一代动力引擎,是一款在合成效果和应用特性上都有重大提升的新一代语音合成系统,它的推出代表中文语音合成产品达到一个新的高度,合成技术的飞速进步将推动语音应用进入令人激动的一个新的时代。


InterPhonic 4.0语音合成效果演示


纯英文-小宇.wav (1.18M 男声)
短语-小燕.wav (1.05M 女声)
多音色-小静.wav (1.2M 女声)
多音色-小燕.wav (1.2M 女声)
多音色-小宇.wav (1.1M 男声)
数字数值-小燕.wav (1.7M 女声)
疑问感叹-小燕.wav (483K 女声)
粤英混读-小美.wav (797K 女声)
粤语-小美.wav (1.03M 女声)

责编:admin

转载请注明来源:科大讯飞InterPhonic 4.0语音合成系统新特性预览

相关文章

噢!评论已关闭。