藏在舌尖上的“身份证”:声音识别技术

    |     2015年7月12日   |   标杆展示   |     评论已关闭   |    1067

|田学科|2008-02-22

由于有着巨大的市场需求和应用前景,以指纹、面部特征和声音等人体部分特征为基础的各种各样的身份识别技术,正在得到政府部门、企业和研究人员的重视,研发和应用都在高速推进。声音识别技术,如监听和窃听技术等,也揭去了过去只为国家执法部门所用的神秘面纱,不断被改进和完善,以满足更为广阔的市场需要。

随着现代通信技术的迅速发展和普及,网络技术和无线通信技术等,为声音识别技术提供了可进行远程操控的平台,使得声音识别技术不仅能够为技术侦察部门服务,而且能够为其它用户提供更为便捷、更加实用的口令和身份识别技术途径,因此,得到了不同类型和不同层面用户的青睐。目前声音识别技术主要有四大应用领域,即金融系统、通信网络系统、国家执法部门和从事访客口令识别研究的研究机构等。

以色列有一家成立仅6年的公司,在声音识别技术领域令人刮目相看,它就是位于雷拉拉市的PERSAY公司。目前该公司在声音识别技术领域拥有的三个产品系列,在世界各地的用户达到了40多个,如美国国土安全部正广泛使用它的技术识别临时访问者定期打来的电话声音,核实他们在美国的滞留情况和准确位置等。

“与竞争对手的技术相比,我们拥有的技术原理,是基于生物语音差异来实现对个体语音识别的。”公司首席执行官奥摩格•阿莱-雷兹在接受本报记者采访时说,“我们的语音识别技术不仅准确性较高,而且不受任何语言和口音差异的限制,使用方便。”

阿莱-雷兹向记者演示了如何用声音作为用户口令,通过打电话进入银行系统的。记者看到,如果线路通畅、发音清晰,那么利用这种方法来识别用户的身份,其准确性可以达到100%。“当然,即便仅仅是在技术上让任何一种识别方法做到完美无暇,都是非常困难的,但是,如果两种识别方法配合使用,如声音识别与密码配合使用,那么其可靠性将会大大提高。”

除了上述声音口令技术被银行等金融系统用于识别用户身份外,PERSAY于2002年开发出了识别通话者身份的自由通话技术———FreeSpeech。该技术产品通过生物语音识别技术,可以向有关部门提供电话另一端说话者的准确身份,确保通话的有效性,为通话双方提供便利。阿莱-雷兹告诉记者,FreeSpeech的用途非常广泛,比如,当通话人需要向政府有关部门汇报情况和了解信息,用户需要在服务商那里更改个人资料(信用卡号、服务期限等)和更新合同等等,首先需要确认的是通话人的身份,如果通话人的身份不能得到确认,那么,就无法使用电话这种便捷的方法去解决问题。

FreeSpeech具有的技术特点包括,不受语言和口音差异限制,准确性高,具有干线与支线同等的音频获取能力,提供网络服务APIs,与CTI和CRM应用兼容,提供网络管理服务等。

2004年,PERSAY又为情报和执法部门研制出了一种可以根据电话,来追踪通话人的技术产品———S.P.I.D(说话者身份)。这一技术利用有线和无线通讯网络,可以使政府执法部门从成千上万的通话者中,鉴别出正在追踪目标的通话声音,从而找到追踪目标。该技术在2005年通过了美国国家标准和技术研究所的鉴定,被认为是一种不受通话内容限制、准确率高的通话人身份识别技术。

作为一家已经进入快速发展通道的创新公司,年轻的阿莱-雷兹认为在不久的将来会有更多的用户使用他们的技术。“尽管声音识别技术在口令和身份识别技术领域是一项比较新的技术,目前仍处于不断改进和提升的阶段,但是我们拥有的这三种产品技术,都已经具有规模化市场应用的能力。目前推广和应用这种技术的主要困难是,需要花费大量时间和精力,通过现场演示等方法,去说服各种用户了解和相信声音识别技术的可靠性和便捷性。”

责编:81926461

转载请注明来源:藏在舌尖上的“身份证”:声音识别技术

上一篇:

下一篇:

相关文章

噢!评论已关闭。