声纹识别:打造物联网时代远程银行的极致体验

    |     2021年3月3日   |   2021年, 客世原创   |     评论已关闭   |    480

随着近年来金融科技的兴起,生物识别技术在金融领域的应用更加广泛。远程银行通过生物识别技术的引入和模式迭代,可以在交易数据的采集、存储、传输、处理的过程中不断提升与用户交互的体验:2006年,人工智能因深度学习卷积神经网络的重大突破迎来第三次高潮;2014年,对抗性神经网络间接提供的安全性让基于数据驱动的语音识别和图像识别起飞并迅速相继产业化;2016年2月,招商银行推出了手机银行4.0版本,该版本具有“刷脸”转账的功能,客户用视频对接远程座席,通过人脸识别技术进行身份认证,然后即可在线办理20-100万元的大额转账业务;2016年 6月,在中国平安银行主办的“人脸识别”技术发布会现场中上演了“刷脸”交易。通过“人脸识别”技术,系统平台可远程审核申请人身份,从而轻松地完成贷款、理财等一系列复杂繁琐的管理手续;2016年9月,民生银行手机银行率先推出虹膜支付的功能,主要应用于手机银行话费充值、便民交费、商城支付等场景,既提升了客户的支付体验也提供了客户资金的安全保障。2020年6月,光大银行手机银行7.0横空出世,新版本首次将生物感知识别、智能语音、自然语言理解等人工智能技术应用到理财产品销售流程中。

5G时代的生物识别技术由于其便利性和灵活性而被越来越多的人,尤其是年轻人所接受。然而,诈骗案的高发,又让使用者心怀忧虑。银行服务技术的创新是银行业务发展的基础,合理使用技术规避相应风险也会直接影响银行的综合竞争力,从而决定了银行未来的客流量。因此利用自身生物特征来确定身份的方法及应用开始受到关注,声纹识别技术就是其中的一种,如何将声纹识别技术更为合理应用到银行服务方面具有重要的意义。

一、远程银行智能化发展的痛点

在远程银行的使用方式上,用户安全无疑是一个非常重要的指标。以手机银行为例,各大银行推出的手机银行采用了静态密码、密码卡、个人安全保护等安全认证措施。这些措施并未使用户认识到手机银行的安全性,原因如下。

首先,静态密码验证是目前最常用的密码验证方法。作为一种低成本、便捷的认证方法,它广泛应用于网络和手机中。但是,在安全性和其他方面仍然存在问题:随着科学技术的发展,犯罪分子可以通过音频分析软件记录用户输入的击键,用户的账号和密码可以通过分析获得,计算机或手机木马可以被盗。取密码也成为一种新的犯罪趋势;由于密码通常是6位数字符串,因此某些用户的密码很简单或有规律,很容易被金融诈骗者猜到;如果用户密码不安全,当手机银行静止时如果密码输入错误3次,系统将冻结用户的账号,造成许多不便。

其次,动态密码卡也是手机银行中最常用的身份验证方法。当用户在手机银行上进行转账、支付、购物等操作时,手机银行系统随机提供密码卡的一组密码,用户根据卡片找到密码组合的号码坐标并将其输入移动银行系统,但使用密码卡也非常不方便。首先,密码卡采用九方网格模式。每次用户执行交易操作时,很难在九平方网格中找到该数字,很容易误解,认证失败。其次,密码卡仍然会有丢失或偷看、拍照和复制等等风险。

第三,动态端口令牌是一种特殊的硬件,它定期更新密码生成芯片的密码并具有显示功能,安全性能相对较高。对于用户来说,基本上手机没有离开的状态,但是用户不方便随身携带动态令牌。如果没有动态令牌,则无法执行移动银行上的交易操作。

第四,由于密码信息与用户的身份无关,因此在协商账户疏忽时不能作为用户身份的依据。

五是银行基于安全性考虑,在向他人的账户转账和汇款的业务上对资金额度有所限制,造成了大客户使用的不便。

因此,为了提高远程银行的可靠性、安全性和便利性,银行迫切需要引入新的身份认证技术,特别是基于语音验证技术的声纹识别技术。由于语音可以通过电话远程验证,这自然成为远程银行引入新认证方法的首选。

二、声纹识别技术在金融应用中的优势

(一)声纹识别基础理论

声纹识别即说话人识别,是利用说话人的语音判断说话人身份的生物特征识别技术。有两种主要类型的应用场景,即说话人识别和说话人确认。前者用于判断一些人(或大量的声音)中的哪一个被称为“多个选一个”问题;而后者则用于确认某个人是否指定某个语音,是“一对一识别”问题,而银行系统大多属于后一个应用程序,即用于识别是否存在服务对象的身份是正确的。与指纹识别类似,每个人说话过程蕴涵的语音特征和发音习惯等也是唯一的。因为具有唯一性,所以可以作为身份验证。

(二)声纹识别原理

声纹识别基本上通过比较包含声音声学特征的声纹来分离声音。通常人们使用音调(音频),响度和音色作为声音的主要特征,并使用它们来区分声音。物体的振动频率确定声音的音调,物体的振动幅度与声源的接近度和响度紧密相关,并且音调是各种单音声音的组合,其由发声物体本身的材料和结构决定。这是我们进行声纹鉴定的具体对象,因此在声纹录制(声音录制)时尤其要注意对这些特点的保持。声纹识别的主要特征包括:语音信号处理、声纹验证、声纹建模,声纹特征提取、声纹比较、判别决策和验证结果。声纹识别原理如下图所示。

图1 声纹识别的原理

 

图2 特征提取过程

(三)声纹识别的优势

各种生物特征比较

三、远程银行声纹识别的技术实现

随着信息技术与互联网日益发达,远程银行也逐步在创新以吸引客户。远程银行通过电话这种现代化的通信工具把用户与银行紧密相连,只要通过拨通远程银行的电话号码,就能够得到远程银行提供的其他服务。远程银行的出现和应用可以使用户随时随地处理金融服务。对于许多消费者来说,以前需要在银行柜台进行操作的购物、转账、支付等都是通过电话完成的。通过这种方式,一方面可以节省用户去银行和排队等待业务的时间。另一方面,它还降低了银行设置网点和银行职员的成本。远程银行正迎来一个快速发展的黄金时期。近年来,人脸识别和指纹识别技术逐渐进入银行业,为银行和客户提供便利。然而,这两种技术在远程银行业务中并不是特别方便,因此远程银行正在逐步引入声纹识别技术。

(一)声纹注册。

在客户开立介质账户或数字账户时,银行可通过VAD检测,降噪、去混响处理,提取有效语音的声纹特征,建立声纹库等各步骤,实现声纹注册。比如,在声纹登记链接中,当用户首次使用远程银行服务激活信用卡或银行卡时,客服人员确认合法身份后,客服人员向客户询问10个问题,如:你叫什么名字,你哪一年?您最喜欢哪种颜色等问题,客户重复客户服务问题,并回答这个问题,客服会将中文字符问题的答案输入数据库,形成语音密码识别模板,登录后验证语音密码。同时,声纹识别系统自动收集用户的声音,提取用户的声纹功能,将其保存在声纹数据库中,并将其作为客户的声纹功能进行身份验证。两者的组合可以达到与当前指纹验证相当的水平。

(二)声纹验证。

在客户通过手机、电话、物联网设备登陆远程银行时,通过客户的声纹比对,说话人事先录入过自己的声音后,验证时,只需要说一句话,即可验证自己的身份,多用于登录、支付等场景,可以替代密码这种繁琐输入,也可以为安全性要求高的操作多设置一道屏障。实际上,微信和支付宝已经支持“声音锁”功能了,只需要念一组8个数据,就可以开锁。在金融领域,声纹1:1的应用会更多,一般用于贷款时的身份确认,代替签名。

在国外,英国巴克莱银行、美国花旗银行、澳大利亚国家银行、万事达卡机构等都已开始引入声纹技术。在我国,2016到2018年间,中国建设银行、贵阳银行、兰州银行、西安银行、中国银联等多家单位与北京得意音通公司合作,由后者为其提供声纹识别身份认证服务。在信息技术逐渐发展的当下,银行业逐步引入声纹识别技术,但是声纹识别技术也面临很多挑战,可能存在不法分子进行模仿声音、人的声音会随着时间变化等情况严重影响声纹识别技术的准确性。

四、声纹+:远程银行客户体验提升建议

综上所述,结合远程银行的现状,可以知道声纹识别技术将会给远程银行服务带来巨大的变化,声纹技术的应用是银行服务的创新之处,也使得银行的服务更加灵活,客户使用也更便捷,对于吸引客户从而增加客流量来说具有重大意义。远程银行应用声纹技术进行优化服务可以有以下方面:

(一)声纹+云柜员

在轻型化、虚拟化的智慧银行建设过程中,未来银行交互的线上化可以实现交互距离的无限延伸,远程银行的座席将从后台走向前台,成为线上化的“云柜员”,线下网点的实体设备会被越来越多的视频交互设备来替代。声纹识别系统的语音获取方便、自然、简单,在用户通话中随着人体细微的变化也不断更新,不用携带,它不会被丢失或遗忘,所以不会造成给用户带来不便。它可以大大提高用户的体验和信任,这可以增加用户和交易量的远程银行的数量,从而降低成本和提高价值。声纹技术可以保证最优客户旅程体验的前提下,让整个流程变得风险可控。

由于说话者的个性特征有长期变化,远程银行的声纹识别系统可以加入在线自适应功能。为了维护用户的声音最好的验证结果,这个功能就是通过使用新的语音记录更新当前用户保存在声纹库中的声纹模型。同时无论当前用户是合法还是非法身份,系统都可以把用户的语音信息和声纹比对结果记录下来备份,当出现相似语音时可以识别,这样可以保证声纹识别技术的准确性。

(二)声纹+智能客服

在登陆验密时,在用户注册然后使用远程银行服务之后,客户服务系统将随机询问之前已用户注册时保留的问题,系统根据用户的回答确定语音密码是否正确,并提取当前用户的语音特征和数据库中的样本特征,进行比较以确定当前用户是否是合法用户,从而决定授权拒绝(可以在第一时间通知合法用户)或其他选择。

在用户体验时,远程银行可以利用粉丝效应,在智能客服中引入明星人设,通过分辨用户声纹特征,自动提供符合用户偏好的明星声线为客户服务,让服务客服更富有趣味。在银行产品推广上,也可以开发设计声纹语音产品,年轻客户通过远程银行申请或购买该款产品,即可触发为自己的偶像打call应援,从而提升银行产品对年轻客户的吸引力。这不仅是对远程银行应用声纹识别技术的宣传,也是对银行产品的宣传。

(三)声纹+无人门店

相比于传统网点,由自助网点进化而来的银行无人店强调以机器取代人工运营、节省人力劳务成本,且占地面积会更小、节省租金;其中最大的亮点是更便利,无需排队,交易全自助,极大地节省时间。尽管概念很性感,但落地过程中出现了很多问题。最显著的便是机具操作方面,仍存在较多的不便利性。交易大部分需要客户进行手工操作,因此无人店仅仅是解放了银行单方面的人工,对于客户来说其实增加了大量繁琐的操作,实际上体验是不升反降。此时,声纹识别可以派上大用处,在账户登录、大额转账、无卡取款等涉及账户和金额的业务中,无人门店可以设置动态声纹密码进行客户端身份认证,可有效提高个人资金和交易支付的安全。

此外,远程银行还可以将无人门店技术进行推广,结合现在比较热门的“智慧城市”、“智慧医院”、“智慧旅游”、“智慧商场”等开发带有声纹识别技术的支付领域,可以兼顾城市交通、医院医疗服务、旅游规划、商场合作和银行业务推广等,方便用户使用,构建数字大脑,有效实现获客。

(四)声纹+普惠金融

在普惠金融领域,多数银行的信息采集与身份识别等审核机制及反欺诈手段仍大量依靠人力,数字化与智能化水平较低,这一环节是声纹识别技术应用的重要阵地。在审核方面,声纹识别技术能为银行提供基础 AI 服务,量化审核用户信用,可在降低金融服务审核的准入门槛的同时,帮助银行建立高效信息获取和风险管理机制。经验丰富的数字科技企业基于海量行业业务数据的调用和认证,充分验证服务的稳定和有效性,最大程度上为银行降低身份识别过程中的风险。

在反欺诈方面,声纹识别技术可分为数据采集和数据分析两种技术类型。其中,数据采集技术主要是应用于从客户端或网络获取客户相关数据的技术方法,包括:声纹比对、网络爬虫、生物探针、地理位置识别、活体检测等等;数据分析技术是指运用声纹分析工具从数据中发现知识的分析方法,包括有监督机器学习模式、无监督机器学习模式和半监督机器学习模式。

(五)声纹+智慧投资

在智慧投资领域,在声纹识别系统中加入年龄段设置系统,不同年龄段设置不同的产品推荐。在客户使用远程银行或手机银行办理业务时,系统自动根据客户语音声纹判断客户的年龄段,为其推荐最佳的银行产品服务,极大地为客户提供了便捷,也为银行带来稳定的客户量。

未来,远程银行还可结合人工智能对声纹进行处理与分析,人工智能可通过具有一定自主性的演算进行更为精准的特征提取和识别以得到更为精确的声纹特征数据,减小结果的误差,使得到的声纹特征具有更为强大的可靠性和利用性;人工智能和声纹识别技术都尚有广阔的发展空间,出现的计算错误或步骤差错可通过人工计算和人工智能自我演算来纠正并改进分析计算模式,这使得智能声纹识别的出错率得以逐步降低而容错率逐步上升;人工智能在进行声纹识别的过程中也可进行其他类别的工作,这使得智能声纹演算拥有更大的应用领域及利用价值。

 

作者:郭子枫;单位为中国工商银行苏州分行;

本文刊载于《客户世界》2021年3月刊。

转载请注明来源:声纹识别:打造物联网时代远程银行的极致体验

相关文章

噢!评论已关闭。