知识图谱的客户关联关系解决方案

    |     2020年12月25日   |   客世原创   |     评论已关闭   |    992

知识图谱本质上是基于语义网络而形成的知识库,即基于语义网络存在相互有一定关联关系的集合,这些关系蕴含着现实世界对象之间的关联。因此,可以把知识图谱理解为蕴含关联关系的多维关系图。知识图谱一般从逻辑上可以包含多种类型的节点和多种类型的关联,这种多类型的节点,通过相互不同类型的关系进行关联而形成复杂的网络结构,也就映射着复杂的现实世界。为了能构建知识图谱,通常用“点”来表示实体、“边”表示关系。比如,在现实当中实体可以表明一些具体的人或概念事物等实体,而关系则可以表达不同实体之间的某种关联,如某人和某人之间是朋友关系、某人是某企业股东等相关的关系。因此,实体关系在很多场景非常适用,并适合用知识图谱来表示。比如,在一个社交网络图谱里,人与人之间可以是朋友关系,也可以是同事关系;同时也可以是人和公司之间的关系。一个实体具有很多属性,且具有各种各样的关系,从而可以全方位地刻画整个实体,并通过关联和属性的刻画深刻地描述世界。

构建知识图谱的过程主要分为实体识别、关系识别、实体归一、知识解析。构建知识图谱的首要步骤,就是要对每个实体进行分类和打标签,根据一定的规则对实体进行识别和命名,标上相关的标签,一个实体的标签可能是一个,也可能是多个,但其中必须有关键的标签指向同一个实体,不同的关键标签指向不同的实体。在识别实体的过程中,同时识别实体之间语义关系,实体和实体语义关系形成知识的范畴。在构建过程中存在这样一种情况,不同的关键标签指向不同的实体,但这样的实体本质是同一的,需要进行实体归一,可以采取多维实体分区、多模型融合实体等价判定、基本主动学习的关键样本构建等技术,解决知识分歧,进行实体合并,提高知识图谱的价值密度。知识解析是在形成的海量知识图谱数据基础之上,利用深度神经网络技术,从不同的层次对实体对象及语义进行解析,从而实现认知层次的语义理解,并与实际的应用场景进行结合,进行知识的计算与推理,获得较好的应用效果。

一、客户关联关系知识图谱的构建

客户关联关系是指客户在经营管理和融资过程之中,因股权分配、进行交易、开展担保等而产生的股权、交易、担保等之间的关系,比如一家企业在另一家企业中股权投资比例大于50%,则它们之间存在强股权投资关系;如果低于50%,则它们之间存在弱股权关系。其他如还存在股权投资关系、控制人关系、担保关系、交易关系、地址关系、事件关系等,其中担保关系等比较关键。

1、主要的客户关联关系

股权关系、控制人关系、担保关系是银行比较关注的客户关系,在银保监会发布的《商业银行集团客户授信业务风险管理指引》中,股权关系、控制人关系是集团客户认定的重要依据,是银行对客户风险进行准确评估不可或缺的重要内容。在银行信贷具体实践过程中,需要重视连环担保、过度担保蕴含的风险,中小企业为了从银行获取授信,采取A对B进行担保、B对C进行担保的方式,从而形成连环担保关系,相互抱团取暖,隐含较大的关联风险,如其中一家企业出现风险事件,将会影响到担保圈中的所有企业,牵一发而动全身,给银行带来巨大的风险。

中小企业进行信用评级时,由于缺乏规范的经营管理、财务等相关数据不够规范、不具有有效的抵押物等原因,难以获得较好的评级结果。一些中小企业急于获取信贷资金,只有冒着风险进行连环担保。在实践中,担保圈涉及的债权债务会形成复杂的债权债务关系,有时相当隐蔽,而且担保圈范围也在不断发生变化。银行需要充分识别、分析客户之间的担保关系,特别是以保证方式办理的融资业务均应纳入担保圈识别、分析和管理范围。

2、客户关联关系的描述

可以使用知识图谱相关技术来对客户关联关系进行描述,知识图谱的本质其实是一种大规模的语义网络,它以实体或对象作为节点,通过语义关系进行连接,通过相关算法对实体或对象之间的关联关系进行挖掘,从而可以深入地分析数据、理解数据,进而进行知识推理和数据挖掘,挖掘和展现实体之间的关系,其在银行的客户关联风险识别、风险监测领域内具有较好的应用。

语义网络是可以用图来描述的一种数据结构,它主要由节点和边组成,可以采用G=(V,E)等相关的方式进行定义,每个节点表示对应现实世界存在的一个实体或对象,而每一条边表示实体和实体或对象和对象之间的关系,因此,在客户关联关系描述中,可用节点表示单一法人企业,边表示单一法人企业之间的股权关系、担保关系等关联关系,边的方向可以代表的股权、担保的控制关系,比如采用带箭头的边,边的起点表示控股企业或提供担保的企业,边的终点表示被控股企业或被担保企业,并且根据需要进行完善和叠加,股权控制关系的叠加识别,可以实现集团客户自动识别,担保关系的叠加识别,可以实现担保圈的建立和展现,通过多重层次的刻画和知识叠加,从而获取蕴含较为完备知识的客户关系图谱。

3、客户关联关系的知识计算

在全面收集和整合银行内外部客户相关数据的基础之上,对不同的客户数据进行全面分析和充分理解,根据不同类型的客户关联关系,设置不同的处理逻辑,采取不同的处理方式进行处理,以股权控制和担保关系为例,设置不同的代码对应相应的类型并在相应的数据类上增加标识,并设置起始标志,以区分不同的关系类型及关联方向。

客户因股权、担保、交易等关系而形成的关系称为“客户关联关系”,而经过分析、整合和去重,可以形成清晰客户关联关系图,主要的步骤如下:

一是确定关键企业,访问图中的企业,对于所有关联指向别的企业确定为关键企业,这样采取图遍历算法对图中所有企业进行遍历,可以获取所有的关键企业,关键企业对应的是集团客户或控股企业。

二是以关键企业为起点,选择一种关联方式,通过关联方向不断地向下搜索,采用深度的递归算法,找出此类关联方式的所有关联企业,获得此类关联关系的关系图谱,完成后选择另一种关联方式,采取同样的方式进行搜索、识别和标记,获取相应的关联关系图谱,重复上述步骤,直至所有关联方式选择完成,从而形成主体部分的客户关系图谱,可以称为“骨干客户关系图谱”。

三是在骨干客户关系图谱的基础上继续搜索具有业务来往的相关企业,从而获得企业具有业务往来的相关关系图谱,成为客户关系图谱重要的辅助部分,可以称为“外围关系图谱”。

外围关系图谱可以认为是在骨干客户关系图谱的基础上进行的一次拓展,实现客户关联关系管理的外延,从而更加清晰地分析客户股权、交易、事件、担保的核心关系和外延关系,更好地服务银行对客户日常经营管理的监测及评级授信的相关工作。从风险管理角度来看,在骨干客户关系图谱的基础上进行适当地扩展,加入外围关系图谱,更有利于银行建立更加全面的视角,深入分析客户的潜在风险,特别适用于连环担保、产业链上涉诉、资产重组等关联企业的经营情形,从而促使银行更加清晰地看监测企业经营管理的潜在风险,有助于风险管理部门获得更为全面的风险管理信息。

二、客户关联关系知识图谱的应用

当前,银行在客户调查过程中,对客户的关联关系、客户风险的准确分析和评估始终是一个难题,由于欺诈依赖于信息不对称和间接关联,一些深藏的风险较难显现,给银行业务的稳健开展带来了较大风险。而基于知识图谱的客户关联关系分析,将不同种类的信息关联在一起形成一个关联网络,这些关联风险能被较好地揭示出来,使隐蔽欺诈和连环担保难以隐身,银行结合实际情况,可在精准客户画像、信用风险评价和客户风险预警等领域进行有益的探索和实践(如图1所示)。

1、精准客户画像

对客户关联关系透彻地分析和展现,需要客户各个维度的数据,在收集客户多维数据的基础上,充分分析潜在的客户关联关系,基于股权投资、控制人、担保、交易、地址、事件等关系,以目标客户为核心,对客户及其关联关系进行全景式地分析和展现,形成相互关联的链状、圈状客户关系全景视图。特别在对集团客户的认定时,全面分析和展现集团子公司之间、子公司与集团外部公司之间的复杂关联关系,生成客户股权关系、担保关系、资金交易等关系图谱,将客户的骨干客户关系和外围关系准确地展现出来,为准确地进行客户画像和风险识别提供重要的支持。

2、信用风险评价

充分融合银行内部数据、企业的基础信息、投资关系、工商数据、税务数据、行业数据、电商数据等各类数据,进一步拓展客户相关的数据类型,充实到知识图谱平台当中,形成比较完整的客户多维数据和行业景气数据,建立多层级客户关联关系模型,构建科学、严谨的企业风险评估体系,利用知识图谱图挖掘分析技术,在对违约概率(PD)、违约损失率(LGD)进行计量时,充分考虑客户关联关系类指标,使信用风险计量更加准确,为单一法人客户、集团客户信用风险评价提供有效支持。

3、客户风险预警

探索和建立基于关联关系的客户风险预警模型,运用对客户关系异动相对敏感的算法,识别关联担保、多头抵押风险,监督资金用途,及时发现关联企业之间违背资本真实性原则频繁调拨资金,利用关联交易或不合理的转移定价抽逃资金等违法行为。通过设置容忍度阈值,一旦相关指标超过该阈值,进行风险预警,同时不断完善模型,提高预警的准确性和及时性,从而有效规避客户潜在的经营风险与资金风险(图1)。

图1 客户关联关系知识图谱的应用

4、反欺诈应用

反欺诈应用建立在对大量数据分析的基础上,使用传统的关系型数据存储对交易行为进行分析,需要进行各类复杂的表间关联和数据连接,有时数据连接未必能尽如人意,分析起来十分复杂,识别效率可能较低,效果难如人意。将交易欺诈环节可能涉及对象及其关联设计成为知识图谱进行全面展现,交易的关联信息清晰地快速分层展现出来,其中的欺诈环就较容易识别。比如,输入某个可疑的手机号,看其关联层次范围内涉及的申请人信息,分析申请人是否与其他可疑对象关联成欺诈环,或与历史具有欺诈行为的申请人间是否有过关联等,判定是否存在欺诈行为,及时采取反欺诈措施。

5、反洗钱应用

将知识图谱技术充分运用到洗钱风险的侦测过程当中,通过融合客户多维数据,对不同路径机构中资金转移、流动、清洗等多个事件建立关联关系,建立智能大额交易和可疑交易侦测模型,结合创新的图计算算法以及可视化交互工具,形成针对案件追溯反查和异常交易结构主动发现两大类原型工具,支持图形化、可视化洗钱风险识别和排查,提高客户身份识别的技术和能力,实现客户尽职调查,实现大额交易和可疑交易及时发现和报告,使银行能够较好地履行反洗钱义务。

6、资金监控

银行内部人员可利用内控某些流程上的漏洞或缺失,在监督失效或相关有权人不知情的情况下,将资金从银行偷偷转移,牟取利益。为避免这种情况的发生,可通过建立资金流向相关的知识图谱,将相关信息相互连通,对账户交易情况实时分析,通过账户及账户间交易,加上资金交易特征,可以挖掘循环交易网络,进而发现一些隐藏的蛛丝马迹,找出资金流向失控的环节,并及时控制,避免出现资金损失。

 

 

作者:董鹏;为专栏撰稿人、资深企管咨询顾问;

本文刊载于《客户世界》2020年12月刊。

转载请注明来源:知识图谱的客户关联关系解决方案

相关文章

噢!评论已关闭。