超AI说｜从大海捞针到按图索骥，厘清复杂的银行风控场景-明略科技

首页知识图谱超AI说｜从大海捞针到按图索骥，厘清复杂的银行风控场景

超AI说｜从大海捞针到按图索骥，厘清复杂的银行风控场景

2021-10-14

小明：

金融是一个高风险的行业。而且由于它在国民经济当中的重要地位，单个金融机构的风险可能引发多米诺骨牌效应，牵一发动全身。现在的金融机构，比如老百姓接触最多的银行，是怎么防范风险的？

邹明：

简单点儿说，银行是吸收存款、释放贷款产生利差，这个是银行收入的一个主要的来源。在这个过程当中就会产生风险：如果这笔贷款回不来，风险如果不能被有效管控，贷款产生损失的话，那自然大家的存款就会受到损失。这是一连串的资金链。

银行的风险主要指银行在吸储和投资的过程当中，怎么保证资金的安全性问题。通常我们说，在银行风险管理里边有三道防线，简单点说就是事前、事中和事后，会有整套的风险稽核的业务手段来保障整体的风险是可以预见的、可以防范的，当风险发生之后，我们也会有相应的手段去应对的。

比如说我是一个企业主，我想为我的公司的经营申请贷款。对于银行的客户经理来讲，他需要对这个客户进行相应的评级工作。所谓评级就是衡量这个客户的信用等级是高、中还是低，从而来决定我们要不要和这个客户签约。这是在事前的阶段。

事中的阶段是说，我们要去衡量当这笔贷款发放出去之后，他的业务状况是否能够保证有足够的还款能力。银行的员工需要查看这个客户的相关信息，比如说他的厂房、员工、实际的生产资料购买和使用的状况，以及最终商品售卖的情况。如果这个企业本身就是一个入不敷出的经营状态的话，银行是不可能给他贷款的。

事后我们要不断去了解这家企业的经营状况，它是不是持续有比较健康的现金流？他的业务开展是不是顺畅？特别是银行给他放出的贷款是不是用在他原本去申请这笔贷款的目的上。整个流程我们要看服务对象本身的情况、经营的要素、对于合同的执行的状况是否符合他和银行签约的条款和内容约束。这是整个对于这笔业务的风险保障的一个流程。

传统的风控手段其实需要大量的人工介入，出于两个原因。一方面，过去我们在大数据时代之前，业务人员没有足够的信息来支撑他做出足够的判断。另一方面，从信息化、数字化的层面，没有比较好的技术手段将这些数据变成能给他足够洞察的结果。

小明：

俗话说“道高一尺，魔高一丈”，尽管金融机构在科技化领域走在了前沿，但仍然避免不了有心人钻空子，比如媒体广泛报道的“羊毛党”。对于越来越科技化、隐蔽化的黑灰产、欺诈行为，银行如何应对？

邹明：

对于金融诈骗或者金融犯罪的这些行为，其实银行一直在行动。

还是先前说的三道防线，每一道防线都会不断地监控可能发生的外部风险事件、内部存在的风险合约等等。薅羊毛这个事有很多方面，它是属于反欺诈的分类。

对于欺诈行为的识别：什么样的人，在什么样的时间，通过什么样的渠道，和银行产生了一次什么样的交互。这些特征综合在一起，是否构成一个欺诈的行为，在银行内部有一个不断升级的反欺诈的特征识别库。这个库会用到我们的数据中台、知识图谱等技术。到下次再有类似的特征发生的时候，很快就会关联到这个特征库，再去做相应判断。

第二个点通常叫“欺诈团伙发掘”。欺诈这种行为，特别是薅羊毛这种行为，往往不是一个人在战斗，背后通常有一个利益群体。我们会综合一些例如资金交易往来等的数据，将一些经常有交易往来的客户识别出来。在这个基础之上，我们可以构建出一个疑似欺诈团伙的图谱。把这些团伙找出来之后，再结合相关的特征，不仅可以防止他们去产生一些欺诈、薅羊毛等行为，还可以把这些团伙的知识固化在我们的知识库当中，未来不断升级，防止更多类似的或者跟他有关联的欺诈行为。

小明：

您刚才提到，银行业务人员每天面对大量业务和复杂的流程，想必工作是千头万绪。企业的数字化怎么能帮助他们理清头绪呢？

邹明：

我理解这个问题，应该是分成三个步骤：数据的收集整理，数据的组织和关联，数据的应用。

银行会有很多的数据，不一定都来自于业务系统数据库，也就是说它需要处理很多结构化数据，还要处理很多非结构化数据，这些数据可能甚至包括一些纸质的文档等等。金融机构经过这么些年的信息化建设，过去这些系统是我有个新的需求，就去建一个系统。竖井化的银行IT架构，自然就造成了数据的相互割裂。

所以就产生了数据仓库这样的一个概念，把割裂的业务系统里的数据都汇总到一个统一的仓库里，统一组织、统一使用。这是过去在这方面的一个尝试。但是到了大数据时代，特别是还要解决非结构化数据如何结构化这样的问题，信息量其实产生了指数级的增长，传统的数据仓库也无法支撑大数据时代的数据规模。

我们要解决的问题是，从海量的多源异构的数据里找出有用的信息。明略科技的NLP技术，可以解决非结构化数据结构化的一个问题；数据中台，比较好地解决了竖井化的各个业务系统当中，数据如何收集和归并的问题；当这些数据归并到一个数据中台之后，知识图谱可以在这些数据之间构建它们的关联关系，使得这些数据形成一张大网，彼此关联起来。有了这样一个知识图谱之后，我们就有能力构建相应的行业模型，能够产生业务价值的大数据智能型的产品。

小明：

接下来这个问题我想不光金融机构，很多其他企业可能也遇到过：企业采购了或搭建了数字化系统，但是业务部门并不爱用，或者并不会用，它就变成了技术部门自嗨的状况。为什么会出现这种尴尬的局面？

邹明：

这个问题非常好。第一，传统信息化系统是有专业程度的，它是为银行内部一些专业的业务过程服务的。基于这样的一个出发点，它并不是对于所有人来说都能获得很好的使用体验。第二，我们过去的数字化系统的设计和实现，往往都会存在一个问题：对于技术人员来说比较友好，但是对于业务人员的友好度不够。

正是存在这样的问题，使得很多的IT系统使用曲线是非常陡峭的。在我们意识到这些传统系统的问题之后，特意对这个系统的使用体验去做了一个重新的设计。我们会从关注用户日常业务场景化的角度去重新规划整个系统。传统数字化系统往往是一些具体功能的罗列，我们的产品提供了一种向导型的使用体验。我们希望直接给客户推送他需要使用的功能，而不是让客户在系统当中去找，从流程上给他提供一个比较平滑的体验过程，不会让他产生脱节感。

举一个例子，对于风险预警这样的一个话题，过去银行的业务人员需要主动分析数据，包括报表的形式等，从这些数据当中找到一些疑似的风险点，基于这些风险点做相应的预警的处理。向导式的功能能够逐步引导客户去完成业务的处理，对于风险预警，更加自动化地、更加智能地将这些风险摆在业务人员面前。

比方说中美的贸易战对出口的行业可能会产生一些什么样的影响？在我们系统当中都会有相应的模型和算法，每天接收来自于外部的海量数据，由这些模型算法自动做出相应的分析，分析之后形成相应的洞察，为银行的客户经理提供相应的风险通报，以及可能金融机构应该采取什么样的措施，由他们来参考如何对这些风险，进行预警。

进一步，我们会在某一些业务领域、某一些业务专题上提供专门的分析的工具。比如说票据业务流程当中会牵涉到很多的实体，有相关的关联方、客户、资金，包括银行自身也是业务参与者。过去，在处理相关业务时候，实际上没有一个工具来集中看整个银行所有的票据，往往都是发生在某一笔具体的业务当中，或者是从客户的角度关联到这笔业务可能有问题。我们有专门针对于客户生命周期的分析、针对于资金流水的分析、金融票据的分析，能通过这些专题，有针对性地解决我们的客户所面临一些单点的问题。

小明：

我们常说机器学习是一个“黑盒子”，计算机给出结果，但是它如何算出来，我们是不知道的。但是对于金融以及医药、法律等其他很多领域来说，知其所以然非常重要。我们能够通过什么样的方法打开黑盒子呢？

邹明：

金融机构，特别是银行，是存在一些特殊性的。无论是从数据，还是我们基于数据产生洞察的结果，务必精确。所以对于金融机构来讲，模型的可解释性是非常重要的。当下流行的这些机器学习手段以及一些产出，都存在一个可解释性的问题。可解释性不高的原因，一方面是我们对于银行数据的了解程度不够，再有一个原因是我们产出的模型其实并没有吃透银行相关的业务。这两点也是我们一直在努力的，希望对业务场景的深刻理解，能够帮助我们去构建更加精确的数据加算法。