桃树信用风险管理“三部曲”之一:贷前审核
来源:桃树 | 作者:杨子 | 发布时间: 2017-10-11 | 187 次浏览 | 分享到:
DataBrain左一个RobotX,右一个Atom,把费时费力的贷前审核问题统统消灭。
导读:人工智能到底是实验室里的天马行空,还是将颠覆世界的科技创新?这个话题自人工智能概念于几十年前兴起,经过几次人工智能热潮的起起落落,依旧为人们津津乐道。作为一家创始人有超过十年人工智能科研及实践经验,且团队已经成功在多家客户落地人工智能解决方案及产品的AI公司,经客户许可,桃树将以一系列实战案例,展示人工智能如何从象牙塔走进企业,又为何将成为未来商业社会的基础设施。今天我们分享的是桃树的机器学习技术在贷前审核领域的积累及应用,此为桃树在金融领域“信贷三部曲”的第一步。

一、贷前审批

贷前审批,究其根本都是要确定两个问题——申请人是否具有资格通过申请?可申请的额度是多?。贷前信息审查是银行发放贷款/信用卡的第一道关卡,也是贷款/信用卡发放后能否如数按期收回的关键,是信贷风险管理的必备章程。


传统的贷前审批,审查周期长并且对审查人员的资质要求很高。银行在收到申请后,审查人员将对申请人的申请用途、资信状况、偿还能力以及资料的真实性、合法性进行认真审查。审查的形式包括面谈、网络、电话及现场核查等多种方式。同时,审查人员还将调用核查资料真实性的工具,包括:身份证真伪查询、社保信息真伪查询、学位证书真伪查询、系统内外黑名单、个人信用报告、公检法网站查询执行记录企业信息等。

如今,随着大数据和机器学习技术的发展,贷前审批这一步骤已经可以通过建立风控模型和决策引擎来替代繁琐的人工审批。通过数据分析来建立风控模型,固化到决策引擎和评分卡系统,优势有两个方面:


1. 决策自动化程度的提高,降低依靠人工审核造成的高成本,提升审批速度
2. 解决人工实地审核和个人主观判断所带来的审核标准不一致的问题,从而标准化审批流程


二、为什么要使用机器学习技术做贷前审批?

利用机器学习技术建模,在信贷申请审批上,可以有效地减少传统方法存在的主观性和不稳定性,提升审批过程的效率和准确性。


如今,在银行、消费金融公司等各种贷款业务机构,数据专家普遍使用信用评分卡模型来进行信用风险评估及金融风险控制。


信用评分卡模型的原理是使用信用评分,对客户实行打分制。。信用评分是指根据银行客户的各种历史信用资料,利用一定的信用评分模型,得到不同等级的信用分数。


根据客户的信用分数,授信者可以分析客户按时还款的可能性,并据此决定是否给予授信以及授信的额度和利率。


由此可见,建立信用评分卡的核心,是数据+模型——银行拥有大量的客户数据,而机器学习技术则擅长在数据中建模并找寻最佳规律。依托银行数据,基于机器学习手段和业务经营,授信者可以快速得到一个信用评分,准确判断授信金额以及风险,以此为据作出最终决策。 


机器擅长于提高效率,而人则擅长于创造。机器可以不用下班,不用休假,完全剔除人功审核的主观性,因此,信用评分卡模型在贷前审核中一直表现突出。


机器通过学习人的思维,替代人去解决了审批过程中重复的工作,把业务人员解放出来对业务更深入地理解。同时,人通过理解机器评分的逻辑,不断积累更丰富多维的审批经验,再将这些经验通过调教模型授予机器,这是机器学习不断完善和优化的核心——让人与机器进行完美的契合,让业务与信贷申请模型不断循环升级。


三、桃树贷前审批解决方案 

桃树解决方案的核心,是独创的桃树数据科七剑体系,包括数据预处理、分群建模、预测建模、算法调参、知识发现、效果分析和模型监控等环节。


完整实施一个数据科学项目需要一个团队,其中不仅包括数据科学家,还包括业务专家、数据库专家、算法专家和系统专家。在这个团队中,数据科学家的核心角色是设计出一个将业务、数据、算法串联起来的闭环体系,其他团队成员则基于数据科学家设计的蓝图将数据解决方案转化为解决业务问题的智能系统。


我们接下来将详细介绍“七剑体系”如何在贷前审批中做到效率及准确性的双双提升。


通常,在申请阶段(一般指贷前审批),我们使用信用评分卡中的申请评分卡,即A卡模型


1、问题定义
根据业务情况建立A卡模型,准确反映并量化客户的风险级别,科学有效管理风险以控制和减少信贷损失,在控制可接受的风险水平的同时争取更多优质客户,有效提高市场占有率,提高审批效率,减少运营成本。


2、数据准备
银行内部信贷申请数据及其他相关业务系统数据,数据工程师根据业务目标提取正负样本及特征值,生成建模所需的“宽表”。通常,由于数据来源众多,数据表结构复杂,提取有效的正负样本并且从正负样本中抽象出特征值是建模中最耗费时间的一步,而数据质量的好坏又往往是模型开发成功与否的关键因素之一。



针对这一问题,桃树科技自主研发的机器学习建模平台DataBrainTM中的RobotXTM组件,经过在众多金融客户中反复的实践及应用,已证实可以快速提取具有业务意义的特征值,生成建模所需的“宽表”。桃树DataBrainTM在众多客户落地案例中,均显著缩短了数据准备所需要的时间。


3、算法调优
样本数据清洗完毕之后,需要根据样本数据选择合适的算法进行建模。逻辑回归是最常用的建立申请评分卡模型的方法。在桃树科技,我们在DataBrainTM中调用自动化建模机器人AtomTM组件进行自动调参完成算法优化。


4、效果分析与线上部署
在这个阶段,桃树数据科学家根据指标衡量模型效果及计算效率,合理评估A卡模型的业务价值。在模型效果符合标准的情况下,再将模型接入业务系统,让模型在海量数据中自动学习并且不断自动优化。


5、模型更新
我们的支持远不止于模型上线。在模型成功部署上线后,桃树的数据专家会实时监控模型效果与业务指标,不断收集反馈数据,持续更新模型。同时,我们也可以根据客户的业务变化,将新的业务指标添加到模型中,确保模型针对业务实际需求,一直保持高效运行。


以上,总结了桃树如何实际运用最前沿的人工智能技术,配合独创的“七剑体系”及机器学习平台DataBrainTM,在贷前信用风控中让放贷机构效率最大化。在接下来的信用风险管理“三部曲”中,我们还将陆续展示桃树的服务及产品在贷中及贷后管理中的落地案例。

如果你也已厌倦旁观期待新挑战,如果你有十八般武艺只待尽情施展,桃树有求贤若渴的金牌销售团队及极客技术团队,只等你来!

金融行业解决方案专家、金融行业建模专家、数据建模实施工程师……更多职位及详情:http://www.taodatarobot.com/join-us.html



桃树只研发最前沿的机器学习应用技术

我们只发布最干货的大数据知识


微信扫码关注桃树公众号