1、 大数据在金融领域的典型应用研究 中国支付清算协会金融大数据应用 研究 组 中国信息通信研究院云计算与大数据研究所 2018 年 3 月 1 版权声明 本报告版权属于 中国支付清算协会金融大数据应用 研究 组 ,并受法律保护。转载、摘编或利用其它方式使用本白皮书文字或者观点的,应注明“来源: 中国支付清算协会金融大数据应用 研究 组 ”。违反上述声明者,本单位会将追究其相关法律责任。 编写指导: 王素珍 、何宝宏 编写小组: 丁华明 、赵计博、 韩涵、赵博 、何阳 2 前 言 近年来,我国金融科技快速发展,在多个领域 已经走在世界前列 。大数据、人工智能、云计算、移动互联网等技术与金融业务深度
2、融合,大大 推动了我国金融业转型升级, 助力金融 更好地服务实体经济, 有效 促进 了 普惠金融 发展 。在这一发展过程中,又以大数 据技术发展最为成熟、应用最为广泛。从发展特点和趋势来看,金融云快速 建设落地奠定了金融大数据的应用基础,金融数据与其他跨领域数据的融合应用不断强化,人工智能正在成为金融大数据应用的新方向,金融行业数据的整合、共享和开放正在成为趋势,给金融行业带来了新的发展机遇 和巨大的发展动力 。 为促进大数据技术在金融领域的创新和 安全应用,中国支付清算协会在金融科技专业委员会的基础上,成立了金融大数据应用研究组 , 依托金融科技专业委员会开展相关研究验证和推广交流活动 ,
3、充分 发挥行业协会贴近市场和 研究机构的 优势 , 深入研究 金融大数据应用理论和实践问题 。 研究组成立以来,在 组长单位中国信息通信研究院 云计算与大数据研究所的带领下,在广大成员单位的支持和配合下,积极开展市场 调研 ,努力 搭建交流平台 , 探索行业标准 建设,开展了 许多富有成效的工作 ,取得了积极成果。 其中一项重要工作就是 面向成员单位征集金融大数据3 创新应用案例 , 开展 重点 课题研究 。该项工作自 2017 年 11月启动以来,得到了广大成员单位的积极响应,共征集到 40多个有效案例。经专家严格评审,最终有 24 个案例获评 “金融大数据创新应用 优秀成果奖 ” 。研究组
4、进一步整合获奖案例内容,结合课题研究成果撰写完成 大数据在金融领域的典型应用研究白皮书 并公开发布 , 借此机会希望 促进 行业交流和优秀 成果的 学习 借鉴 , 为推动金融大数据更好发展应用贡献一份智慧和力量 。 4 大数据在金融领域的典型应用研究 数据是数字经济时代的新型生产资料,基于数据的生产变革和业务模式创新正驱动着全球范围内经济社会各个领域的数字化、智能化转型,发展大数据已经成为国家战略。十九大报告明确指出,要推动“互联网、大数据、人工智能和实体经济深度融合。” 金融行业数据资源丰富,数据应用由来已久。从发展特点和趋势来看,金融云快速 建设落地奠定了金融大数据的应用基础,金融数据与其
5、他跨领域数据的融合应用不断强化,人工智能正在成为金融大数据应用的新方向,金融行业数据的整合、共享和开放正在成为趋势。 随着大数据技术的广泛普及和发展成熟,金融大数据应用已经成为行业热点趋势,在交易欺诈识别、精准营销、黑产防范、消费信贷、信贷风险评估、供应链金融、股市行情预测、股价预测、智能投顾、骗保识别、风险定价等涉及银行、证券、保险、支付清算 和互联网金融等多 领域的具体业务中,得到广泛应用。涌现出一大批技术创新、业务突破的应用案例。总结来看,对于大数据的应用分 析能力,正在成为金融机构未来发展的核心竞争要素。 5 毋庸置疑,金融大数据拥有着广阔的发展前景。然而,金融大数据应用也面临着数据资
6、产管理水平不足、技术改造难度大、行业标准缺失、安全管控压力大和政策保障仍不完善等一系列制约因素。 为推动金融大数据更好发展应用 ,必须从政策扶持保障、数据管理能力提升、行业标准规范建设和应用合作创新等多个方面入手,不断强化 应用基础能力,持续完善 产业生态环境。 一、大数据的兴起与金融大数据的发展 (一)大数据的兴起 近年来,摄像头、可穿戴设备、 GPS 等传感器收集着大量音频、视频、图像等各类结构化和非结构化数据,随着电子商务、社交、综合信息网站等互联网应用的发展,数据基于网络大量产生并存储,信息量爆发式增长。据 IDC 的研究显示,全球数据总量年复合增长率 50%。这种增长速度意味着未来两
7、年,全球新增的数据量将超过人类有史以来积累的数据总和。 IDC 预测,到 2020 年,全球数据总量将达到 40ZB( 400 亿 TB),代表地球上每个人平均会产生 5TB 的数据。 人类正从 IT 时代走向 DT 时代,数据是数字化时代的“石油”,大数据就是数字化时代的“冶炼工艺”。通过数据的收集、 存储、分析和可视化技术,解决大数据海量、高速、多变、低密度的问题,使数据从散乱的信息,变成知识和智慧,帮助组织解决发展中遇到的实际问题。 6 麦肯锡公司早在 2011 年就已经预见到大数据时代的到来,并提出:“各个行业和领域都已经被数据渗透了,目前数据已成为非常重要的生产因素。对于大数据的处理
8、和挖掘将意味着新一波的生产率不断增长和消费者盈余浪潮的到来。” 人们已经意识到,通过数据给社会创造 价值 的能力和用数据盈利的能力将成为所有组织的核心竞争力。 纵观金融行业的发展史,每次都是科技的创新推动着金融行业的发展与变革。电报技术、互联网技术的推出都对金融机构的服务模式和风控方式产生了重大影响。近几年,各国政府不断加大对科技创新的重视程度。科技创新的速度不断加快,并逐步与金融业务深度融合,以大数据、云计算、人工智能、区块链等为代表的新技术已逐渐成为金融发展的新动力。 普华永道调研显示,在所有金融科技中,大数据是金融行业投资和应用的首选。首先,从内在需求看,在互 联网金融模式的冲击下,整个
9、金融业的运作模式正在重构,行业竞争日益激烈,基于数据的精细化运营需求日益迫切。其次,从应用基础上看,金融行业拥有海量数据资源。金融业是最有意愿进行信息化投入的行业之一,经过多年的信息沉淀,各系统内积累了大量高价值的数据,拥有用于数据分析的基础资源。最后,从产品供应上看,大数据产品已经越来越成熟,技术供给越来越丰富,部署成本直线下降。此外,部分先行者为大数据部署提供了宝贵的应用案例,使得金融大数7 据解决方案越趋完善。 (二)金融大数据的产生 金融数据产生的主体有 三 种:“人”、“机”、“ 物”。“人”指的是人类活动的数据,它是人类在活动过程所产生的各类数据,包括评论、通话记录、照片、网页浏览
10、痕迹、交易记录等信息。“机”指的是信息系统产生的数据,这些信息主要以文件、多媒体等形式存在,包括审计、日志这样自动生成的信息。“物”指的是物理世界产生的数据,是通过摄像头、传感器等数字设备在监测中采集的数据,例如服务器运行监控数据、押运车监控数据等。 (三)金融机构数据获取方式 金融机构有三种数据获取的方式:在自有系统中沉淀、在网上采集和从第三方购买。 1.在自有系统中沉淀数据。 金融机构通常会部署数百个应用系统,这些系统在日常经营中持续产生和储存数据,经过长期的数字化运营积累,数据的规模已经较为庞大。以银行业为例,目前中国单家股份制商业银行累积的数据已经达到上百 TB。波士顿咨询的调研表示,
11、银行业每创收 100 万美元,平均就会产生 820GB 的数据。 2.在网上采集数据。 金融机构在网上主要采集企业的舆情数据和个人的行动数据。企业舆情数据包括两大方面:一是政府公开数据:工商、司法、行政和一行三会的处罚 /涉诉数据等;二是企业经营动态数据:资产重组、投融资、高8 管变动、员工招聘、新产品发布和产品 销售情况等。个人行动数据也包括两大方面:一是基本属性数据:性别、年龄、学历、职业等;二是喜好数据:浏览页面、浏览商品、页面停留时间、关注的商品、支付的商品、产品评分、产品投诉、产品建议、加入的社群、经常互动的话题等。 3.从第三方购买数据。 金融机构购买的主要是企业的数据,在个人数据
12、购买上比较谨慎。在个人数据交易上,大型金融机构普遍认为比较敏感,要谨慎对待。目前,大型金融机构从第三方购买个人数据的行动基本停滞, 主要从政府侧购买公共数据 ,例如公积金、社保和税务数据等。 (四)金融大数据的发展特点 1.金融云快速 落地奠定大数据应用基础。 金融云具备的快速交付、高扩展、低运维成本等特性,能够在充分考虑金融机构对信息安全、监管合规、数据隔离和中立性等要求的情况下,为机构处理突发业务需求、部署业务快速上线、实现业务创新改革提供有力支持。因此,金融业一直较为积极的推动云计算的落地。 目前,大型金融机构纷纷开启了基于云计算的信息系统架构转型之路,逐步将业务向云迁移。大型金融机构普
13、遍青睐混合云架构,将非核心应用迁移到公有云上,再将部分核心应用迁移到私有云平台上,关键业务上继续使用传统架构。新兴金融机构如蚂蚁金服、微众银行等在诞生 之初就把所有IT 系统架构在云上。 9 2.实时计算分析能力是金融大数据应用的首要关注点 。金融机构的业务要求大数据平台具有实时计算的能力。目前,金融机构最常使用的大数据应用场景为精准营销、实时风控、交易预警和反欺诈等业务都需要实时计算的支撑。 以精准营销和交易预警为例,精 准营销要求在客户短暂的访问与咨询时间内发现客户的投资倾向,推荐 适合的产品。交易预警场景要求大数据平台在秒级完成从事件发生、到感知变化、到输出计算结果的整个过程,识别出客户
14、行为的异常,并做出交易预警。因此,流式计算框架的实时计算大数据平台目前逐渐在金融机构得到应用,以满足低延时的复杂应用场景需求。 3.金融业务创新越来越依赖于大数据应用分析能力 。 客户对服务体验的要求越来越高,需要金融机构随时随地都能提供服务,产品设计的更易用、更直观,响应速度更快速。金融机构提供产品和服务的重点,也从简单的标准化,转变为个性化。 大数据能够在产品设计和客户服务两方面提高创新能力。在产品设 计上,大数据能够更好的利用现有数据,为客户进行全面的客户画像,识别客户的需求。基于精准的客户认知,金融机构可以细分客户的需求,从而针对性的设计出符合客户个性化需求的、场景化的产品。在客户服务
15、上,大数据可以提高产品的自动化程度,从而扩大产品和服务的范围、拓宽客户基础,使得金融机构得以覆盖以前服务不到的10 长尾客户。此外,产品自动化还能够快速的对客户 需求做出反应,提高客户粘性。 4.金融数据正在向金融科技行业巨头聚集 。 互联网和科技行业存在的“赢家通吃”模式,在金融行业继续上演。随着行业的快速整合,原来分散在各家金融 机构的数据正快速向金融科技行业巨头集中,从而形成数据寡头。 以支付行业为例,原来分散在各家银行手中的支付数据正快速向支付宝和财付通集中。目前,支付宝和财付通已经覆盖了绝大多数消费场景,包括电商购物、餐饮、出行、航旅、公共事业缴费、线下购物等几乎所消费场景。过去银行
16、可以通过借记卡和信用卡的消费记录来分析客户的消费行为,为金融企业的服务和产品设计提供支持。现在这些小额消费行为很多都通过第三方支付发生,银行无法拿到具体的消费数据。客户消费数据的缺少,正在影响银行对个人客户的了解和分析。 (五)金融大数据的发展趋势 1.大数据应用水平正在成为金融企业竞争力的核心要素。 金融的核心就是风控,风控以数据为导向。金融机构的风控水平直接影响坏账率、营收和利润。经过长期的数字化改造,金融机构积累了大量的信息系统,通过这些系统积累了海量的数据,但是这些数据是分散在各个系统中,不能实现集中分析。金融机构已经意识到需要有效地管理其日益重要的数据资产,正在主动思考和实践数据资产
17、治理的方法。11 目前,金融机构正在加大在数据治理项目中的投入,结合大数据平台建设项目,构建企业内统一的数据池,实现数据的“穿透式”管理。大数据时代,数据治理是金融机构 需要深入思考的命题,有效的数据资产管控,可以使数据资产成为金融机构的核心竞争力。 在国内,金融机构对大数据的认知已经从探索阶段进入到认同阶段。普华永道研究显示, 83%的中国金融机构表示希望在大数据上进行投资。金融行业对大数据的需求属于业务驱动型。其迫切希望应用大数据技术使营销更精准、风险识别更准确、经营决策更具针对性、产品更具吸引力,从而降低企业成本,提高企业利润。随着更多金融机构基于大数据获得丰厚的回报,将进一步打消它们的
18、顾虑,加速大数据的普及。 2.金融行业数据整合、共享和开放成为趋势 。 数据越关联越有价 值,越开放越有价值。随着各国政府和企业逐渐认识到数据共享带来的社会效益和商业价值,全球已经掀起一股数据开放的热潮。大数据的发展需要所有组织和个人的共同协作,将个人私有、企业自有、政府自有的数据进行整合,把私有大数据变为公共大数据。 目前,美欧等发达国家和地区的政府都在数据共享上做出了表率,开放大量的公共事业数据。中国政府也着力推动数据开放。一方面,国家带头着力推动政府数据公开。国务院促进大数据发展行动纲要提出:到 2018 年,中央政12 府层面实现金税、金关、金财、金审、金盾、金宏、金保、金土、金农、金
19、水、金质 等信息系统通过统一平台进行数据共享和交换。另一方面,国家还通过推动建设各类大数据服务交易平台,为数据使用者提供更丰富的数据来源。在发改委发布的国家发展委员会办公厅关于请组织申报大数据领域创新能力建设专项通知中明确提到要建设大数据流通与交易平台,用以支撑数据共享。 3.金融数据与其他跨领域数据的融合应用不断强化 。2015 年以前,金融机构主要基于金融业自有信息进行分析。金融机构主要基于自身静态数据通过人工对内进行经营分析、产品设计、营销设计等;对外进行客户分析和行情分析。从 2016 年开始,大数据技术逐渐成熟,数据采集技术快速发展,通过图像识别、语音识别、语义理解等技术实现外部海量
20、高价值数据收集,包括政府公开数据、企业官网数据、社交数据。金融机构得以通过客户动态数据的获取更深入的了解客户。 未来,数据流通的市场会更健全。金融机构将可以方便的获取 电信、电商、医疗、出行、教育等其他行业的数据,一方面会有力的促进金融数据和其他行业数据融合,使得金融机构的营销和风控模型更精准。另一方面,跨行业数据融合会催生出跨行业的应用,使金融行业得以设计出更多的基于场景的金融产品,与其他行业进行更深入的融合 。 4.人工智能正在成为金融大数据应用的新方向 。 新兴技13 术高速发展,大数据和人工智能技术正在快速融合。大数据技术强调数据的采集、存储、处理和展现。人工智能可以在各个阶段助力大数
21、据发挥更大的作用 。 在采集上,图像识别、语音识别、语义理解等人工智能认知技术实现海量非结构化数据采集。在数据的储存和管理上,人工智能技术可以实现自动为数据打标签,自动将数据归类。在数据处理上,人工智能深度学习、机器学习、知识图谱技术可以提高算法模型的数据处理的效率和准确度。数据展现上,智能可视化大屏技术可以实现数据实时监控和可视化呈现。 大数据与人工智能正在进行多维度的深度融合,拓展了金融大数据的应用价值和应用场景。 5.金融数据安全问题越来越受到重视 。 大数据的应用为数据安全带来新的风险。数据具有高价值、无限复制、可流动等特性,这些特性为数据安全管理带来了新的挑战。 对金融机构来说,网络
22、恶意攻击成倍增长,组织数据被窃的事件层出不穷。这对金融机构的数据安全管理能力提出了更高的要求。大数据使得金融机构内海量的高价值数据得到集中,并使数据实现高速存取。但是,如果出现信息泄露可能一次性泄露组织内近乎全部的数据资产。数据泄露后还可能急速扩散,甚至出现 更加严重的数据篡改和智能欺诈的情况。 对个人来说,金融信息的泄露会暴露出大量的个人基本信息和消费信息等,大数据技术可以便捷地大批量收集这些14 信息并进行画像,这使得公民更容易受到欺诈,造成经济损失。 二、金融大数据的应用场景分析 大数据技术的应用提升了金融行业的资源配置效率,强化了风险管控能力,有效促进了金融业务的创新发展。金融大数据在
23、银行业、证券行业、保险行业、支付清算行业和互联网金融行业都得到广泛的应用。 (一)大数据在银行业中的应用 1.信贷风险评估。 在传统方法中,银行对企业客户的违约风险评估多是基于过往的信贷数据和交易数据等静态数据,这种方式的最大弊端就是缺少前瞻性。因为影响企业违约的重要因素并不仅仅只是企业历史的信用情况,还包括行业的整体发展状况和实时的经营情况。而大数据手段的介入使信贷风险评估更趋近于事实。 内外部数据资源整合是大数据信贷风险评估的前提。一般来说,商业银行在识别客户需求、估算客户价值、判断客户优劣、预测客户违约可能的过程中,既需要借助银行内部已掌握的客户相关信息,也需要借助外部机构掌握的人行征信
24、信息、客户公共评价信息、商务经营信息、 收支消费信息、社会关联信息等。该部分策略主要目标为数据分析提供更广阔的数据维度和数据鲜活度,从而共同形成商业银行贷款风险评估资源。 15 信贷风险评估 的 步骤: ( 1)以客户级大数据为基础,为存量客户建立画像,使银行能够向各管辖机构、各业务条线、各产品条线进行内容全面、形式友好、敏捷的客户级大数据集中供给。 ( 2)建立专项集中的企业及个人风险名单库,统一“风险客户”等级标准,集中支持各专业条线、各金融产品对高风险客户的过滤工作。 ( 3)统筹各专业条线、各业务环节对大数据增量信息的需求优先序列,对新客户、高等级客户、高时效业务、高风险业务实现大数据
25、实时采集式更新;对存量、一般、普通时效业务、低风险业务实现大数据集中、批量、排序、滚动更新。 2.供应链金融。 供应链金融的风险控制从授信主体向整个链条转变。供应链核心企业拥有良好的资产、充足的资金和高额的授信额度。而依附于核心企业的上下游企业可能需要资金,但是贷不到款。供应链金融可以由核心企业做担保,以产品或应收账款做质押,帮助上下游企业获得资金。 利用大数据技术,银行可以根据企业之间的投资、控股、借贷、担保以及股东和法人之间的关系,形成企业之间的关系图谱,利于关联企业分析及风险控制。知识图谱在通过建立数据之间的关联链接,将碎片化的数据有机的组织起来,让数据更加容易被 人 和机器理解和处理,
26、并为搜索、挖掘、分析等提供便利。 16 在风控上, 银行以核心企业为切入点,将供应链上的多个关键企业作为一个整体。利用 交往圈分析模型,持续观察企业间的通信交往数据变化情况,通过与基线数据的对比来洞察异常的交往动态,评估供应链的健康度及为企业贷后风控提供参考依据。 (二)大 数据在 证券行业中的应用 1.股市行情预测。 大数据可以有效拓宽证券企业量化投资数据维度,帮助企业更精准的了解市场行情。随着大数据广泛应用、数据规模爆发式增长以及数据分析及处理能力显著提升,量化投资将获取更广阔的数据资源,构建更多元的量化因子,投研模型更加完善。 证券企业应用大数据对海量个人投资者样本进行持续性跟踪监测,对
27、账本投资收益率、持仓率、资金流动情况等一系列指标进行统计、加权汇总,了解个人投资者交易行为的变化、投资信心的状态与发展趋势、对市场的预期以及当前的风险偏好等,对市场行情进行预测。 2.股价预测。 证券行业具有自身的特点,与其他行业产品与服务的价值衡量普遍存在间接性的特点不同,证券行业客户的投资与收益以直接的、客观的货币形式直观的呈现。受证券行业自身特点和行业监管要求的限制,证券行业金融业务与产品的设计、营销与销售方式也与其他行业具有鲜明的差异,专业性更强。 诺贝尔经济学奖得主罗伯特 席勒设计的投资模型至今17 仍被业内沿用。在他的模型中,主要参考三个变量:投资项目计划的现金流、公司资本的估算成
28、本、股票市场对投资的反应(市场情绪)。他认为,市场本身带有主观判断因素,投资者情绪会影响投资行为,而投资行为直接影 响资产价格。然而,在大数据技术诞生之前,市场情绪始终无法进行量化。大数据技术 可以收集并分析社交网络如微博、朋友圈、专业论坛等渠道上的结构化和非结构化数据,了解市场对特定企业的观感,使得市场情绪感知成为可能。 3.智能投顾。 智能投顾是近年证券公司应用大数据技术匹配客户多样化需求的新尝试之一,目前已经成为财富管理新蓝海。智能投顾业务提供线上的投资顾问服务,能够基于客户的风险偏好、交易行为等个性化数据,采用量化模型,为客户提供低门槛、低费率的个性化财富管理方案。智能投顾在 客户资料
29、收集分析、投资方案的制定、执行以及后续的维护等步骤上均采用智能系统自动化完成,且具有低门槛、低费率等特点,因此能够为更多的零售客户提供定制化服务。随着线上投顾服务的成熟以及未来更多基于大数据技术的智能投资策略的应用,智能投顾有望从广度和深度上都将证券行业带入财富管理的全新阶段,为未来政策放宽证券公司投资顾问从前端佣金收费向后端的管理费收取模式转变进行探索准备。 (三)大数据在保险行业中的应用 1.骗保识别。 赔付直接影响保险企业的利润,对于赔付18 的管理一直是险企的关注点。而赔付中的“异常值”(即超大额赔 付)是推高赔付成本的主要驱动因素之一。保险欺诈严重损害了保险公司的利益,为了识别可疑保
30、险欺诈案件,需要展开大量专项调查,但往往需要耗费数月或数年的时间。 借助大数据手段,保险企业可以识别诈骗规律,显著提升骗保识别的准确性与及时性。保险企业可以通过建设保险欺诈识别模型,大规模的识别近年来发生的所有赔付事件。通过筛选从数万条赔付信息中挑出疑似诈骗索赔。保险企业再根据疑似诈骗索赔展开调查会有效提高工作效率。此外,保险企业可以结合内部、第三方和社交媒体数据进行早期异常值检测,包括了客户的健康状况、财产状况、理赔记录 等,及时采取干预措施,减少先期赔付。 2.风险定价。 保险企业对保费的定义是基于对一个群体的风险判断,对于高风险的群体收取较高的费用,对于低风险群体则降低费用。通过灵活的定
31、价模式可以有效提高客户的粘性。而大数据为这样的风险判断带来了前所未有的创新。 保险公司通过大数据分析可以解决现有的风险管理问题。比如,通过智能监控装置搜集驾驶者的行车数据,如行车频率、行车速度、急刹车和急加速频率等;通过社交媒体搜集驾驶者的行为数据,如:在网上吵架频率、性格情况等;通过医疗系统搜集驾驶者的健康数据。以这些数据为出发点,如果一 个人不经常开车,并且开车十分谨慎的话,那么他可以比大部分人节省 30%40%的保费,这将大大的提高保险产19 品的竞争力。 (四)大数据在支付清算行业中的应用 交易欺诈识别。 目前,支付服务操作十分便捷,客户已经可以做到随时、随地 进行转账操作。面对盗刷和
32、金融诈骗案件频发的现状,支付清算企业交易诈骗识别挑战巨大。 大数据可以利用账户基本信息、交易历史、位置历史、历史行为模式、正在发生行为模式等,结合智能规则引擎进行实时的交易反欺诈分析。整个技术实现流程为实时采集行为日志、实时计算行为特征、实时判断欺诈等级、实时 触发风控决策、案件归并形成闭环。 图 1 交易欺诈方式及场景示例 (五)大数据在互联网金融行业中的应用 1.精准营销。 在移动互联网时代,客户在消费需求和消费行为上快速转变。首先,在消费需求上,客户的需求 更加细化,急需个性化的金融产品。另外,在消费行为上,互联网金融企业很难接触到消费者及了解客户的需求并推销产20 品,营销资源和营销机
33、会极其宝贵。因此,为了降低对用户打扰和营销成本,提高营销转化率以面对日趋激烈的行业内部竞争,互联网金融企业急需一种更为精准的营销解决方案。 具体来讲,银行业精准营销的主要应用目标主要为三点:一是 精准营销的首要目的是寻找目标客户,精准定位营销对象。 二是 在获得客户挖掘结果后,精准营销应用的下一步功能应当是针对具体客户,提供一整套智能决策方案。 三是 配备完整的业务操作平台,实现整个精准营销从客户挖掘直至业务完成的各工作环节,最大化程度缩短业务操作流程,实现精准营销的 “一站式” 操作。 利用大数据平台的模型分析结果,挖掘出潜在客户,实现可持续的营销计划。银行业精准营销的技术流程包括以下五点:
34、 ( 1)客户信息整合及验证。 该步骤的核心为数据整合处理,即利用大数据平台打通内外部数据、不同业务数据、不同结构数据之间的壁垒,对数据格式进行规范化处理,形成以客户为中心的“一户一条”数据记录。 ( 2)客户及场景标签设定。 根据精准营销的不同角度设定不同类别的场景标签,该类标签较用户标签通常具有更高的灵活性,以便随着业务发展和精准营销场景的变换随时增减或改变。 ( 3)客户类型初分。 对于不同类型的目标客户,精准营销模型应当给出具有针对性的营销方案。因此需要对大数21 据平台里的所有客户进行类型的区分。该部分可以通过用户画像技术提供的分类标准,进行 用户的标签化分类工作。建立合理的客户类型
35、初分体系是精准营销的基础。 ( 4)客户筛选。 客户筛选是指对客户质量进行筛选把控,普遍基于大数据平台的黑白灰名单技术,对客户进行判定。原则上白名单客户属于精准营销判定的推荐客户;黑名单客户则是不能服务的客户;灰名单客户为风险提示类的客户。 ( 5)业务统一工作平台部署。 作为精准营销的前台,通过 API 接口打通数据存储层、数据处理层、算法层以及高级业务层,通过门户网站、 APP、 APP 接口等方式提供银行产品推荐、客户准入、客户跟踪管理等高级营销策略。 图 2 精准营销的技术流程 2.黑产防范 。 互联网金融企业追求服务体验,强调便捷22 高效,简化手续。而这一特点也易被不法分子利用,虚
36、假注册、利用网络购买的身份信息与银行卡进行套现,“多头借贷”乃至开发电脑程序骗取贷款等已经形成了一条“黑色”产业链,对于互联网金融行业而言,欺诈风险高于信用风险。 大数据能够帮助企业掌握互联网金融黑产的行为特点,从业人员规模、团伙地域化分布以及专业化工具等情况,并制定针对性的策略。黑产特征如下:借款 手机归属地与真实城市 IP 匹配;设备上相邻两次借款(含跨平台)时间间隔极短;用户手机长期处于同 一位置未移动过等。通过黑产识别和预警减少损失。 3.消费信贷 。 消费信贷和传统企业信贷截然不同。它拥有小额、分散、高频、无抵押和利息跨度极大的特点。在贷款额度上可以小到 100 元人民币;一家机构一
37、天放贷数量可能达到数万到数十万笔; 90%以上是纯信用贷,只能依靠数据进行审批;年化利率从 4%到 500%的都有。 客户特点是年轻、消费观念超前、无信用记录。消费信贷客户大多数年龄都在 35 岁以下;月光族,愿意透 支未来。某些 人 群甚 至 对借钱消费形成习惯性依赖 ; 80%-90%的客群无人行借贷信用记录,导致拒绝率极高。 大数据需要贯穿到客户全生命周期的始末。基于大数据的自动评分模型、自动审批系统和催收系统是消费信贷的基础。利用大量行为数据分析弥补信贷数据的缺失。下面会列举一些趋势上的分析方法: 1)随着手机号使用 数的增加,23 客户稳定性增加,违约 风险逐步降低。 2)过去 12
38、 个月内所有类目本地生活消费等级越高,违约风险越低。 3)最近 12个月网络游戏消费金额越多,违约风险越高。 4)最近 12 个月内财经媒体访问天数越多,违约率风险越低。 图 3 手机号使用年数与违约率 图 4 申请家庭住址距离差与违约率 三、金融大数据的典型案例分析 2017 年 中国支付清算协会金融大数据应用研究 组 面向协会金融科技专业委员会成员单位征集大数据应用案例,共24 征集 到 40 多个案例。 经专家 组 评审, 从中 评选出 24 个 “金融大数据创新应用优秀案例” , 进行深入分析。 (一) 风险控制 类应用 1.中国银行“艾达”大数据风控平台 ( 1) 项目背景。 近年来
39、国内外金融形势愈加复杂, GDP增速放缓 ,企业业绩下滑,负债率持续攀升。金融持续脱媒,企业经营呈“跨业、跨界、跨境”态势,对银行信贷依赖度降低。集团客户关联关系复杂,更加分散化、隐蔽化、多元化,越来越多的资金从实体经济转向虚拟经济,风险蔓延速度迅猛,并呈现“跨渠道、跨地域、跨产品”传播,与此同时,银行对资金流向的监控手段却非常有限。在新的经济环境下,原来被动的风险防控方式已经难以满足新常态下客户高效 性和 多样性 的需求。 ( 2) 应用场景。 应用于 企业用户画像 、 风险管理 、 精准营销 等场景 。 ( 3) 成果 概述。 “艾达” 大数据 智能风控 平台是面向 全行前、中、后 台业务
40、人员, 包括 客户经理、 风险 经理、审计经理 和 管理层的 大数据风控 平台。 通过对 结构化、非结构化的 整合 ,运用 大数据 、 AI 等 新技术重塑业务流程与风险管理模式,不断挖掘数据价值。 将大数据应用 作为 提升风险管理能力的关键工具和重要途径, 也是 中国银行 首次 尝试用大数据建模进行风控管理。 ( 4) 项目收益。 打通了数据孤岛,挖掘并提升行内存25 量数据价值。解放生产力、发展生产力,提升企业运营效率,“艾达”嵌入业务环节,节约的时间保守估计在 20 个工作日以上,特别是对于突发事件、隐藏风险知晓的及时性,可有效规避损失。企业实时预警监控,降低授信风险,挽回资金损失。“艾
41、达” 上线 至今 , 触发风险 预警标签 4303088 个 ,成本中心向利润中心转变。提升全行大数据应用能力,打造数据生态圈。 2.中国 交通银行信用卡中心电子渠道实时反欺诈监控交易系统 ( 1)项目背景。 交通银行需要实时接收电子渠道交易数据,整合系统其他业务数据,通过规则实现快速建模、实时告警与在线智能监控报表等功能。 总体要求能实时接收官网业务数据,整合客户信息、设备画像、位置信息、官网交易日志、浏览记录等,通过规则实现快速建模、实时告警与在线智能监控等功能。 ( 2)应用场景。 应用于 风险 预警 场景 。 ( 3)成果 概述。 明略数据通过为交通银行卡中心构建反作弊模型、实时计算、
42、实时决策系统,帮助拥有数十 TB历史数据,日均增逾两千万条日志流水的国有银行卡中心建立电子渠道实时反 欺诈交易监控系统。利用分布式实时数据采集技术和实时决策引擎,帮助信用卡中心高效整合多系统业务数据,处理海量高并发线上行为数据,识别恶意用户和欺诈行为,并实时预警和处置,通过引入机器学习框架,对26 海量数据进行分析、挖掘构建并周期性更新反欺诈规则和反欺诈模型。 ( 4)项目收益。 明略数据反欺诈系统上线后,运转稳定、高效,迅速监控电子渠道产生的虚假账号、伪装账号、异常登录、频繁登录等新型风险和欺诈行为:系统 7*24 小时稳定运行,日均处理逾两千万条日志流水、实时识别出近万笔风险行为并进行预警
43、下发。数据接入、计算报警、案 件调查的整体处理时间从数小时降低至秒级,监测时效提升近3000倍,上线 3个月已帮助卡中心挽回数百万元的风险损失。 3.光大银行大数据风控智能化数据产品:滤镜 ( 1) 项目背景。 以大数据、移动互联网为代表的新型技术正在推动实体经济变革与创新,银行的风险管理决策方式也逐步转向智能化和移动化。近年来,光大银行科技创新机制催化大量创新项目支持行内业务智能化转型,其中大数据实验室在风险管理领域积极开展风险预警分析研究,成功孵化数据产品“滤镜”。该产品利用大数据技术对企业客户进行过滤,提示高信用违约倾向的企业名单,向总分 行风险管理决策者提供更加科学精准的决策支持,同时
44、依托首个移动数据应用平台“光速观察”提升风险决策的时效性。 ( 2) 应用场景。 应用于 风险预警 、 风险分析 、 风险排查 等 场景。 ( 3) 成果 概述。 滤镜数据产品依托光大银行首个移动应用平台“光速观察”,运用多项大数据分析技术,构建大27 数据风险预警信号,采用名单式管理模式,向总分行风险管理决策者提示具有高信用违约风险的企业信息,有效提升风险决策时效性和精准度。 滤镜将社交网络分析技术充分应用到风险预警监控,综合运用图算法进行客户风险预测实现客户、群体、网络评分,精确锁定潜在风险客户。该数据产品 对 隐匿在客户行为和客户交往圈中的资金短缺、风险传播、群体违约等风险事件特征化,揭
45、示客户潜在的信用违约风险。 ( 4) 项目收益。 “滤镜”自 2016 年 5 月底开始上线试运行,通过后评价分析,大数据预警信号过滤的企业在预警后 6 个月发生违约的平均概率 27%,比传统基于专家 规则模型有明显提升。滤镜目前以月度为单位产生预警客户名单,月均预警客户数约 300个左右,对应预警客户授信余额达 300亿,可以据此估算可能减少的损失金额可达数十亿元。 4.恒丰 银行 全面 风险预警系统 ( 1) 项目背景。 恒丰银行近年来陆续推出了信贷工厂、消费金融、供应链金融等一系列网贷、平台贷业务,为不同行业、不同规模的客户提供了丰富的信贷类产品。业务规模快速发展的同时,如何快速、全面识
46、别、监测、防范客户信用风险,成为了全行风险管理领域最为重要的工作之一。对此,恒丰银行提出通过运用大数据技术构建信用风险预警系统,加 强风险信息归集、监测、审查的准确性、及时性,强化风险预测能力。 28 ( 2) 应用场景。 应用于 贷前、贷中、贷后风险检查、监测、预测和缓释控制 等 场景。 ( 3) 成果 概述。 全面风险预警系统依托于星环大数据基础平台,整合行内外数据,包括行内授用信、不良、逾期、征信,行外司法、舆情、风险信号、工商、关联关系等,以多种方式为用户提供客户的风险提示和风险发现功能,为及时处置风险争取时间。数据主要来自于行内交易、业务数据沉淀、外部数据采购等方式接入,结构化、非结
47、构化数据共治,整合了共计数千万家企业的相关信息,通过批处理和数据加工处理,能够在 1s 之内为用户提供需要的服务。 ( 4) 项目收益。 恒丰银行信用风险预警系统自投产上线以来,风控能力逐步提升,在客户风险识别效率、准确率、成本控制等方面较传统风控手段有了大幅提高。新增 信贷资产质量大幅提升。 以某平台贷为例,自风控系统启用以来,其新增授信业务逾欠率控制在 1%以内,且呈逐渐降低态势;新增的网贷、平台贷授信业务发放效率显著提升。 基于大数据风控技术的航信票贷、恒信快贷等业务产品实现了 24 小时、 8 小时放款 ;新增业务的客户贷前调查成本大幅降低。经对某平台贷的数据统计,风险预审过程可综合节
48、约近 80%的人力成本,同时基于该统计数据调整的业务发展规划更为科学、符合实际。 5.腾讯云天御大数据反欺诈平台 ( 1)项目背景。 在金融领域互联网化的背景下,金融29 机构特别是互联网金融企业,更加追求便捷高效,简化手续,强调服务体验,而这一特点也易被不法分子利用,虚假注册、利用网络购买的身份信息 与银行卡进行套现,“羊毛党”通过低成本甚至零成本取得互联网平台 奖励,“多头借贷”乃至开发电脑程序骗取贷款等等已经形成了一条“黑色”产业链,互联网金融行业面临着严禁的挑战,对于互联网金融行业而言,欺诈风险高于信用风险。 ( 2)应用场景。 应用于互联网金融行业贷前审核风控及贷后监控、支付行业防盗
49、刷、互联网行业线上营销风控、网站及 App 安全风险防控等场景 。 ( 3)成果 概述。 腾讯云 “天御”大数据反欺诈平台( AF)是腾讯首次在云端输出反诈骗技术能力,依托 19 年安全积累、亿级体量的黑产数据,腾讯从计算力、算法、数据等三方面能力为反诈骗 AI 创新提供条件。腾讯云反欺诈产品包含有反薅羊毛、反骗贷、反洗钱、反骗保(保险)、移动银行 APP 保护、防盗刷等众多应用程序接口( API),无需改动企业 IT 系统。“天御”系统数据来源包括支付画像、群组画像、社交画像、设备画像、行为画像等几大类别。主要应用于银行、证券、保险、 P2P 等行业客户,准确识别恶意用户与行为,解决客户在支付、借贷、理财、风控等业务环节遇到 的欺诈威胁,降低企业的损失。 ( 4)项目收益。 贷前审核与贷后监控方面 , 微众银行微粒贷产品逾期率低于 0.3%。 活动防刷方面 , 一是注册环节,