JR T 0237—2021 金融大数据平台总体技术要求.pdf

上传人:花仙子 文档编号:1528963 上传时间:2022-03-25 格式:PDF 页数:20 大小:1.34MB
下载 相关 举报
JR T 0237—2021 金融大数据平台总体技术要求.pdf_第1页
第1页 / 共20页
JR T 0237—2021 金融大数据平台总体技术要求.pdf_第2页
第2页 / 共20页
JR T 0237—2021 金融大数据平台总体技术要求.pdf_第3页
第3页 / 共20页
JR T 0237—2021 金融大数据平台总体技术要求.pdf_第4页
第4页 / 共20页
JR T 0237—2021 金融大数据平台总体技术要求.pdf_第5页
第5页 / 共20页
亲,该文档总共20页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 ICS 35.240.40 CCS A 11 JR 中 华 人 民 共 和 国 金融 行 业 标 准 JR/T 0237 2021 金融大数 据 平台总 体技术要 求 General technical requirements of financial big data platform 2021-12-29 发布 2021-12-29 实施 中 国 人 民 银 行 发布 JR/T 0237 2021 I 目 次 前言 . II 1 范围 . 1 2 规范 性引 用文 件 . 1 3 术语 和定 义 . 1 4 缩略 语 . 3 5 金融 大数 据信 息价 值链 . 3 6 金融 大数 据

2、平 台总 体目标 . 4 7 金融 大数 据平 台功 能技 术要求 . 4 7.1 概述 . 4 7.2 数 据接 入功 能要 求 . 5 7.3 数 据存 储功 能要 求 . 6 7.4 数 据处 理功 能要 求 . 7 7.5 数 据分 析功 能要 求 . 8 7.6 数 据服 务功 能要 求 . 9 7.7 平台 运 维功 能要 求 . 10 8 金融 大数 据平 台非 功能 技术要 求 . 12 8.1 安 全性 要求 . 12 8.2 可 靠性 要求 . 12 8.3 性能 要求 . 12 9 金融 大数 据平 台接 口技 术要求 . 13 9.1 数 据接 入接 口技术 要求 .

3、13 9.2 数 据服 务接 口技术 要求 . 13 9.3 管 理接 口技术 要求 . 13 附录( 资料 性) 金融 大数 据平台 应用 场景 . 14 参考文 献 . 16 JR/T 0237 2021 II 前 言 本 文件 按照GB/T 1.1 2020 标 准化 工作 导则 第1 部 分: 标 准化 文件 的结 构和 起草规 则 给出 的规 定 起草。 请注意 本文 件的 某些 内容 可能涉 及专 利。 本文 件的 发布机 构不 承担 识别 专利 的责任 。 本 文件 由中 国人 民银 行提 出。 本 文件 由全 国金 融标 准化 技术委 员会 (SAC/TC 180 )归口 。

4、本 文件 起草 单位 : 招商 银 行股份 有限 公司 、 中国 人 民银行 清算 总中 心 、 华 为 技术有 限公 司 、 中 国邮 政 储蓄银 行 股 份有 限公 司 、 北京国 家金 融标 准化 研究 院有限 责任 公司 。 本 文件 主要 起草 人: 俞吴 杰 、 杨 鹏、 陈 翔、 黄波、 王 鹏程、 张天 舟、 张 芮玲 、 王 庆刚、 孔昭 龙、 方 方、 那勇、 王嘉 琪、 张兰 兰、 王伟利 、白 阳、 符海 芳、 赵华、 蒋健 源 、 沈澍 、李 琪 。JR/T 0237 2021 1 金 融大数 据平台总 体技术 要求 1 范围 本文件 规定 了面 向 金 融业 的大数

5、 据平 台总 体技 术要 求的框 架结 构、 功能 技术 要求、 非功 能技 术 要 求 以及接 口技 术要 求。 本 文件 适用 于金融 大 数据 平台的 设计 、开 发和 应用 。 2 规范性 引用 文件 下列 文件 中的 内容 通过 文中的 规范 性引 用而 构成 本文件 必不 可少 的条 款。 其 中, 注 日期 的引 用文 件, 仅该日 期对 应的 版本 适用 于本文 件; 不注 日期 的引 用文件 , 其 最新 版本 (包 括所有 的修 改单 ) 适 用 于 本 文件。 JR/T 0236 2021 金融 大 数据 术语 ISO/IEC 20546:2019 信 息技术 大 数据

6、概 述和 术语 3 术语和 定义 JR/T 0236 2021 金融 大 数据 术语 界 定的 以及 下列术 语和 定义 适用 于本 文件。 3.1 大 数据 big data 海量 的数 据集 , 其数 据 在本质 上具 有体 量大 、 种 类多 、 变 化快 、 变数 多的 特征 , 需 要一 种易 扩展 的 技术来 有效 存储 、处 理、 管理和 分析 。 注:1. 大数据通常以多种不同 方式使用,例如,作为某种用于处理大数据海量数据集的易扩展技术的名称 。 2.GB/T 35295 2017 信息技 术 大数据 术语中2.1.1 对大数据的定义为“具有体量巨大、来源多样、生 成极快、且

7、多变等特征并且难以用传统数据体系结构有效处理的包含大量数据集的数据” 。 3. 在某些非工程性研讨的场合 ,“大数据”一词的外延可能被扩大到所有的数据 。 来 源:JR/T 0236 2021 ,3.1 3.2 大数据 参考 体系 结构 big data reference architecture 一 种用 作工 具以 便于 对 数据内 在要 求、 设计 结构 和运行 进行 开放 性探 讨的 高层概 念模 型 。 注: 比较普遍认同的大数据参 考体系结构一般包含 :系统协调者、数据提供者、大数据应用提供者、大数据框架 提供者和数据消费者等5 个逻辑功能构件。 来源 :JR/T 0236 20

8、21 ,4.1 3.3 系统协 调者 system orchestrator 大 数 据参 考体 系结 构中 的一 种 逻辑 功能 构件 , 可 定义 所 需的 数据 应用 活动 并将 其 整合 到可 运行 的 垂直系 统中 。 注 :1. 系统协调者可以是人、 软件或这二者。 JR/T 0237 2021 2 2. 系统协调者一般包括 :业务 领导者、咨询师、数据科学家、信息体系结构设计师、软件体系结构设计师、安 全体系结构设计师、个人信息保护体系结构设计师和网络体系结构设计师 。 来源 :JR/T 0236 2021 ,4.2 3.4 数据提 供者 data provider 大 数据 参

9、考 体系 结构 中 的一种 逻辑 功能 构件 , 可 将新的 数据 或信 息引 入大 数据系 统 。 注: 数据提供者一般包括: 企业、 公共机构、 科学家、 调研 人员、 从事数据搜索的工程师、 网络应用软件、 网络运 营商和末端用户 。 来源 :JR/T 0236 2021 ,4.3 3.5 大数据 应用 提供 者 big data application provider 大数据 参考 体系 结构 中的 一种逻 辑功 能构 件, 可执 行数据 生命 周期 操作 , 以 满足系统 协 调者 定 义 的 需求以 及安 全和 隐私 保护 的需求 。 注: 大数据应用提供者一般包 括: 大数据应

10、用领域专家、 大数据平台领域专家和大数据咨询师。 来源 :JR/T 0236 2021 ,4.4 3.6 数据消 费者 data consumer 大 数 据 参考 体 系结 构 中的一 种 逻 辑功 能 构件 , 是 使用 大 数 据应 用 提供 者 所提供 的 应 用的 末 端用 户 或其他 系统 。 注: 数据消费者一般包括 :末 端用户、调研人员、应用和系统。 来源 :JR/T 0236 2021 ,4.6 3.7 分布式 文件 系统 distributed file system 多个结 构化 数据 集分 布在 一个或 多个 服务 器集 群的 各计算 节点 的文 件系 统 。 注:

11、此类系统中, 数据可能分 布在文件 或数据集层, 更为普遍的是在数据块层级分布, 同时支持集群中多个节点与 大型文件或数据集的不同部分交互 。 来源 :JR/T 0236 2021 ,6.12 3.8 非结构 化数 据 unstructured data 特征为 除了 记录 或文 件级 别外没 有任 何结 构的 数据 。 注: 总体而言,非结构化数据 不是由数据元素组成 。 示例: 自由文本是非结构化数 据的一个例子。 来源 :JR/T 0236 2021 ,3.30 3.9 工作流 workflow 指 具有 明确 起点 和终 点以 描述任 务的 活动 序列 。 注: 工作流是一类活动模型

12、, 且可能具有分支、决策点和事件 。 来源 :GB/T 32854 2020 ,3.1 JR/T 0237 2021 3 4 缩略语 下列 缩 略语 适用 于本 文件 。 API : 应用 程序 接口 (Application Program Interface ) AI :人 工智 能(Artificial Intelligence ) CEP : 复杂 事件 处理 (Complex Event Processing ) CPU : 中央 处理 器(Central Processing Unit ) DDL : 数据 库模 式定 义语 言 (Data Definition Language

13、) FTP : 文件 传输 协议 (File Transfer Protocol ) FTPS : 基于SSL 的文 件传 输 协议(File Transfer Protocol Over SSL ) HTML : 超文 本标 记语 言(Hyper Text Markup Language ) I/O : 输入/ 输出 (Input/Output ) JDBC :Java 数据 库连 接(Java Database Connectivity ) JAR : 一种 软件 包文 件格 式 (Java Archive ) JSON :JavaScript 对 象简 谱(JavaScript Obje

14、ct Notation ) LPA : 标签 传播 算法 (Label Propagation Algorithm ) MPI : 信息 传递 接口 (Message Passing Interface ) ODBC : 开放 数据 库互 连(Open Database Connectivity ) REST : 表述 性状 态传 递(Representational State Transfer ) RPC : 远程 过程 调用 (Remote Procedure Call ) SCP : 安全 复制 (Secure Copy ) SDK : 软件 开发 工具 包(Software Deve

15、lopment Kit ) SFTP : 安全 文件 传送 协议 (Secret File Transfer Protocol ) SQL : 结构 化查 询语 言(Structured Query Language ) SSL : 安全 套接 层协 议(Secure Sockets Layer ) UI :用 户界 面 (User Interface ) Web : 全球 广域 网(World Wide Web ) XML : 可扩 展标 记语 言(Extensible Markup Language ) 5 金融大 数据 信息 价值 链 从信息 价值 链的 角度 来看 , 金融 大数 据平

16、 台面向 金 融大数 据应 用提 供者 、 系 统协调 者及 大数 据 框 架 提供者 ,核心 活动 在于从 数据 提 供者 处 收集 、处理 、分析 金融活 动过 程中的 相关业 务数据 、用 户信 息 、 行为数 据等 ,并 结合 金融 业务特 征支 撑 金 融机 构的 各项活 动和 服务 。 金 融大 数据信 息价 值链 见图1 。 JR/T 0237 2021 4 图1 金 融大 数据 信息 价值 链 数据提 供者 为金 融大 数据 平台提 供数 据或 信息 ,包 括数据 源提 供者 、数 据流 通平台 提供 者和 数据 API提 供者 。 系统协 调者 在金 融领 域规 范和协 调各

17、 类所 需的 数据 应用活 动, 包括 系统 的配 置管理 、 作 业调 度、 资源调 度、 运行 监控 等活 动。 金融大 数据 应用 提供 者 满 足金融 领域 大数 据服务 需 求,包 括收 集、 预处 理、 分析、 可视 化和 访问 等活动 。 大数据 框架 提供 者 为 金融 大数据 应用 提供 者在 创建 具体应 用 时 提供 资源 和服 务。 数据消 费者 是金 融大 数据 应用的 最终 使用 者或 其他 系统。 6 金融 大 数据 平台 总体 目标 金融 大 数据 平台 的总体 目标 是帮 助金 融机构 更 高效 、 更快 速 地 完成 金融 大数 据应用 的开 发、 部 署

18、和 管理, 从以 交易 为中 心转 向 以数据 为中 心, 以应 对更 多 维、 更 大量 、 更 实时 的数 据 和互联 网业 务的 挑战 。 金融机 构以 防范 系统 性风 险为底 线 , 对数据 安全 和 业务 连 续性 保障 的技 术要求 通常 高于 其他 行业 。 7 金融大 数据 平台 功能 技术 要求 7.1 概述 金融大 数据 平台 是企 业级 、 分布 式、 开 放、 统 一的 大数据 平台 , 应 包括 数据 接入、 数据 存储、 数 据 处理 、 数 据分 析及 数据 服务 相关 组件 。 从功 能的 必 要性及 重要 性角 度看 , 金 融大数 据平 台具 体功 能技

19、术 要 求 可以 划 分为 基 本要 求 和 增 强要 求 。增 强 要求 是从 技 术的 发 展趋 势 和金 融用 户 的前 瞻 性需 求 入手提 出的。 数据接 入的 基本 要求 应包 括作业 调度 、 数 据传 输、 消 息队列 、 批 量采 集, 增强 要 求 宜包 括实 时采 集; 数据存 储 的 基本 要求 应包 括分布 式关 系数 据库 、 分 布式存 储系 统 ( 文件、 对 象、 块) 等, 增 强要 求 宜 包 括分布 式列 数据 库、 分布 式图数 据库 ; 数 据处 理 的 基本要 求 应 包括 批处 理、 流处理 、 图 计算 , 增 强 要 求 宜包括 批流 融合

20、计算 、 内 存计算 ; 数 据分 析 的 基本 要求 应 包括 模型 库、 数据 处理引 擎 等 , 增 强 要 求 宜 包 括数据 可视化 ;数 据 服务 的 基本 要 求应 包括 风险管 理、 用 户画像 、营销 管理 、客户 服务和 经营 分析 等 。 金融大 数据 平台 技术 架构 见图2 。 JR/T 0237 2021 5 数据处理 数据服务 数据分析 数 据 源 应 用 数据提供者 金融大数据平台 数据使用者 / / 平台 运维 数据接入 数据存储 / / 图2 金 融大 数据 平台 技术 架构 金融大 数据平 台由 数据接 入、数 据存储 、数 据处理 、数据 分析、 数据

21、服务和 平台运维 等部 分组 成 , 主要内 容如 下 : a) 数据接 入 提 供结 构化 数据 、非结 构化 数据 或半 结构 化数据 的采 集、 数据 的导 入导出 以及 数据 流 的定义 等功 能 , 支 持 多系 统集成 ,支 持多 协议 接入 , 如支持RESTful 、RPC 、 异步消 息接 入。 结 构化数 据包 括 数 据库 文件 以及结 构化 文本 文件 等。 非结构 化数 据包 括图片 、 音频 、 视频 、文 档 及应用 数据 等 。 半结 构化 数据包 括XML 、 表格 、JSON 、HTML 、电 子邮 件 等 。 注:REST 指的是一组架构约束 条件和原则

22、,满足这些约束条件和原则的应用程序或设计 称为RESTful 。 b) 数据存 储 提 供大 数据 的分 布式存 储管 理, 涵盖 多种 存储方 式和 文件 系统 。 c) 数据处 理 支 持结 构化 、 半 结构化 及非 结构 化数 据 , 提供丰 富的API 接口 和SDK 开发包 , 支持 分布 式 计算技术 、 流处 理技 术 、 内存计 算技 术 , 实现 稳定 、强大 的数 据处 理能 力 。 d) 数 据分析 采 用数据挖 掘、机 器学习等 技术,支 持多个 数据处理 引擎 ,具 备 数据 可视化、 多种算 法、 建 模分 析 等 深度 挖掘 分析能 力 。 e) 数据服务 提

23、供海 量金 融交 易数据 、 用户 信息 数据 、 金 融业务 数据 的访 问 、 控 制 等基础 服务 , 提供 营销管 理、 风险 管理 、 客 户 服务、 经营 分析 及用 户画 像 等高 级数 据服 务 , 金融 大数据 平台 支撑 的 应用场 景见 附录 。 f) 平台运 维具备 高 可靠 、 安 全、 容错 、 易用 的集 群管 理 能力 , 支 持大 规模 集群 的 安装部 署等 功能 , 提供分 钟级 别的 统一 风险 管理 , 具备 各 类日 志 的 指 标实时 采集 能力、 通用 的SQL 查询 能力、 可 视 化监控 能力 。 7.2 数据接 入功 能要 求 7.2.1

24、作业调度 作业 调 度的 功能 要求 如下 : a) 应支持 工作 流 任 务的 调度 。 b) 应支持 工作 流的 编排 。 c) 应支持 工作 流的 批量 启停 、导入 、导 出 。 d) 应支持 通过 接口 方式 进行 工作流 的增 、删 、改 、 查 管理 。 JR/T 0237 2021 6 e) 宜支持 工作 流的 可视 化 。 7.2.2 数据采集 数据采 集的 功能 要求 如下 : a) 应 支持 数据 库与 文件 系统 间数据 、文 件的 导入 和导 出 。 b) 应 支持 数据 的批 量采集 。 c) 宜支持 数据 的 实 时采 集 。 d) 应 支持 任务 的并 行执 行

25、, 在任务 失败 后可 以重 新调 度 。 e) 应 支持 通过 可视 化配 置等 形式进行 的 数据 采集 。 f) 宜支持 异构 数据 库之 间的 建表语 句转 换DDL 建 表功 能 。 7.2.3 消息队列 消息队 列的 功能 要求 如下 : a) 应支持 高吞 吐、 分布 式消 息 的处理 。 b) 应支持 消息 的缓存 。 c) 应支持 离线 应用 和在 线应 用对消 息的 使用 和处 理 。 d) 宜支持 多种 客户 端。 7.2.4 数据传 输 数据传 输的 功能 要求 如下 : a) 应 支持 通用 的数 据传 输协 议 。 b) 应 支持 断点 续传 机制 。 c) 应 支

26、持 同步 、异 步传 输机 制 。 d) 应 支持 传输 安全 加密 机制 。 e) 宜支持 高速 大容 量数 据传 输机制 ,如FTP 、FTPS 、SCP 、SFTP 等 。 7.3 数据存 储功 能要 求 7.3.1 分布式 文件 系统 分布式 文件 系统 的功 能要 求如下 : a) 应支持 文件 的上 传、 下载 、读写 、复 制、 移动 、删 除、访 问控 制等 。 b) 应支持 文件 的搜 索、 批量 操作、 回收 站、 快照 等 。 c) 应支持 文件 容错 机制 和系 统高可 用机 制, 包括 数据 块的备 份、 系统 快速 恢复 等 。 d) 应支持 文 件 数据 的校 验

27、和 同步, 保证 数据 的完 整性 与一致 性 。 e) 应支持RESTful 接口 对分 布 式文件 系统 进行 基本 操作 。 f) 应支持 金融 大数 据 平 台对 国内外 主流 操作 系统 的兼 容性 , 如Linux 、Unix 、AIX 、MacOS 、Kylin 、 EulerOS等 。 注:Linux 、Unix 、AIX 、MacOS 、Kylin 、EulerOS 为操作系统名称。Linux 是一种免费使用和 自由传播的操作系 统; Unix 是20 世纪70 年代初出 现的一 种操作系统, 除了作为网络操作系统之外, 还可以作为单机操作系统使用; AIX 是国 际商 业机

28、 器公 司开 发的操 作 系统 ,名 称来 自先 进交 互运 行 系统 (Advanced Interactive executive , AIX );MacOS 是由苹果 公司开发 的操 作系统 ;Kylin是一个中国自主 知识产 权操 作系统 ;EulerOS 是华为自主研 发的服务器操作系统。 g) 宜支持 将小 文件 自动 打包 为大文 件进 行集 中存 储 。 h) 宜支持 对不 同型 号CPU 的 兼 容性 。 i) 宜支持 弹性 扩展 功能 、动 态添加 操作 以及 删除 节点 操作 。 j) 宜支持 对数 据资 源的 统一 检索、 编目 、增 加和 删除 操作。 JR/T 02

29、37 2021 7 7.3.2 分布式 列数 据库 分布式 列数 据库 的功 能要 求如下 : a) 应支持 数据 以键 值形 式进 行存储 。 b) 应支持 基于 表级 、行 级和 列级的 用户 权限 管理 。 c) 应支持 对数 据库 数据 进行 列加密 。 d) 应支持 多级 索引 。 e) 宜支持 将多 个具 有类 似功 能或存 在关 联的 业务 表合 并存储 。 7.3.3 分布式 图数 据库 分布式 图数 据库 的功 能要 求如下 : a) 应支持 由节 点及 边组 成( 即节点 间关 系) 的数 据模 型 。 b) 应支持 图查 询、 图遍 历及 图分析 。 c) 应支持 主流

30、开发 接口 ,如RESTful 、Gremlin 等 的接 口 。 注:Gremlin 是一种图遍历语言 。 d) 宜支持 单节 点、 多节 点多 层关系 扩线 查询 。 e) 宜支持 顶点 、属 性的 继承 操作 。 f) 宜支持 长任 务异 步会 话机 制。 7.3.4 分布式 关系 型数 据库 分布式 关系 型数 据库 的功 能要求 如下 : a) 应支持 结构 化数 据的 分布 式存储 机制 。 b) 应支持SQL 实现 数据 的查 询 操作, 包括 并发 事务 控制 、存储 过程 等 。 c) 应支持 多表 关联 。 d) 应保障 数据 分布 式存 储 的 一致性 。 e) 应支持

31、关系 型数 据库 间的 数据进 行跨 库关 联 。 f) 宜支持 行列 混合 存储 ,表 按行或 列格 式存 储 。 g) 宜支持 与ODBC 接 口的 兼容 性。 7.4 数据处 理功 能要 求 7.4.1 批处理 批处理 的功 能要 求如 下: a) 应 支持 多种 数据 类型 的离 线分析 ,包 括结 构化 数据 、半结 构化 数据 、非 结构 化数据 。 b) 应 支持 离线 计算 任务 进度 与状态 的实 时上 报 。 c) 宜 支持 执行 多节 点离 线任 务联动 。 d) 宜 支持 多种 语言 分析 任务 的开发 接口 。 e) 宜 支持 分散-聚 集的 处理 方 式 。 7.4

32、.2 流处理 流处理 的功 能要 求如 下: a) 应 支持 数据 的实 时获 取、 处理、 输出 和持 久化 。 b) 应 支持 用户 级别 的访 问控 制 。 c) 应 支持 对消 息处 理任 务进 行全生 命周 期管 理, 包括 创建、 浏览 、中 止、 激活 、去激 活等 。 d) 应支持 滚动 窗口 和滑 动窗 口两种 窗口 方式 。 e) 应 提供SQL 或类SQL 的 数据 操作接 口 。 f) 应 支持 在 出 现故 障情 况下 , 使用 容错 机制 处理 事件 。 JR/T 0237 2021 8 g) 应 具备 高容 错 能 力, 如节 点、进 程等 出现 异常 时 , 能

33、够重 新部 署该 处理 单元 。 h) 宜 支持 与JDBC 接 口的 兼容 性 。 i) 宜支持 基于 多种 分布 式流 处理引 擎的 查询 语言 ,如flink 、spark 等 。 注:flink 是一种开源流处理框 架,spark 是一种专为大规模数 据处理而设计的快速通用的计算引擎 。 j) 宜提供 画布 、SQL 和JAR 等 多种流 计算 开发 模式 。 7.4.3 图计算 图计算 的功 能要 求如 下: a) 应 支持 同步 计算 模型 或异 步计算 模型 编写 迭代 算法 。 b) 应 支持 基于 属性 图模 型的 图数据 表达 ,包 含结 点 或 边上的 标签 和属 性类

34、型定 义 。 c) 应 支持 内置 常用 图指 标计 算功能 ,以 描述 图的 拓扑 结构特 征 。 d) 应 支持 实现 水平 扩展 的分 布式图 计算 和 图 查询 。 e) 宜支持 明细 数据 的多 种导 入方式 ,包 括 全 量导 入、 增量导 入以 及自 定义 导入 。 f) 宜支持 索引 ,提 供在 线图 分析和 图 查 询功 能 。 g) 宜支持PageRank 、 社 区发 现、最 短路 、LPA 等 多种 图 计算能 力。 注:PageRank 是谷歌排名运算 法则的一部分,是谷歌用来标识网页的等级 或重要性的一种方法。 7.4.4 内存计 算 内存计 算的 功能 要求 如下

35、 : a) 应 支持 负载 均衡 和水 平扩 展 。 b) 应 支持 对 多 种数 据类 型的 离线分 析, 包括 结构 化数 据、半 结构 化数 据、 非结 构化数 据 。 c) 应 支持 高度 抽象 算子 ,快 速构建 分布 式的 数据 处理 应用 。 d) 宜 支持 标准SQL 语法 。 e) 宜 支持 读取 非关 系型 数据 库数据 。 7.4.5 批流融 合计 算 批流融 合计 算的 功能 要求 如下: a) 宜 支持 统一 查询SQL 语言 。 b) 宜 支持 多种 场景 下的 流式SQL ,如 位置 信息 分析 等 。 c) 宜 支持 常用 时间 窗口 ,包 括 滚动 窗口 、滑

36、 动窗 口等 。 d) 宜 支持 基于SQL 的批 流数 据 的模式 识别 。 e) 宜 支持 事件 驱动 的流 处理 ,降低 处理 延迟 。 f) 宜 支持 处理 乱序 事件 流、 窗口计 算、CEP 等。 g) 宜支持 对 复 杂任 务的 调度 ,如支 持深 度学 习的 训练 、MPI 任务 等。 7.5 数据分 析功 能要 求 7.5.1 模型库 模型库 的功 能要 求如 下: a) 应 支持 具备 机器 学习 、深 度学习 、自 然语 言处 理等 能力的 数据 挖掘 及分 析算 法模型 。 b) 应 支持 动态 扩展 。 c) 应 支持 模型 有效 性校 验及 评估 。 d) 应 支持

37、 用户 灵活 的自 定义 模型 。 e) 应 提供 算法I/O 注册 、算 法 注册的 接口 ,算 法厂 商的 算法要 与存 储解 耦 。 f) 算法镜 像文 件存 储 宜 对接 分布式 文件 系统 ,保 证镜 像数据 的可 靠性 。 g) 应 为Web 类 常驻 应用 提供 访 问代理 和负 载均 衡服 务, 允许用 户自 定义 域名 。 JR/T 0237 2021 9 h) 应 提供 标准 的RESTful 接 口 ,方便 业务 系统 集成 。 i) 宜支持 对 多 算法 厂商 多算 法的统 一注 册、 管理 。 j) 宜支持 各算 法厂 商独 立 维 护、升 级算 法 。 k) 宜 提

38、供 友好 直观 的UI 设计 ,方便 用户 操作 管理 。 l) 宜对外 提供 在线 或离线 算法 服务 。 7.5.2 数据处 理引 擎 数据处 理引 擎的 功能 要求 如下: a) 应 支持 图计 算引 擎 。 b) 应 支持 流处 理引 擎 。 c) 宜 支持 语义 推理 引擎 。 d) 宜支持 规则 引擎 。 e) 宜 支持 预测 算法 、机 器学 习、推 荐算 法、 相似 度算 法、分 类聚 类、 文本 挖掘 。 7.5.3 数据可 视化 数据可 视化 的功 能要 求如 下: a) 数据应 可视 化, 支持 多维 度、多 种形 式的 数据 展现 。 b) 数据模 型应 可视 化, 支

39、持 可视化 交互 、调 整模 型 。 c) 数据处 理过 程宜 可视 化, 包括数 据获 取、 数据 分析 、 数据 展现 等。 d) 宜支持 信息 流可 视化 ,包 括交易 过程 等 。 e) 宜支持 统计 分析 可视 化, 包括用 户视 图、 交易 视图 、资金 视图 等。 7.6 数据服务 功 能要 求 7.6.1 营销管理 营销管 理的 功能 要求 如下 : a) 应 提供 客户 画像 和客 户标 签服务 。 b) 应 提供 拓展 客 户 、营 销、 销售、 运营 、服 务、 考核 等 客户 营销 全流 程服 务 。 c) 应 提供 多渠 道营 销服 务 。 d) 应 提供 实时 营销

40、 服务 。 e) 宜 提供AI 智 能营 销服 务。 7.6.2 风险管理 风险管 理的 功能 要求 如下 : a) 应 提供 客户 征信 信息 服务 。 b) 应 提供 客户 风险 识别 、风 险计量 和评 估服 务 。 c) 应 提供 客户 风险 监测 、风险 控制 、风险 预 警和 处理 服务 。 d) 应支持 用户 风险 识别 分析 、 用户 行为 预测 分析 。 e) 应支持 用户 风险 评估 和监 测分析 、 实 时发 现交 易风 险 、实 时处 理风 险 、 实时 处理反 欺诈 等 。 f) 应支持对经过识别和评估的风险采取分散、对冲、转移、规避和补偿等措施 进行分析,支持 对

41、抵押、 担保 、金 融衍 生品 等风险 缓释 工具 的分 析。 7.6.3 客户服 务 客户服 务的 功能 要求 如下 : a) 应 提供 客户 管 理 信息 服务 。 b) 应 提供 客户 账单 管理 、 积 分管理 、财 富体 验、 财务 规划 等 增值 服务 。 c) 应 提供 远程 开户 、智 能客 服等多 渠道 客户 服务 。 JR/T 0237 2021 10 d) 宜 提供 刷脸 支付 、无 感支 付等多 种智能 支 付服 务 。 e) 宜 提供 智能 投顾 、智 能保 单识别 、智 能金 融咨 询等 多种智 能金融 服 务。 7.6.4 经营分 析 经营分 析的 功能 要求 如

42、下 : a) 应 提供 资产 负债 管理 服务 。 b) 应 提供 财务 管理 、管理 会计 服务 。 c) 应 提供 多维 度绩 效考 核分 析服务 。 d) 应 提供 运营 管理 服务 。 e) 应 提供 合规 审计 服务 。 7.6.5 用户画 像 用户画 像的 功能 要求 如下 : a) 应支持 用户 自然 属性 数据 分析 。 b) 应支持 用户 系统 日志 、交 易数据 分析 。 c) 应支持用户标签及 多维度 细分,包括用户价 值、活 跃度、忠诚度、影 响力、 消费能力、用户 属 性、消 费偏 好等 。 d) 应支持 多用 户的 关联 分析 。 e) 宜 支持 用户 社交 网络

43、等第 三方数 据分 析。 7.6.6 数据基 础服 务 数据基 础服 务的 功能 要求 如下: a) 应支持 交易 数据 访问 控制 ,包括 实时 交易 数据 、历 史交易 数据 等 。 b) 应支持 用户 数据 访问 控制 ,包括 用户 基本 信息 、金 融业务 偏好 等 。 c) 应支持 金融 业务 数据 访问 控制, 包括 负债 业务 、资 产业务 、中 间业 务等 。 d) 应支持 上层 应用 注册 机制 、鉴权 、管 理 。 e) 应支持 服务 功能 查询 机制 。 f) 应支持 开放 的API 调 用接 口 。 g) 应支持 批量 数据 查询 获取 。 h) 应支持 数据 订阅 功

44、能 。 i) 应支持 元数 据驱 动的 数据 地图管 理及 服务 ,包 括元 数据自 动获 取 、 数据 血缘 分析等 。 7.7 平台运 维 功 能要 求 7.7.1 安装部署 安装部 署的 功能 要求 如下 : a) 应 支持 用户 根据 业务 需要 对 金融 大数 据 平 台容 量进 行调整 ,包 括 对 主机 、服 务实例 等 的 调整 。 b) 应 支持 用户 定期 升级 系统 , 支持 关键 业务 滚动 升级 。 c) 应 支持 补丁 上传 、安 装、 卸载 。 d) 宜支持 对金融 大 数据 平台 所有组 件的 自动 化、 向导 式安装 部署 。 e) 宜 提供 开箱 即用 的组 件开 发包 。 f) 宜支持 集群 、组 件和 管理 系统统 一进 行安 装部 署。 7.7.2 监控告警 监控告 警的 功能 要求 如下 : a) 应 支持 对主 机、 服务 及服 务实例 等进 行实 时监 控 。 b) 应 支持 系统 自动 感知 故障 并生成

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 行业标准 > JR金融行业

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1