1、I C S 3 5 . 2 4 0 . 4 0 C C S A 1 1 JR 中 华 人 民 共 和 国 金 融 行 业 标 准 J R / T 0 2 3 6 2 0 2 1 金 融 大 数 据 术 语 F i n a n c i a l b i g d a t a T e r m i n o l o g i e s 2 0 2 1 - 1 2 - 2 9 发 布 中 国 人 民 银 行 发 布 2 0 2 1 - 1 2 - 2 9 实 施J R / T 0 2 3 6 2 0 2 1 I 目 次 前 言. I I 引 言. I I I 1 范 围. 1 2 规 范 性 引 用 文 件.
2、1 3 基 础 概 念. 1 4 参 考 体 系 和 生 命 周 期. 6 5 治 理 与 管 理. 1 1 6 支 撑 运 行 环 境. 1 5 附 录 ( 资 料 性 ) 本 文 件 中 术 语 描 述 的 策 略. 1 9 参 考 文 献. 2 0J R / T 0 2 3 6 2 0 2 1 I I 前 言 本 文 件 按 照 G B / T 1 . 1 2 0 2 0 标 准 化 工 作 导 则 第 1 部 分 : 标 准 化 文 件 的 结 构 和 起 草 规 则 的 规 定 起 草 。 请 注 意 本 文 件 的 某 些 内 容 可 能 涉 及 专 利 。 本 文 件 的 发 布
3、 机 构 不 承 担 识 别 专 利 的 责 任 。 本 文 件 由 中 国 人 民 银 行 提 出 。 本 文 件 由 全 国 金 融 标 准 化 技 术 委 员 会 ( S A C / T C 1 8 0 ) 归 口 。 本 文 件 起 草 单 位 : 中 国 人 民 银 行 科 技 司 、 成 方 金 融 信 息 技 术 服 务 有 限 公 司 、 中 国 农 业 银 行 股 份 有 限 公 司 、 中 国 人 民 银 行 金 融 信 息 中 心 、 中 国 建 设 银 行 股 份 有 限 公 司 、 中 国 人 民 银 行 重 庆 营 业 管 理 部 、 中 证 信 息 技 术 服 务
4、 有 限 责 任 公 司 、 华 为 技 术 有 限 公 司 、 成 方 金 融 科 技 有 限 公 司 、 中 国 工 商 银 行 股 份 有 限 公 司 、 海 通 证 券 股 份 有 限 公 司 、 工 业 和 信 息 化 部 电 子 第 五 研 究 所 、 北 京 国 家 金 融 标 准 化 研 究 院 有 限 责 任 公 司 。 本 文 件 主 要 起 草 人 : 李 伟 、 陈 立 吾 、 杨 富 玉 、 周 祥 昆 、 虞 瑾 、 齐 小 东 、 何 军 、 梁 静 、 丁 俨 、 时 向 一 、 郝 洁 、 李 宽 、 王 鹏 、 艾 霁 坤 、 聂 晓 峰 、 徐 光 贤 、
5、 朱 建 强 、 孟 桂 清 、 刘 静 芳 、 曹 建 勇 、 刘 超 、 刘 启 滨 、 秦 逞 、 李 向 东 、 冯 晋 雯 、 赵 华 、 符 海 芳 、 文 州 、 汪 星 辰 、 沈 云 明 、 吴 保 杰 、 刘 舒 婷 、 柴 思 跃 、 谢 彦 丽 、 李 琪 。J R / T 0 2 3 6 2 0 2 1 I I I 引 言 随 着 大 数 据 技 术 在 金 融 领 域 的 广 泛 深 入 应 用 , 大 数 据 技 术 已 经 成 为 促 进 金 融 科 技 创 新 , 驱 动 监 管 科 技 智 能 化 的 重 要 技 术 支 撑 , 在 规 范 社 会 治 理
6、、 提 供 金 融 服 务 等 方 面 发 挥 着 重 要 作 用 。 在 金 融 应 用 场 景 下 , 一 方 面 , 大 数 据 术 语 可 能 会 被 赋 予 特 定 的 金 融 含 义 , 部 分 术 语 从 信 息 技 术 视 角 看 不 属 于 狭 义 的 大 数 据 概 念 , 需 要 进 一 步 定 义 , 供 金 融 行 业 参 考 ; 另 一 方 面 , 在 不 同 的 场 合 , 对 大 数 据 的 概 念 存 在 不 同 的 表 述 , 导 致 在 大 数 据 管 理 与 使 用 等 过 程 中 对 大 数 据 的 实 质 性 内 容 认 知 不 同 , 可 能 影
7、响 信 息 传 导 和 业 务 需 求 的 表 达 。 基 于 以 上 原 因 , 有 必 要 尽 快 统 一 金 融 领 域 大 数 据 相 关 概 念 , 促 进 快 速 形 成 共 识 。 本 文 件 在 收 集 现 有 国 家 标 准 、 行 业 标 准 以 及 国 际 标 准 中 大 数 据 相 关 术 语 的 基 础 上 , 通 过 分 析 归 纳 , 结 合 我 国 金 融 应 用 特 点 , 形 成 了 金 融 大 数 据 的 术 语 标 准 。 本 文 件 通 过 描 述 金 融 大 数 据 的 基 础 概 念 、 参 考 体 系 和 生 命 周 期 、 治 理 与 管 理
8、、 支 撑 运 行 环 境 等 方 面 的 常 用 术 语 , 以 期 望 减 少 相 关 人 员 在 沟 通 中 的 分 歧 , 促 进 大 数 据 在 金 融 行 业 中 的 应 用 。J R / T 0 2 3 6 2 0 2 1 1 金 融 大 数 据 术 语 1 范 围 本 文 件 界 定 了 金 融 大 数 据 领 域 中 的 常 用 术 语 。 本 文 件 适 用 于 在 金 融 领 域 中 涉 及 到 的 与 大 数 据 相 关 的 信 息 沟 通 。 注:本文件中术语描述的策略见附录。 2 规 范 性 引 用 文 件 下 列 文 件 中 的 内 容 通 过 文 中 的 规 范
9、 性 引 用 而 构 成 本 文 件 必 不 可 少 的 条 款 。 其 中 , 注 日 期 的 引 用 文 件 , 仅 该 日 期 对 应 的 版 本 适 用 于 本 文 件 ; 不 注 日 期 的 引 用 文 件 , 其 最 新 版 本 ( 包 括 所 有 的 修 改 单 ) 适 用 于 本 文 件 。 G B / T 5 2 7 1 2 0 2 1 信 息 技 术 词 汇 G B / T 2 5 0 0 0 2 0 2 1 系 统 与 软 件 工 程 系 统 与 软 件 质 量 要 求 和 评 价 ( S Q u a R E ) G B / T 3 5 2 7 4 2 0 1 7 信 息
10、 安 全 技 术 大 数 据 服 务 安 全 能 力 要 求 G B / T 3 5 2 9 5 2 0 1 7 信 息 技 术 大 数 据 术 语 G B / T 3 4 9 6 0 2 0 1 8 信 息 技 术 服 务 治 理 G B / T 3 6 0 7 3 2 0 1 8 数 据 管 理 能 力 成 熟 度 评 估 模 型 I S O / I E C 2 3 8 2 : 2 0 1 5 I n f o r m a t i o n t e c h n o l o g y V o c a b u l a r y I S O / I E C 2 0 5 4 6 : 2 0 1 9 I n
11、 f o r m a t i o n t e c h n o l o g y B i g d a t a O v e r v i e w a n d v o c a b u l a r y I S O / I E C 2 0 5 4 7 : 2 0 2 0 I n f o r m a t i o n t e c h n o l o g y B i g d a t a r e f e r e n c e a r c h i t e c t u r e I S O / I E C 2 0 9 4 4 : 2 0 1 3 I n f o r m a t i o n t e c h n o l o g
12、 y M e t a d a t a R e g i s t r i e s I n t e r o p e r a b i l i t y a n d B i n d i n g s ( M D R - I B ) I S O / I E C 3 8 5 0 5 : 2 0 1 8 I n f o r m a t i o n t e c h n o l o g y G o v e r n a n c e o f I T G o v e r n a n c e o f d a t a I S O 5 5 0 0 0 : 2 0 1 4 A s s e t m a n a g e m e n t
13、 O v e r v i e w , p r i n c i p l e s a n d t e r m i n o l o g y 3 基 础 概 念 3 . 1 大 数 据 b i g d a t a 海 量 的 数 据 集 , 其 数 据 在 本 质 上 具 有 体 量 大 、 种 类 多 、 变 化 快 、 变 数 多 的 特 征 , 需 要 一 种 易 扩 展 的 技 术 来 有 效 存 储 、 处 理 、 管 理 和 分 析 。 注:1 . 大数据通常以多种不同方式使用,例如,作为某种用于处理大数据海量数据集的易扩展技术的名称。 2 . G B / T 3 5 2 9 5 2 0
14、1 7 信息技术 大数据 术语 中 2 . 1 . 1 对大数据的定义为 “具有体量巨大、 来源多样、 生 成极快、且多变等特征并且难以用传统数据体系结构有效处理的包含大量数据集的数据 ”。 3 . 在某些非工程性研讨的场合,“大数据 ”一词的外延可能被扩大到所有的数据。 来 源 : I S O / I E C 2 0 5 4 6 : 2 0 1 9 , 3 . 1 . 2 , 有 修 改 3 . 2J R / T 0 2 3 6 2 0 2 1 2 金 融 大 数 据 f i n a n c i a l b i g d a t a 金 融 领 域 中 的 大 数 据 。 注:在某些非工程性研
15、讨的场合, “金融大数据 ” 一词的外延可能被扩大到所有的金融数据, 也可能被限定在某一 特殊的领域,例如银行大数据、证券大数据、保险大数据等。 3 . 3 信 息 i n f o r m a t i o n 在 信 息 处 理 中 , 关 于 客 体 ( 如 事 实 、 事 件 、 事 物 、 过 程 或 想 法 , 包 括 概 念 ) 的 知 识 , 这 些 客 体 在 一 定 的 场 合 中 具 有 特 定 的 含 义 。 注:在某些非工程性研讨的场合,“信息”和“数据”可能没有被严格地区分。 来 源 : G B / T 5 2 7 1 . 1 2 0 0 0 , 0 1 . 0 1 .
16、 0 1 , 有 修 改 3 . 4 数 据 d a t a 任 何 以 电 子 或 者 其 他 方 式 对 信 息 的 记 录 。 注:1 . 可以通过人工或自动手段处理数据。 2 . 在某些非工程性研讨的场合,“数据” 有可能被认为是“大数据”的一个子集。 3 . I S O / I E C 2 0 5 4 6 : 2 0 1 9 I n f o r m a t i o n t e c h n o l o g y B i g d a t a O v e r v i e w a n d v o c a b u l a r y 中 3 . 1 . 5 对 数 据的定义与此等同。 4 . G B
17、 / T 5 2 7 1 . 1 2 0 0 0 信息技术 词汇 基本术语 中 0 1 . 0 1 . 0 2 对数据的定义为 “信息的可再解释的形式化 表示,以适用于通信、解释或处理”。 3 . 5 证 券 交 易 数 据 s e c u r i t i e s t r a d i n g d a t a 在 证 券 交 易 过 程 中 产 生 的 数 据 。 3 . 6 证 券 期 货 行 情 数 据 s e c u r i t i e s a n d f u t u r e s m a r k e t d a t a 有 关 证 券 期 货 市 场 价 格 的 数 据 。 3 . 7 数
18、 据 隐 私 d a t a p r i v a c y 记 录 与 描 述 自 然 人 的 私 人 生 活 安 宁 和 不 愿 为 他 人 知 晓 的 私 密 空 间 、 私 密 活 动 、 私 密 信 息 的 数 据 。 注:在不同工作场合、不同业务场景和不同数据组合下,“数据隐私”可能对应不同的外延。 3 . 8 目 标 实 体 t a r g e t e n t i t y 与 用 户 相 关 的 基 础 事 物 , 关 于 这 些 事 物 的 信 息 应 保 留 并 被 测 量 。 注:1 . 目标实体同义词可能包括信息产品输入和工作成果。 2 . 目标实体的示例有: 体系结构、 上
19、下文模式 、 概念模型、 逻辑模型、 物理数据模型、 数据字典、 文档、 数据 文件、数据库管理、关系数据库管理系统、表单、显现设备 等。 3 . 目标实体由性质精确定义。 性质的示例有: 属性、 元素、 信息、 元数据、 词汇表、 数据格式、 数据项、 数据 值、信息项、信息项内容、数据记录等 。 来 源 : G B / T 2 5 0 0 0 . 2 4 2 0 1 7 , 4 . 3 6 , 有 修 改 3 . 9 属 性 a t t r i b u t e 目 标 实 体 的 固 有 性 质 或 特 性 , 能 用 人 工 或 自 动 手 段 定 量 或 定 性 地 区 分 。 来 源
20、 : G B / T 2 5 0 0 0 . 2 4 2 0 1 7 , 4 . 2 3 . 1 0J R / T 0 2 3 6 2 0 2 1 3 数 据 变 异 性 d a t a v a r i a b i l i t y 数 据 集 传 输 速 率 、 格 式 或 结 构 、 语 义 或 质 量 的 变 化 。 来 源 : I S O / I E C 2 0 5 4 6 : 2 0 1 9 , 3 . 1 . 1 3 3 . 1 1 数 据 多 样 性 d a t a v a r i e t y 数 据 集 的 各 种 格 式 、 逻 辑 模 型 、 时 间 尺 度 和 语 义 。
21、注:数据多样性指不规则数据结构或异构数据结构,及导航、查询和数据类型划分。 来 源 : I S O / I E C 2 0 5 4 6 : 2 0 1 9 , 3 . 1 . 1 4 3 . 1 2 数 据 速 度 d a t a v e l o c i t y 创 建 、 传 输 、 存 储 、 分 析 或 可 视 化 数 据 的 流 速 。 来 源 : I S O / I E C 2 0 5 4 6 : 2 0 1 9 , 3 . 1 . 1 5 3 . 1 3 数 据 真 实 性 d a t a v e r a c i t y 数 据 的 完 整 性 或 准 确 性 。 注:数据真实性指
22、用以支持实时决策的描述性数据和对于对象的自查询。 来 源 : I S O / I E C 2 0 5 4 6 : 2 0 1 9 , 3 . 1 . 1 6 3 . 1 4 数 据 波 动 性 d a t a v o l a t i l i t y 与 数 据 的 一 段 时 间 变 化 率 有 关 的 特 征 。 来 源 : I S O / I E C 2 0 5 4 6 : 2 0 1 9 , 3 . 1 . 1 7 3 . 1 5 数 据 体 量 d a t a v o l u m e 数 据 量 的 范 围 , 与 数 据 处 理 过 程 中 的 计 算 和 存 储 资 源 及 对 这
23、 些 资 源 的 管 理 有 关 。 注:数据体量在处理大型数据集中变得非常重要。 来 源 : I S O / I E C 2 0 5 4 6 : 2 0 1 9 , 3 . 1 . 1 8 3 . 1 6 数 据 模 型 d a t a m o d e l 根 据 数 据 在 信 息 系 统 的 正 式 描 述 和 所 使 用 的 数 据 库 管 理 系 统 的 要 求 确 定 的 在 数 据 库 中 构 建 数 据 的 模 式 。 注:大数据不需要数据模型的观点是不正确的,至少是不完整的。大数据的数据模型往往在对大数据进行处理时 , 根据大数据的特征和对大数据加工的目的构建。 来 源 :
24、I S O / I E C 2 0 5 4 6 : 2 0 1 9 , 3 . 1 . 8 , 有 修 改 3 . 1 7 上 下 文 模 式 c o n t e x t u a l s c h e m a 应 用 了 数 据 模 型 的 使 用 周 境 边 界 的 正 规 描 述 。 注:这是对业务信息需求的高层描述, 上下文模式比概念模型更一般化, 包括体系结构的 (系统) 周境的整体视图。 来 源 : G B / T 2 5 0 0 0 . 2 4 2 0 1 7 , 4 . 4 , 有 修 改 3 . 1 8 数 据 集 d a t a s e t ( d a t a s e t )
25、可 用 一 种 或 多 种 格 式 访 问 或 下 载 的 可 标 识 的 数 据 集 合 。 注:数据集中的数据可能是可唯一定位但非为某一特定目的组织的, 也可能是非结构化的。 来 源 : I S O / I E C 2 0 5 4 6 : 2 0 1 9 , 3 . 1 . 1 1 , 有 修 改 J R / T 0 2 3 6 2 0 2 1 4 3 . 1 9 数 据 项 d a t a i t e m 在 特 定 上 下 文 内 数 据 的 最 小 可 识 别 单 位 , 其 定 义 、 标 识 、 允 许 值 和 其 他 信 息 由 一 组 属 性 指 定 。 注:1 . 字段被认
26、为是数据项的同义词。 2 . 数据项是数据值的物理对象“容器”。 来 源 : G B / T 2 5 0 0 0 . 2 4 2 0 1 7 , 4 . 9 3 . 2 0 数 据 记 录 d a t a r e c o r d 一 个 单 元 化 的 相 关 数 据 项 的 集 合 。 来 源 : G B / T 2 5 0 0 0 . 2 4 2 0 1 7 , 4 . 1 5 3 . 2 1 数 据 文 件 d a t a f i l e 一 个 单 元 化 的 相 关 数 据 记 录 的 集 合 。 来 源 : G B / T 2 5 0 0 0 . 2 4 2 0 1 7 , 4 .
27、 7 3 . 2 2 主 数 据 m a s t e r d a t a 组 织 中 需 要 跨 系 统 、 跨 部 门 共 享 的 核 心 业 务 实 体 数 据 。 注:大数据意义下的主数据可能是原始数据中的,也可能是加工后的数据中的,两者并不等同。 来 源 : G B / T 3 6 0 7 3 2 0 1 8 , 3 . 1 2 , 有 修 改 3 . 2 3 数 据 字 典 d a t a d i c t i o n a r y 收 集 有 关 数 据 的 信 息 , 如 名 称 、 描 述 、 创 建 者 、 所 有 者 、 出 处 、 不 同 语 言 的 翻 译 以 及 用 法
28、。 来 源 : G B / T 2 5 0 0 0 . 2 4 2 0 1 7 , 4 . 6 3 . 2 4 数 据 格 式 d a t a f o r m a t 对 于 数 据 的 储 存 或 者 显 现 的 管 理 安 排 。 注:数据格式可以参照数据类型以及数据项的长度。 来 源 : G B / T 2 5 0 0 0 . 2 4 2 0 1 7 , 4 . 8 , 有 修 改 3 . 2 5 数 据 类 型 d a t a t y p e ( d a t a t y p e ) 指 定 数 据 结 构 和 一 组 允 许 操 作 的 一 组 数 据 对 象 , 以 便 这 些 数
29、据 对 象 在 执 行 其 中 任 何 一 个 操 作 时 作 为 操 作 数 。 注:I S O / I E C 2 3 8 2 : 2 0 1 5 I n f o r m a t i o n t e c h n o l o g y V o c a b u l a r y 中1 7 . 6 . 6 对数据类型的定义为“以这些值的属性 和对这些值的操作为特征的不同值集”。 来 源 : I S O / I E C 2 0 5 4 6 : 2 0 1 9 , 3 . 1 . 1 2 , 有 修 改 3 . 2 6 数 据 值 d a t a v a l u e 数 据 项 的 内 容 。 注: 1
30、 . G B / T 2 5 0 0 0 . 1 2 2 0 1 7 系统与软件工程 系统与软件质量要求和评价 (S Q u a R E ) 的 5 . 1 . 1 中说明, 从 “固 有”的角度看,数据质量是指数据本身,如数据域值和可能的限制。 2 . 数据值是对目标实体的属性赋予的数值或类别。 来 源 : G B / T 2 5 0 0 0 . 2 4 2 0 1 7 , 4 . 1 7 , 有 修 改 3 . 2 7J R / T 0 2 3 6 2 0 2 1 5 数 据 指 纹 d i g i t a l f i n g e r p r i n t 部 署 算 法 的 技 术 , 该
31、 技 术 通 过 分 析 设 备 上 的 大 量 技 术 特 征 和 设 置 , 生 成 独 特 的 标 识 符 , 该 标 识 符 可 对 产 生 机 器 识 别 码 的 特 定 计 算 设 备 进 行 识 别 , 并 可 对 个 人 身 份 进 行 识 别 。 来 源 : I S O 1 9 7 3 1 : 2 0 1 7 , 3 . 1 7 3 . 2 8 结 构 化 数 据 s t r u c t u r e d d a t a 一 种 数 据 表 示 形 式 , 按 此 种 形 式 , 由 数 据 元 素 汇 集 而 成 的 每 个 记 录 的 结 构 都 是 一 致 的 并 且 可
32、 以 使 用 关 系 模 型 进 行 有 效 描 述 。 注:一般来说,原始未经处理的大数据不是结构化数据,但处理的结果往往采用结构化的方式组织。 来 源 : G B / T 3 5 2 9 5 2 0 1 7 , 2 . 2 . 1 3 , 有 修 改 3 . 2 9 半 结 构 化 数 据 s e m i - s t r u c t u r e d d a t a 包 含 用 来 分 隔 语 义 元 素 以 及 对 记 录 和 字 段 进 行 分 层 的 标 记 , 但 不 符 合 关 系 模 型 的 数 据 。 示例:可扩展标记语言( E x t e n s i b l e M a r
33、k u p L a n g u a g e , X M L ) 和 J a v a 脚本对象表示法 (J a v a S c r i p t O b j e c t N o t a t i o n , J S O N )都是半结构化数据的例子。 注:1 . 半结构化数据往往不完全符合除关系模型外其他形式的关联。 2 . 半结构化数据的一般特点是属于同一类的实体可以有不同的属性。 3 . 半结构化数据往往也被称为自描述的数据,其顺序往往并不重要。 4 . I S O / I E C 2 0 9 4 4 - 1 : 2 0 1 3 I n f o r m a t i o n t e c h n o
34、 l o g y M e t a d a t a R e g i s t r i e s I n t e r o p e r a b i l i t y a n d B i n d i n g s ( M D R - I B ) 中 3 . 2 1 . 1 2 . 2 1 对半结构化数据的定义为 “组件的数据类型及其标签未预先确定的聚合数据类型 ” 。 3 . 3 0 非 结 构 化 数 据 u n s t r u c t u r e d d a t a 特 征 为 除 了 记 录 或 文 件 级 别 外 没 有 任 何 结 构 的 数 据 。 示例:自由文本是非结构化数据的一个例子。 注:总
35、体而言,非结构化数据不是由数据元素组成。 来 源 : I S O / I E C 2 0 5 4 6 : 2 0 1 9 , 3 . 1 . 3 7 , 有 修 改 3 . 3 1 静 态 数 据 d a t a a t r e s t 处 于 静 止 状 态 , 具 有 大 数 据 的 体 量 大 和 多 样 性 特 征 的 数 据 。 示例:静态数据可能不是大数据,例如应用系统的配置数据。 注:静态数据通常是存储于物理媒体中的数据。 来 源 : G B / T 3 5 2 9 5 2 0 1 7 , 2 . 1 . 3 7 , 有 修 改 3 . 3 2 动 态 数 据 d a t a i
36、 n m o t i o n 处 于 活 动 状 态 , 其 典 型 特 征 表 现 为 大 数 据 的 速 度 和 多 变 性 特 征 的 数 据 。 示例:动态数据可能不是大数据,例如应用系统在某个时点的交易量。 注:动态数据在网络上传输或暂时驻留于计算机内存中供读取或更新 。 对动态数据以实时或近实时方式进行处理和 分析。 来 源 : G B / T 3 5 2 9 5 2 0 1 7 , 2 . 1 . 3 6 , 有 修 改 3 . 3 3 开 放 数 据 o p e n d a t a 可 被 其 他 数 据 使 用 的 数 据 。 注:开放数据有可能有一个开放的范围, 例如客户信
37、息在核心银行系统内是对交易系统开放的 , 但并不对核心银行J R / T 0 2 3 6 2 0 2 1 6 系统外的其他系统开放。 来 源 : G B / T 3 5 2 9 5 2 0 1 7 , 2 . 1 . 4 4 , 有 修 改 3 . 3 4 链 接 数 据 l i n k e d d a t a 连 接 其 他 数 据 的 数 据 。 来 源 : G B / T 3 5 2 9 5 2 0 1 7 , 2 . 1 . 4 5 3 . 3 5 流 数 据 s t r e a m i n g d a t a 经 由 接 口 传 递 , 从 连 续 运 行 的 数 据 源 产 生 的
38、 数 据 。 来 源 : G B / T 3 5 2 9 5 2 0 1 7 , 2 . 1 . 2 4 3 . 3 6 关 系 模 型 r e l a t i o n a l m o d e l 结 构 基 于 一 组 关 系 的 数 据 模 型 。 来 源 : G B / T 5 2 7 1 . 1 7 2 0 1 0 , 1 7 . 0 4 . 0 4 , 有 修 改 3 . 3 7 非 关 系 模 型 n o n - r e l a t i o n a l m o d e l 在 存 储 和 处 理 数 据 时 不 遵 从 关 系 模 型 的 逻 辑 数 据 模 型 。 来 源 : I
39、 S O / I E C 2 0 5 4 6 : 2 0 1 9 , 3 . 1 . 2 8 3 . 3 8 内 源 性 数 据 e n d o g e n o u s d a t a 产 生 规 则 由 系 统 协 调 者 确 定 , 并 可 在 需 要 时 由 系 统 协 调 者 协 调 数 据 提 供 者 、 大 数 据 应 用 提 供 者 、 大 数 据 框 架 提 供 者 产 生 、 变 更 、 废 止 使 用 的 数 据 。 来 源 : G B / T 3 1 1 8 6 . 1 2 0 1 4 , 3 . 7 , 有 修 改 3 . 3 9 外 源 性 数 据 e x o g e
40、 n o u s d a t a 在 系 统 协 调 者 、 大 数 据 应 用 提 供 者 、 大 数 据 框 架 提 供 者 外 部 产 生 , 产 生 规 则 可 能 公 开 也 可 能 不 公 开 , 数 据 提 供 者 在 提 供 数 据 时 不 能 确 定 其 可 用 状 态 , 可 在 系 统 协 调 者 不 知 道 的 情 况 下 产 生 、 变 更 、 废 止 使 用 的 数 据 。 来 源 : G B / T 3 1 1 8 6 . 1 2 0 1 4 , 3 . 8 , 有 修 改 4 参 考 体 系 和 生 命 周 期 4 . 1 大 数 据 参 考 体 系 结 构 b
41、 i g d a t a r e f e r e n c e a r c h i t e c t u r e 一 种 用 作 工 具 以 便 于 对 数 据 内 在 要 求 、 设 计 结 构 和 运 行 进 行 开 放 性 探 讨 的 高 层 概 念 模 型 。 注:比较普遍认同的大数据参考体系结构一般包 含 : 系统协调者、 数据提供者、 大数据应用提供者、 大数据框架提 供者和数据消费者等5 个逻辑功能构件。 来 源 : G B / T 3 5 2 9 5 2 0 1 7 , 2 . 1 . 3 4 . 2 系 统 协 调 者 s y s t e m o r c h e s t r a
42、t o r 大 数 据 参 考 体 系 结 构 中 的 一 种 逻 辑 功 能 构 件 , 可 定 义 所 需 的 数 据 应 用 活 动 并 将 其 整 合 到 可 运 行 的 垂 直 系 统 中 。 示例:在金融行业中, 系统协调者可能是金融监督管理部门或相关行业协会 。 在一个金融机构内部, 系统协调者可J R / T 0 2 3 6 2 0 2 1 7 能是高级管理层或特别授权的大数据管理部门。 注:1 . 系统协调者可以是人、软件或这二者。 2 . 系 统 协调 者 一 般包 括 : 业务 领 导 者 、咨 询 师 、数 据 科 学家 、 信 息 体系 结 构 设计 师 、 软件 体
43、 系 结 构设 计 师 、 安全体系结构设计师、个人信息保护体系结构设计师和网络体系结构设计师。 来 源 : G B / T 3 5 2 9 5 2 0 1 7 , 2 . 1 . 4 , 有 修 改 4 . 3 数 据 提 供 者 d a t a p r o v i d e r 大 数 据 参 考 体 系 结 构 中 的 一 种 逻 辑 功 能 构 件 , 可 将 新 的 数 据 或 信 息 引 入 大 数 据 系 统 。 示例:在金融行业中, 数据提供者可能是各金融机构 。 在一个金融机构内部, 数据提供者可能是某个应用系统 、 某 个业务部门或某个金融业务的客户。 注:数据提供者一般包括
44、: 企业、 公共机构、 科学家、 调研人员、 从事数据搜索的工程师、 网络应用软件、 网络运 营商和末端用户。 来 源 : G B / T 3 5 2 9 5 2 0 1 7 , 2 . 1 . 5 , 有 修 改 4 . 4 大 数 据 应 用 提 供 者 b i g d a t a a p p l i c a t i o n p r o v i d e r 大 数 据 参 考 体 系 结 构 中 的 一 种 逻 辑 功 能 构 件 , 可 执 行 数 据 生 命 周 期 操 作 , 以 满 足 系 统 协 调 者 定 义 的 需 求 以 及 安 全 和 隐 私 保 护 的 需 求 。 示例
45、:在金融行业中, 大数据应用提供者可能是金融监督管理机构、 金融服务提供商或某些厂商。 在一个金融机构 内部,大数据应用提供者可能是信息科技管理部门、应用研发部门或相关业务部门。 注:大数据应用提供者一般包括:大数据应用领域专家、大数据平台领域专家和大数据咨询师。 来 源 : G B / T 3 5 2 9 5 2 0 1 7 , 2 . 1 . 6 , 有 修 改 4 . 5 大 数 据 框 架 提 供 者 b i g d a t a f r a m e w o r k p r o v i d e r 大 数 据 参 考 体 系 结 构 中 的 一 种 逻 辑 功 能 构 件 , 可 建 立 一 种 计 算 框 架 ,