1、 ICS 33.040 CCS M10 中 华 人 民 共 和 国 通信行 业 标 准 YD/T XXXXX XXXX 融合通信 中 即时消 息 业务 安 全监测及 处置 技术要求 Security technical specification for instant message service on rich communication (suite ) service ( 报批 稿) XXXX - XX - XX 发布 XXXX - XX - XX 实施 中 华 人 民 共 和 国工 业 和 信 息 化 部 发布 YD YD/T XXXXX XXXX I 目 次 前言 . IIIII
2、 1 范围 . 1 2 规范 性引 用文 件 . 1 3 术语 和定 义 . 1 4 缩略 语 . 2 5 总述 . 2 6 消息 监测 总体 技术 架构 . 23 6.1 网 络部 署位 置 . 23 6.2 功 能组 成 . 3 7 监测 过滤 . 4 7.1 监 测过 滤模 块功 能结 构 . 4 7.2 监 测过 滤流 程 . 45 7.3 特 征匹 配 . 56 7.4 热 点实 时跟 踪 . 56 7.5 黑/ 白名 单号 码库 . 6 7.6 不 良消 息指 纹库 . 67 8 策略 生成 . 67 8.1 策 略生 成模 块功 能结 构 . 67 8.2 黑 名单 生成 . 7
3、 8.3 消 息指 纹生 成 . 78 9 用户 标记 分析 . 8 9.1 用 户标 记分 析模 块功 能结构 . 8 9.2 消 息送 审流 程 . 89 9.3 消 息送 审优 先级 . 910 10 不 良消 息审 核 . 910 10.1 不良 消息 审核 模块 功 能结构 . 910 10.2 不良 消息 深度 分析 . 1011 10.3 不良 消息 分类 分级 . 1011 10.4 不良 消息 判定 . 1112 10.5 不良 消息 库 . 1112 11 不 良消 息处 置 . 1213 11.1 不良 消息 处置 模块 功 能结构 . 1213 11.2 处置 方案 .
4、 1213 11.3 用户 身份 特征 . 13 11.4 用户 处置 历史 . 1314 12 数 据采 集要 求 . 1314 12.1 IM AS 即时 消息 采集 数据格 式 . 1314 12.2 用户 标记 消息 数据 格 式 . 1415 YD/T XXXXX XXXX II 前 言 本 文件 按照GB/T 1.1 2020 标准 化工 作导则 第1 部分: 标准化 文件 的结构 和起草 规则 的规 定 起草。 请注意 本文 件的 某些 内容 可能涉 及专 利。 本文 件的 发布机 构不 承担 识别 这些 专利的 责任 。 本 文件 由中 国通 信标 准化 协会提 出并 归口 。
5、 本 文件 起草 单位 : 中国 移 动通信 集团 设计 院有 限公 司 、 中国 移动 通信 集团 公 司 、 国家 计算 机网 络应 急技术 处理 协调 中心 、中 国联合 通信 有限 公司 。 本 文件 主要 起草 人: 张滨 、 赵刚 、 冯 运波 、 杜 雪涛 、 赵蓓 、 常 玲、 薛姗 、 马 力鹏、 吴日 切 夫 、 李 祥 军、江 为强 、李 智水 、 张 高山、 张琳 、洪 东、 刘佳 。 YD/T XXXXX XXXX 1 融合通信中 即 时 消息业务安全 监 测 及 处 置 技 术 要 求 1 范围 本 文件 主要 规定 融合 通信 中 即时 消息 业务 的监 测总 体
6、技术 架构 、 不良 消息 监 测过滤 、 策略 生成、用 户标记 分析 、不 良 消 息审 核 和处 置等 相关 技术 要求 。 本 文件 适用 于 电 信运 营商 开展融 合通 信 中 即时 消息 业务 网 络侧 的安全 监测 和 处置 。 2 规范性引用文件 本 文件 没有 规范 性引 用 文 件。 。 3 术语和定义 3.1 融合通 信业 务 rich communication suite service 构建在IMS 网 络之 上 , 基 于增强 型地 址簿 , 为用 户 提供语 音 、 消 息、 业务 能 力指示 、 社交 呈现 信息 共享、IM 聊 天、 文件传 输 、图片 及
7、视 频共 享及 网络 地址簿 等多 种业 务的 集合。 3.2 融合通 信即 时消 息业 务 在一定 时间 内, 发送 用户 与接收 用户 之间 准实 时的 消息交 互服 务。 即时 消息 业务交 换的 消息 可以 包 含文本 和多 媒体 内容 (包 括图片 、 音 频、 视 频 、 文 件 等) , 消息 正文 可以 随着 聊 天邀请 同时 发送 给对 方。 即使没 有社 交呈 现关 系存 在, 也 能够 邀请 对方 或者 接收聊 天请 求 。 3.3 不良消 息 违 反互联 网信息 服务管理 办法( 国 务院令 第292 号) 第三十五 条规定 (“ 九不 准”)的 的即时 消 息。 3.
8、4 即时消 息指 纹 将即时 消息 (包 括文 本、 图片、 音频、 视频 、 文 件 等) 经 过 特 征抽 取 和 单向 哈希 加 密等 方式 , 得到 可以唯 一标 识即 时 消 息的 固定长 度 字 符串 序列 。 YD/T XXXXX XXXX 2 4 缩略语 下列缩 略语 适用 于 本 文件 。 IM AS :即 时消 息 应 用服 务 器 (Instant Message Application Server ) 5 总述 不良消 息 通 常具 有如 下特 征 : 未经用 户许 可 由于 即 时消 息 消息 业务 使 用主动 发送 ,被动 接收 的工作 模式, 不良 消息发 送者
9、往 往没有 征得 即 时消息 接收 用户 许可 就直 接给手 机用 户发 送。 使用非 法收 集号 码 不良 消 息发 送者 往往 没有 征得用 户同 意 , 就 直接 通 过网站 、 调查 、 注册 等渠 道 来获取 移动 用户 终端 号码, 进而 发送 不良 消息 。 批量发 送 出于经 济利 益、 政治 利益 等方面 的考 虑, 不良 消息 总是批 量发 送 。 批量 发送 主 要有 两种 发 送 手段 , 按照号 段全 面发 送和 按照 号码精 确发 送。 按照 号段 全面发 送即时 消 息没 有考 虑到用 户情 况, 必然 是 不良 消息; 而按 照号 码精 确发 送并没 有征 得
10、即 时消 息 目 标用户 同意 ,同 样是 不良 消息。 具有重 复性 不良 消 息发 送者 一旦 获知 了目标 用户 号码 , 往 往会 给这些 号码 多次 发送 即时 消息 , 以期 达到 发送 者 不良目 的 。 6 消息监测总体技术架 构 6.1 网络部署位置 融合通信 即时消息 安全监测主要是 通过对即时 消息 指纹 以及消息发送 特征等信息 ,结合用户举 报/ 标记信 息以 及第 三方 不良 消息 进 行综 合分 析 和 判断 , 并 根据 不良 消息 内容 及用 户发送 历史 对 不 良消 息 进 行处置 。 不良消 息处置 包 括拦截 不良 消息 、 关 停用 户业务 等 。
11、安全 监测 系统 在通信 网络 中的 位置 如图 1 所示。 YD/T XXXXX XXXX 3 用户 IMS核心网 IM AS 即时消息 安全监测系统 举报/ 标记 本运营商 其他系统 其他运营 商和安全 厂商系统 本运营商网络 图 1 即时 消息 安全 监 测 系统 网络 部署 本标准 仅涉及 合 通信 用户 在 无线IMS 网 络环 境下 发 送 即时 消息 的监 测 处 置技 术要求 , 融 合通 信用 户 在2/3G 环境 下发 送的SMS 短信不 在本 标准 定义 。 6.2 功能组成 融合通 信 即时 消息 安全 监 测 系统 的内部 功能 组成如图2所示 ,系统 由监测 过滤
12、、策略 生成、 用户 标 记分析 、不良 消 息审 核 和 不良消 息处 置五 个模块 构成 。 不良 消息审 核 不良 消息 处 置 监测 过滤 数据/ 指令 用户 标记分 析 用户 举报/ 标记 融合 通信即 时消息 安全监 测系统 处置 要求 策 略 生 成 其它 运营 商 和 安全 厂商 系 统 本运 营商 其 他 系统 IM AS 用户 终端 共享 数据 数据/指令 疑似不良消息 疑似/ 确认 不良消息 确认不良 消息 确认不良 消息 处置 要求 图2 融合通信即 时 消息 安全 监测系统 功能组 成 其中 : 监测过 滤 : 根 据既 定策 略 对即时 消息 进行 过滤 , 将 符
13、合过 滤策 略的 消息 ( 称为 疑似 不良 消息 ) 发送给 不良 消息 审核 模块 二次审 核 , 并对 不良 消息 模块二 次审 核 判 定的 不良 消息 ( 称为 确认 不 良消息 )向IM AS 发 送拦 截 指令。 策略生成 : 根据 消息 特 征 和 发 送方 行 为进 行分 析 形成 过 滤策 略 ,将 过滤 策 略发 送 给监 测 过 滤 模块。 用户标 记分 析 : 按照 一定 策 略 将用 户标 记/ 举报 的不 良 信息 发 送给 不良 消息 审核 模块进 行分 析 。 YD/T XXXXX XXXX 4 不良消 息审 核 :对 疑 似 不 良消息 进行 审核 , 如果
14、 确 认不良 消息 , 则发 送给 不 良消息 处置 模块 、 监测过 滤模 块以 及用 户标 记分 析 模块 。 不 良 消息 处 置: 对确 认 不良 消 息进 行 适当 的处 置 ,包 括 安全 提 醒、 不良 消 息拦 截 和即 时 消 息 业务关 停等 。 7 监测 过滤 7.1 监测过滤模块功能结 构 监测过 滤模 块 ( 功能 结构 如图3 ) 对IM AS 发送 的即 时 消息数 据进 行过 滤分 析, 如即时 消息 被判 定 为 不良消 息 , 则向IM AS发送 拦截指 令 。IM AS 接 收到 拦 截指令 后, 不再 将该 即时 消息发 送给 接收 方。 其它 运营 商
15、 和安 全厂商 系统 不良 消息审 核 数据/ 指令 疑似/确认 不良消息 黑/ 白名 单 号码 库 监测 过滤 策略 生成 数据/ 指令 IM AS 特征 匹配 不良 信息 指纹 库 第三方黑/ 白 名单号码 热 点 实 时 跟踪 图 3 监测 过滤 模 块 功能 结 构 监测过滤 主 要功 能包 括 : 不良消 息 特 征匹 配 : 对IM AS 发送 的即 时消 息数据 , 进行发 送方 号码 和信 息指 纹 黑白 名单 比对 , 如命中 则为 疑似 不良 消息 ,发送 给不 良信 息审 核模 块 进行 二次 审核 。 热 点 送审 : 对即 时消 息 的热 点 进行 实 时监 控 ,
16、并 将热 点 即时 消 息发 送不 良 消息 审 核模 块 进 行 审核。 拦截/ 放行 指令 : 根 据特 征 匹配和 二次 审核 结果 ,向IM AS 发 送拦 截/ 放 行指 令。 7.2 监测过滤 流程 监测过 滤的 详细 流程 如 图4 所示 。 YD/T XXXXX XXXX 5 读取IM AS 发送的即时消 息数据 对比号码库白名单 向IM AS 发送放行指令 对比信息指纹库 对比号码库黑名单 命中 ? 否 命中 ? 命中 ? 否 是 向IM AS 发送拦截指令 否 向IM AS 申请消息内容 , 发送不良信息审核模块 是 不良消息审核 判定为不良消息 是 否 是 热点送审 实时
17、热点跟踪 图4 不良 消息 监 测 过滤 流 程 7.3 特征匹 配 特征匹 配模 块是 将即 时 消 息数据 与 黑 白名 单号 码库 和不良 消息 指纹 库进行 对比,如 命中 (即 时消 息 的发送 方 号 码或 者消 息指 纹 在相 应库中 ) 则进 行相 应处置 。具体 处 置方 法根 据命中 库的 不同 有所 差别 , 具体方法 如 下: 白名单号码库 命中 :如 即 时消息 是 在 白名 单库 中 的 号码发 送, 向IM AS 发送 放 行指令 。 黑名单号】 码库 命中: 如 即时消 息 是 在黑 名单 库中 的号码 发送 ,向IM AS 取 证 即时消 息内 容, 将取证
18、内容 发送 给不 良信 息审核 模块 , 如判 定为 不 良消息 , 则发 送拦 截指 令 ; 否则发 送放 行指 令。 不良信息指纹库 命中 :即 时消息 指纹 在 不 良信 息指 纹库中 ,向IM AS发 送拦 截 指令。 7.4 热点实时跟踪 对 用户 发送 的即 时消 息进 行热点 跟踪 , 根 据即 时消 息指纹 实时 跟踪 热点 消息 。 热点 跟踪 包括 各种 富 媒体形 式 的 即时 消息 :文 本、图 像、 音频 和视 频。 对热点 的跟 踪应 包括 以下 因素 : 时间性 热点 ,包 括突 发性 热点和 长期 性热 点 : 突发性 热点 : 短 时间 (小 时)内 发送 量
19、较 高的 即时 消息; YD/T XXXXX XXXX 6 长期性 热点 : 在 较长 时间 内(周 ,月 ) 发 送量 较高 的即时 消息 。 地域因 素 : 在某 个地 区范 围内发 送量 较大 的即 时消 息 。 社交圈 :在 一些 社交 圈 范 围内发 送量 较大 即时 消息 。 7.5 黑/ 白名单号码库 如 发送 方号 码在 白名 单号 码库 中 ,向IM AS发送 放行 指令 。 白名单 号码 主要 来源 于: 经认证 的特 别用 途号码/ 群组 上级单 位下 发特 别用 途号 码 。 黑名单 号码 库 的 号码 发送 的消息 需要 不良 消息 审核 模块进 行二 次判 定, 主
20、要 来源于 : 运营商 内部 不良 号码 库 其他运 营商 及第 三方 厂商 共享的 黑名 单号 码库 用户投 诉黑 名单 上级及 相关 单位 下发 的黑 名单号 码库 策略生 成模 块产生 的 黑名 单。 7.6 不良消息指纹库 不良消 息指 纹库 的指 纹用 于对 即 时消 息消息 指纹 的 精确匹 配 , 与不 良消 息指 纹 库 中指纹 匹 配一 致 的 即时消 息 , 向IM AS 发送 拦 截指令 。不 良消 息 指 纹库 的 主要 来源 于 : 经不良 消息 审核 模块 判定 的不良 消息; 上级单 位下 发的 不良 消息 。 8 策略生 成 8.1 策略生成 模块功 能结 构
21、策略生 成模 块 为 监测 过滤 模块 ( 如图5) 生成 过滤 策 略,主 要包 括: 根据用 户收 发消 息特 征, 生成黑 名单 策略 ; 根据确 认不 良消 息内 容 , 生成不 良消 息指 纹 ; 根据上 级单 位下 发的 不良 消息, 生成 不良 消息 指纹 。 YD/T XXXXX XXXX 7 不良 消息审 核 监测 过滤 策略 生成 收发 特征 分 析 消息 指纹生 成 综合 分析 数据/指令 确认不良消息 黑名 单生 成 图5 策略 生成 模 块功 能结 构 8.2 黑名单生成 8.2.1 收发 特 征分 析 根据用 户收 发消 息的 号码 进行收 发特 征分 析 , 主要
22、 收发分 析特 征如 表1 所示 。 表1 收发 特 征分 析策 略 分析策 略 说明 发送频 率 单位时 间发 送 即 时消 息 的 次数 收发比 单位时 间发 送 即 时消 息和接 收即 时消 息次数 比率 接收号 码离 散度 同一发 送号 码的 所有 接收 号码在 单位 时间 内 的离散 程度=接 收方 号码 个 数 ( 去重 )/ 发送 即 时消息 次数 万号段 占比 单位时 间内 , 某 一发送 号 码 的所有 接收 号码 处 于相同 万号 段的 号码 数量 占总被 接收 号码 的 比 率 8.2.2 综合分 析 系统根 据用 户日 常通 信行 为综合 分析 ,可 以采 用的 综合分
23、 析方 式包 括: 用 户 身份 特 征: 对用 户 号码 根 据用 户 在网 时长 、 历史 信 用情 况 等对 用户 身 份进 行 分级 。 通 常 可分为VIP 用户 、 高 级用 户 和普通 用户 。 用 户 社交 圈 分析 :用 户 日常 即时 消 息 收发 是否 存 在 稳 定 的通 信 范围 , 主 要 通过 发 送和 接 收 即 时消息 号码中 是 否存 在稳 定的通 信 对 象, 以及 通信 对象占 比 。 不 良 消息 传 播分 析 : 某 一消 息 被判 定 为不 良消 息 后, 对 不良 消 息的 历史 转发 路 径 进行 分 析 , 对参与 不良 消息 发送 的用 户
24、进行 降级 或扣 分。 结合以 上分 析方 式 , 以 及 即时消 息收 发特 征 , 对 用 户的综 合分 值进 行判 断 。 对于不 良消 息发 送可 能 性较大 的用 户号 码 , 作为 黑名单 号码 发送 给监 测过 滤模块 。 8.3 消息指纹生成 YD/T XXXXX XXXX 8 不良消 息审 核模 块将 已经 判定为 不良 消息 的即时 消息 内容 发送 给策 略生 成模 块 , 由 策略 生成 模块 生 成相应 的不 良消 息指 纹 发 送给监 测过 滤模 块 。 系统 可 按照 不同 类型 的即 时消息 分别 生成 相应 的消 息指纹 , 包 括文本、图 片、 音频、 视频
25、、 文件等。 即时消 息指 纹应 能够 在指 明消息 类型 的基 础上 ,唯 一标识 每一 个即 时消 息。 融合通 信即 时消 息监 测系 统的消 息指 纹生 成方 法 , 应与IM AS 的消 息 指 纹生 成 算法为 同一 算法 。 9 用户标记分析 9.1 用户标记 分析模块功 能结 构 用户标 记分 析模 块接受 用 户举报/标 记的 不良 信息 及 上级单 位和 其他 渠道 的用户 标记/举 报信 息 , 按 照送审 流程 送给 不良 消息 审核模 块进 行审 核 。 上级 单位转 发的 举报 信息 , 应 按照一 定周 期 向 上级 单 位 反 馈相应 的分 析及 处置 结果 。
26、用户 标记 分析 模块 的功 能结 构 如图6所示 。 不良 消息 审 核 用户 举报/ 标记 用户 终端 疑似/ 确认 不良消息 用户 标记 分 析 消息 送审 上级 单位 、 其 它运 营商 和 安 全厂 商系统 举报/ 标记 信息 用户 标记 不良 信息 库 图6 用 户标 记分 析 模 块功 能结构 用户标 记/举 报不良 消息 主 要 来自 三个方 面:融 合通 信 应用 软件、 上级 单位 和 第三方 安全机构 。 被 用户标 记或 举报 的不 良消 息称为 用户 标记 不良 消息 。 系统 应只 分析 融合 通信 用户的 标记/举报 信息 。 9.2 消息送审流程 系统 将 接收
27、 到的 用户 标记 不良信 息保 存在 用户 标记 不良消息 库中 , 首先 与系 统 保存的 标记 消息 和 不 良消息 进行 比对 , 如无 历 史记录 , 则送 不良 消息 审 核 模块 。 如果 用户 标记 不良 消息 已经 被判 定为 不良 消 息,则 相关 信息 送不 良消 息处置 模块。 对 于政 府机 构 下发 的举报 信息 , 需要 定期反 馈相 关判 定结 果。 用 户标 记即时 消 息送 审流 程如 图7所示 。 YD/T XXXXX XXXX 9 接收用户标记不良 消息 , 保存在用户 标记不良信息库中 消 息指纹是否在用户 标记不良信息库中 送消息指纹生成模 块 ,
28、获取被标记不 良消息的消息指纹 将用户标 记不良消 息 库的记 录合并 , 添加标记记录 消息指纹是否在 不良信息库中 将 不良 消息送不 良 消息处置模块 用户 标记不良消息库 是否 标记为不良信息 将标记 消息送不 良消息 审核 模块 将不良消息送不 良消息处置模块 如为上级单位下 发举报消息 , 将判定/ 处置结果定期反馈 。 是 否 否 否 是 是 是否为 不良消息 将判定结果 记录 在用户标记 不良 消息库 是 否 图7 用 户标 记不 良消 息送 审流程 9.3 消息送审优先级 恶意用 户可能 利 用用 户标 记功能 在系 统忙 时发 送大 量用户 标记 信息 , 扰 乱监 测系统
29、 正常 功能 。 系统 应具备 标记 消息 送审 优先 级策略 。 在 系统 忙时 , 如果 出现 的 大量用 户标 记行 为 , 应 按 照优先 级分 批送 审 。 在 系 统闲时 再分批 将 其余 用 户标记 不良 信息 送审 。 系统忙 时, 用户 标记 不良 消息送 审 优 先级 如下 : 上级单 位和 其他 合作 第三 方标记 消息 ; VIP 用户 标记 消息 ; 高级用 户标 记消 息; 其他。 10 不良消息审核 10.1 不良消息 审核模块功能 结构 YD/T XXXXX XXXX 10 不良消 息审 核模 块对 监测 过滤模 块发 现的 疑似 不良 消息进 行深 度分 析
30、和 判定 , 对于经 判定 确认 的 不 良消息 ,按 照不 良信 息来 源 发送 给相关 模 块。 对不 同的 消 息送 审 来 源的 处置 如下: 监测分 析模 块 和 投诉 分析 模块送 审的 消息 ,判 定为 不良消 息后 分别 反馈 ; 所有经 判定 的不 良消 息 : 送策略 生成 模块 生成 不良 消息指 纹 ; 送不良 消息 处置 模块 ,根 据不良 消息 的类 别和 级别 , 进行 相应 处置 。 不良 消息 处 置 疑似/ 确认 不良消息 投诉 分析 疑似/ 确认 不良消 息 监测 过滤 确认不良消息 策略 生成 共享 和自有 不良 信息库 不良 信息 深度 分析 不良 消
31、息 审核 不良 消息 分 类 分级 不良 信息 判定 确认不良消息 图8 不 良消 息审 核模 块功能 结构 10.2 不良消息深度分析 系统 对 疑似 不良 消息 , 按 照消息 类 型 分别 进行 内容 分析 。 系统 通过 提取 关键 特征和 疑似 不良 内容 , 为不良 消息 判定 模块 提供 判定依 据 。 各种类 型的 疑似 不良 消息 进行深 度分 析的 技术 能力 要求 如 表2 所示 。 表2 疑 似不 良消 息深 度分 析 技术 要求 类型 分析能 力 分析结 果 文本 短文本 及长 文本 分类 能力 文本分 类识 别结 果 图片 相似图 像识 别 、 特 定类 型 图像识
32、 别 、 图 像内显 示文 字识 别、 头像 识别 关键特 征和 疑似 不良 图片 音频 相似音 频识 别 , 音 频片 段 识别 、 以 及音 频转文 字识 别 关 键 特 征 和 疑 似 不 良 音 频 转 文 字, 或 音频 片段 视频 相似视 频识 别 、 视 频片 段 识别 、 特 定 类 型视频 识别 、视 频中 的音 频识别 关键特 征和 疑似 不良 视频 截图 文件 常见文 件中 文字 及图 片抓 取及识 别 关键特 征和 疑似 不良 文字 或图片 10.3 不良消息分类分级 YD/T XXXXX XXXX 11 系统 对 不良 消息 依据 内容 进行分 类, 可分 为 淫 秽
33、色 情类 、 政治 类 、 诈骗 类 、 侵犯权 益类 、赌 博类 、 网络敲 诈和 有偿 删帖 类 、 暴恐类 、以 及 其 他有 害信 息。 系统 可 依据 不良 消息 的 社 会影响 程度 、影 响范 围、 用户投诉 量 以及 直接 后果 等 ,进 行适 当分级 。 10.4 不良消息判定 系统根 据 不 良消 息深 度分 析输出 的关 键特 征与 系统 存储的 不良 消息 特征 进行 比对, 计 算 相似 度, 并 提取出 若干 个相 似度 中 的 最大值W。 若W大于 等于 某一阈 值M (M 可根据 实际情 况, 自行设 定), 则判定 其属 于不良 消息, 并根据 不良 消 息库
34、中 与之 匹配 的不 良消 息的分 类分 级情 况, 确定 该不良 消息 所属 类别 及等 级。 将 该不 良消 息发 送 给 不 良消息 处置 模块 进行 处置 ,并发 送给 策略 生成 模块 ,生成 消息 指纹 ,供 监测 过滤模 块使 用; 若W小 于等 于某 一阈 值N(N 可根据 实际 情况 ,自 行设 定), 则判 定其 属于 正常 消息; 若MWN,则 对 其 关键特 征 及疑似 不良内 容 进 行取证 ,明确 认定其 是否 属于不 良消息 。若判 定为 不 良消息 ,则 将该 不良 消息 发送给 不良 消息 处置 模块 进行处 置, 并发 送给 策略 生成 模 块, 生成 消息
35、 指纹 , 供监测 过滤 模块 使用。 阈值M 和N可 以根 据系 统实 际情况 自行 设定 。 10.5 不良消 息库 不良消 息库 主要 来源 于: 监 测过 滤模 块发 送的 疑似 不良消 息, 经不 良消 息审 核模块 判定 的不 良消 息; 用户投 诉经 不良 消息 审核 模块判 定的 不良 消息 ; 其他运 营商 及安 全厂 商共 享的不 良消 息经 不良 消息 审核模 块判 定的 ; 上级单 位下 发的 不良 消息 ; 不良消 息库 中存 储不 良消 息样本 、 不 良消 息指 纹、 不良消 息关 键特 征、 不良 消息分 类信 息、 不良 消 息分级 信息 等。 对于以上 来
36、源的 不良 消息 , 存入 不良 消息 库流 程如 下 : (1) 来源为 第三 方( 其他 运营 商及安 全厂 商) 和用 户投 诉的不 良消 息 , 需进 行不 良消 息 审核 , 确认为 不良 消息 后再 进入 下一环 节, 来源 为本 系统 监 测和上 级单 位下 发的 不良 消息直 接进入下 一环节 ; (2) 去重 , 即 提取 不良 消息 的 消息指 纹 , 与 不良 消息 库 中存储 的消 息指 纹进 行比 对, 若不 良消 息库中 没有 此消 息再 进入 下一环 节; YD/T XXXXX XXXX 12 (3) 对不良 消息 进行 处理 ,包 括提取 关键 特征 、分 类分
37、 级等; (4) 将不良 消息 样本 、 不 良消 息指纹 、 不 良消 息关 键特 征、 不 良消 息分 类、 不良 消息级别 等 信 息存入 不良 消息 库中 。 11 不良消息处置 11.1 不良消息处置模块 功 能结 构 不良消 息处 置模块 ( 功 能 结构 如 图9 )对确 认的 不良 消息根 据其 分类分 级情 况 、发送 用户 身份及 用 户处置 历史 ,进 行适 当的 处置, 包括 不良 消息 撤销 和不良 消息 业务 关停 等 。 不 良 消 息 审 核 处置 要求 本运 营商 其 他 系统 确认不良 消息 不良 消息 处 置 用户 身份 特 征 用 户 处 置 历 史 处
38、置 方案 图9 不良 消 息处 置模 块 功 能结构 11.2 处置方案 系统 对 于已 经确 认的 不良 信息, 除对 不良 消息 进行 拦截外 , 还 需要 具备 即时 消息撤 销和 用户 业务 关 停的进 一步 处置 的能 力 。 系统根 据用 户身 份特征 和 用户处 置历 史 ( 包括 发送 不良消 息次 数和 不良 消 息 类 别、级 别) ,综 合判 定是 否对用 户进 行业 务关 停处 置。 1)不 良消息 撤销 系统能 够将 已发 送的 即时 消息撤 回的 能力 : 对于文 本类 消息 ,应 能够 在一定 时限 内从 用户 终端 撤回; 对于富 媒体 类即 时消息 , 应能够
39、 在 用 户未 下载 的情 况下 撤 回, 撤回 后未 下载 到本地 的用 户不 再能 够 访问富 媒体 信息。 2)不 良消 息业 务关 停 系统能 够对 用户 账号 即时 消息业 务关 停, 被关 停即 时消息 业务 的用 户不 能够 发送和 接收 即时 消息 。 如 有群 聊的 群主 被关 停业 务的情 况, 可考 虑关 闭该 群聊。 YD/T XXXXX XXXX 13 11.3 用户身份特征 通过 发 送不 良消 息的 用户 号码可以 关 联出 签约 用户 的身份 , 对 用户 可以 从以 下 方面综 合评 价其 身份 特征值 ,作 为用 户处 置的 参考依 据。 1)实 名 认证
40、特征: 若用户为实名 认证 , 且其 名下的 号码总 数 不超 过一 定数量 ,则实 名特征 值高 ; 反之, 实名 特征 值下 降 ; 统计用 户实 名认 证包 含但 不限于 如 下 情况 : 用户实 名 认 证且 仅有 唯一 号码; 用户实 名认 证且 号码 数量 小于预 定值 ; 用户实 名认 证且 号码 数量 多于预 定值 ; 用户为 非实 名认 证。 2)身 份特 征: 用户 身份 分 级如下 所示 , 身 份特 征值 由高到 低, 依次 递减 ; 统计用 户分 级包 括但 不限 于如下 级别 : VIP用户 高级用 户 一般用 户 高危用 户 11.4 用户处置历史 系统保 留一
41、段时 期内 所有 用户的 不良 消息 处置 记录 , 作为 用户 处置 的参 考依 据。 系统根 据用 户的 实名 认证 情况, 保存 实名 用户 名下 所有号 码的 处置 历史 。 12 数据 采集要求 12.1 IM AS 即时消息采集 数据 格式 从IM AS 采 集的 即时 消 息 信 息应包 括 : 发送 方号码 、 接收 方 号码 、接 收方 个数 、 即时 消息 指纹 等 , 如表3 所 示。 表3 IM AS 采集 数据 内容 说明 发送方 号码 发送即 时消 息的 用户 号码 接收方 号码 列表 接收即 时消 息的 用户 号码 ,如为 群聊 此项 为空 即时消 息指 纹 即时消 息的 唯一 识别 序列 码 发送时 间 即时消 息的 发送 时间 消息类 型 即时消 息的 类型 YD/T XXXXX XXXX 14 群聊ID 群聊识 别码 ,如 为 点 对点 即时消 息 此 项为 空 即时消 息指 纹指 通过 抽取 即时消 息的 特征 值, 通过 一 定的编 码, 能够 唯一 性的 对 即时消 息进 行标 识, 但是不 能通 过还 原等 方法 推演出 即时 消息 原始 内容 。 12.2 用户 标记消息数据格 式 从第三 方或 融合 业务 应用 获取
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1