CY T 235.1-2020 出版资源内容部件数据元 第1部分:文本.pdf

上传人:diecharacter305 文档编号:1500406 上传时间:2021-03-24 格式:PDF 页数:18 大小:1.42MB
下载 相关 举报
CY T 235.1-2020 出版资源内容部件数据元 第1部分:文本.pdf_第1页
第1页 / 共18页
CY T 235.1-2020 出版资源内容部件数据元 第1部分:文本.pdf_第2页
第2页 / 共18页
CY T 235.1-2020 出版资源内容部件数据元 第1部分:文本.pdf_第3页
第3页 / 共18页
CY T 235.1-2020 出版资源内容部件数据元 第1部分:文本.pdf_第4页
第4页 / 共18页
CY T 235.1-2020 出版资源内容部件数据元 第1部分:文本.pdf_第5页
第5页 / 共18页
亲,该文档总共18页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、ICS 01.140.40 A 19 CY 中华人民共和国 新闻出版 行 业 标 准 CY/T 235.1 2020 出版资源内容部件数据元 第 1 部分:文本 Data elements of publishing resource content components Part 1: Text 2020 - 11 - 16 发布 2021 - 02 - 01 实施 国家新闻出版署 发布 CY/T 235.1 2020 I 目 次 前言 . III 1 范围 . 1 2 规范 性引用文件 . 1 3 术语和定义 . 1 4 数据元描述 . 2 4.1 数据元属性 . 2 4.2 内部标识符

2、. 3 4.3 数据类型 . 3 4.4 数据格式 . 4 5 数据 元目录 . 4 5.1 文本版本 . 5 5.2 文本版权 . 5 5.3 文本版权年 . 5 5.4 文本版权所有者 . 5 5.5 文本标识符 . 5 5.6 文本出版地 . 5 5.7 文本出版日期 . 6 5.8 文本出处 . 6 5.9 文本创建时间 . 6 5.10 文本贡献者 . 6 5.11 文本贡献者简介 . 6 5.12 文本贡献者角色 . 7 5.13 文本关键字 . 7 5.14 文本获取限制 . 7 5.15 文本奖项 . 7 5.16 文本类型 . 7 5.17 文本描述 . 8 5.18 文本名

3、称 . 8 5.19 文本其他名称 . 8 5.20 文本使用限制 . 8 5.21 文本提要 . 8 5.22 文本文件大小 . 9 5.23 文本文件格式 . 9 5.24 文本文件名称 . 9 5.25 文本修改时间 . 9 5.26 文本样式 . 9 CY/T 235.1 2020 II 5.27 文本语种 . 9 5.28 文本主题 . 10 6 数据元的维护与管理 . 10 6.1 数据元的维护与管理概述 . 10 6.2 数据元提交机构的职责 . 10 6.3 数据元注册机构的职责 . 10 附录 A (规范性) 文本代码表 . 11 CY/T 235.1 2020 III 前

4、言 本文件按照 GB/T 1.1 2020标准化 工作导则 第 1 部分:标准化文件的结构和起草规则的规定 起草。 本 文件 是 CY/T 235出版资源内容部件数据元 的第 1 部分。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本 文件 由全国新闻出版信息标准化技术委员会( SAC/TC 553) 提出并 归口。 本 文件 起草单位:北京大学、中宣部机关服务中心(中宣部信息中心)、北京拓标卓越信息技术研 究院、中国科技出版传媒股份有限公司。 本 文件 主要起草人: 王文清、姜磊、刘成勇、郭昱锦、刘勇、张沫、南志弘、陆新民、关涛、陈鹏 飞。 CY/T 235.

5、1 2020 1 出版资源内容部 件数据元 第 1 部分:文本 1 范围 本 文件 规定了新闻出版文本 资源 的 基础 数据元描述、目录、维护与管理 。 本 文件 适用于新闻出版行业 出版 资源的 规划、采集、存储、交换、共享与利用 。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款 。 其中,注日期的引用文件 , 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于 本文件。 GB/T 4880.2 2000 语种名称代码 第 2 部分: 3 字 母代码 GB/T 7408 2005 数据元和交换格式 信息交换 日期和时

6、间表示法 GB/T 18391.3 2009 信息技术 元数据注册系统 (MDR) 第 3 部分:注册系统元模型与基本属性 ( ISO/IEC 11179-3:2003,IDT) CY/T 50 2008 出版术语 3 术语和定义 下列术语和定义适用于本文件。 3.1 出版资源内容部件 publishing resource content components 可独立使用并构成出版物基本要素的内容资源 。 3.2 数据元 data element 由 一个属 性集合规定其 定义、标识、表示和允许值的数据单元。 来源: GB/T 18391.3 2009, 3.3.36 3.3 属性 attr

7、ibute 一 个对象或实体的特性。 来源: GB/T 18391.3 2009, 3.1.3 3.4 文本 text CY/T 235.1 2020 2 以字母、符号、字、短语、段落、句子、表格或者其他字符排列形式出现,用于表达特定意义的数 据。 来源: CY/T 50 2008, 6.47 3.5 值域 value domain 允许值的 一个 集合。 来源: GB/T 18391.3 2009, 3.3.140 4 数据元描述 4.1 数 据元属性 4.1.1 属性定义 遵循 GB/T 18391.3 2009 中相关 数据元 定义, 采用以下 属性 描述 数据元 见表 1。 表 1 属

8、性定义 序号 名称 必备性 说明 1 内部标识符 必备 为数据元指定的 与语言无关的唯一标识 2 中文名称 必备 赋予数据元的单个或多个中文字词的指称 3 英文标签 必备 由一个对象称谓的一个英文词或短语构成 4 同义名称 有则必备 与中文名称语义相同的其他名称 5 说明 必备 数据元 含义 的 描述 与解释 6 数据类型 必备 用于表示数据元的符号、字符或其他表示的类型 7 数据格式 必备 用 字符串表示数据元值的格式 8 值域 有则必备 数据元的允许值 集合 9 计量单位 有则必备 数据元取值的限定计量单位 10 备注 有则必备 数据元的注释 11 版本 必备 数据元的发布 标识 12 提

9、交机构 必备 提出 增加、变更或废止 数据元 的组织或部门 13 注册机构 必备 获得 数据元 授权 的注册 组织 4.1.2 数据元共享信息 数据元属性定义 共享以下信息 : a) “版本”属性:本文件发布后, 数据元的版本为 1.0 版; b) “提交机构”属性: 数据元的“提交机构” 为 本文件的 起草单位; c) “注册机构”属性:数据元的“注册机构” 为 本文件的 归口单位。 注: 本文件数据元目录以数据元中文名称的汉语拼音为序。 4.1.3 英文标签表达 数据元的英文标签,由一个对象称谓的一个英文词或短语构成,基本表达要求包括: CY/T 235.1 2020 3 a) 与中文名称

10、概念对应,英文用词采用国际社会的通用词; b) 以英文字母全拼形式出现(常用的缩写除外); c) 首词的第 1 个字母为大写; d) 由短语构成的英文标识,每个词的首字母为大写,之间无空格; e) 英文标签置于 中; f) 相同标签在不同应用环境中应加上限定词; g) 1 个标签的长度不宜超过 60 个字符。 4.2 内部标识符 4.2.1 内部标识符结构 数据元的内部标识符 由数据元标识和数据元序号 2 部分组成,采用 5 位字母数字码表示 , 其中数据 元标识 采用 1 位大写字母表示 ,数据元序号由 4 位数字组成, 如图 1 所示。 X X X X X 数据元序号 ( 4 位 ) 数据

11、元标识 ( 1 位 ) 图 1 内部标识符编码结构 4.2.2 数据元 标识 出版资源内容部件数据元 由 10部分 组成 , 各组成部分的 数据元标识见表 2。 表 2 出版资源内容部件数据元标识 序号 出版资源 内容部件 标准 名称 数据元标识 1 出版资源内容部件数据元 第 1 部分: 文本 A 2 出版资源内容部件数据元 第 2 部分: 静态图像 B 3 出版资源内容部件数据元 第 3 部 分: 动态图像 C 4 出版资源内容部件数据元 第 4 部分: 音频 D 5 出版资源内容部件数据元 第 5 部分: 表格 E 6 出版资源内容部件数据元 第 6 部分: 列项 F 7 出版资源内容部

12、件数据元 第 7 部分: 索引 G 8 出版资源内容部件数据元 第 8 部分: 数 学 公式 H 9 出版资源内容部件数据元 第 9 部分: 化学式 I 10 出版资源内容部件数据元 第 10 部分: 程序 J 4.3 数据类型 数据类型 的 取值 见表 3。 CY/T 235.1 2020 4 表 3 数据类型取值 序号 数据类型 说明 1 字符型 采用字符形式(字母、数字、汉字等)表示的值的 类型 2 数值型 采用 0 9 数字形式表示的值的类型 3 日期型 采用 GB/T 7408 2005 中规定的 YYYY-MM-DD 格式表示年、月、日的组合 4 时间型 采用 GB/T 7408

13、2005 中规定的 hh:mm:ss 格式表示时、分、秒的组合 5 日期时间型 采用 GB/T 7408 2005 中规定的 YYYY-MM-DDThh:mm:ss 格式表示日期和时间的组 合,其中“ T”为时间标志符 6 布尔型 两个且有两个表明条件的值,如 On/Off、 True/False 7 二进制型 图像、音频、视频等二进 制流文件格式 4.4 数据 格式 数据格式表示方法见表 4。 表 4 数据 格式中使用的字符含义 序号 字符 说明 1 a 表示字母字符 2 n 表示数字字符 3 an 表示字母数字字符 4 m( m 为自然数) 表示定长 m 个字符(一个汉字为两个字符) 5

14、.ul 表示长度不确定的文本 6 . 表示从最小长度到最大长度,前面附加最小长度,后面附加最大长度 (也可以只附 加最大长度 ) 7 .p,q( p、 q 均为自然数 ) 最长 p 个数字字符,小数点后 q 位 8 YYYY-MM-DD 表示年、月、日日期格式 9 hh:mm:ss 表示时、分、秒时间格式 10 YYYY-MM-DDThh:mm:ss 表示日期和时间的组合,其中“ T”为时间标志符 数据 格式 表示的 示例如下: a) a3:固定长度为 3 个字母字符; b) a.12:可变长度,最多为 12 个字母的字符串; c) .ul:表示长度不确定的文本; d) n3:固定长度为 3

15、位的数字字符; e) n.12, 2:最大长度为 12 位的小数格式(包括小数点和小数点后面的数字),小数点后保留 2 位数字。 f) an3:固定长度为 3 个字母数字字符; g) an.3:最多为 3 个字母数字字符。 5 数据元目录 CY/T 235.1 2020 5 5.1 文本版本 内部标识符: A0001 中文名称: 文本 版本 英文标签: 说明: 文本 的 版本名称 。 数据类型:字符型 数据格式 : .ul 5.2 文本版权 内部标识符: A0002 中文名称:文本 版权 英文标签: 说明:文本 的版权 信息 说明 。 数据类型:字符型 数据格式 : .ul 5.3 文本版权

16、年 内部标识符: A0003 中文名称:文本版权 年 英文标签: 说明: 用于描述拥有 文本版权的 年份。 数据类型:字符型 数据格式: .ul 5.4 文本版权 所有者 内部标识符: A0004 中文名称:文本版权 所有者 英文标签: 说明: 拥有 文本 版权的个人、组织或实体的名称 。 数据类型:字符型 数据格式: .ul 5.5 文本标识符 内部标识符: A0005 中文名称:文本标识符 英文标签: 说明: 赋予 文本 的一个唯一标识。 数据类型:字符型 数据格式 : .ul 5.6 文本 出版地 内部标识符: A0006 CY/T 235.1 2020 6 中文名称:文本出版地 英文标

17、签: 说明:文本的 出版单位所在地 。 数据类型:字符型 数据格式: .ul 5.7 文本 出版日期 内部标识符: A0007 中文名称:文本出版日期 英文标签: 说明:文本 首次出版的时间 。 数据类型:日期型 数据格式: YYYY-MM-DD 5.8 文本出处 内部标识符: A0008 中文名称:文本出处 英文标签: 说明:文本的来源信息。 数据类型:字符型 数据格式 : .ul 5.9 文本创建 时间 内部标识符: A0009 中文名称:文本创建时间 英文标签: 说明:文本创 建的时间 。 数据类型: 日期时间型 数据格式 : YYYY-MM-DDThh:mm:ss 5.10 文本贡献者

18、 内部标识符: A0010 中文名称:文本 贡献 者 英文标 签: 说明:对文本内容作出贡献的 个人或团体 。 数据类型:字符型 数据格式 : .ul 5.11 文本贡献者简介 内部标识符: A0011 中文名称:文本 贡献 者 简介 英文标签: 说明:文本贡献 者 的 基本信息或经历 。 CY/T 235.1 2020 7 数据类型:字符型 数据格式 : .ul 5.12 文本贡献者角色 内部标识符: A0012 中文名称:文本 贡献 者 角色 英文标签: 说明: 文本贡献者的角色类型 。 数据类型: 数值 型 数据格式 : n2 值域:见 附录 A的 表 A.1。 5.13 文本关键字 内

19、部标识符: A0013 中文名称:文本关键字 英文标签: 说明: 体现 文本 内容主题的核心词汇 。 数据类型:字符型 数据格式 : an.200 5.14 文本获取限制 内部标识符: A0014 中文名称: 文本获取限制 英文标签: 说明: 对 文本 获取设置的限制 。 数据类型:字符型 数据格式 : .ul 5.15 文本 奖项 内部标识符: A0015 中文名称: 文本 奖项 英文标签: 说明: 文本 的获奖情况。 数据类型:字符型 数据格式 : .ul 5.16 文本 类型 内部标识符: A0016 中文名称:文本类型 英文标签: 说明:文本的内容特征或者分类描述。 数据类型: 数值

20、型 数据格式: n2 CY/T 235.1 2020 8 值域: 见附录 A的 表 A.2。 5.17 文本描述 内部标识符: A0017 中文名称:文本描述 英文标签: 说明:文本相关的描述说明。 数据类型:字符型 数据格式 : .ul 5.18 文本名称 内部标识符: A0018 中文名称:文本名称 英文标签: 说明:赋予文本的名称 。 数据类型:字符型 数据格式 : an.200 5.19 文本 其他 名称 内部标识符: A0019 中文名称:文本 其他 名称 英文标 签: 说明:文本正式名称的别名 。 数据类型:字符型 数据格式 : an.200 5.20 文本使用限制 内部标识符:

21、A0020 中文名称: 文本使用限制 英文标签: 说明: 对复制、出版 和 传播 等使用设置的限制 。 数据类型:字符型 数据格式 : .ul 5.21 文本提要 内部标识符: A0021 中文名称:文本提要 英文标签: 同义名称:文本摘要 说明:文本内容的概要描述。 数据类型:字符型 数据格式: .ul CY/T 235.1 2020 9 5.22 文本文件大小 内部标识符: A0022 中文名称:文本文件大小 英文标签: 说明:文本 文件大小的字节数。 数据类型:数值型 数据格式 : n.20, 2 计量单位:兆字节( MB) 5.23 文本文件格式 内部标识符: A0023 中文名称:文

22、本文件格式 英文标签: 说明: 计算 机存储 文本 数据的格式 。 数据类型: 数值 型 数据格式 : n2 值域: 见附录 A的 表 A.3。 5.24 文本文件名 称 内部标识符: A0024 中文名称:文本文件名 称 英文标签: 说明: 为 文本 文件指定的名称 。 数据类型:字符型 数据格式 : an.300 5.25 文本修改 时间 内部标识符: A0025 中文名称:文本修改时间 英文标签: 说明:文本修改的时间 。 数据类型: 日期时间型 数据格式 : YYYY-MM-DDThh:mm:ss 5.26 文本样式 内部标识符: A0026 中文名称:文本样式 英文标签: 说明: 文

23、本排版时需要用到的样式。 数据类型:字符型 数据格式 : .ul 5.27 文本语种 CY/T 235.1 2020 10 内部标识符: A0027 中文名称:文本语种 英文标签: 说明: 文本内容的 语言种类 。 数据类型:字符型 数据格式 : a3 值域: GB/T 4880.2 2000 中 的 3 字母 语种 代码 5.28 文本主题 内部标识符: A0028 中文名 称:文本主题 英文标签: 说明:文本内容的 分类 描述 。 数据类型:字符型 数据格式 : .ul 6 数据元的维护 与 管理 6.1 数据元的维护 与 管理概述 数据元 维护和管理工作 由专门的 提交机构和注册机构 负

24、责。 6.2 数据元提交机构的职责 数据元提交机构的 基本职责包括 : a) 收集、发现和提取数据元; b) 对数据元进行基本审查; c) 向数据元的注册机构提交数据元。 6.3 数据元注册机构的职责 数据元注册机构的 基本职责包括 : a) 受理数据元提交机构的 相关 业务; b) 对提交机构提交的数据元进行 评审; c) 对数据元进行管理和维护, 包括保障数据资源 有效性、 数据元更新以及 数据元版本控制等; d) 及时对外或相关机构发布最新数据元及数据元管理系统更新和 升级信息,保持数据元与管理系 统的时效性。 CY/T 235.1 2020 11 A A 附 录 A (规范性) 文本

25、代码表 A.1 文本贡献者角代码表 文本贡献者角色代码见表 A.1。 表 A.1 文本 贡献者角色 代码表 序号 名称 代码 1 作者 01 2 合作者 02 3 编者 03 4 修订者 04 5 删节者 05 6 改写者 06 7 翻译者 07 8 编译者 08 9 审核者 09 10 校对者 10 11 主编 11 12 分卷编辑 12 13 合作编辑 13 14 责任编辑 14 15 顾问编辑 15 16 总编辑 16 17 出版者 17 18 其他 99 A.2 文本类型代码表 文本 类型 代码见表 A.2。 表 A.2 文本类型代 码表 序号 名称 代码 1 概述 /注解 01 2 描述 02 3 目录 03 4 广告描述 04 CY/T 235.1 2020 12 表 A.2 ( 续 ) 序号 名称 代码 5 书评引文 05 6 名人评论 06 7 大字标题 07 8 特点介绍 08 9 传记说明 09 10 出版说明 10 11 节选 11 12 其他 99 A.3 文本文件格式代码表 文本文件格式代码见表 A.3。 表 A.3 文本 文件格式 代码表 序号 名称 代码 1 HTML 01 2 XML 02 3 PDF 03 4 DOC 04 5 TXT 05 6 EPUB 07 7 CEBX 08 8 WPS 09 9 其他 99 _

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 行业标准 > CY新闻出版

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1