DB13 T 2351 1-2016 标准文献结构化数据规范第1部分:全文元数据.pdf

上传人:hopesteam270 文档编号:371992 上传时间:2018-10-02 格式:PDF 页数:25 大小:334.86KB
下载 相关 举报
DB13 T 2351 1-2016 标准文献结构化数据规范第1部分:全文元数据.pdf_第1页
第1页 / 共25页
DB13 T 2351 1-2016 标准文献结构化数据规范第1部分:全文元数据.pdf_第2页
第2页 / 共25页
DB13 T 2351 1-2016 标准文献结构化数据规范第1部分:全文元数据.pdf_第3页
第3页 / 共25页
DB13 T 2351 1-2016 标准文献结构化数据规范第1部分:全文元数据.pdf_第4页
第4页 / 共25页
DB13 T 2351 1-2016 标准文献结构化数据规范第1部分:全文元数据.pdf_第5页
第5页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、ICS 01.140.20 A 14 DB13 河 北 省 地 方 标 准 DB 13/T 2351.12016 标准文献结构化数据规范 第1部分:全文元数据 Structured data specifications of standard documents Part 1:Full-text Metadata 2016 - 05 - 23发布 2016 - 07 - 01实施 河北省质量技术监督局 发 布DB13/T 2351.12016 I 目 次 前言 II 引言 . III 1 范围 1 2 规范性引用文件 1 3 术语和定义 1 4 全文元数据的属性 2 5 全文元数据模型 2

2、6 全文元数据描述 3 7 全文元数据字典描述 . 14 8 全文元数据扩展原则和方法 . 14 附录A(规范性附录) 标准文献全文结构化元数据代码集 . 15 附录B(规范性附录) 篇章条编号、表号和图号说明 . 16 附录C(资料性附录) 标准文献结构化全文元数据-字典描述 18 参考文献 22 DB13/T 2351.12016 II 前 言 本部分按照GB/T 1.1-2009给出的规则起草。 DB13/T 2351标准文献结构化数据规范包括了3部分: 第1部分:全文元数据; 第2部分:指标元数据; 第3部分:元数据著录规则。 本部分是第1部分,本部分与第3部分配套使用。 本部分由河北

3、省标准化研究院提出并归口。 本部分起草单位:河北省标准化研究院。 本部分主要起草人:施健、卢艳芳、马星晓、李朴、李建勋、谢燕、闫志强、张园园、陈南、赵倩、郭天强、安姣。 DB13/T 2351.12016 III 引 言 标准文献电子文档格式有DOCX、数字版PDF、扫描版PDF。在生产、科研和管理过程中,往往需要定位到标准内容、指标信息上,如:检索标准指标、指标比对及标准水平分析等。但是,现有的标准文献电子文档为非结构化文档,这一特性决定它的内容检索指向性笼统模糊,故而,以非结构化文档为单元存储无法实现小颗粒度的指标数据的检索、比对分析,只有通过数据处理将非结构化文档转换为结构化或半结构化文

4、档方能解决上述问题。 为寻求上述瓶颈的突破,河北省标准化研究院在2012年将标准文献结构化列为重点科研项目,在此基础上,2013年又承担了国家标准化委员会标准化信息中心的“双打”重点产品标准文献结构化内容数据库项目,而实现标准文献结构化必须首要解决2个问题:1)结构化标准的数据结构问题,换而言之,标准结构化加工抽取出的数据是哪些数据?2)对抽取出来的数据进行加工应符合什么样的数据规范要求,方能满足与原始标准文本内容的一致性的需求。 解决第一个问题,需要建立标准结构化数据模型,并通过元数据规范来实现; 解决第二个问题,需要建立数据的著录规则,实现数据的规范性。 项目组在确定文献结构化抽取技术的基

5、础上,对4000余项强制性国家标准的内容要素逐一进行了分析研究、归纳总结后,按UML思想确定了标准结构化数据模型,并在工程上对4000余项强制性国家标准进行了结构化数据的抽取验证,确定了结构化元数据。通过验证测试,逐步完善了加工抽取结构化数据的规范要求,形成了标准文献结构化数据规范。 目前,在行业内广泛使用的GB/T 22373-2008标准文献元数据是针对标准文献题录的元数据标准,侧重的是标准文献形式特征,而此次制定的标准文献结构化数据规范是关于标准内容结构化的全文元数据和指标元数据规范,希望此两个标准的结合使用,实现标准文献信息资源的统一描述,促进标准文献信息资源的开发利用。 DB13/T

6、 2351.12016 1 标准文献结构化数据规范 第1部分:全文元数据 1 范围 本部分规定了标准文献结构化全文元数据(包括全文、术语、图像、表格和公式)的术语和定义、属性、模型、描述以及扩展原则和方法。 本部分适用于标准文献结构化数据的处理。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 74088 数据元和交换格式信息交换 日期和时间表示法(GB/T 7408-2005,ISO 8601:2000,IDT) GB/T 18391.3-2009 信息

7、技术 元数据注册系统(MDR) 第3部分:注册系统元模型与基本属性(ISO/IEC 11179-3:2003,IDT) GB/T 19710-2005 地理信息 元数据(ISO 19115-2003,MOD) GB/T 26816-2011 信息资源核心元数据 3 术语和定义 下列术语和定义适用于本部分。 3.1 信息资源 information resource 在政治、经济和社会等各领域产生和使用、具有各种载体形式的信息内容。 GB/T 26816-2011,定义3.1 3.2 元数据 metadata 定义和描述其他数据的数据。 GB/T 18391.3-2009,定义3.2.18 3.

8、3 元数据元素 metadata element 元数据的基本单元。 注:元数据元素在元数据实体中是唯一的。 GB/T 19710-2005,定义4.61 3.4 元数据实体 metadata entity 一组说明信息资源相关特性的元数据元素。 注:可以包含一个或一个以上元数据实体。 GB/T 19710-2005,定义4.71 3.5 核心元数据 core metadata DB13/T 2351.12016 2 描述信息资源基本属性的元数据元素和元数据实体。 GB/T 26816-2011,定义3.5 4 全文元数据的属性 4.1 中文名称 指元数据元素或元数据实体的中文名称,用本部分第

9、6章中各条的标题来表达。 4.2 英文名称 元数据元素的英文名称,一般用小写英文全称,英文单词之间用空格分隔。 元数据实体的英文名称,每一个单词首字母为大写,其余字母为小写,英文单词之间用空格分隔。 4.3 缩写名 应符合GB/T 26816-2011中4.6的要求。 4.4 定义 应符合GB/T 26816-2011中4.2的要求。 4.5 数据类型 应符合GB/T 26816-2011中4.4的要求。 4.6 值域 应符合GB/T 26816-2011中4.5的要求。 4.7 约束/条件 应符合GB/T 26816-2011中4.7的要求,约束/条件代码见附录A 表A.1。 4.8 最大出

10、现次数 应符合GB/T 26816-2011中4.8的要求。 5 全文元数据模型 标准文献结构化全文元数据模型见图1。 DB13/T 2351.12016 3 图1 全文元数据模型 6 全文元数据描述 6.1 全文元数据 中文名称: 全文元数据 英文名称: Full-text Metadata 缩写名: FulTxtMdata 定义: 描述结构化标准中全文数据的元数据。 数据类型: 复合型 约束/条件: M 最大出现次数: 1 6.2 标识符 中文名称: 标识符 英文名称: identifier 缩写名: ID DB13/T 2351.12016 4 定义: 名称空间中对象的唯一标识符。 数据

11、类型: 字符串 值域: UUID 约束/条件: M 最大出现次数: 1 6.3 全文 中文名称: 全文 英文名称: Full Text 缩写名: FulTxt 定义: 以篇章条形式描述的标准内容。 数据类型: 复合型 约束/条件: M 最大出现次数: 1 6.4 标准号 中文名称: 标准号 英文名称: document reference 缩写名: docRef 定义: 由有关标准化机构给定的用于唯一识别某一标准的注册号或登记号,标准号由标准代号、顺序号、发布年份及有关标识符组成。 数据类型: 字符串 值域: 标准代号+1 个空格+顺序号+1 个连字符“-“+4 位发布年份 约束/条件: M

12、最大出现次数: 1 6.5 标准名称 中文名称: 标准名称 英文名称: document name in Chinese 缩写名: docNmCN 定义: 标准的中文名称 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.6 篇章条编号 中文名称: 篇章条编号 英文名称: chapter number 缩写名: chapNo 定义: 标准内容中篇章条按一定规则的顺序编号(篇章条编号定义说明见附录 B.1.1)。 数据类型: 字符串 值域: 见附录 B.1.2 约束/条件: O 最大出现次数: 1 6.7 篇章条名称 中文名称: 篇章条名称 英文名称: chapte

13、r name DB13/T 2351.12016 5 缩写名: chapNm 定义: 标准中篇章条的标题名称。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.8 篇章条内容 中文名称: 篇章条内容 英文名称: Charpter Content 缩写名: ChapCont 定义: 标准中篇章条的段落内容。 数据类型: 复合型 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.9 篇章条类型 中文名称: 篇章条类型 英文名称: chapter type 缩写名: chapTyp 定义: 描述篇章条类别。 数据类型: 字符串 值域: 字典(篇章条类型代码见

14、附录 表 A.2)。 约束/条件: O 最大出现次数: N 6.10 篇章条所在页码 中文名称: 篇章条所在页码 英文名称: charpter page number 缩写名: chapPNo 定义: 同一标准篇章条首次出现所在的页码。 数据类型: 数值型 值域: 正整数 约束/条件: M 最大出现次数: 1 6.11 篇章条父章节 中文名称: 篇章条父章节 英文名称: parent chapter number 缩写名: parChpNo 定义: 当前篇章条的上一级章节的编号。 数据类型: 字符串 值域: 条层级最多4层的篇章条编号 约束/条件: C 最大出现次数: 1 6.12 篇章条顺序

15、号 中文名称: 篇章条顺序号 DB13/T 2351.12016 6 英文名称: charpter order number 缩写名: chpOrdNo 定义: 篇章条的顺序号 数据类型: 数值型 值域: 正整数 约束/条件: M 最大出现次数: 1 6.13 文字 中文名称: 文字 英文名称: word 缩写名: wrd 定义: 以文字形式描述的标准内容。 数据类型: 自由文本 约束/条件: O 最大出现次数: 1 6.14 表格 中文名称: 表格 英文名称: Table 缩写名: Tab 定义: 以表格形式描述的标准内容。 数据类型: 复合型 约束/条件: O 最大出现次数: N 6.15

16、 表号 中文名称: 表号 英文名称: table number 缩写名: tabNo 定义: 标准内容中表格按特定规则的顺序编号。(表号定义说明见附录 B.2.1)。 数据类型: 字符串 值域: 见附录 B.2.2 约束/条件: O 最大出现次数: 1 6.16 表名 中文名称: 表名 英文名称: table name 缩写名: tabNm 定义: 描述表格主题的名称。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.17 表格图像路径 中文名称: 表格图像路径 英文名称: table image path DB13/T 2351.12016 7 缩写名: ta

17、bImgPath 定义: 表格图像文件存储的路径。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.18 表注 中文名称: 表注 英文名称: table note 缩写名: tabNote 定义: 标准内容中表格的注释。 数据类型: 字符串 值域: 自由文本 约束/条件: O 最大出现次数: 1 6.19 表格所在页码 中文名称: 表格所在页码 英文名称: table page number 缩写名: tabPNo 定义: 标准内容中同一表格首次出现所在页码。 数据类型: 数值型 值域: 正整数 约束/条件: M 最大出现次数: 1 6.20 同一表格顺序号 中

18、文名称: 同一表格顺序号 英文名称: same table order number 缩写名: tabOrdNo 定义: 跨页表格图像文件的顺序号。 数据类型: 数值型 值域: 正整数 约束/条件: M 最大出现次数: 1 6.21 表格HTML格式 中文名称: 表格HTML格式 英文名称: table HTML code 缩写名: tabHTML 定义: 用HTML描述的表格信息。 数据类型: 字符串 值域: 自由文本 约束/条件: C 最大出现次数: 1 6.22 图像 中文名称: 图像 DB13/T 2351.12016 8 英文名称: Image 缩写名: Img 定义: 以图形式描述

19、的标准内容。 数据类型: 复合型 约束/条件: O 最大出现次数: N 6.23 图号 中文名称: 图号 英文名称: image number 缩写名: imgNo 定义: 标准内容中图像按特定规则的顺序编号。(图号定义说明见附录 B.3.1)。 数据类型: 字符串 值域: 见附录 B.3.2 约束/条件: O 最大出现次数: 1 6.24 图名 中文名称: 图名 英文名称: image name 缩写名: imgNm 定义: 描述图的主题的名称。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.25 图像路径 中文名称: 图像路径 英文名称: image pa

20、th 缩写名: imgPath 定义: 图像文件存储的路径。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.26 图注 中文名称: 图注 英文名称: image note 缩写名: imgNote 定义: 标准内容中图像的注释。 数据类型: 字符串 值域: 自由文本 约束/条件: O 最大出现次数: 1 6.27 图像所在页码 中文名称: 图像所在页码 DB13/T 2351.12016 9 英文名称: image page number 缩写名: imgPNo 定义: 标准内容中同一图像首次出现的页码。 数据类型: 数值型 值域: 正整数 约束/条件: M

21、最大出现次数: 1 6.28 同一图像顺序号 中文名称: 同一图像顺序号 英文名称: same image order number 缩写名: imgOrdNo 定义: 同一图号的图像在不同页赋予的顺序编号。 数据类型: 数值型 值域: 正整数 约束/条件: M 最大出现次数: 1 6.29 公式 中文名称: 公式 英文名称: Formula 缩写名: Fmla 定义: 以公式形式描述的标准内容。 数据类型: 复合型 约束/条件: O 最大出现次数: N 6.30 公式名称 中文名称: 公式名称 英文名称: formula name 缩写名: fmlaNm 定义: 描述公式的主题的名称。 数据

22、类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.31 公式所在页码 中文名称: 公式所在页码 英文名称: formula page number 缩写名: fmlaPNo 定义: 标准内容中同一公式首次出现所在页码。 数据类型: 数值型 值域: 正整数 约束/条件: M 最大出现次数: 1 6.32 公式图像路径 中文名称: 公式图像路径 DB13/T 2351.12016 10 英文名称: formula image path 缩写名: fmlaImgPath 定义: 公式图像文件存储的路径。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数:

23、 1 6.33 公式注 中文名称: 公式注 英文名称: formula note 缩写名: fmlaNote 定义: 公式的注释。 数据类型: 字符串 值域: 自由文本 约束/条件: O 最大出现次数: 1 6.34 术语 中文名称: 术语 英文名称: Term 缩写名: Term 定义: 在本标准中需要规范的用词。 数据类型: 复合型 约束/条件: O 最大出现次数: N 6.35 术语中文名称 中文名称: 术语中文名称 英文名称: term name in Chinese 缩写名: termNmCN 定义: 术语的中文标题名。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出

24、现次数: 1 6.36 术语英文名称 中文名称: 术语英文名称 英文名称: term name in English 缩写名: termNmEN 定义: 术语的英文标题名。 数据类型: 字符串 值域: 自由文本 约束/条件: O 最大出现次数: 1 6.37 术语内容 中文名称: 术语内容 DB13/T 2351.12016 11 英文名称: term definition 缩写名: termDef 定义: 术语的定义内容。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.38 术语缩略语 中文名称: 术语缩略语 英文名称: term abbriviation

25、缩写名: termAbbr 定义: 为了使用方便,使术语称谓中的成分进行有规律的节缩或者省略形成的词。 数据类型: 字符串 值域: 自由文本 约束/条件: O 最大出现次数: N 6.39 术语同义词 中文名称: 术语同义词 英文名称: term synonym 缩写名: termSyn 定义: 表达意义相同或相近,但是表达形式不同的词汇。 数据类型: 字符串 值域: 自由文本 约束/条件: O 最大出现次数: N 6.40 术语禁用词 中文名称: 术语禁用词 英文名称: term stop 缩写名: termStp 定义: 禁止使用的术语。 数据类型: 字符串 值域: 自由文本 约束/条件:

26、 O 最大出现次数: N 6.41 术语注 中文名称: 术语注 英文名称: term note 缩写名: termNote 定义: 术语条款的注释。 数据类型: 字符串 值域: 自由文本 约束/条件: O 最大出现次数: 1 6.42 术语所在页码 DB13/T 2351.12016 12 中文名称: 术语所在页码 英文名称: term page number 缩写名: termPNo 定义: 标准内容中该术语首次出现所在页码。 数据类型: 数值型 值域: 正整数 约束/条件: M 最大出现次数: 1 6.43 版本信息 中文名称: 版本信息 英文名称: Version Information

27、 缩写名: VInfo 定义: 描述全文数据产生、更新的一组信息。 数据类型: 复合型 约束/条件: M 最大出现次数: 1 6.44 更新时间 中文名称: 更新时间 英文名称: update time 缩写名: upTime 定义: 描述全文数据修改更新的时间。 数据类型: 日期型 值域: 按GB/T 7408 执行,格式为 CCYY-MM-DD hh:mm:ss 约束/条件: M 最大出现次数: 1 6.45 记录状态 中文名称: 记录状态 英文名称: record status 缩写名: recSta 定义: 关于标准文献全文元数据库中记录所处的状态(修改、删除、新增)的说明。 数据类型

28、: 字符串 值域: 采用表 A.3记录状态代码中的名称。 约束/条件: M 最大出现次数: 1 6.46 版本 中文名称: 版本 英文名称: version number 缩写名: verNo 定义: 描述全文数据更新的版本编号。 数据类型: 字符串 值域: 自由文本 约束/条件: M 最大出现次数: 1 6.47 加工单位 DB13/T 2351.12016 13 中文名称: 加工单位 英文名称: process unit 缩写名: prsUnit 定义: 描述全文数据加工单位的信息。 数据类型: 字符串 值域: 字典 约束/条件: M 最大出现次数: 1 7 全文元数据字典描述 标准文献结

29、构化全文元数据字典描述见附录C,表C.1中带“*”的元数据为核心元数据。 8 全文元数据扩展原则和方法 标准对象的多样性决定标准内容的多样性,标准文献结构化全文元数据亦需要扩充。扩充的原则与方法应符合GB/T 26816-2011第6章的要求。 DB13/T 2351.12016 14 A A 附 录 A (规范性附录) 标准文献全文结构化元数据代码集 A.1 约束/条件代码 约束/条件代码见表A.1。 表A.1 约束/条件代码 代码 名称 说明 M 必选 表明该元数据元素或元数据实体必须选择。 O 可选 根据实际应用可以选择也可以不选的元数据元素或元数据实体。已经定义的可选元数据元素和可选元

30、数据实体,可指导部门元数据标准制定人员充分说明其信息。 如果一个可选元数据实体未被使用,则该实体所包含的元素(包括必选元素)也不选用。 可选元数据实体可以有必选元素,但只当可选实体被选用时才成为必选。 C 条件必选 当满足约束条件中所定义的条件时应选择。条件必选用于以下三种可能性之一: a) 当在多个选项中进行选择时,至少一个选项必选,且必须使用; b) 当另一个元数据元素已经使用时,选用一个元数据实体或元数据元素; c) 当另一个元数据元素已经选择了一个特定值时,选用一个元数据元素。 A.2 篇章条类型代码 篇章条类型代码见表A.2。 表A.2 篇章条类型代码 代码 名称 说明 Q 强制 表

31、明该篇章条内容为强制性。 T 推荐 表明该篇章条内容为推荐性。 A.3 记录状态代码 记录状态代码见表A.3。 表A.3 记录状态代码 代码 名称 说明 A 修改 A-Amend D 删除 D-Delete N 新增 N-New DB13/T 2351.12016 15 B B 附 录 B (规范性附录) 篇章条编号、表号和图号说明 B.1 篇章条编号说明 B.1.1 篇章条编号定义说明 篇章条编号是标准内容中篇章条按一定规则的顺序编号。结构化标准内容一般包括三个层次:篇、章、条。章是标准内容划分的基本单元,一般从“公告”或“前言”开始,一直延续到“参考文献”结束,标准正文中使用阿拉伯数字从1

32、开始对章编号,附录中一般使用大写拉丁字母从A开始对章编号,特殊情况以文本为准。篇是章的向上扩充类型,使用汉语小写数字从“一”开始对篇编号。条是章的细分,是章的下一层级,一般使用阿拉伯数字从1开始对条编号,特殊情况以文本为准,条最多可以有5层。篇章条编号根据篇章条的层级,由篇编号、章编号、条编号、固定的描述词和分隔符“.”按一定的规则组合形成。 B.1.2 篇章条编号值域 篇章条编号的值域有以下几种形式: a) 篇层级的篇章条编号值域为:“第”+篇编号+“篇”。 示例:“第一篇”、“第二篇” b) 章层级的篇章条编号值域为: 1) 标准正文中的篇章条编号值域:章编号。 示例:“1”、“5” 2)

33、 附录中的篇章条编号值域:“附录”+章编号。 示例:“附录 A”、“附录 B” c) 条层级的篇章条编号值域为: 1) 标准正文中的篇章条编号值域:章编号+“.”+条编号。 示例: “5.2”、“5.2.1“ 2) 附录中的篇章条编号值域:章编号+“.”+条编号。 示例:“A.1”、“B.1.1” B.2 表号说明 B.2.1 表号定义说明 表号是标准内容中的表格按特定规则的顺序编号。自引言开始连续到附录之前的标准正文中整体使用阿拉伯数字从1开始对表编号,附录中每章使用阿拉伯数字从1开始对表编号。表号由“表”、分隔符“.”和表编号按一定的规则组合而成,续表在表号后面加“(续)”。 B.2.2

34、表号值域 表号值域按有无续表有以下两种形式: d) 无续表的表号值域: 1) 自引言开始连续到附录之前的标准正文中的表号值域:“表”+表编号。 示例:“表 1” 、“表2” 2) 附录中的表号值域:“表”+章编号+“.”+表编号。 示例:“表 A.1” 、“表B.1” e) 有续表的表号值域: 1) 自引言开始连续到附录之前的标准正文中的表号值域:“表”+表编号+“(续)”。 示例:“表 1(续)” 、“表2(续)” DB13/T 2351.12016 16 2) 附录中的表号值域:“表”+章编号+“.”+表编号+“(续)”。 示例:“表 A.1(续)”、“表 B.1(续)” B.3 图号说明

35、 B.3.1 图号定义说明 图号是标准内容中的图像按特定规则的顺序编号。自引言开始连续到附录之前的标准正文中整体使用阿拉伯数字从1开始对图编号,附录中每章使用阿拉伯数字从1开始对图编号。图号由“图”、分隔符“.”和图编号按一定的规则组合而成,续图在表号后面加“(续)”。 B.3.2 图号值域 图号值域按有无续图有以下两种形式: f) 无续图的图号值域: 1) 自引言开始连续到附录之前的标准正文中的图号值域:“图”+图编号。 示例:“图 1” 、“图2” 2) 附录中的图号值域:“图”+章编号+“.”+图编号。 示例:“图 A.1”、“图 B.1” g) 有续图的图号值域: 1) 自引言开始连续

36、到附录之前的标准正文中的图号值域:“图”+图编号+“(续)”。 示例:“表 1(续)” 、“表2(续)” 2) 附录中的图号值域:“图”+章编号+“.”+图编号+“(续)”。 示例:“图 A.1(续)” 、“图B.1(续)” DB13/T 2351.12016 17 C C 附 录 C (资料性附录) 标准文献结构化全文元数据-字典描述 C.1 标准文献结构化全文元数据-字典描述见表C.1。 表C.1 标准文献结构化全文元数据-字典描述 序号 中文名 英文名 缩略语 定义 数据类型 值域 约束 最大出现次数 核心元数据 0 全文元数据 Full-text Metadata FulTxtMdat

37、a 描述结构化标准中全文数据的元数据。 复 合型 M 1 1 标识符 identifier ID 名称空间中对象的唯一标识符。 字 符串 UUID M 1 * 2 全文 Full Text FulTxt 以篇章条形式描述的标准内容。 复 合型 M 1 2.1 标准号 document reference docRef 由有关标准化机构给定的用于唯一识别某一标准的注册号或登记号,标准号由标准代号、顺序号、发布年份及有关标识符组成。 字 符串 标准代号+1 个空格+顺序号+1 个连字符“-“+4 位发布年份 M 1 * 2.2 标准名称 document name in Chinese docNm

38、CN 标准的中文名称 字 符串 自由文本 M 1 * 2.3 篇章条编号 chapter number chapNo 标准内容中篇章条按一定规则的顺序编号(篇章条编号定义说明见附录 B.1.1)。 字 符串 见附录 B.1.2 O 1 * 2.4 篇章条名称 chapter name chapNm 标准中篇章条的标题名称。 字 符串 自由文本 M 1 * 2.5 篇章条内容 Charpter Content ChapCont 标准中篇章条的段落内容。 复 合型 自由文本 M 1 * 2.5.1 文字 word wrd 以文字形式描述的标准内容。 自 由文本 O 1 * 2.5.2 表格 Tab

39、le Tab 以表格形式描述的标准内容。 复 合型 O N DB13/T 2351.12016 18 表C.1标准文献结构化全文元数据-字典描述(续) 序号 中文名 英文名 缩略语 定义 数据类型 值域 约束 最大出现次数 核心元数据 2.5.2.1 表号 table number tabNo 标准内容中表格按特定规则的顺序编号。(表号定 义 说 明 见 附 录 B.2.1)。 字 符串 见附录 B.2.2 O 1 * 2.5.2.2 表名 table name tabNm 描述表格主题的名称。 字 符串 自由文本 M 1 * 2.5.2.3 表格图像路径 table image path t

40、abImgPath 表格图像文件存储的路径。 字 符串 自由文本 M 1 * 2.5.2.4 表注 table note tabNote 标准内容中表格的注释。 字 符串 自由文本 O 1 * 2.5.2.5 表格所在页码 table page number tabPNo 标准内容中同一表格首次出现所在页码。 数 值型 正整数 M 1 2.5.2.6 同一表格顺序号 same table order number tabOrdNo 跨页表格图像文件的顺序号。 数 值型 正整数 M 1 2.5.2.7 表 格HTML 格式 table HTML code tabHTML 用 HTML 描述的表格

41、信息。 字 符串 自由文本 C 1 2.5.3 图像 Image Img 以图形式描述的标准内容。 复 合型 O N 2.5.3.1 图号 image number imgNo 标准内容中图像按特定规则的顺序编号。(图号定 义 说 明 见 附 录 B.3.1)。 字 符串 见附录 B.3.2 O 1 * 2.5.3.2 图名 image name imgNm 描述图的主题的名称。 字 符串 自由文本 M 1 * 2.5.3.3 图像路径 image path imgPath 图像文件存储的路径。 字 符串 自由文本 M 1 * 2.5.3.4 图注 image note imgNote 标准内

42、容中图像的注释。 字 符串 自由文本 O 1 * 2.5.3.5 图像所在页码 image page number imgPNo 标准内容中同一图像首次出现的页码。 数 值型 正整数 M 1 2.5.3.6 同一图像顺序号 same image order number imgOrdNo 同一图号的图像在不同页赋予的顺序编号。 数 值型 正整数 M 1 2.5.4 公式 Formula Fmla 以公式形式描述的标准内容。 复 合型 O N 2.5.4.1 公式名称 formula name fmlaNm 描述公式的主题的名称。 字 符串 自由文本 M 1 * 2.5.4.2 公式所在页码 f

43、ormula page number fmlaPNo 标准内容中同一公式首次出现所在页码。 数 值型 正整数 M 1 DB13/T 2351.12016 19 表C.1标准文献结构化全文元数据-字典描述(续) 序号 中文名 英文名 缩略语 定义 数据类型 值域 约束 最大出现次数 核心元数据 2.5.4.3 公式图像路径 formula image path fmlaImgPath 公式图像文件存储的路径。 字符串 自由文本 M 1 * 2.5.4.4 公式注 formula note fmlaNote 公式的注释。 字符串 自由文本 O 1 * 2.5.5 术语 Term Term 在本标准

44、中需要规范的用词。 复合型 O N 2.5.5.1 术语中文名称 term name in Chinese termNmCN 术语的中文标题名。 字符串 自由文本 M 1 * 2.5.5.2 术语英文名称 term name in English termNmEN 术语的英文标题名。 字符串 自由文本 O 1 * 2.5.5.3 术语内容 term definition termDef 术语的定义内容。 字符串 自由文本 M 1 * 2.5.5.4 术语缩略语 term abbriviation termAbbr 为了使用方便,使术语称谓中的成分进行有规律的节缩或者省略形成的词。 字符串 自由

45、文本 O N 2.5.5.5 术语同义词 term synonym termSyn 表达意义相同或相近,但是表达形式不同的词汇。 字符串 自由文本 O N 2.5.5.6 术语禁用词 term stop termStp 禁止使用的术语。 字符串 自由文本 O N 2.5.5.7 术语注 term note termNote 术语条款的注释。 字符串 自由文本 O 1 2.5.5.8 术语所在页码 term page number termPNo 标准内容中该术语首次出现所在页码。 数值型 正整数 M 1 2.6 篇章条类型 chapter type chapTyp 描述篇章条类别。 字符串 字

46、典(篇章条类型代码见附 录 表A.2)。 O N 2.7 篇章条所在页码 charpter page number chapPNo 同一标准篇章条首次出现所在的页码。 数值型 正整数 M 1 2.8 篇章条父章节 parent chapter number parChpNo 当前篇章条的上一级章节的编号。 字符串 条层级最多4层的篇章条编号 C 1 2.9 篇章条顺序号 charpter order number chpOrdNo 篇章条的顺序号 数值型 正整数 M 1 3 版本信息 Version Information VInfo 描述全文数据产生、更新的一组信息。 复合型 M 1 DB1

47、3/T 2351.12016 20 表C.1标准文献结构化全文元数据-字典描述(续) 序号 中文名 英文名 缩略语 定义 数据类型 值域 约束 最大出现次数 核心元数据 3.1 更新时间 update time upTime 描述全文数据修改更新的时间。 日 期型 按 GB/T 7408执行,格式为CCYY-MM-DD hh:mm:ss M 1 * 3.2 记录状态 record status recStatus 关于标准文献全文元数据库中记录所处的状态(修改、删除、新增)的说明。 字 符串 采用表 A.3记录状态代码中的名称。 M 1 * 3.3 版本 version number verN

48、o 描述全文数据更新的版本编号。 字 符串 自由文本 M 1 * 3.4 加工单位 process unit prsUnit 描述全文数据加工单位的信息。 字 符串 字典 M 1 DB13/T 2351.12016 21 参 考 文 献 1 GB/T 1.1-2009 标准化工作导则 第1部分:标准的结构和编写 2 GB/T 7714-2015 信息与文献 参考文献著录规则 3 GB/T 22373-2008 标准文献元数据 4 GB/T 24639-2009 元数据的XML Schema置标规则 5 GB/T 25100-2010 信息与文献 都柏林核心元数据元素集(ISO 15836-2009,MOD) 6 崔运鹏.基于本体论的农业知识管理关键技术研究.北京:中国农业科学技术出版社,2009 7 高瓦特斯,利维森.正则表达式经典实例.郭耀,译.北京:人民邮电出版社,2010 8 胡荷芬,高斐.UML面向对象分析与设计教程.北京:清华大学出版社,2012 9 李景.本体理论在文献检索系统中的应用研究.北京:北京图书馆出版社,2005 10 李景,孟宪学,苏晓路.领域本体的构建方法.北京:中国农业科学技术出版社,2009 11 施穆勒.UML基础、案例与应用(第三版).李虎,赵龙刚,译.北京:人民邮电出版社,2012 _

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 地方标准

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1