1、ICS 35.240.30 A 14 每昌中华人民圭t-、不日国国家标准信息与文献GB/T 2901-2012月SO2709: 2008 代替GB/T2901-1992 信息交换格式Information and documentation-Format for information exchange (lSO 2709: 2008 , Information and documentation一Format for information exchange , IDT) 2012-07-31发布2012-11-01实施AS:15器;私田二,一职. ,/.-飞 面早出:,)9 数码防J中华人
2、民共和国国家质量监督检验检亵总局中国国家标准化管理委员会发布GB/T 2901-2012月SO2709: 2008 前言本标准按照GB/T1. 1-2009给出的规则起草。本标准代替GB/T2901-1992(书目信息交换用磁带格式。本标准等同采用国际标准ISO2709 :2008(信息与文献信息交换格式。本标准适应ISO/IEC10646的要求,采用8位Unicode传输格式CUTF-8)进行编码。其结果是,不再采用字符作为长度单位,改用八位字节Coctet)作为长度单位。本标准由全国信息与文献标准化技术委员会提出。本标准由中国标准化研究院归口。本标准起草单位:中国国防科技信息中心、中国科学
3、技术信息研究所。本标准主要起草人z真臻、张兰、李秀锦、王莉、张志平。本标准所代替标准的历次版本发布情况为z一一-GB/T2901-1982、GB/T2901-1992。I GB/T 2901-20 12/ISO 2709: 2008 信息与文献信息交换格式1 范围本标准规定了一种通用的交换格式。本标准造用于各种类型文献的书目记录以及其他类型记录。本标准并不规定每个记录的长度或内容,也不赋予宇段标识符、宇段指示符或子字段标识符的具体含义,这些内容由执行格式规定。本标准描述了一种通用的结构,这一框架结构不是作为系统内部的处理格式,而是作为数据处理系统之间的交换格式而设计的。2 规范性引用文件下列文
4、件对于本文件的应用是比不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。ISO/IEC 646: 1991信息技术信息交换用ISO七位编码字符集(Informationtechnology一ISO7-bit coded character set for information interchange) ISO/IEC 6429: 1992 信息技术编码字符集用的控制功能(Informationtechnology-Control functions for coded character sets) ISO/IEC
5、 10646:2003信息技术通用多八位编码字符集(Informationtechnology U niversal MultipleOctet Coded Character Set (UCS) 3 术语和定义3. 1 3.2 3.3 3.4 3.5 下列术语和定义适用于本文件。字符character 用于组织、控制和表示数据的一组元素中的某个元素。数据字段data field 记录中记载描述性内容的字符。目次区directory 记录中宇段位置的索引。目次区说明directory map 说明目次区内目次项结构的一组参数。字段field 记录中含有特定类型内容的可变长部分,位于目次区之后,
6、并与目次区中的某个目次项对应。注z一个字段可以包含一个或多个子字段。1 GB/T 2901-2012月SO2709: 2008 3.6 字段分隔符field separator 目次区、记录标识字段、参考宇段和数据字段的终止控制符。3. 7 字段标识符tag 与一个字段相关联的、用于标识该字段的3个八位字节。3.8 字段指示符indicator 如果有,则是该字段的首个数据元,为该字段内容、该字段与同一记录中其他宇段的关系或某些数据处理操作提供附加信息。/二二一千二三/仨/ , , 3.9 /乞/ -_ / /二三二、二三八位字一组连记录recor/ 勺I字段的集他括个记录头标、一个目次区和数
7、据。 叭注z如果需事li允评把若干个记录或记录的一部分连接到子记录中,并按具体交换格式中的规飞飞执行3.11 /、 记录标识字段record idmtiner field 标识记录的字符串。叭的要需KE A同口可时标录隔录段录头记分记字记录个录止考理记每记终参处nt句3a且寸hdqd句33qu - 二/分隔字符separating character 按照逻辑、某些情况下按照层次,分隔和限定数据单元的控制字符。3.16 结构structure 构成一个记录的各部分的安排。3.17 子字段subfield 宇段的一部分,含有一个确定的信息单元。3.18 子宇段标识符identifier 由一个或
8、多个字符构成的、紧靠在子字段之前的、用于标识子宇段的数据元素。2 . GB/T 2901-20 12/ISO 2709: 2008 3. 19 子记录subrecord 记录中可作为一个实体处理的一组字段。4 记录交换格式的结构4. 1 概要记录的总体结构如图1所示,详细结构如图2所示。图2中包含了4种数据字段的可选结构。 一个记录包括下列固定长和可变长元素i次序如图2所示卜a) 记录头标(固定长hb) 目次区(可变长气c) 记录标识字段(可变长); d) 参考字段(可变长); e) 数掘字段f) g) 、:1二 、-气飞、 / / 3 GB/T 2901-2012月SO2709: 2008
9、.位字节几位字节八位字节八位字节八位字节八位字节八位字节.位字节八位字节.位字节八位字节3个八位字数据基地址字段标识符-4 -9 3 2-16 7-19 3 1 2 3 节字段标识符口02OOA至OOZ至9其他字段标识数据字段可选格式指示符长度子字段标识符长度记录长度记录状态执行码指示符长度于字段标识符长度数据基地址用户系统使用每个目次项字段*度部分的*度每个目次项起始字符位置部分的长度每个目次项约定执行部分的长度备用字段标识符字段长度起始字符位置约定执行部分(可选目次项目次项字段分隔符数据字段分隔符数据字段分隔符数据字段分隔符数据字段分隔符数据字段分隔符记录分隔符下一条记录第一种可选格式=0
10、 =口4.2 基本字符编码到E神费2i : nn 5网¥ 百温王nn 量节哥主nn 3罔¥ 记录标识字段参考字段盖协商冒事面目FZ冷K E + 主斗N品喜岛V 湖?号冲和量部牧于字段标识符数据于字段标识符数据字段分隔符子字段标识符数据于字段标识符数据字段分隔符记录分隔符下一条记录第二种可选格式=0 0 圄2记录详细结构指事符数据字段分隔符字段指习毛符数据字段分隔符记录分隔符下一条记录第三种可选格式1 ! 0 =口指事符于字段标识符数据于字段标识符数据字段分隔符指市符子字段标识符数据于字段标识符数据字段分隔符记录分隔符下一辈记录第四种可选格式1 ! 0 0 记录头标和目次区中的所有数据以及字段指
11、示符、子宇段标识符、宇段分隔符和记录分隔符都应采自1SO/1EC646的字符表,每个字符一个八位宇节,遵循1SO/1EC646或1SO10646,采用UTF-8编码。4 GB/T 2901-20 12/ISO 2709: 2008 4.3 记录头标4.3. 1 概要如图2所示,记录头标应固定为24个八位字节,每个八位字节表示一个字符。这些八位字节根据其位置应分别在4.3.2至4.3.9中定义。4.3.2 记录长度(J位字节0-4)应为包含记录头标、目次区、字段区和记录分隔符在内的一个记录的八位字节总数,用五位十进制数字表示,右对齐,不足五位时左边用零填充。注:这里所描述的记录长度是逻辑记录长度
12、。在机器对数据进行处理的实际情况下,有时需要将信息划分为若干块。4.3.3 记录状态(J位字节日应为描述记录状态的单个字符,在执行性国际标准中具体定义,例如表示某个记录是新记录还是修改过的记录。如果缺少执行性国际标准,应由信息交换双方达成专门协议。4.3.4 执行码(J位字节6-9)本标准不做具体定义,宜由信息交换双方达成专门协议。4.3.5 字段指示符长度(J位字节10)应为字段指示符的八位字节数,用一位十进制数字表示。未使用字段指示符时应将字段指示符长度置零。4.3.6 子字段标识符长度(J位字节11)应为子宇段标识符的八位字节数,用一位十进制数字表示。子宇段标识符的首字符或仅有的一个字符
13、应总是ISO/IEC646或ISO/IEC6429的ISL未使用子宇段标识符时应将子宇段标识符长度置零。4.3.7 数据基地址(八位字节12-16)应为记录头标和目次区包括目次区结尾的字段分隔符)的字符总数,用五位十进制数字表示,右对齐,不足五位时左边用零填充。4.3.8 由用户系统定义的位置(八佳字节17-19)这些八位字节位置应由用户系统定义。4.3.9 目次区说明目次区说明根据其八位字节的位置应定义如下:a) 八位字节20:目次区中各目次项的字段长度部分的字符数,用一位十进制数字表示。b) 八位字节21:目次区中各目次项的起始字符位置部分的字符数,用一位十进制数字表示。c) 八位字节22
14、:目次区中各目次项的执行约定部分的字符数,用一位十进制数字表示。d) 八位字节23:备用。5 GB/T 2901-2012/ISO 2709:2008 4.4 目次区4.4. 1 概要目次区应由可变数量的目次项组成。每个目次项对应一个字段(记录标识字段、参考宇段和数据字段)。目次区应以一个字段分隔符结束。4.4.2 目次项目次项由以下几个部分组成,并按此顺序排列za) 字段标识符zb) 宇段长度;c) 起始字符位置zd) 约定执行部分。宇段标识符的长度应为3个八位字节。每个目次项的其他3个部分的八位字节数,都应由目次区说明定义(记录头标的八位字节2022)。同一目次区内的所有目次项结构都相同。
15、4.4.3 字段标识符宇段标识符应为用3个八位字节来表示相应宇段的名称,这3个字符的含义由执行性国际标准定义。如果未使用国际标准,应由交换双方达成专门协议。4.4.4 字段长度宇段长度有以下3种情况:a) 由当前目次项宇段标识符指定的宇段的八位字节总数(包括字段指示符和宇段分隔符); b) 零,这表明一个字段的字符总数大于目次项中字段长度部分设定的最大十进制数(n)(见注释hc) 情况b)中的字段的最后一个部分的八位宇节数(包括宇段分隔符)。注:在情况b)中,该字段将分为若干部分。除最后一个部分外,其他各部分的长度都相同(时,每一部分都有相应的目次项,该目次项包含该字段的标识符和该部分数据的起
16、始字符位置。长度零表示该目次项对应的字段部分不是最后一个部分,其长度当作的处理。在b)、c)两种情况下,同一宇段的各部分对应的目次项必须按顺序邻接。4.4.5 起始字符位置起始字符位置应包含一个十进制数,表示字段标识符指定的字段的第一个八位宇节相对于数据基地址的位置(即,紧邻目次区的首个字段的起始字符位置是零)。4.4.6 约定执行部分如果目次项中有约定执行部分,则它包含有与本目次项所对应的字段相关的控制信息。4.5 字段4.5.1 概要6 所有的字段均以一个字段分隔符结束,有3种类型的宇段za) 记录标识字段z字段标识符为001(0表示零); b) 参考字段z字段标识符为002至009,需要
17、时可使用OOA至OOZ(字母字符可使用大写或小写字母); GB/T 2901-20 12/ISO 2709: 2008 c) 数据字段:宇段标识符为010至999,需要时可使用OAA至ZZZ(字母字符可使用大写或小写字母;数字和字母字符允许任意组合。使用字母-数字型字段标识符时,不应从00开始,因只有参考字段是从00开始的)。4.5.2 记录标识字段标识记录的字符串,应由编制记录的机构分配。注:记录标识字段不设字段指示符或子字段标识符。4.5.3 参考字段提供处理记录时可能需要的数据。注:参考字段不设字段指示符或子字段标识符。4.5.4 数据字段每个数据宇段都由一个或多个字段指示符(可选),一
18、个或多个子宇段标识符(可选),数据和一个字段分隔符组成。记录头标中定义的字段指示符长度和子宇段标识符长度,确定了字段指示符或子宇段标识符的存在与否以及它们的长度。一条记录中每个数据宇段使用的字段指示符长度和子宇段标识符长度应一致。记录中的每个数据宇段应按下列4种格式之一构成za) 数据:记录头标中的宇段指示符长度和子字段标识符长度均置为零。见图2数据宇段的第一种可选结构。b) 子宇段标识符和数据:记录头标中的字段指示符长度置零,而子宇段标识符长度置为1或大于1的数。见图2数据字段的第二种可选结构。c) 字段指示符和数据:记录头标中的宇段指示符长度置为1或大于1的数,而子宇段标识符长度置为零。见
19、图2数据宇段的第三种可选结构。d) 宇段指示符、子字段标识符和数据z记录头标中的字段指示符长度和子字段标识符的长度均置为1或大于1的数。见图2数据宇段的第四种可选结构。7 OON ghNOm同NFON|。由NH白。中华人民共和国国家标准信息与文献信息交换格式GB/T 2901-2012/ISO 2709: 2008 非中国标准出版社出版发行北京市朝阳区和平里西街甲2号(100013)北京市西城区三里河北街16号(100045)网址总编室:(010)64275323发行中心:(010)51780235读者服务部:(010)68523946中国标准出版社秦皇岛印刷厂印刷各地新华书店经销 开本880X 1230 1/16 印张O.75 字数14千字2012年11月第一版2012年11月第一次印刷* 书号:155066. 1-45642定价16.00元GB/T 2901-2012 如有印装差错由本社发行中心调换版权专有侵权必究举报电话:(010)68510107打印日期:2012年12月10日F002
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1