GBZ 18906-2002 开放式电子图书出版物结构.pdf
《GBZ 18906-2002 开放式电子图书出版物结构.pdf》由会员分享,可在线阅读,更多相关《GBZ 18906-2002 开放式电子图书出版物结构.pdf(40页珍藏版)》请在麦多课文档分享上搜索。
1、ICS 35.240.30A 19中华人民共和国国家标准化指导性技术文件GB/Z 18906-2002开放式电子图书出版物结构Open electronic-book publication structure2002-12-04发布2003-05-01实施中华人民共和国国家质量监督检验检疫总局发布GB/Z 18906-2002目次一一月J舀1范围2规范性引用文件3术语和定义,4概述5 OEB包6 HTML/XMI置标结构7 CSS结构附录A(资料性附录)元素类型表,GB/Z 18906-2002前言本指导性技术文件修改采用开放式电子图书论坛(Open ebook Forum, Oebf)的开
2、放式电子图书出版物结构)(第1版)原文件的附录B(OEB包DTD),附录C(OEB文档DTD)和附录D(字符实体)未被采用,该组织的详细信息请参见http:/www. openebook. org.本指导性技术文件仅供参考本指导性技术文件的附录A为资料性附录本指导性技术文件由中华人民共和国信息产业部提出。本指导性技术文件由中国电子技术标准化研究所总归口。本指导性技术文件起草单位:中国电子技术标准化研究所(CESD、中国科学院计算技术研究所。本指导性技术文件主要起草人:黄铁军、林守勋、肖明、李红辉、高健。GB/Z 18906-2002开放式电子图书出版物结构范围研究开放式电子图书出版物结构的目的
3、是为电子图书的内容表述提供一种规范,特别需要注意的是:本指导性技术文件试图为内容提供商(比如出版商以及拥有可显示内容的其他人或者机构)和工具提供商提供最小化的通用指南,确保电子图书的内容在各种电子图书平台上均具有保真性、精确性、可访问性和呈现性。本指导性技术文件试图反映各种电子图书内容格式标准的现有情况。本指导性技术文件的目标是:为出版商、代理机构以及作者等电子图书内容发布者提供一种格式,使他们能够为用户提供适于多种阅读器系统的电子图书内容。本指导性技术文件的前提假设是:为了使电子图书技术在市场上取得更大成功,阅读器系统必须能够方便地访问大量的、多种类型的作品。2规范性引用文件下列文件中的条款
4、通过本指导性技术文件的引用而成为本指导性技术文件的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本指导性技术文件,然而,鼓励根据本指导性技术文件达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本指导性技术文件GB/T 7408数据元和交换格式信息交换日期和时间表示法(eqv ISO 8601)GB 13000. 1信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面(idt ISO/IEC 10646-1)GB/T 17235.1信息技术连续色调静态图像的数字压缩及编码第1部分:要求和指南(eqv
5、 ISO/IEC 10918-1)3术语和定义下列术语和定义适用于本指导性技术文件。3.1OEB基本文档basic OEB document指按本指导性技术文件来定义其结构的OEB文档。3.2内容提供商content provider出版商、作者或其他信息提供者,他们按照本指导性技术文件所描述的格式为一个或多个阅读器系统提供某种出版物。3.3建议不用功能deprecated本指导性技术文件允许但建议用户不要使用的功能。该功能在将来的版本中可能会被放弃。GB/Z 18906-20023.4扩展ORB文档extended ORB document在本指导性技术文件定义的扩展机制内,使用了本指导性技
6、术文件规定之外的构造的OEB文档。3.5ORB核心媒体类型ORB core media type所有阅读器系统都必须支持的MIME媒体类型。3.6ORB文档ORB document符合本指导性技术文件中规定的XML文档3.7ORB包ORB package描述OEB出版物的文件。它标识出版物中的所有其他文件,并提供有关这些文件的描述和访问信息。3.8ORB出版物ORB publicationOEB文档以及其他文件的集合,这里的其他文件通常表现为各种媒体类型,包括结构化文本和图形,它们共同构成该出版物中不可分割的组成部分。3.9读者reader阅读出版物的人。3.10阅读设备reading dev
7、ice呈现出版物的物理平台(包括硬件和软件)。3.11阅读器系统reading system能够接受OEB出版物并且能够为读者所利用的一种软硬件统一体。各种阅读器系统的最大不同之处可能表现在其体系结构的不同上。阅读器系统既可在某个单一的设备上实现,也可分散在多台计算机上实现。需要特别注意的是,如果某个阅读设备是更大的阅读器系统的组成部分,则不要求该设备能够直接接受OEB出版物,但整个阅读器系统必须能够做到这一点。阅读器系统中还可以包括本指导性技术文件范围以外的其他附加处理功能,比如压缩、索引、加密、版权管理以及分发等功能。概述4.1关于本指导性技术文件本指导性技术文件由出版商、阅读器系统厂商、
8、软件开发商以及相关标准的专家们汇集在一起,它是共同探讨努力的结果4.2与其他规范之间的关系本指导性技术文件将其他相关规范的子集和应用组合在一起,以方便实现各种电子文档的创建、组织、表述以及明确互换。相关规范包括:a) XMLL 0置标元语言(http, /www. w3. org/TR/REC-xmll ;b) XMI名域规范(http: /ww诺. w3. org/丁R/REC-xml-names) ;c) HTML4.0文档内容置标语言(http:/www. w3. org/TR/REC-htm140),同时还考虑了XHTMLI. 0规范(http:刀www. w3. org/TR/xht
9、mll/);d) CSS 1样式表语言(http: /www. w3. org/TR/REC-CSSl),同时还包括CSS 2(http:/www.GB/Z 18906-2002w3. or郁TR/REC-CSS2)中极少量的属性;。)Dublin Core元数据语言(http: /purl. o:dc/)以及USMARC相关代码列表(http:/www.loc. gov/marc/relators/re9802r1. html);f) GB 13000字符集;g)特殊的MIME媒体类型(http:/www. ietf. org/rfc/rfc 1738. txt).4.2.1与XML之间的关
10、系OEB基于XMI,的原因是因为后者具有普遍性和简便性等特征,并且因为这样做还能使文档存活得更长一些XMI中提供了有关文档语法的明确规则,这样做可以减少文档的实现成本,还可以减少文档在跨系统中的不兼容性。此外,XML具有可扩展性,因为它并没有将其限定为任何特殊的元素类型集合,它还支持国际化,并鼓励对文档进行置标(只要这些置标能够更直接地表述文档的内部组成即可),这些置标被用于文档的格式化以及其他类型的计算机处理。OEB阅读器系统必须是XML 1. 0中定义的XML处理器。所有OEB文档都必须是格式良好的XMI文档,尽管并没有要求它们必须是有效的XML文档,但在本指导性技术文件中为了确保所有基本
11、OEB文档的有效性,所以对其语法形式特作如下规定:是有效的XML文档;完全符合OEB文档DTD规定;在XHTMI. 1。颁布后,还必须符合该规范的有关规定;在遵循HTMIA.。版本的常用浏览器中可进行有效浏览。最后一条并不要求OEB阅读器系统完全符合HTMI, 4. 0规范,其中的一个主要原因是:HTMI.4.。在实际应用(比如在浏览器中应用)时支持XML空元素语法,但在先于XHTML 1.。的HTML4.。正式规范中却不支持XML空元素语法格式良好的XML语法要求能够具备任何HTML浏览器通常要求的各种特征,比如:所有元素都必须限定在起始标记和结束标记之间;所有元素都必须正确嵌套,不允许交叉
12、嵌套;属性值必须用引号括起来;属性赋值必须使用非最小化形式(而不同于诸如“边界”之类的某些用法);内容中用到的“,但在XML语法中这些空格是可选的)。空元素是指允许不包含任何内容的元素(比如HTMI中的br和hr元素)。XML与正式的HT-ML语法在对待空元素方面仍然互不兼容。但是,XM工语法中要求标记末尾的斜杠前面带有空格这一规定已被大多数HTML浏览器接受(这是严格遵守XMI、语法的格式,因为XML忽略各种标记内部的空格。因此,本指导性技术文件中要求XML的这个(一致的)变种(比如“Gbr/)。这是最简便的语法形式,尽管这样做有助于延长文档的使用寿命,但从严格意义上说,这不是有效的HTML
13、格式。很轻松就能够将有效的HTMI句法转换成格式完备的XMI句法(不过,语义转换可能会添加新的结构,但也许不会添加新的信息值)对较规范的非有效性tITML进行转换也通常是轻松完成的过程,并且很容易就可以自动实现,目前已有用于自动实现的若干免费工具,比如“Tid尹(请参考网址:ht-tp:/www. w3. org/People/Raggett/tidy/)。但是,如果想将非常不规范的HTMI,转换成XMI,则其复杂程度不可预知格式完备的XMI_l.。文档不一定都是合格的OEB文档,原因是本指导性技术文件中又对其作了更加严格的限制,以提高文档的互操作性。这些限制条件就是定义如下的“OEB通用要求
14、”。GB/Z 18906-2002本指导性技术文件中定义了两个XML DTD,即包DTD和基本OEB文档DTD。其中,包DTD构成某个完整出版物的“根”,阅读器系统利用它来查找和组织出版物的各个组成部分基本OEB文档DTD则从形式上定义了本指导性技术文件中所描述的HTMI子集。4.2.2与XML名域之间的关系本指导性技术文件的当前版本中并没有要求阅读器系统依据XML名域建议草案(http: /www.w3, org/TR/REC-xml-names)来处理XML名域前缀名域前缀是为元素和属性名称添加前缀的一种方法,以便对来自多个不同定义集合中的名称进行区分。利用XMI一名域声明,可将某个前缀与
15、某个唯一的URI进行关联另外,名域声明或许将某个URL作为缺省的名域,并将其应用于缺少名域前缀的元素。XMI一名域前缀与后缀元素之间用冒号隔开。本指导性技术文件中禁止使用有关OEB的以下用法,即禁止在OEB文档中使用名域前缀。但是,如果想在OEB包中使用Dublin Core元数据元素的各种属性,则要求使用诸如“dc: prefix(前缀)”之类的形式。OEB文档中的元素若带有名域前缀,则被视为扩展元素,并且冒号将扮演正常的XML名称符号。阅读器系统必须将冒号识别为OEB文档中的有效名称符号为了保持向上兼容性,要求OEB包中的元素元数据都带有xmlns:dc=http:/purl. org/d
16、c/elements/I. 0/”属性和xmlns:oebpackage =http:/openebook. org/namespaces/oeb-package八. 0/.属性。此外,还需要在OEB包DTD中对Dublin Core诸元素进行声明,并带有明显的前缀“dc:.4.2.3与HTML之间的关系由于考虑到现有软件工具、历史遗留数据、出版实践以及市场条件等多方面的重要性所以本指导性技术文件基于HTMI基础之上。采用这种方法,可以允许内容提供商对现有的HTML内容、工具以及专门技术作进一步探讨。为了将阅读器系统开发商的研制负担降至最低点(他们可能会使用在功率和显示方面都会受到限制的各种设
17、备),所以本指导性技术文件的出版物结构中并没有包括全部的HTML元素和属性。本指导性技术文件中的元素和属性选自HTML 4. 0规范,并遵照与现有的HTML, XHTML以及新兴的XML的发展方向相吻合的原则进行选取如果您想了解全部的元素和属性,则请参考附录A,其中包括了有关H丁MI, 3.2,HTML 4.。以及OEB文档中各种元素类型的一份完整列表。HTML 4.。中建议不用的全部HTML构造,在本指导性技术文件中或者弃而不用,或者依旧建议不用。基于Css的各种对等物的情形就是如此。样式表构造还可以用于HTML 4. 0规定以外的新功能为了获得可预知的结果并且保持本指导性技术文件未来版本的
18、向上兼容性,本指导性技术文件中强烈建议:基本OEB文档都是有效的XML文档,并且该文档与OEB文档DTD相关。4.2.4与Css之间的关系本指导性技术文件在Css 1和CSS2的基础上定义了一种样式语言,并带有媒体类型text/x-oebl-CSS o尽管OEB撰写组意识到上述有关媒体类型的定义与Css工作组(请参阅网址http:刀www. w3.org/T刚REC-CSSI)的建议草案没有吻合,但考虑到实际情况又不得不这样做。本指导性技术文件中包括了基于Css的样式表构造,后者用来定义基准的显示效果功能。为了将阅读器系统开发商以及设备制造商的负担降至最低点,本指导性技术文件中没有包括CSSi
19、或者CSS 2中的全部属性。本指导性技术文件中增加了少数几个附加的属性和属性值,用来支持页面布局、页眉和页脚。在大多数情况下,本指导性技术文件中并未要求阅读器系统能提供标准Css样式表所要求的全部显示效果。例如,某些阅读器系统中使用的是单色显示器。所以,本指导性技术文件中既没有认可将所有阅读器系统限定为单色显示器这类做法,也没有声称要使用OEB以外的非标准颜色扩展。在此情况GB/Z 18906-2002下,本指导性技术文件中允许使用各种CSS设置,并保持其含义。但这样做的结果是,完全合乎要求的阅读器系统也许会逐渐蜕变成显示效果更简单的系统。本指导性技术文件支持嵌人样式属性、样式元素以及外部链接
20、的样式表在处理各种样式表的过程中,本指导性技术文件没有要求阅读器系统执行与XML名域相关的各种处理。样式表可通过以下途径与某一OEB文档进行关联:a)利用特定HTMI元素的、t刃。属性进行关联;b)利用HTMI头中的styl。元素进行关联;c)在HTML头中的link元素利用一个外部样式标识符进行关联,或者d)通过W3C建议草案“与XML文档进行关联的样式表”(网址为:http:刀www. w3. org/TR/xml-stylesheet)中定义的处理指令来利用某个外部样式表标识符进行关联如果将来发布了该草案的正式文本,则请采用最终的正式文本。上述前三种情形的优先权如HTMI. 4. 0和C
21、SS 2中所定义的。通过处理指令链接的样式表单并视为在任何实际的HTML link元素之前通过link元素链接的样式表单。正如一致性部分中所定义的那样,如果没有为某个特定元素定义任何样式表或者找不到任何可应用的样式,则缺省的HTMI一显示效果将等同于本指导性技术文件以及HTMIA。中其他任何地方定义的显示效果通过上述前两种方法将样式附加到文档中,使用的也许仅仅是本指导性技术文件第7章中支持定义的CSS结构。但是,通过HTMI链接元素或者处理指令来链接外部样式表这两种方法,使用的或许是CSS或其他样式语言,LL如XSI(请参考网址:http : / /www. w3. org/TR/ W D-x
22、sl) .只有本指导性技术文件第7章中支持定义的那些CSS结构才可能会包含在样式类型text/x-oebl-CSS”中。对于其他媒体类型的样式表,则由阅读器系统自行判断以什么内容来替代“text/x-oebl-css”样式表。HTML 4.。规范将外部样式表按其标题成批链接到集合中(如果标题为空字符串,则包括一个“持久性”集合)。该规范要求在诸如此类的集合中至少有一个样式表必须是MIME媒体类型text/x-oebl-css阅读器系统执行的只是OEB CSS子集,所以它可能会忽略使用其他样式语言的所有样式表支持外部样式表功能的各种阅读器系统也许会从其他任一外部样式表中进行选择。本指导性技术文件
23、强烈建议用户为本指导性技术文件支持的任何新样式表语言定义唯一的MIME媒体类型,并通过检查MIME媒体类型来对样式表语言中的样式表进行检测4.2.5与Dublin Co,之间的关系Dublin Core被设计用来将作者和出版商的编目负担降至最低点,同时还能提供更多的有用数据。本指导性技术文件中支持Dublin Core中现有的全部元数据元素集,并在相关贡献者部分补充了一小部分附加属性,其中还可能会有更多有用的特殊信息。例如,如果将角色属性添加到“dc: Contributor元素中,则可为某个出版物的相关贡献者添加更详细的说明信息,包括利用脚本代码来表述角色。内容提供商必须在其提供的内容中包含
24、本指导性技术文件5. 2中定义的元数据元素的最小集,并吸收附加的元数据,以方便读者发现他们感兴趣的各种出版物。4.2.6与GB 13000之间的关系各种出版物使用的或许是按UTF-8或UTF-16编码的所有GB 1300。字符集。使用GB 1300。编码形式,有利于促进文档的国际化和多语言化进程。但是,并没有要求各种阅读器系统提供全部GB 1300。字符集的各种字形。要求各种阅读器系统能够正确解析所有UTF-8和UTF-16字符阅读器系统也许不能显示某些字符,但必须能对其不能够显示的各种字符给出某种样式的信号。不可以把GB 1300。字符显示成仅仅像8位字符的形式。例如,有害的符号(比如。x2
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
本资源只提供5页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GBZ 18906 2002 开放式 电子图书 出版物 结构
