GB Z 18906-2002 开放式电子图书出版物结构.pdf

上传人:terrorscript155 文档编号:199588 上传时间:2019-07-14 格式:PDF 页数:41 大小:1.29MB
下载 相关 举报
GB Z 18906-2002 开放式电子图书出版物结构.pdf_第1页
第1页 / 共41页
GB Z 18906-2002 开放式电子图书出版物结构.pdf_第2页
第2页 / 共41页
GB Z 18906-2002 开放式电子图书出版物结构.pdf_第3页
第3页 / 共41页
GB Z 18906-2002 开放式电子图书出版物结构.pdf_第4页
第4页 / 共41页
GB Z 18906-2002 开放式电子图书出版物结构.pdf_第5页
第5页 / 共41页
亲,该文档总共41页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、ICS 35.240.30 A 19 韭/、王H王|日导GB/Z 18906 2002 Open electronic-book pubIication structure 2002-12-04发布2003-05-01实. . 中华人民共和国国家质量监督检验检疫总局发布GBjZ 18906-2002 目次前言. . . . E 1 范围. . . . . . . . . . . . . . . l 2 规范性引用文件., . . . . . . . . . . . . . . . . . . . . . 1 3 术语和定义. . . . l 4 概述. . . . . . . . . . .

2、. . . . . . . . . . 2 5 OEB包. . . . . . . 9 6 HTMLjXML置标结构. . . . . . . . . . . . . . . 18 7 css结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 附录AC资料性附录)元素类型表. . . . . . . . . . . . . . . . 35 I 厂GB/Z 18906-2002 目U本指导性技术文件修改采用开放式电子图书论坛(Openebook Forum , OebO的开放式电子图书出版物结构)(第

3、1版)。原文件的附录B(EB包DTD)、附录C(OEB文档DTDl和附录D(字符实体)未被采用,该组织的详细信息请参见http:/www.openebook. org 0 本指导性技术文件仅供参考。本指导性技术文件的附录A为资料性附录。本指导性技术文件由中华人民共和国信息产业部提出。本指导性技术文件由中国电子技术标准化研究所总归口。本指导性技术文件起草单位2中国电子技术标准化研究所(CES!)、中国科学院计算技术研究所。本指导性技术文件主要起草人z黄铁军、林守勋、肖明、李红辉、高倍。皿GB/Z 18906-2002 开放式电子图书出版物结构范围研究开放式电子图书出版物结构的目的是为电子图书的内

4、容表述提供一种规范,特别需要注意的是. 本指导性技术文件试图为内容提供商(比如出版商以及拥有可显示内容的其他人或者机构和工具提供商提供最小化的通用指南,确保电子图书的内容在各种电子图书平台上均具有保真性、精确性、可访问性和呈现性。 本指导性技术文件试图反映各种电子图书内容格式标准的现有情况。 本指导性技术文件的目标是为出版商、代理机构以及作者等电子图书内容发布者提供一种格式,使他们能够为用户提供适于多种阅读器系统的电子图书内容。本指导性技术文件的前提假设是为了使电子图书技术在市场上取得更大成功,阅读器系统必须能够方便地访问大量的、多种类型的作品。2 规范性引用文件下列文件中的条款通过本指导性技

5、术文件的引用而成为本指导性技术文件的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本指导性技术文件,然而,鼓励根据本指导性技术文件达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本指导性技术文件。GB/T 7408数据元和交换格式信息交换日期和时间表示法CeqvISO 8601) GB 13000. 1 信息技术通用多八位编码字符集CUCS)第一部分=体系结构与基本多文种平面Cidt ISO/lEC 10646-1) GB/T 17235. 1 信息技术Ceqv ISO/IEC 10918-1) 3 术语和定义连续色

6、调静态图像的数字压缩及编码下列术语和定义适用于本指导性技术文件。3. 1 OEB基本文档basic OEB document 指按本指导性技术文件来定义其结构的OEB文档。3.2 内容提供商content provider 第1部分要求和指南出版商、作者或其他信息提供者,他们按照本指导性技术文件所描述的格式为一个或多个阅读器系统提供某种出版物。3.3 建议不用功能deprecated 本指导性技术文件允许但建议用户不要使用的功能。该功能在将来的版本中可能会被放弃。l G/Z 18906-2002 3.4 扩展OE文档extended OE document 在本指导性技术文件定义的扩展机制内,

7、使用了本指导性技术文件规定之外的构造的OER文挡回3.5 OE核心媒体类型OE core media type 所有阅读器系统都必须支持的MIME媒体类型。3.6 OE文档OE document 符合本指导性技术文件中规定的XML文档。3.7 OE包OEpackage 描述OEB出版物的文件。它标识出版物中的所有其他文件,并提供有关这些文件的描述和访问信息。3.8 OE出版物OE publication OEB文档以及其他文件的集合,这里的其他文件通常表现为各种媒体类型,包括结构化文本和图形,它们共同构成该出版物巾不可分割的组成部分。3.9 读者reader 阅读出版物的人。3. 10 阅读设

8、备reading device 呈现出版物的物理平台(包括硬件和软件)。3. 11 阅读器系统reading system 能够接受OEB出版物并且能够为读者所利用的一种软硬件统一体。各种阅读器系统的最大不同之处可能表现在其体系结构的不同上。阅读器系统既可在某个单一的设备上实现,也可分散在多台计算机上实现。需要特别注意的是,如果某个阅读设备是更大的阅读器系统的组成部分,则不要求该设备能够直接接受OEB出版物,但整个阅读器系统必须能够做到这一点。阅读器系统中还可以包括本指导性技术文件范围以外的其他附加处理功能,比如压缩、索引、加密、版权管理以及分发等功能。4 概述4. 1 关于本指导性技术文件本

9、指导性技术文件由出版商、阅读器系统厂商、软件开发商以及相关标准的专家们汇集在一起,它是共同探讨努力的结果。4.2 与其他规范之间的关系本指导性技术文件将其他相关规范的子集和应用组合在一起,以方便实现各种电子文凹的创建、组织、表述以及明确互换。相关规范包括:2 a) XMLl. 0置标元语言(http,/www.w3. org/TR/REC-xm); b) XML名城规范(http,/www.w3. org/TR/REC-xml-names); c) d) HTML4.0文档内容置标语言(http,/ /www. w3. org/TR/REC-htm140).同时还考虑了XHTMLl.O规范(h

10、ttp,/www.w3. org/TR/xhtmll/); CSS 1样式表语言(http,/www.w3. org/TR/REC-CSSl).同时还包括CSS2(http , /www. 墨-_G/Z 18906-2002 w3. org/TR/RECCSS2)中极少量的属性ge) Dublin Core元数据语言(http,/purLorg川c/)以及USMARC相关代码列表(http,/www.loc. gov/marc/relators/re9802r1. htm) , f) GB 13000字符集gg) 特殊的MIME媒体类型(http,/www.ietf.org/rfc/rfc17

11、38. txt)。4.2. 1 与XML之间的关系OEB基于XML的原因是因为后者具有普遍性和简便性等特征,并且因为这样做还能使文档存活得更长一些。XML中提供了有关文裆语法的明确规则,这样做可以减少文档的实现成本,还可以减少文裆在跨系统中的不兼容性。此外.XML具有可扩展性,因为它并没有将其限定为任何特殊的元素类型集合,它还支持国际化,并鼓励对文档进行置标(只要这些置标能够更直接地表述文档的内部组成即可).这些置标被用于文档的格式化以及其他类型的计算机处理。OEB阅读器系统必须是XML1.0中定义的XML处理器。所有OEB文裆都必须是格式良好的XML文挡,尽管并没有要求它们必须是有效的XML

12、文档,但在本指导性技术文件中为了确保所有基本OEB文档的有效性,所以对其语法形式特作如下规定 是有效的XML文档;完全符合OEB文挡DTD规定,在XHTML1. 0颁布后,还必须符合该规范的有关规定;在遵循HTML4.0版本的常用浏览器中可进行有效浏览。最后一条并不要求OEB阅读器系统完全符合HTML4. 0规范,其中的一个主要原因是,HTML4.。在实际应用(比如在浏览器中应用)时支持XML空元素语法,但在先于XHTML1.。的HTML4.0正式规范中却不支持XML空元素语法。格式良好的XML语法要求能够具备任何HTML浏览器通常要求的各种特征,比如: 所有元素都必须限定在起始标记和结束标记

13、之间;所有元素都必须正确嵌套,不允许交叉嵌套;属性值必须用引号括起来;属性赋值必须使用非最小化形式(而不同于诸如边界之类的某些用法), 内容中用到的,但在XML语法中这些空格是可选的)。空元素是指允许不包含任何内容的元素(比如HTML中的怡和hr元素)0XML与正式的HTML 语法在对待空元素方面仍然互不兼容。但是.XML语法中要求标记末尾的斜杠前面带有空格这一规定已被大多数HTML浏览器接受(这是严格遵守XML语法的格式,因为XML忽略各种标记内部的空格。因此,本指导性技术文件中要求XML的这个(一致的)变种(比如勺。这是最简便的语法形式,尽管这样做有助于延长文挡的使用寿命,但从严格意义上说

14、,这不是有效的HTML格式。很轻松就能够将有效的HTML句法转换成格式完备的XML句法(不过,语义转换可能会添加新的结构,但也许不会添加新的信息值)。对较规范的非有效性HTML进行转换也通常是轻松完成的过程,并且很容易就可以自动实现,目前已有用于自动实现的若干免费工具,比如Tidy(请参考网址:http , / /www. w3. org/People/Raggett/tidy/)。但是,如果想将非常不规范的HTML转换成XML.则其复杂程度不可预知。格式完备的XML1.0文档不一定都是合格的OEB文挡,原因是本指导性技术文件中又对其作了更加严格的限制,以提高文挡的互操作性。这些限制条件就是定

15、义如下的OEB通用要求,3 、-G/Z 18906-2002 本指导性技术文件中定义了两个XMLDTD,即包DTD和基本OEB文档DTDo其中,包DTD构成某个完整出版物的根,阅读器系统利用它来查找和组织出版物的各个组成部分。基本OEB文裆DTD则从形式上定义了本指导性技术文件巾所描述的HTML子集。4.2.2 与XML名域之间的关系本指导性技术文件的当前版本中并没有要求阅读-:/g系统依据XML名域建议草案(http:/www.w3.org/TR/REC-xml-names)来处理XML名域前缀。名域前缀是为元素和属性名称添加前缀的一种方法,以便对来自多个不同定义集合中的名称进行区分。利用X

16、ML名域声明,可将某个前缀与某个唯一的URI进行关联。另外,名域声明或许将某个URL作为缺省的名域,并将其应用于缺少名城前缀的元素。XML名域前缀与后缀元素之间用冒号隔开。本指导性技术文件中禁止使用有关OE的以下用法,即禁止在OEB文档中使用名域前缀。但是,如果想在OEB包中使用DublinCore元数据元素的各种属性,则要求使用诸如dc:prefix(前缀)之类的形式。OEB文随中的元素若带有名域前缀,则被视为扩展元素,并且冒号将扮演正常的XML名称符号。阅读器系统必须将冒号识别为OEB文挡巾的有效名称符号。为了保持向上兼容性,要求OEB包中的元素元数据都带有xmlns:dchttp:/pu

17、rl.org/dc/elements/1. 0/属性和xmlns:oebpackage = http:/openebook. org/namespaces/oeb-package/1. 0/属性。此外,还需要在OEB包DTD巾对Dublin Core诸元素进行声明,并带有明显的前缀dcz。4.2.3 与HTML之间的关系由于考虑到现有软件工具、历史遗留数据、出版实践以及市场条件等多方面的重要性,所以本指导性技术文件基于HTML基础之上。采用这种方法,可以允许内容提供商对现有的HTML内容、工具以及专门技术作进一步探讨。为了将阅读器系统开发商的研制负担降至最低点(他们可能会使用在功率和显示方面都

18、会受到限制的各种设备),所以本指导性技术文件的出版物结构中并没有包括全部的HTML元素和属性。本指导性技术文件中的元素和属性选自HTML4.0规范,并遵照与现有的HTML、XHTML以及新兴的XML的发展方向相吻合的原则进行选取。如果您想了解全部的元素和属性,则请参考附录A,其中包括了有关HTML3.2、HTML4. 0以及OE文档中各种元素类型的一份完整列表。HTML 4.0巾建议不用的全部HTML构造,在本指导性技术文件巾或者弃而不用,或者依旧建议不用。基于CSS的各种对等物的情形就是如此。样式表构造还可以用于HTML4.0规定以外的新功能。为了获得可预知的结果并且保持本指导性技术文件未来

19、版本的向上兼容性,本指导性技术文件中强烈建议z基本OEB文档都是有效的XML文档,并且该文档与OEB文档DTD相关。4.2.4 与css之间的关系本指导性技术文件在CSS1和CSS2的基础上定义了一种样式语言,并带有媒体类型text/x-oebl css 尽管OEB撰写组意识到上述有关媒体类型的定义与CSS工作组(请参阅网址http:/www.w3. org/TR/.REC-CSSl)的建议草案没有吻合,但考虑到实际情况又不得不这样做。本指导性技术文f!中包括了基于CSS的样式表构造,后者用来定义基准的显示效果功能。为了将阅读器系统开发商以及设备制造商的负担降至最低点,本指导性技术文件中没有包

20、括CSSl或者CSS2 中的全部属性。本指导性技术文件中增加了少数几个附加的属性和属性值,用来支持页顶布局、页用和页脚。在大多数情况下,本指导性技术文件中并未要求阅读器系统能提供标准CSS样式表所要求的全部显示效果。例如,某些阅读器系统中使用的是单色显示器。所以,本指导性技术文件中既没有认可将所有阅读器系统限定为单色显示器这类做法,也没有声称要使用OEB以外的非标准颜色扩展。在此情况GB/Z 18906-2002 下,本指导性技术文件中允许使用各种CSS设置,并保持其含义。但这样做的结果是,完全合乎要求的阅读器系统也许会逐渐蜕变成显示效果更简单的系统。本指导性技术文件支持嵌入样式属性、样式元素

21、以及外部链接的样式表。在处理各种样式表的过程中,本指导性技术文件没有要求阅读器系统执行与XML名域相关的各种处理。样式表可通过以下途径与某OEB文档进行关联-a) 利用特定HTML元素的style属性进行关联;b) 利用HTML头中的style元素进行关联;c) d) 在HTML头中的link元素利用个外部样式标识符进行关联,或者通过W3C建议草案与XML文裆进行关联的样式表气网址为,http,/www. w3. org/TR/ xm1-sty 1esheet)中定义的处理指令来利用某个外部样式表标识符进行关联。如果将来发布了该草案的正式文本,则请采用最终的正式文本。上述前三种情形的优先权如H

22、TML4. 0和CSS2中所定义的。通过处理指令链接的样式表单并视为在任何实际的HTML1ink元素之前通过link元素链接的样式表单。正如一致性部分中所定义的那样,如果没有为某个特定元素定义任何样式表或者找不到任何可应用的样式,则缺省的HTML显示效果将等同于本指导性技术文件以及HTML4.0中其他任何地方定义的显示效果。通过上述前两种方法将样式附加到文档中,使用的也许仅仅是本指导性技术文件第7章中支持定义的CSS结构。但是,通过HTML链接元素或者处理指令来链接外部样式表这两种方法,使用的或许是CSS或其他样式语言,比如XSL(请参考网址,http,/www.w3.org/TR/WD-xs

23、)。只有本指导性技术文件第7章中支持定义的那些CSS结构才可能会包含在样式类型text/x- oeb1 css中.对于其他烧体类型的样式表,贝11阅读器系统自行判断以什么内容来替代text/x-oebl-css样式表。HTML 4. 0规范将外部样式表按其标题成批链接到集合中(如果标题为空字符串,贝tl包括一个持久性集合)。该规范要求在诸如此类的集合中至少有一个样式表必须是MIME媒体类型text/x-oeb1 css 阅读器系统执行的只是OEBCSS子集,所以它可能会忽略使用其他样式语言的所有样式表。支持外部样式表功能的各种阅读器系统也许会从其他任一外部样式表中进行选择。本指导性技术文件强烈

24、建议用户为本指导性技术文件支持的任何新样式表语言定义唯一的MIME媒体类型,并通过检查MIME媒体类型来对样式表语言中的样式表进行检测。4.2.5 与DublinCore之间的关系Dub1in Core被设计用来将作者和出版商的编日负担降至最低点,同时还能提供更多的有用数据。本指导性技术文件中支持Dub1inCore中现有的全部元数据元素集,并在相关贡献者部分补充了一小部分附加属性,其中还可能会有更多有用的特殊信息。例如,如果将角色属性添加到dc:Contributor 元素中,则可为某个出版物的相关贡献者添加更详细的说明信息,包括利用脚本代码来表述角色。内容提供商必须在其提供的内容中包含本指

25、导性技术文件5.2中定义的元数据元素的最小集,并吸收附加的元数据,以方便读者发现他们感兴趣的各种出版物。4.2.6 与GB130之间的关系各种出版物使用的或许是按UTF-8或UTF-16编码的所有GB13000字符集。使用GB13000编码形式,有利于促进文档的国际化和多语言化进程。但是,并没有要求各种阅读器系统提供全部GB 13000字符集的各种字形。要求各种阅读器系统能够正确解析所有UTF-8和UTF-16字符。阅读器系统也许不能显示某些字符,但必须能对其不能够显示的各种字符给出某种样式的信号。不可以把GB13000字符显示成仅仅像8位字符的形式。例如,有害的符号(比如Ox2623)不必通

26、过包GB/Z 18906-2002 括正确的字型来支持。但是,该符号决不能被解析或显示成好象它的组成成分是两个字符&.#(Ox0026 Ox0023)。4.2.7 MIME媒体类型本指导性技术文件中定义了一份核心MIME娘体类型清单,所有阅读器系统都必须能够支持这些媒体类型,各种出版物中也必须包括这些类型。各种出版物中也许会包括其他媒体类型资源,但是,对于诸如此类的每一种资源类型来说,都必须包括可替代核心MIME媒体类型的某种资源(可利用本指导性技术文件中定义的方法来实现OEB核心MIME媒体类型包括:媒体类型参考措述imagejjpeg RFC 2046 用于栅恪图形mage!png RFC

27、 2083 用于栅格图形text/ x-oe bl-document 本指导性技术文件用于基本OEB文档或扩展。EB文档text/ x-oebl-css 本指导性技术文件用于OEBCSS样式表子集4.3 -致性本条巾主要定义了OEB文档、出版物以及阅读器系统这三者之间的一致性。4.3. 1 文档与出版物之间的一致性本指导性技术文件中为OEB文档定义了两种命名的一致性级别,即基准一致性和扩展一致性,并为OEB出版物定义了一致性级别。4. 3. 1. 1 通用要求如果某份OEB文档符合一致性要求(包括基准一致性要求和扩展一致性要求).或者某个OEB包文件符合一致性要求,贝rJ它必须符合通用要求中规

28、定的各种必要条件za) 必须是按XML1.0规范定义的格式完备的XML文挡;b) 起始部分必须带有正确的XML声明(比如:); 必须按UTF-8或者UTF-16进行编码;对于空元素,必须使用XML空元素语法,并在元素尾部的斜杠前面加上空格;不包括内在声明子集;所有带有NMTOKEN,ID或者IDREF值的属性,都必须是合法的XML名称。4.3. 1. 2 基本OEB文档某一文档成为基本OEB文档的充分必要条件是za) 必须符合本指导性技术文件中的通用要求;b) 如果有DOCTYPE声明,则必须引用基本OEB文档DTD,。只能使用本指导性技术文件中定义的各种元素名、属性名以及属性值;所有的元素名

29、和属性名都必须是小写形式;文档中使用的各种元素名、属性名以及属性值,必须在更广泛的程度上与本指导性技术文件以及HTML4.O, Dublin Core等规范的相关描述目的保持一致。如果发生冲突,则必须优先考虑本指导性技术文件;如果文档中使用了外部样式表,则在每个标题集合中至少有某种样式表(具体说明请参见HTML4.。规范)必须是MIME媒体类型textlx-oe bl-css (包括所有的持久性集合勺g) 文档本身指定所有的样式参数必须隶属于OEBCSS子集。4.3. 1. 3 扩展OEB文档某个文档成为扩展OEB文档的充分必要条件是za) 必须符合OEB通用要求;) C唱defid) e)

30、6 文档中使用了没有在本指导性技术文件中定义元素、属性或者属性值,或者文挡的DOCTYPE声明被引用到基本OEB文档DTD以外的其他DTD;对本指导性技术文件中没有定义的其他任何元素,只能利用OEBCSS子集提供某种可应用的样式规则;如果文档中使用了外部样式表,则在每个标题集合至少有某种样式表(具体说明请参见HTML4.。规范),必须是MIME媒体类型text/x-oebl-css (包括所有的持久性集合); 文档本身中指定的所有样式参数必须隶属于OEBCSS子集。4.3. 1. 4 有效性基本OEB文档或者扩展OEB文档,可能都是有效的,也可能都是无效的(其有效性在XMLl.。中进行了定义)

31、,具体情况与其关联的DTD有关。但是,所有OEB文档都必须是格式完备的XMLl.0 文挡。4.3.1.5 出版物的一致性某个文件集合成为具有一致性特征的OEB出版物的充分必要条件是za) 包括一个OEB包文件,该文件符合上述OEB选用要求,并且是符合OEB包DTD的有效XML文档gOEB包文件中包括且仅包括与出版物中各个文件相对应的一个文件清单款曰:与出版物中各个文件相对应的文件清单款目被用来指定该文件的MIME媒体类型(请参考网址;http;/www. ietf. org/rfc/rfc2046. txt) , 如果文件的文件沂单款目确定该文件属于核心MIME媒体类型中的某种类型,则该文件必

32、须保持相应的MIME媒体类型中定义的一致性;dc-metada ta元素中至少要包括一个dc;Idcntifier和dc:Title element; 包元素的unique-identifier属性是对dc;identif凹的正确的XMLIDREF, g) 为dc;Contributor元素的角色属性指定的任何扩展属性值都必须以oth.开头gh) 为向导元素的类型属性指定的任何扩展届性值都必须以other.开头。4.3.2 阅读器系统的-致性本指导性技术文件中仅定义了适用于阅读器系统的某种兼容性级别。阅读器系统在处理文档时必须遵循以下规则,才能保持其兼容性ga) 当阅读器系统用来显示某一基本O

33、EB文档时,必须做到z1) 按照XML规范正确处理XML,其中包括对格式完备的各种错误进行处理的规范要求p应该认识到本指导性技术文件中描述的所有标记都允许使用,并在处理时需要使本指导性技术文件与HTML4.0、CSS2 , Dublin Core等规范中的相应解释保持一致(如果发生任何冲突,则应优先考虑本指导性技术文件)。当阅读器系统被用来显示某一扩展OEB文档时,必须做到21) 满足a)的1)和a)的2)中的要求,应该认识到z如果元素实例并非来自本指导性技术文件,则应使其遵循4.2.4节中所描述的任一可应用的样式表规则;必须继续处理和显示嵌人元素。如果1)和2)中没有规定如何处理某些元素,则

34、应该应用嵌入显示方式来进行处理g在缺少可靠信息的情况下,不会生成不被支持的各种媒体类型对象。5.3. 1、6.6. 2、6. 7. 3、6.30以及6.36等中对这些可靠信息进行了定义。当阅读器系统被用来显示某一OEB包时,必须做到u; 1) 能够处理本指导性技术文件第5章中所描述的全部元素和属性值。当通过OEBspine提供导航功能时,阅读器系统应该做到2G/Z 18906-2002 2) 3) 2) 4) ) ,。d) ) ,。e) d) c) ) LU c) e) f) c) d) 7 L一-GB/Z 18906-2002 4.4 e) 1) 不能显示text/x-oe bl-docum

35、ent媒体类型以外的其他内容。当利用日TML链接机制或XML样式表(http,/www. w3. org/TR/ xml-stylesheet中对该样式表进行了描述处理指令来显示一个或者多个样式表时,阅读器系统应该做到:1) 2) 能够处理符合text/x一oebl-css样式表规范的文档,如果某个样式表的MIME媒体类型不是假定的text/x-oebl-css,则可能需要用其替代 text/ x-oebl-css 0支持其他样式表媒体类型的阅读器系统(尽管它不是必需的阅读设备)必须能够提供某种机制,该机制可用来确保忽略所有不同于text/x-oebl-css的其他样式表。注2并没有要求阅读器

36、系统必须支持XML实体和属性声明(这超出了XML对它们的解析要求).因为保持兼容性的OEB文档中不允许使用这种结构。可扩展性如果想在本指导性技术文件定义的HTML子集中提供的内容以外再添加各种信息和结构(比如对内容关联更多的语义).则建议用户使用的机制是利用OEB文档扩展。可以随意添加各种非OEB元素,只要这些元素附带的样式表中提供了该元素的样式定义即可。4.5 例如,下面给出的是某个扩展OEB文挡的实例片断:Chapter one Now is the time 其前提条件是,只要关联的样式表中带有以下代码片断即可zchapter page-break-before: always) mil

37、estone ) chapterhead font-weight: bold; font-family: sans-seri f; text-align: center; display: block; margin-top: 4ex 可访问性本指导性技术文件中吸收了若干新功能,以确保生成的内容能够被残疾人访问和使用。目前由World Wide Web Consortium(W3C)组织、开发的适于HTML4.。的内容访问性功能已被吸收到UOEB 规范中。本指导性技术文件与W3CWeb Content Accessibility Guidelines 1. 0 ( http:/www. w3.

38、 org/TRI 1999/W AI-WEBCONTENT-19990505/)保持一致,以确保最广泛的用户能够访问以该格式发布的各种图书。此外.OEB研制人员还应该查看和应用W3CHTML 4. 0 Gllidelines for Mobile Access (http:/www. w3. org/TR/NOTE-htm140-mobile/)推荐草案以及W3CWeb Accessibility Initiative 提议的UserAgent Gllidelines(http, / /www. w3. org/TR/WD-W AI-USERAGENT /).以确保阅读器系统能够满足各种访问要

39、求。4.6 未来发展方向本指导性技术文件的设计同时考虑充分利用当前的实践经验和电子图书未来发展的需要。尽管本指导性技术文件还有待发展,但本指导性技术文件的仍旧期望今后发布的各种版本会朝同一方向继续8 G/Z 18906-2002 发展,包括2增强其功能性、访问性、国际化、可扩展性,以及更加严格地区分内容与表现形式,同时保持与相关标准之间的关联。此外,还应该优先维护本指导性技术文件现有版本的向后兼容性。5 OE包符合本指导性技术文件的出版物中必须包含且仅包含个OEB包文件,该文件可被用来指定OEB文档、图形以及组成OEB出版物的其他对象,还可用来指定它们彼此之间是如何相互关联的。如果想很容易就能

40、在组成某个出版物的文件组中识别出各种包文件,则建议所有包文件都使用同一扩展名.opf气包文件的MIME媒体类型都是text/xml。本指导性技术文件中并没有明确定义如何从物理上将各种文件捆绑在一起,以生成某一数据转换对象(比如使用.Zlp或者.tar文件)。尽管没有要求OEB包DTD在物理上包括所有出版物,但是,如果其中包括了所有出版物,则应从以下清单中进行引用。OEB包文件的主要组成部分包括2 PACKAGE IDENTITY(包标识):将OEB视作一个整体的唯一标识符。METADATA(元数据h有关出版物的元数据(标题、作者、出版商等)。MANIFEST(文件清单h组成某个出版物的所有文件

41、(包括文档、图形、样式表等)的一份清单,其中包括有关本指导性技术文件巾不支持的文件类型的反馈声明。SPINE(书脊):可提供线性阅读次序的一种文挡排列。TOURS(导读):出版物的一组可选阅读序列,比如用于各种阅读目的以及适于各种读者阅读技巧水平的可选择性视图。GUIDE(指南):有关出版物基本结构的一系列指引信息,比如有关出版物的内容、前言以及目录等。OEB包必须是有效的XML文档,并且该文挡必须符合OEB包DTD规定。OEB包的非正式大纲如下所述zmetdata manifest sine guide 下面描述的是OEB包的各个组成部分。5. 1 包标识包元素是包文件中最外层的元素,其他元

42、素都被嵌套在包元素巾。OEB包必须指定某个值作为其unique-identifier属性。unique-identifier属性值被用来指定哪个dc: Identifier元素(如5.2.10中所述)提供OEB包的优先标识符或者主要标识符。但文件的作者负责选择某一主要标识符,该标识符对于某个特定包(比如,从包文件清单中引用的文件集合)来说是唯一的,并且仅对该特定包来说是唯一的。尽管要求保持包的唯一性,但是,如果阅读器系统遇上两个截然不同的包都拥有唯的主要标识符这种情况,则也不应该带来重大灾难。5.2 出版物元数据 9 G/Z 18906-2002 必须有的元数据元素可用来提供有关整个出版物的信

43、息。dc-元数据元素巾包含了某条DublinCore元数据记录,并且r元数据元素中包含的是追加的元数据信息。dc元数据元素中包含的是DublinCore先导计划(http,/!purl.org!dc!)中定义的特定出版物级别的元数据。给出以下描述主要是为了方使用户起见,此外还优先考虑了DublinCore中给出的定义(请参考网址,http,!www.ietf.org!rfc!rfc2413.txt)。与HTML4.0中元数据元素相类似的是.x-元数据元素中必须包含某个元数据元素的一个或者多个实例,但可将它们作为一个整体应用到出版物中。x-元数据元素允许内容提供商任意表述元数据,这些元数据可能超

44、出了DublinCore 语言的描述范围。单个OEB文档中或许直接包含了文档专用的元数据元素(同HTML4.0规范中的元数据元素相同)。此规范单独使用OEB包文件作为表达出版级别的DublinCore元数据的基础。例如:. XML名域机制(请参考网址,http,/ /www. w3. org/TR/REC-xml-names/)被用来识别使用Dublin Core元数据中的各种元素,以避免发生冲突。注意:在处理名域时.对阅读器系统未作任何要求。该语法被用来提供向上兼容性。dc-元数据元素中可以包含DublinCore中任一元素的任意实例。DublinCore元素名通常以dcz前缀开头,后面紧跟

45、-个大写字母。DublinCore元数据可以任意次序出现。事实上,同一元素类型的多个实例(比如可使用多个dczCreaor元素)可以散布在其他元数据元素当中,并且不会改变任何意义。为了保持向上兼容性.OEB包中的元素metadata要求带有以下属性,即,xmlns,dc= http,/ purl. org/dc/elements/1. 0/和xmlns,oebpackage = http, / / openebook. org!namespaces/oeb-pack age/1. O/。Dublin Core中的每个字段都可以用某个元素来进行表示,该元素的内容就是该字段的值。dcmetadat

46、a元素中必须包含dc,Title.至少还应该包含一个dc,Identifier 0同OEB包文件中的其他元素一样.Dublin Core中的每个元素或许都需要指定一个id属性。至少有一个dc,Identi刮目必须有一个指定的id属性可供但中的unique-identifier引用。由于DublinCore用于Creator和Contributor的元数据字段中并没有对为作品作出特殊贡献者(比如作者、编辑者以及插图画家等)这一类角色进行区分。所以,本指导性技术文件中增加了一个可选的角色属性,具体内容请参见本指导性技术文件5.2. 6中有关角色属性的讨论。本指导性技术文件中为dc,Identifi

47、er元素添加了一个可提供结构化机制的scheme属性,以便将某一标识符的值从产生或者定义该值的系统或者授权巾K分开来,具体内容请参见本指导性技术文件5.2. 10中有关scheme属性的讨论。本指导性技术文件中还为dc,Data元素添加了一个事件属性,从而使内容提供商能够区分各种出版物的特殊日期(比如出版物的创建日期、出版日期以及修改日期).具体内容请参见本指导性技术文件5. 2. 7中有关事件属性的讨论。例如.10 厂一一一, G/Z 18906-2002 Alice in Wonderland Novel 123456789X Lewis Caroll 在DublinCore巾,没有对dc-元数据元素中的各种元素属性进行定义,仅定义了各种元素的内容。以下各节中描述的是DublinCore各种元数据元素的相关信息.5.2. 1 用来标识出版物的标题。尽管OEB包中至少应该包括该元素类型的一个实例,但是,还允许在OEB包中包括多个实例。任何阅读器系统如果想将标题元数据显示给用户,则既可以只显示第一条dc: Tit1e元数据信息,也可以显示所有的dc:Title元数据信息。5.2.2 用来标识出版物的创建者或者作者。对为出版物作出贡献的

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 国家标准

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1