1、I臼37.080A 14 量菌中华人民共和国国家标准GB/T 23286.1-2009/ISO 19005-1 :2005 文献管理长期保存的电子文档文件格式第1部分:PDF1.4CPDF/A-l)的使用Document management-Electronic document file format for long-term preservation-Part 1: Use of PDF1. 4CPDF/A-1) (ISO 19005-1: 2005 , IDT) 2009-03-13发布2009-09-01实施、蚊码防伪/ 中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员
2、会发布中华人民共和国国家标准文献管理长期保存的电子文档文件格式第1部分:PDF1.4 (PDF/A-1 )的使用GB/T 23286. 1-2009/ISO 19005-1: 2005 * 中国标准出版社出版发行北京复兴门外三里河北街16号邮政编码:100045网址电话:6852394668517548 中国标准出版社秦皇岛印刷厂印刷各地新华书店经销 开本880X 1230 1/16 印张2字数50千字2010年1月第二版2010年1月第一次印刷铸书号:155066 1-37704 定价30.00元如有印装差错由本社发行中心调换版权专有侵权必究举报电话:(010)68533533GB/T 23
3、286.1-2009/ISO 19005-1 :2005 目次E11244444455689900567125 1i1在1A1A14nrunLnd法结济凸川国本EH性最H致的刊-MU km坷/IJJ-WA用英凹使中器uu读uuuHUH)录录录件性t附单附附附用义别致致准构作构表性性性引定明级一一标求结uu操据结式料料料.性和说性述级级合要件形体明释档数辑互啧啧啧札围范语号致概AB符术文图字透注文元逻交A-U性言范规术符-1234技123456789或乱和东前1234511t丘66.6.6.n队队队队6.6.附附附参I GB/T 23286.1-2009/ISO 19005-1 :2005 .O
4、.L. . 回目UJ=I GB/T 23286(文献管理长期保存的电子文档文件格式计划分为两部分:一第1部分:PDFl.4(PDF/ A-l)的使用;一一第2部分:PDF1.7(PDF/A-2)。本部分为GB/T23286(文献管理长期保存的电子文挡文件格式的第1部分。本部分等同采用ISO19005-1: 2005 (文献管理长期保存的电子文档文件格式第1部分:PDF1.4 (PDF/ A-l)的使用以英文版)的技术内容,并包含ISO于2007年4月1日发布的技术勘误表ISO 19005-1 :2005/Cor. 1的内容。本部分对ISO19005-1 :2005做了编辑性修改,删除了引言部分
5、,增加了资料性附录C。本部分的附录A、附录B和附录C均为资料性附录。本部分由全国文献影像技术标准化技术委员会(SAC/TC86)提出并归口。本部分由全国文献影像技术标准化技术委员会第五分委员会起草。本部分主要起草人:薛四新、李明敬。皿GB/T 23286.1-2009/ISO 19005-1 :2005 文献管理长期保存的电子文档文件格式第1部分:PDF1.4CPDF/A-l)的使用1 范围本部分规定了如何使用便携文档格式(PDF)1. 4进行电子文档的长期保存。本部分适用于包含字符、光栅和向量数据的电子文挡。本部分不适用于1一一将纸质文档或电子文档转换成PDF/A格式的具体过程;一一特定的技
6、术设计、用户界面、软件实现或者呈现的操作细节;一一文档存储的特定物理方法如存储介质和存储条件:一一对计算机硬件和/或操作系统的要求。2 规范性引用文件下列文件中的条款通过GB/T23286的本部分的引用而成为本部分的条款。凡是注明日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本部分,然而,鼓励根据本部分达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本部分。GB/T 1988-1998 信息技术信息交换用七位编码字符集(eqvISO/IEC 646: 1991) GB/T 16964. 1一1997信息技术字型信息交换第1部分:
7、体系结构(eqvISO/IEC 9541-1: 1991) GB/T 13000. 1一1993信息技术通用多八位编码字符集(UCS)第一部分z体系结构与基本多文种平面(lSO/IEC10646-1: 1993 , IDT) ISO 14721 空间数据与信息传输系统开放档案信息系统(OAIS)参考模型ISO 15930-4 图形技术采用PDF的印前数码数据交换第四部分:用PDF1.4(PDF/X-1a)进行CMYK和专色印刷数据的完全交换日期和时间格式,W3C备忘录,1997年9月15日,可从他ttp:/www. w3. org/TR/NOTE-date time)下载PDF参考勘误表,第三
8、版,2003年6月18日,可从(http:/partners. adobe. com/ asn/acrobat/ docs/PDF14errata. txt)下载可扩展标记语言(XML)1. O(第三版),W3C推荐标准,2004年2月4日,可从(http:/www.w3. org /TR/2004/REC-xml-20040204)下载ICC. 1: 1998-09色彩描述档文件格式,国际色彩联盟,可从(http:/www.color. org/ICC-l_1998-09. PDF)下载ICC. 1A: 1999-04 , ICC. 1: 1998-09规范附录2,国际色彩联盟,可从他ttp
9、:/www.color. org/ICC-1A_1999-04. PDF)下载PDF参考:Adobe便携文档格式,1.4版,Adobe系统公司,第三版(lSBN0-201-75839-3)。在本部分中将简称为(PDF参考),可从(http:/partners.adobe. com/ asn/ acrobat/ docs/File Format Specifi cations/PDFReference. pdf下载1 GB/T 23286.1-2009/ISO 19005-1 :2005 RDF/XML语法规范(修改版),W3C推荐标准,2004年2月10日,可从(http:/www.w3. o
10、rg/ TR/ 2004/REC-rdf-syntax-grammar-2004021 0/)下载语种标识标签,RFC1766,1995年3月,可从(http:/www.ietf. org/rfc/rfcl766. txt)下载XMP规范,2004年1月,Adobe系统公司,可从(http:/partners.adobe. com/asn/tech/xmp/pdf/ xmpspecification. pdf下载3 术语和定义3. 1 3.2 3.3 下列术语和定义适用于本部分。-致性级别conformance level 文件和阅读器必须遵循的限制和要求的集合。ISO 15930-4J 交叉
11、引用表cross reference table 包含文件中的间接对象的起始宇节偏移量信息的PDF数据结构。字典dictionary 键一值对照表。键与值分别对应某对象某一属性的名称和取值。一般用来收集和归拢复杂对象的属性。ISO 15930-4J 3.4 电子文档electronic document 面向页面的文本与图像数据的集合,以及元数据的电子表现。这些元数据被用于辨别、解释和呈现这些文本与图形数据。可在纸上或者以光学缩微文献的形式重现,且无显著信息丢失。3.5 文件结束标志end -of -file marker 用来标识PDF文件结束的五字符序列:%EOFo3.6 行结束标记end
12、-of-line marker;EOL marker 用来标识一行文本结束的一个或两个字符的序列,包括回车(CARRIAGE阻TURN)符(ODh)或换行(LlNEFEED)符(OAh),或者一个回车符之后紧跟一个换行符。3. 7 3.8 3.9 2 字体font 表征字形或其他图形元素的图形集合。ISO 15930-4J 字形flyph 独立于任何特殊设计的、可识别的抽象图形符号。GB/T 16964.1-1997J 圄际色影联盟描述档ICC profile 遵循国际色彩联盟规范和附录的色彩描述挡及其附录。ICC. 1: 1998-09J和ICC.1A: 1999-04J 3. 10 3.
13、11 3.12 3.13 GB/T 23286.1-2009/180 19005-1 :2005 支互式阅读器interactive reader 在软件处理的过程中需要或允许人为交互的阅读器。注:交互式阅读器的一个例子z文件查看器;非交互阅读器的例子z光栅图像处理器。A级一致性Level A conformance 满足本部分所有要求的一致性级别。B级一致性Level B conformance 满足本部分关于电子文档视觉外观的要求,但不包括关于文档结构和语义属性方面的要求。长期long-term 足够长的时间段,信息在该时间段内被存储,其间可能会发生一系列技术变迁,包括新的媒体和数据格式支
14、持、用户群体的变更,这个时间段可能会延伸到元限未来。3. 14 3. 15 3. 16 3.17 ISO 14721J PDF便携文档格式Portable Document Format 在(PDF参考及其勘误表中定义的文件格式。ISO 15930-4J 阅读器reader 可以恰当地读取和处理文件的软件。ISO 15930-4J 空格字符space character 用于在文本显示操作中表现正视空白距离的文本字符串。注2通常使用的空格字符包括z水平制表符3.4.4和3.4.5),或者是指线性化的PDF文件的首页尾部(参见(PDF参考)F.2)。在线性化的文件中,首页尾部以及最后一个尾词典中
15、都要包含ID关键字,并且两处的取值要相同。注z显式地禁用Encrypt关键字会使文件加密和密码保护许可权限的功能隐式失效。6.1.4 交叉引用表在交叉引用项头中,起始对象的序号及范围应用一个SPACE(20h)字符分隔。xref关键字和交叉引用项头应用一个EOL标记分开。任何对象如果其偏移量在交叉引用表中没被引用,则该对象不必满足本部分的任何要求。6. 1. 5 文档信息字典合格文件中可能会定义一个文档信息字典。如果定义了,该字典的所有元素应与6.7.3中定义的类似于XMP元数据的属性相一致。6. 1.6 串对象16进制串应包含偶数个非空白字符,每个字符的取值应在0-9,A-F以及a-f中选取
16、。6. 1.7 流对象stream关键字后应跟回车符GARRIAGERETRUN (ODh)加换行符LINEFEED (oAh)序列或只跟单个换行符。endstream关键字之前要有一个EOL标记。流字典中的Length关键字的取值为文件中stream关键字之后的换行符到endstream关键字之前的EOL标记之间的字节数。注1:这些要求消除了与流内容的结束点相关的潜在的不确定性.流对象字典中不包含F、FFilter或FDecodeParams关键字。注2:这些关键字用来指向那些文件之外的内容。显式地禁用这些关键字,可以防止使用文件之外的可产生外部关联的内容。以避免使文件的保存过于复杂.6.
17、1. 8 间接对象对象序号与生成序号之间应用一个空白字符间隔开。生成序号与o均关键宇之间也应用一个空白字符间隔开。对象序号与endobj关键字之前分别应有一个EOL标记。obj关键字和endobj关键字之后也分别应有一个EOL标记。5 GB/T 23286.1-2009/ISO 19005-1 :2005 6. 1. 9 续性化的PDF本部分应被允许线性化,但是符合标准的阅读器将忽略文件中的所有线性化信息。6. 1. 10 过滤器本部分不应允许使用LZWDecode过滤器。注:LZW压缩算法的使用取决于知识产权的限制。6. 1. 11 嵌入式文件文件规范的字典中不应包含EF关键字参见(PDF参
18、考)3.10. 2)。文件名字典中不应包含EmbeddedFiles关键字(参见(PDF参考)3.6.3)。注2这些关键字用于向PDF文件中嵌入包含任意内容的文件。显式地禁用这些关键字可以防止使用嵌入文件,使用可建立外部关联的嵌入文件,以避免使文件的保存过于复杂.6. 1. 12 实现上的限制合格文件不能违反任何(PDF参考表C.1中的结构限制。注z遵循了这些结构限制的合格文件可以与尽可能多的阅读器兼容。6. 1. 13 可选内容文档目录字典不应包含OCProperties关键字。注2显式地禁用OCProperties关键字在9.10.4中的定义。OutputIntent包含于文件的Outpu
19、tIntents阵列中,它的S键的键值是GTS_PDFA 1 ,它的D臼tOutputProfile键的键值是一个有效的ICC配置文件流。如果一个文件的OutputIntents阵列包含了多个条目,则所有包含了DestOutputProfile键的条目都要以同一个间接对象作为该键值,该间接对象为一个有效的ICC配置文件流。6.2.3 色彰空间6.2.3. 1 总则色彩描述应采取与设备元关的方式,或直接采用设备元关的色域,或间接地使用OutputIntent进行设置。除了6.2.3.2和6.2. 3. 4中限制使用的以外,合格文件可以使用(PDF参考中列出的任何色域。注z按照6.2.3中描述的与
20、设备无关的方式声明色彩可以根据色度定义,使色彩的呈现可预测而不受合格文件之外的假设或信息的影响。本部分也提供了一种可以将色度定义和设备相关的色彩数据结合起来的机制。6. 2. 3. 2 ICCBased的色域所有ICCBased色域都要以ICC色彩配置文件流的方式嵌入(参见(PDF参考)4. 5)。标准阅读器要按照ICC规范来呈现ICCBased色域,不能使用ICC配置文件流字典中的替代(AIternate)色域。6.2.3.3 来校准色域合格文件可以使用DeviceRGB色域或者DeviceCMYK色域,但是二者不能同时使用。如果文件中使用了未校准色域,则文件应当包含PDF/ A-1 Out
21、putIntent (在6.2.2中定义)。包含了OutputIntent的PDF/A-l文件只能在采用RGB色域时才能使用DeviceRGB;同样,只有在采用CMYK色域时才能使用DeviceCMYK。当呈现一个文件中的DeviceGray色域时(该文件的OutputIntent为RGB配置文件),标准阅读器应6 GB/T 23286.1-2009/180 19005-1 :2005 按照(PDF参考)6.2. 1中的方法将DeviceGray色域转化为RGB色域进行处理。当呈现一个文件中的DeviceGray色域时(该文件的OutputIntent为CMYK配置文件),标准阅读器应按照(P
22、DF参考6.2.2中的方法将DeviceGray色域转化到DeviceCMYK色域进行处理。当呈现与设备相关的色域中指定的色影时,标准阅读器应使用文件的PDF/ A-l OutputIntent字典作为源色域。(参见(PDF参考)6.2. 2) 6.2.3.4 Separation(分色)色域和DeviceN(专色性色域当呈现DeviceN色域和Separation色域时,标准阅读器应遵守如下准则:-一一如果在色域中选取的色彩全部为Cyan、Magenta、Yellow和Black中的一种或几种,同时文件以CMYK配置文件作为OutputInput属性,所有选中的色彩必须从PDF/ A-l O
23、utputIntent字典指定的色域中选取,不能使用替代色域(参见。DF参考)6.2. 2)。一一如果输出设备不支持Separation色域和DeviceN色域,则应当采用替代(AItemate)色域。Separation色域和DeviceN色域的替代(AItemate)色域应遵循6.2. 3. 2和6.2. 3. 3中对色域的限制。6.2.4 图像图像字典不应包含AItemates关键字以及OPI关键字。如果图像字典中包含Interpolate关键字,其值必须为falseoIntent关键字的使用应符合本部分6.2.9中的规则。6. 2. 5 XObjects表单XObjects表单字典不应
24、包含以下任何一项:一一OPI关键字;一一取值为PS的Subtype2关键字;一-PS关键字。注:在早期版本的PDF规范中,取值为PS的Subtype2关键字以及PS关键字用来定义任意可执行的PostScript代码流,这种方式会影响呈现效果的稳定性与可预测性。6.2.6 外部(XObjects)参考合格文件不应包含任何外部参考。注:外部参考指的是任何其他PDF文件中会创建外部关联的内容,它会导致文件的保存过于复杂。6.2.7 外部PostScript对象(PostScriptXObj配ts)合格文件不应包含任何外部PostScript对象。注z外部PostScript对象包含任意可执行的Pos
25、tScript代码流,这会影响呈现效果的稳定性与可预测性。6.2.8 扩展的固形状态ExtGstate字典不应包含TR关键字,也不应包含取值为Default之外的TR2关键字。标准阅读器将忽略ExtGState字典中的盯关键字。RI关键字的使用应符合本部分6.2.9中的规则。6.2.9 呈现方式(Renderingintent) 呈现方式的取值必须是(PDF参考中定义的下列四种之-:RelativeColorimetric, AbsoluteColori metric, Perceptual或Saturationo注:默认的呈现方式是RelativeColorimetric.6.2. 10 内
26、容流内容流不应包含任何未在(PDF参考中定义的操作符,即使该操作符被BX/EX兼容符号括起来。ri操作符的使用应遵守6.2.9中的规则。注1:内容流被用作页面描述。例如,内容流可能被用于说明某个页面对象的内容或用于说明某外部表单对象Cform XObject)的内容,或是用于说明注释(包括表单域和Widget注释的外观流。注2:在早期版本的PDF格式中定义了一种Postscript操作符囚。(PDF参考中没有定义此操作符,所以本节将默认禁止使用此操作符。7 G/T 23286.1-2009/ISO 19005-1 :2005 6.3 字体6.3. 1 总则6.3.2-6.3.8的内容是为了保证
27、合格文件在将来的呈现过程中,其文本内容在字形上与原始文件的静态外观一致,并允许恢复文本内容中每个字符的的语意属性。6.3.2 字体类型合格文件中使用的所有字体应符合刊DF参考)5.5中的字体规范。本部分中,Type1的多种变形字体(MultipleMaster Fonts)应被认为是Type1字体的特例,所有适用于Type1的要求也应自动适用于Type1的多种变形字体。注:保证字体的一致应由作者来完成.本部分中将不规定字体以哪种方式保持一致,6.3.3 合成字体6.3.3. 1 总则在合格文件中所引用的任何合成(Type0)字体,其CIDFont和CMap字典列表中的CIDSystemInfo
28、项应保持一致(参见(PDF参考)5.6.2),即该字体在CIDSystemlnfo字典中的Registry和Ordering串应完全相同,除非CMap字典中的UserCMap关键字的取值是Identity-H或是Identity-V。6.3.3.2 CID字体对于所有的Type2 CIDFonts来说,CIDFont字典应包含CIDToGIDMap项,该项为从字符索引(CIDs)到字形编号或Identity的流映射。(参见(PDF参考表5.13)。6.3.3.3 CMaps 除了Identity-H和Identity-V之外,所有在合格文件中使用的CMaps,应按照(PDF参考6.5.4中描述
29、的那样被嵌入到文件中。对所有嵌入的CMaps而言,CMap字典中WMode项的整数值应和嵌入的CMap流中的WMode取值相同。6.3.4 嵌入式字体程序合格文件中使用的所有字体的字体程序都应嵌入该文件中(参见(PDF参考)5.的,除非专门用文本呈现模式3使用该字体。当某种宇形在如下任何一种关联中被引用时,我们就认为使用了对应的字体。一一某页对象的Contents流;一一某外部表单对象流;一一某注释的外观流含表单域); 一一某Type3字体宇形的内容流;一一某平铺模式流。只允许使用按本部分嵌入文件中并可作无限制的全局呈现的宇体。所有的符合标准的阅读器都应使用嵌入式字体进行呈现,而不应用其他的一
30、些局部驻留字体、替换字体或者仿真宇体。8 注1:如5.5.5中的建议方案规范化。6. 3. 8 Unicode字符映射本条内容只适用于A级一致性的文件,B级一致性不需考虑本条的限制。字体字典应包括ToUnicode项,其取值为一个CMap流对象,可将字符编码映射到其Unicode取值22(参见(PDF参考)5.的。对以下三种情况例外:一一使用了下列预定义的编码的字体:MacRomanEncoding、MacExpertEncoding、WinAnsiEncoding,或者使用了预定义的Identity-H或Identity-VCMaps字体。一-Type1字体,其字符名称来自于Adobe标准拉
31、丁字符集或者来自于符号字体中的命名字符集(参见(PDF参考附录D)。一一Type0字体,其子CIDFont使用了Adobe-GB1、Adobe-CNS1、Adobe-Japan1或Adobe-Korea 1 字符集。注:Unicode映射允许恢复文件中用到的每一个字符的语义信息。6.4 透明出现在ExtGState或者外部对象(XObject)字典里的SMask关键字的取值应为Noneo如果Group对象包含取值为透明(Transpareilcy)的S关键字,则外部表单对象(formXObject)不应包含此Group对象。如果ExtGState对象中出现了下列关键字,它们的取值应为:一一-B
32、MNormal或Compatible;一一-CA1. 0; 一一-ca1. 0 0 注:这些约定限制了透明在合格文件中的使用。要取得半透明的图形视觉效果可以采取8.4.5).显式地设置这些标志可以消除注释字典的设置和阅读器行为之间的任何不确定性。注释字典不能包含C阵列或IC阵列,除非在PDF/ A-l OutputIntent字典的DestOntputProfile中使用了RGB色域。参见6.2.2)注2:这些规定保证了在注释中由非外观流机制使用的设备色域是由PDF/ A-l Outputlntent间接定义了的。如果注释字典中包含了AP关键字,则由其定义的外观字典只能包含N关键字,其对应的取
33、值为定义了注释外观的流.注3:6.5.3中的规定适用于所有的注释类型,包括表单域的Widget类型.6.6 文挡操作6.6. 1 总则禁止使用Laoncb、Soond、Movie、ResetForm、ImportData和JavaScript等操作。另外,禁止使用s盼state和no-op操作。除了NextPage、PrevPage、FirstPage和LastPage之外的操作应被禁止。对四种被允许的操作,符合标准的交互式阅读器应按照(PDF参考表8.45来执行合理的操作。交互式表单域不能执行任何类型的操作。注1:本部分不讨论多媒体内容的支持。ResetForm操作将改变呈现出的表单的外观效
34、果.ImportData操作用于从外部文件导人表单数据.JavaScript操作允许使用任意的可执行代码,这些代码可能影响呈现的可靠性及可预测性.注2:对交互式表单域的附加需求在6.9节中说明.6.6.2 触发事件Widget注释字典或Field(域)字典不应包含附加操作字典的AA项。文档目录字典也不应包含附加操作字典的AA项。注:这些附加操作字典用于定义任意的JavaScript操作。显式地禁用AA项可以防止某些会产生外部关联的JavaScript操作,以避免文件的保存过于复杂.6.6.3 超文本链接符合标准的交互式阅读器可以选择使超链接失效,但是除了 Peter, Pa ul和Mary9.
35、3进行修改。注:xmp前缀的XML命名空间URI是(http:/ns.adobe.corn/xap/1. 0/); xmpMM前缀的命名空间URI是(http:/ns. adobe. corn/xap/1. O/rnrn/)。6.7.7 文件来源信息为了描述高级用户对合格文件的创建、转换或其他示例操作,每一项操作都要被记录在xmpMM:History属性中。对于每个操作的记录而言:一一要指定action、parameters以及when域;一一要指定softwareAgent域;一一不能指定instanceID域。注1:xmpMM前缀的XML命名空间URI是(http:/ns.adobe. c
36、orn/ xap/1. 0/ rnrn/) 注2:对有特定验证需求的软件应记录更多除了在XMP模式中预定义之外的类型的操作以及关于这些操作的更多细节.举例来说,这些其他类型的操作包括改变文裆外观的操作、降低象素或替换字体等.关于操作的更多细节包括操作者的身份识别和操作环境的信息。如果是从原始形式为纸质文档、缩微摄像生成的,或其他电子文档转换而来的合格文件,xmpMM:History应记录下所有的高级操作过程(例如,从PDF1.4转到PDF/A-l),如对文件内容和功能的修改(例如,原先嵌入的JavaScript代码和音频没被保存下来)、对一些已存在的元数据的处理(例如,文档信GB/T 2328
37、6.1-2009/ISO 19005-1 :2005 息字典的所有值转换为XMP)以及其他转换过程中的重要方面。对于所有的合格文件,不管是直接创建还是从其它类型的文档(例如纸质文档、缩微胶片或其他电子格式转换而来,xmpMM:History中都应记录下随后的高级工作流程的操作过程(例如,操作和传递的描述),如对文件管理政策的引用(例如,文件收集、处理和使用遵循的官方条例的名称)、所用软件工具的名称和版本以及其他任何涉及到文件的创建和使用相关的信息。如果在文件的生命周期中,XMP元数据属性被改变了或删除了,则xmpMM:History应记录这些变化,通过在对应项的parameters域中保存属性
38、的名称和原来的取值。这一推荐操作适用于除xmpMM: History自身之外所有的元数据属性。如果某元数据属性被删除了,其在xmpMM:History中对应项的action域应设为pdfa:deleted。6.7.8 扩展模式应将合格文件中用到的所有扩展模式的描述嵌入到该文件的元数据流中(参见6.7.2)。这些描述应用本条标准中定义的PDF/A扩展模式的容器模式来实现。注:扩展模式指的是9.7中的所有关于标记性PDF的要求。注2标记性PDF定义了用于显式声明和描述文档内容逻辑结构信息的方法。6.8.2.2 标记信息字典文档目录字典应包含Marklnfo字典,其唯一的项Marked应取值为tru
39、e.注2这一设置说明文件符合标记住PDF规定.6.8.3 人为附加信息(Artifacts)6.8.3. 1 总则分页特征,例如页头、页码,装饰布局特征如脚注、背景,制作辅助信息如分割符和影条等。这些信息应按照(PDF参考)9.7.2规定为分页、布局以及页面辅助信息。6.8.3.2 词的分割通常采用空格进行词的分割,其语言和脚本系统还应遵守如下的限制:在可显示的字符串中,在单个词之间应用一个或多个空格符进行显式的标识。如果某词的结尾正好在整个字符串的结尾处,则应在该词之后插入一个或多个空格符。应注意到一个词有可能跨越两个或多个显示字符串,只有一个或多个空格符才是分词的标志,所以显示字符串的边界
40、未必是词的边界。对于分词而言,一个空格和两个或多个空格的作用相同。6.8.3.3 结构层组合格文件的逻辑结构是以文档目录宇典中的StructTreeRoot项为根的层级结构。(参见9.8.1)。如果以Unicode编码的文本宇符串采用了非默认自然语言,或是内部结构元素或标记内容序列定义的非自然语言,则应使用转义序列来标记其使用的语言(参见(PDF参考)3.8. 1)。注:区分生疏的外文词汇和已成为当前语言常用语的外文词汇是一件困难的事情,所以本条的要求是为了消除这一文本内容语意的不明确性。6.8.5 替代描述如果结构元素的内容包含图像、公式等非文本内容且这些内容没有相应的自然预定义的文本,则应
41、通过结构元素字典中的Alt键来提供一个替代的文本描述,如(PDF参考9.8.2所述。注z替代描述为表义不清的非文本内容提供了清晰的文本描述.6.8.6 非文本注释对于不显式文本的注释类型,注释字典的Contents关键字应按照符合人的阅读习惯的形式来规定注释内容的替换描述。6.8.7 替换文本所有未采用标准模式显示的文本结构元素,如自定义字符或者内联图形,应该提供替换的文本,并保存在结构元素字典的ActualText项中(参见(PDF参考)9.8.3)。注:替换文本能提供文本等价物有助于对表义不清的文本元素的理解。6.8.8 缩写扩展文本内容中的所有缩写都应保存在一个用Span标记的内容序列中
42、,其E属性提供了缩写的文本扩展(参见(PDF参考9.8.的。注:缩写扩展能提供文本等价物,有助于对表义不清的术语的理解。6.9 交互式表单本条的目的是保证表单域的呈现没有不明确之处。任何时候标准阅读器都不应通过使用表单域来改变页面的呈现效果或文件内容,Widget注释字典或域字典中不应包含A或AA关键字。交互式表单字典的NeedAppearance标记的取值为false,或者为不可见。每个表单域都应有一个与域数据对应的外观字典,标准阅读器应按照此外观字典而不是表单数据来呈现域。注:外观字典的要求保证了表单呈现的可靠性.16 GB/T 23286.1-2009/ISO 19005-1 :2005
43、 附录A资料性附录)PDF/A-1一致性总结A.1 总则A.l到A.3的内容为快速了解PDF/A-l的要求中与(PDF参考中的不同之处提供了方便,但是这并不意味着它是一个PDF/A-l有关要求的详尽的列表。标准的PDF/A-l声明是第二章到第六章的内容。如果本附录中的内容和前面的正文有冲突的话,以正文为准。为了PDF/A-l的一致性,表A.l和表A.2中列出了PDF1.4的操作符、对象以及这些对象在本部分和(PDF参考中的要求不一致的关键字。表格中说明了操作符、对象和关键字的状态,以及正文中定义这些状态的位置。下面是所用到的状态取值z一一必要的CRequired)该操作符、对象或关键字必须出现
44、在合格文件中。一一禁止的CProhibited)该操作符、对象或关键字被禁止出现在合格文件中。一一限制的CRestricted)该操作符、对象或关键字可以出现在合格文件中,但是其使用、内容或取值要遵守某些特定的限制。一一推荐的CRecornrnended)该操作符、对象或关键字可以出现在合格文件中。一一忽略的CIgnored)该操作符、对象或关键字可以出现在合格文件中,但是将被标准阅读器忽略。如果表中列出了某个PDF字典对象,但是其关键字没有出现在表中,则该对象中的所有关键字以及这些关键字的派生宇(如果有的话)都应继承该字典对象在表中的状态。A对象是B对象的派生对象,当下列任何一条成立时则称B
45、对象是A对象的原始对象z一-A对象是B对象中某关键字的取值;一一B是一个阵列,而A是其中的一个元素;一-A是B的派生的派生。A.2 操作符a合格文件中可以使用任何(PDF参考中定义的用于Contents流的操作符。表A.1中是这些操作符的状态。表A.1操作符状态操作符状态所在条款cs 限制的6.2.3 cs 限制的6.2.3 K 限制的6.2.3 k 限制的6.2.3 RG 限制的6.2.3 咆限制的6.2.3 d 限制的6.2.9 未在(PDF参考中定义的操作符禁止的6.2.10 A.3 对象和关键字合格文件中可以使用任何(PDF参考中定义的对象和关键字。这些对象和关键字的状态见表人20一些
46、关键字的状态取决于相关的特定的键一值对。这种情况下,在关键字之后都列出了相关的取值。17 G/T 23286.1-2009/ISO 19005-1 :2005 表A.2对象和关键字状态对象关键字(及取值状态所在条款AcroForm Need Appearances 限制的6.9 NNOP 禁止的6.6.1 S Named 限制的6.6.1 S ImportData S JavaScript Action S Launch S Movie 禁止的6.6.1 S ResetForm S SetState S Sound AA 禁止的6.6.2 CA 限制的6.5.3 Contents 推荐的(针对
47、非文本注释的6.8.6 Annot A级一致性)Subtype FileAttachment Subtype Sound 禁止的6.5.2 Subtype Movie 人为附加信息属性列表字典推荐的(针对A级一致性6.8.3 AA 禁止的6.6.2 Lang 推荐的(针对A级一致性)6.8.4 Metadata 必须的6.7.2 Catalog Names 限制的6. 1. 11 OCProperties 禁止的6. 1. 13 OutputIntents 限制的6.2.2 Struct T reeRoot 推荐的(针对A级一致性6.8.3.3 CIDSystemlnfo 限制的6.3.3.1
48、 CMap WMode 限制的6.3.3.3 BM 限制的6.4 CA 限制的6.4 Ca 限制的6.4 ExtGstate HT 忽略的6.2.8 SMask 限制的6.4 TR 禁止的6.2.8 TR2 限制的6.2.8 Field dictionary AA 禁止的6.6.2 Filespec EF 禁止的6. 1. 11 Filters LZWDecode 禁止的6. 1. 10 18 GB/T 23286.1-2009/ISO 19005-1 :2005 表A.2(续)对象关键字(及取值状态所在条款FontDescriptor 必须的(Type3除外6.3.4 ToUnicode 必
49、须的气针对A级一致性)6.3.8 Font Type 限制的6.3.2 Widths 忽略的6.3.6 Font (Subtype CIDFontTypeO或CIDFont白CIDSystemlnfo 限制的6.3.3.1 Type2) Font (Subtype CIDtoGIDMap 限制的6.3.3.2 CIDFontType2) Font (Subtype Encoding 禁止的(针对符号字体)6.3.7 TrueType) 限制的针对非符号字体)字体文件流Metadata 推荐的6.7.10 CharSet 必须的6.3.5 CIDSet 必须的(针对CIDFont)6.3.5 FontDescriptor FontFile或