1、中华人民共和国国家标准信息处理文本与办公系统办公文件体系结构和交换格式第一部分引言和总则发布实施国家技术监督局发布中华人民共和国国家标准信息处理文本与办公系统办公文件体系结构和交换格式第一部分引言和总则国家技术监督局批准实施本标准等同采用国际标准信息处理文本与办公系统办公文件体系结构和交换格式第部分引言和总则主题内容与适用范围系列标准以下简称本系列标准的目的是便于文件的交换在本系列标准中文件被认为是一些项诸如备忘录信件发票表格和报告其中可包括图片和表格材料文件中使用的内容元素可以是图形字符几何图形元素和光栅图形元素一个文件可能包括所有这些元素注本系列标准被设计成允许扩充的以便在其中包括印刷特性
2、颜色报表及其他诸如声音等内容类型本系列标准适用于以数据通信手段或者交换存储媒体手段实现的文件交换本系列标准的文件交换可以达到以下两个目的允许按始发者的意图进行显现允许进行诸如编辑和重新格式化的处理交换中文件的复合可以有几种形式允许显现文件的格式化形式允许处理文件的可处理形式允许显现和处理的格式化可处理形式本系列标准还规定了用于处理被交换文件的信息结构的交换此外本系列标准还允许交换包含一种或多种不同类型内容的文件诸如字符文本图像图形和声音本系列标准的这一部分主要内容如下介绍整个本系列标准给出各部分标准所需的引用标准定义本系列标准中所用的术语提出文件体系结构的概念给出各部分的综述描述各部分的相互关
3、系定义了与本系列标准的一致性给出定义文件应用轮廓的规则引用标准下列标准所包含的条文通过在本标准中引用而构成为本标准的条文本标准出版时所示版本均为有效所有标准都会被修订使用本标准的各方应探讨使用下列标准最新版本的可能性各单位应注意收集有关标准的最新版本信息处理文本与办公系统办公文件体系结构和交换格式第二部分文件结构信息处理文本与办公系统办公文件体系结构和交换格式第四部分文件轮廓信息处理文本与办公系统办公文件体系结构和交换格式第五部分办公文件交换格式信息处理文本与办公系统办公文件体系结构和交换格式第六部分字符内容体系结构信息处理文本与办公系统办公文件体系结构和交换格式第七部分光栅图形内容体系结构信
4、息处理文本与办公系统办公文件体系结构和交换格式第八部分几何图形内容体系结构信息处理系统计算机图形存储和传送图片描述信息的元文卷第一部分功能描述信息处理系统开放系统互连抽象语法记法一规范信息处理文本与办公系统标准通用置标语言信息处理支持设施文件交换格式信息处理系统计算机图形存储和传送图片描述信息的元文卷第三部分二进制编码定义下列定义适用于本系列标准动作位置实现下一个字符所规定的动作的点环绕对齐一种制表对齐它对特定字符串的字符图像序列进行定位使得那个字符串内特定字符组的第一个字符图像的定位点被定位在制表停止处宽高比像素阵列在像素走向方向上的大小与其在行前进方向上的大小之比确保再生区标称页面上减去允
5、许的边缘损失后的矩形区属性文件组元的元素它具有一个名字和一个值它表示这个组元的特性或者表示这个组元与一个或多个其他组元的关系可用区由文件布局过程确定的区域内容布局过程将内容部分格式化到该区域中基本成分基本逻辑或布局客体或者可派生出基本逻辑或布局客体的客体类基本布局客体特定布局结构中没有下级的客体基本逻辑客体特定逻辑结构中没有下级的客体基本测量单位等于的的线性测量单位注可以用局部定义的比例因子将文件映射到特定成像装置基本值在给定文件应用轮廓的上下文中进行文件交换时无条件允许的属性值控制功能参数值或任何其他能力值联编由标识符和值组成的对其中值可以是任何类型可以由表达式来确定并可通过使用联编标识符来
6、访问块在帧或页内对应于一矩形区的基本布局成分下边缘基本布局客体在行前进方向上的定位区边缘左下角布局客体在水平方向上前进最少垂直方向上前进最多的角右下角布局客体在水平方向和垂直方向上前进都最多的角居中布局或成像过程的结果它对一行字符图像序列进行定位使得从行原点位置到第一个字符图像定位点的距离大致等于从最后一个字符图像转移点到定位区结尾边缘的距离一种制表对齐它对一特定字符串的字符图像序列进行定位使得第一个字符图像定位点到制表停止处的距离大致等于从制表停止处到最后一个字符图像转移点的距离注术语居中也用于属性定位的参数对齐和属性块对齐字符用于组织控制和显现信息的元素集合中的一个元素字符基线当字符图像处
7、于正视取向时在水平方向上穿过该字符图像的直线字符图像在显现媒体上为人所能感知的字符呈现字符取向与字符走向相关的字符基线的方向字符走向在一行框内连续字符图像的前进方向字符序列要显现为一行或多行的一系列字符字符间距仅适用于固定间距的字型当字符间隙等于零时连续字符图像的定位点间的距离剪取像素阵列考虑了所有剪取参数以后所成像的实际像素阵列完全生成符集由文件根客体类描述和至少一级的下级客体类描述组成的文件组元这些描述用来控制建立和或修改表示对应的特定结构的客体描述集成分客体或客体类复合成分复合逻辑或布局客体或者派生复合逻辑或布局客体的客体类复合布局客体布局结构中有一个或多个下级客体的客体复合逻辑客体逻辑
8、结构中有一个或多个下级客体的客体固定间距一种字型特性对所有字符图像其定位点到转移点之间的距离都相同组元具有下列类型之一的属性集文件轮廓客体描述客体类描述显现式样布局式样或内容部分描述内容除了结构信息之外的由文件运送并为人所能感知的信息内容体系结构用一组内容元素属性和控制功能来定义基本成分内容的内部结构和表示的规则以及内容显现的准则内容体系结构类用为每类内容元素定义的一组形式之一来定义基本成分内容的内部结构和表示的规则注对字符内容元素而言内容体系结构类的例子有格式化形式可处理形式和格式化可处理形式内容体系结构级属于内容体系结构类的一个已标识特征子集内容编辑过程建立新内容或修改先前内容的过程内容元
9、素文件内容的基本元素内容布局过程与文件布局过程相互作用的过程它包含将内容部分格式化到可用区以及根据显现式样中所含信息确定块大小内容部分根据其逻辑和或布局结构划分文件内容的结果内容部分描述表示内容部分的文件组元它由内容信息和规定其内容信息性能的属性组成内容类型内容元素的分类如图形字符光栅图形元素和几何图形元素控制功能字符集的元素它影响数据的记录处理传输或解释其编码表示由一个或多个位组组成注控制功能的例子字符内容体系结构中的选择图形呈现几何图形内容体系结构中的设置线条类型现行布局位置在出现每一种布局流的布局过程中维持的最低级别帧的标识数据结构表示全部或部分组元数据项集合及数据项之间的关系注构成数据
10、结构的数据项表示文件属性文件轮廓成分式样或相关的内容部分描述对应于结构元素的组元描述符表示文件轮廓客体类描述布局式样显现式样或客体描述的数据结构文件为人感知的结构化信息量它可以作为一个单元在用户和或系统之间交换文件应用轮廓本系列标准中定义的特征组合的规范以形成满足应用需求的子集文件体系结构根据一组成分和内容部分来定义文件结构根据组元和属性来定义文件表示的规则由一个或多个下列结构组成的文件结构信息特定逻辑结构特定布局结构类属逻辑结构和或类属布局结构文件体系结构类以格式化形式可处理形式或格式化可处理形式来定义文件结构和文件表示的规则文件体系结构级属于文件体系结构类的已标识特征子集文件主体文件的一部
11、分它可以包括类属逻辑和布局结构特定逻辑和布局结构布局和显现式样但不包括文件轮廓文件类逻辑客体类描述布局客体类描述类属内容部分描述式样和文件轮廓的集合规定为具有共同特性的文件集文件类描述文件类的规范文件布局过程根据类属布局结构和包含在特定逻辑结构类属逻辑结构和布局式样中的信息来建立特定布局结构的过程文件布局根特定布局结构层次中的最高级复合客体文件逻辑根特定逻辑结构层次中的最高级复合客体文件轮廓规定整个文件特性的属性集文件轮廓级属于文件轮廓的已标识特征子集编辑过程文件处理阶段它由内容编辑过程和逻辑结构编辑过程组成结尾对齐布局或成像过程的结果它对一行字符图像序列进行定位使得最后一个字符图像的转移点定
12、位在定位区的结尾边缘处一种制表对齐它对一特定字符串的字符图像序列进行定位使得最后一个字符图像的转移点定位在制表停止处结尾边缘基本布局客体的定位区在字符走向方向上的边缘转移点与某一字符图像相关的用于下一字符图像定位的参考点外部文件类由不包含类属结构的被交换文件的文件轮廓所引用的一种文件类因子集一个或多个客体类描述用来分解表示特定结构的客体描述的各属性归档为了便于文件检索按规定的方法存储文件字型通常具有共同设计和大小的字符图像集合字型大小字型中字符图像的高度格式化形式文件的一种表示形式它允许按始发者的意图对文件进行显现但它不支持编辑和重新格式化格式化可处理形式文件的一种表示形式它允许按始发者的意图
13、对文件进行显现并支持编辑和重新格式化格式化执行确定文件布局的操作帧一种复合布局成分类型它对应于页内或另一帧内的矩形区类属内容部分与客体类相关的内容部分类属内容部分描述与客体类描述相关的内容部分描述类属文件旨在用于交换文件处理的类属结构所需的结构化信息量以及可选用的相关式样和内容部分类属布局结构布局客体类和相关的类属内容部分的集合类属逻辑结构逻辑客体类和相关类属内容部分的集合几何图形元素以几何图形方法来描述图像的图形元素注几何图形元素包括描述图原几何形状的元素如点弧直线图形字符用于表示信息的图形符号集合中的一员注图形字符包括简单的字母数字字符如带音调的字母和图示字符如镶嵌字符图形元素具有可视表示
14、的内容元素注本系列标准将图形元素分为三类图形字符几何图形元素和光栅图形元素硬行终止符重新格式化过程不能消去的行终止符布局客体的水平方向布局客体中的方向相对于此方向内容体系结构可以定义用页水平轴确定的属性成像次序某布局客体的直接下级布局客体成像的优先次序成像过程利用文件轮廓特定的和类属布局结构显现式样和内容部分在显现媒体上以人可感知的形式产生文件的过程缩进布局或成像过程的结果使一行字符图像序列在字符走向方向上从离开行原点位置一定距离处开始初始点与基本布局客体相关的点该基本布局客体内成像的所有行框都相对于此点定位见与基本布局客体相关的点该基本布局客体内成像的所有像素都相对于此点定位见交换将文件从始
15、发系统传送到接收系统的过程交换数据元素表示文件组元的数据结构交换格式用于交换的文件的表示规则交换格式类适用于某一特定应用的交换格式的形式注本系列标准中定义的类由交换数据元素的排列次序或者由其编码进行区别字符间隙在相邻字符图像间的附加间距量相交两个或多个布局客体在显现媒体上部分或全部重叠的公共区项标识符在内容部分第一行字符之前的字符串用来标识随后的文本齐行布局或成像过程的结果改变间隔字符和或字符间隙的宽度从而产生同时具有起始对齐和结尾对齐形式的文本显现出界超出其定位点或转移点的字符部分布局分类基本逻辑客体与最低级别帧的联系以使这些基本逻辑客体的内容放置到合适的帧内布局客体文件的特定布局结构元素例
16、如页块布局客体类可派生出一组有共同特征的布局客体的类属布局结构的元素例如具有共同头标和脚注的页布局过程文件处理的一个阶段由文件布局过程和内容布局过程组成注这也称为格式化布局流属于同一布局分类的基本逻辑客体集布局结构基于显现将文件内容划分并且再细划分成更小部分的结果如划分成页块形成文件布局层次的所有布局客体和相关的内容部分布局式样源于逻辑成分的文件组元用来指导建立特定布局结构先导边缘帧或块的边缘该边缘与布局走向的方向垂直它是从该帧或块的外部在布局走向的相反方向上首先遇到的边缘左边缘帧或块的边缘该边缘与布局走向的方向平行它是从该帧或块的外部在与布局走向逆时针成的方向上首先遇到的边缘行框其内有一字符
17、图像序列的矩形区域行原点位置行框内用于定位该行框的点行前进基本布局客体内连续行框的前进方向见基本布局客体内连续像素行的前进方向见行间距基本布局客体内相邻两参考线间的距离见基本布局客体内相邻两行像素间的距离见行终止符指示行结束或字符序列结束的控制功能或控制功能组合逻辑客体文件的特定逻辑结构的元素它对应用或用户可能有意义如章条段逻辑客体类可派生出一组具有共同特性的逻辑客体的类属逻辑结构元素如用共同内部结构来表示各条的复合逻辑客体逻辑结构按照人能感知的内容意义将文件内容划分并且再细划分成更小部分的结果如划分成章条段表示文件逻辑层次的所有逻辑客体和相关的内容部分逻辑结构编辑过程建立新的特定逻辑结构或修
18、改先前的特定逻辑结构并将内容分配或重新分配给基本逻辑客体的过程必备属性当应用于某一组元时在该组元内必须明确规定的属性标称页由文件的发送方设定的具有理想显现表面大小的矩形区注给出了理想大小的例子非基本的属性值控制功能参数值和其他能力的限定符仅当在文件轮廓中已声明了这些值或能力时文件交换时才允许它们在给定的文件应用轮廓上下文中出现非必备属性当应用于某一组元时不必显式规定的属性如果在给定的组元内不显式规定该属性则不应用该属性客体特定布局结构或特定逻辑结构的元素客体类可派生出具有共同特性的客体的类属结构的元素客体类描述规定客体类性能的属性集性能中包括该客体类与其他成分的关系如果有的话客体描述规定客体性
19、能的属性集性能中包括该客体与其他成分的关系如果有的话客体类型每个成分的性能该性能规定应用该成分的描述中允许出现哪些属性并指出该成分在文件体系结构中的作用办公文件语言标准通用置标语言的一种应用用于表示符合本系列标准的文件孤行与后续正文相关的且由页边界或列边界隔开的一行或多行正文伸出布局或成像过程的结果从距离行原点位置逆着字符走向的某一距离处开始定位一行字符图像序列页对应于用来显现文件内容的矩形区的布局成分页坐标系统一种正交坐标系统坐标原点位于页的左上角其横坐标和纵坐标分别与页的上边缘和左边缘相重合页集表示若干页或若干页集的集合的复合布局成分双字符紧排两相邻字符图像之间的距离取决于这两个字符组合在
20、一起时的情况而不是它们单独出现时的情况并行注释两个相继并行显现的字符串第二个字符串用来指明第一个字符串的发音或解释部分生成符集层次相关的客体类描述组成的集合这些客体类描述用来指导建立层次相关的对应客体描述但没有完整地规定所有可能建立的特定结构像素阵列用来表示图示图像的二维像素阵列像素走向基本布局客体内一行连续像素的前进方向像素间距基本布局客体内一行中任何两个连续像素间的距离图片元素像素在图片中可以各自寻址的最小图形元素光栅图形元素的替换术语定位区基本布局客体内的矩形区所有字符图像的定位点和转移点都位于该区内定位点与字符图像放置相关的点即字符根据定位点在动作位置上成像显现以可为人感知的形式来呈现
21、文件的操作显现媒体可为人感知的形式的信息载体显现式样源于基本逻辑或布局成分的文件组元它指导文件内容的格式和外观表现显现表面二维显现媒体如纸胶片视频显示屏幕在其上可以将格式化形式的文件显示给人看可处理形式允许进行编辑和格式化的文件表示形式处理对文件进行操作包括编辑重新格式化显现归档和检索光栅图形元素图片元素像素的另一种叫法参考区基本布局客体内的矩形区它的各边长等于像素间距和行间距像素的主要部分在该区内成像参考线经过行原点并与字符走向平行的线参考点位于与像素走向和行前进方向反向的参考区角上的点它用来定位像素重新格式化执行确定先前已格式化了的文件的新布局的操作关心域虚拟坐标空间中的矩形区它的边与坐标
22、系统的轴平行并包围了所要成像的部分几何图形资源文件含有一个或多个客体类描述的类属文件这些客体类描述可以被另一个文件的一个或多个客体类描述所引用检索先前已归档信息的重新获得右边缘帧或块的边缘该边缘与布局走向的方向平行它是从该帧或块的外部在与布局走向逆时针成的方向上首先遇到的边缘比例测量单位用于在显现表面上对布局客体和内容元素测定位置和测定大小的线性测量单位其值等于基本测量单位乘以单位比例相继布局次序在没有规定成像次序时多个布局客体成像的相继次序相继逻辑次序布局过程处理多个逻辑客体的相继次序相继次序在一结构内对客体排序的约定使得每个客体的所有直接下级排在该客体之后该客体的具有相同直接上级的任何其他
23、客体之前即有序树遍历软行终止符在后续的布局过程中允许消去重新定位或替代的行终止符间距比率行间距和像素间距的比率特定布局结构布局客体和相关内容部分的集合特定逻辑结构逻辑客体和相关内容部分的集合起始对齐布局或成像过程的结果它对一行字符图像序列进行定位使得该序列第一个字符图像的定位点定位在行原点位置或者定位在由第一个行缩进或行伸出如果有的话规定的点上一种制表对齐它对一特定字符串的字符图像序列进行定位使得该序列的第一个字符图像的定位点定位在制表停止处起始边缘基本布局客体的定位区在字符走向的相反方向上的边缘结构元素文件的结构元素为内容部分客体和客体类制表对齐一种布局或成像过程它将一特定字符串的字符图像序
24、列按照特定方法起始对齐结尾对齐居中或环绕对齐沿参考线定位在特定点制表停止上制表停止一个参考线上的位置它被用于制表对齐的特定方法起始对齐结尾对齐居中或环绕对齐文本单元表示内容部分描述的数据结构上边缘基本布局客体定位区在行前进相反方向上的边缘左上角布局客体在水平方向和垂直方向上都前进得最少的角右上角布局客体在水平方向上前进得最多在垂直方向上前进得最少的角后边缘帧或块的边缘该边缘与布局走向的方向垂直它是从该帧或块的外部在布局走向的方向上首先遇到的边缘单位比例比例因子整数或分数应用于基本测量单位从而导出比例测量单位可变间距字型的特性不同字符图像的定位点和转移点之间的距离可以不同寡行与前面正文相关的而被
25、页边界或列边界将其与前面正文隔开的一行或多行正文约定下列约定用于本系列标准属性名引用属性名是通过在双引号内给出属性名并且在其前加上属性这个词例如属性下级表示这个属性在某些情况下用术语来描述与属性具有相同名称的概念在引用这种概念时既不使用属性这个词也不使用引号属性值名引用属性值名是通过在单引号标记内给出属性值名例如第二个参数允许发送方通过规定值或来选择或方式的页显现成分和成分描述成分这一术语可以与限定性术语一起使用包括基本的复合的页集页帧块逻辑和布局例如含有块的布局成分意指含有块的布局客体或含有块的布局客体类帧成分意指帧类型客体或派生帧类型客体的类术语成分描述可以用同样的方法来限定术语的引用可用
26、下划线重点标出文本中出现的术语定义这些术语已在第章中定义的一般概念的目的文件体系结构的目的是在下述意义上使文件易于交换包括正文图像图形和声音在内的不同的内容类型可以在同一文件中共存可以最有效地传送文件始发者的关于编辑格式化和显现的意图本章使用了许多第章中给出定义的术语然而为了本章的目的下面给出了一些不同但又兼容的基本术语定义交换是通过数据通信或交换存储媒体的手段把文件提交给接受人或接收装置的过程编辑是执行与建立及修正文件结构和或文件内容有关的操作格式化是执行确定文件布局即确定其内容在显现媒体上的外部形式的操作显现是以可为人感知的形式来呈现文件内容的操作典型的显现媒体有纸和视频屏幕文件体系结构以
27、三种形式规定了文件的表示格式化形式它允许按始发者意图对文件进行显现可处理形式它允许对文件进行编辑和格式化格式化可处理形式它允许对文件进行显现编辑和重新格式化格式化形式的常用替换术语是最终形式和图像形式可处理形式的常用替换术语是可修改形式这些形式中的任何一种都允许始发者表达交换文件的结构化和或格式化意图的总体概念的概念基于存在文件的布局观念和逻辑观念物理观念如页的集合和文件的抽象成分观念如句子的组合存在特定结构和类属结构特定文件结构是用户可读的结构类属结构是指导文件建立的样板可以重复使用这个样板来修正文件存在文件类文件类是某一分类文件共同具有的类属特征的集合如销售报告单逻辑结构和布局结构文件体系
28、结构的关键概念是结构的概念文件结构就是将文件内容划分并反复地再细划分成更小部分这些部分称为客体结构具有树形式文件体系结构允许两种结构应用于文件逻辑结构和布局结构一给定文件可以同时应用这两种结构或其中任何一种在逻辑结构中文件是根据含义进行划分和再细划分的逻辑客体的例子是章条图和段在布局结构中文件是根据布局进行划分和再细划分的布局客体的例子是页和块图给出了一个称为报告的文件的逻辑观念例子图文件逻辑观念的例子逻辑结构和布局结构提供了同一文件不同的但互补的观念例如一本书可以认为是由含图和段的章组成的也可以认为是由含有正文块和或图形块的页组成的不能再细划分成更小客体的客体被称为基本客体所有其他的客体称为
29、复合客体在文件体系结构中定义了下述类型的版面客体块对应于显现媒体上的一个矩形区含有一部分文件内容的基本布局客体帧对应于显现媒体上的一个矩形区并含有一个或多个帧或者一个或多个块的复合布局客体页对应于显现媒体上的一个矩形区的基本或复合布局客体如果是复合布局客体则含有一个或多个帧或者一个或多个块页集一个或多个页集和或若干页构成的集合文件布局根特定布局结构层次中最高级别的客体对于逻辑客体文件体系结构中只定义了基本逻辑客体复合逻辑客体和文件逻辑根没有其他分类诸如章条和段等逻辑客体分类依赖于应用并可用客体类机制来定义它们见条内容部分文件内容的基本元素称为内容元素对于由字符文本组成的内容内容元素为字符对于图
30、像或图形内容元素为图片元素也叫像素或几何图形元素线弧多边形等等当某一文件既有逻辑结构又有布局结构时一般来说每一内容元素确切地属于一个基本逻辑客体和一个基本布局客体属于一个基本逻辑客体如果该文件有逻辑结构和一个基本布局客体如果该文件有布局结构的相关内容元素的集合被称为内容部分由此可知基本逻辑客体与一个或多个内容部分有关联基本布局客体与一个或多个内容部分有关联任何一个逻辑或布局客体基本或复合与整数个内容部分有关联一般情况下逻辑客体与布局客体之间没有一一对应关系图说明了最后一点图逻辑客体和布局客体间可能的对应关系内容体系结构与基本逻辑客体或基本布局客体相关的内容部分可能具有更详细的内部结构规定内部结
31、构的规则取决于内容的类型并称为内容体系结构只能根据一种内容体系结构来构成基本逻辑客体或基本布局客体的内容和分别包含了字符光栅图形和几何图形内容体系结构的定义属性属性是文件的性能或是文件组元即逻辑客体布局客体逻辑客体类布局客体类式样或内容部分的性能它表示文件或文件有关成分的特性或者与一个或多个文件或文件成分之间的关系与整个文件相关的属性集被称为文件轮廓它表示关于文件的引用信息也可以重复文件内容信息例如标题和作者的姓名应用于逻辑客体或布局客体的属性集取决于客体的类型对于基本逻辑客体复合逻辑客体文件逻辑根块帧页页集和文件布局根定义了不同的属性集这些称为文件体系结构属性文件体系结构属性不依赖于应用它们
32、的客体的内容类型文件体系结构属性的例子有属性客体标识符所有客体属性下级复合客体布局指示诸如属性不可分性属性位移属性分隔属性定位块和帧属性定尺寸块帧和页除了文件体系结构属性外还有一显现属性集应用于基本逻辑客体和基本布局客体应用于一给定基本客体的显现属性集取决于规定该客体内容的内容体系结构对于每一种内容体系结构定义了不同的显现属性集显现属性的例子有属性字符间距字符内容体系结构属性剪取光栅图形内容体系结构属性行呈现几何图形内容体系结构显现属性可以汇集成显现式样逻辑和布局客体可以引用它们应用于内容部分的属性包括内容部分标识符和一组编码属性它们的复合取决于内容所用的编码方法例如用于传真编码光栅图形图像的
33、属性每行像素数逻辑结构和布局结构间的关系原则上逻辑结构和布局结构是相互独立的文件的逻辑结构由作者决定并在编辑过程中嵌入文件中布局结构通常由格式化过程决定与逻辑结构相关的称为布局指示的属性可以控制格式化过程布局指示的例子有要求从新的一页开始一章要求将条的标题和其第一段的前两行显现在同一页上项目列表的缩进量布局指示可以汇集成布局式样每一布局式样可被一个或多个逻辑客体所引用特定结构和类属结构在一个文件中逻辑客体和或布局客体常可以被分类成相似客体组因此引入了客体类概念相似性可能与逻辑特征有关诸如章条或段的层次还可能与布局特征有关诸如大小或式样或者与内容有关诸如页头标和尾标甚至整个文件可以是相似文件组中
34、的一个成员如信件备忘录或报告客体类或文件类是其成员共同性能集的规范这样的规范由确定旨在规定共同性能属性值的一组规则组成这些规则可用来控制组成类的客体或文件之间的一致性并易于在该类内建立附加的客体或文件与文件相关的逻辑客体类和布局客体类的集合及它们之间的关系被称为类属逻辑结构和类属布局结构给定文件所特有的结构叫作特定逻辑结构和特定布局结构文件类由类属逻辑结构和类属布局结构来描述类属逻辑结构表示应用于有关文件类的所有可能的特定逻辑结构集类属布局结构表示应用于有关文件类的所有可能的特定布局结构集类属逻辑结构可以被用作在编辑过程中派生出特定逻辑客体和结构的一组规则类属布局结构可以被用作在格式化过程中派
35、生出特定布局客体和结构的一组规则图给出了类属布局结构的例子本例显示了具有一个头标帧一个尾标帧和两列主体正文帧的页布局图页布局的例子文件轮廓文件轮廓由与整个文件相关的属性集组成除了便于文件存储和检索的诸如标题日期和作者姓名等引用信息外为了使接收者便于确定处理或成像文件所需具备的能力文件轮廓还包含文件中使用的文件体系结构特征的概要表示后一种类型信息的属性被称为文件特性它们包括文件形式格式化可处理或格式化可处理的规范文件中使用的内容体系结构的规范文件中使用的字符集字符字型字符式样字符取向和重点类型的规范文件轮廓可单独交换类属文件由文件轮廓和类属结构组成的类属文件可用来协助处理交换文件类属文件也可以被
36、交换文件处理模型与文件处理的关系本系列标准所涉及的是允许对交换文件进行处理的文件体系结构的定义所提供的文件处理模型作为规定本系列标准描述的处理范围的基础本条概括了文件处理的基本模型见图该模型既不表示实际的实现也不在任何方面限制可应用于交换文件的处理从概念上讲一个文件可以被认为是经过了图所示的三个处理阶段处理次序并不意味着在实际实现中的执行顺序图基本文件处理模型编辑过程文件编辑过程所涉及的是建立新文件或修改先前的文件文件体系结构提供了用于表示从这个过程产生的文件和影响这个过程的控制信息的数据结构虽然文件的建立和修改在所执行的功能和所遵循的规程方面有所不同但从模型的角度来看可认为它们是等同的因为两
37、者的结果是相同的一个新文件一旦编辑完成产生的文件可被交换这种文件被认为是以可处理形式交换的它适于输入到编辑或者布局过程布局过程文件布局过程所涉及的是文件内容面向页的组织结构即布局的定义这种过程可按两种方式操作布局过程可以生成不能修改的文件它只适于输入到成像过程这种文件被认为是格式化形式的这个过程也可以生成可进一步处理如果需要的格式化可处理形式的文件它适于输入到成像布局或编辑过程中的任何一种文件体系结构提供了用于表示两种形式的格式化文件和影响布局过程的控制信息的数据结构成像过程文件成像过程所涉及的是用可为人感知的形式来显现文件图像例如显现在纸上或屏幕上按照本系列标准交换的文件可以含有与成像过程有
38、关的信息该成像过程允许文件按其始发者的要求成像本系列标准不定义成像过程成像过程被认为是局部定义的过程它取决于所使用的显现装置还可能有其他形式的文件处理文件体系结构对此没有具体说明各部分综述本系列标准包括第一二部分和第四八部分目前还没有第三部分第一部分引言和总则提供了关于整个本系列标准的信息它简要地描述了文件体系结构每一部分的概况和各部分之间的相互依赖关系给出了各部分需要的一些引用标准定义了用于各部分的术语规定了与本系列标准的一致性并给出了定义文件应用轮廓的规则第二部分文件结构定义了可应用于文件表示描述的文件体系结构概念目的是允许对文件结构有一个共同的理解术语文件体系结构是指产生或解释文件的一组
39、规则描述了体系结构的概念定义了文件结构和属性也规定了文件体系结构和内容体系结构之间的接口定义了文件体系结构类提供了文件处理模型描述另外它还包括基于本系列标准的文件结构的例子和表示文件结构的推荐的记法第四部分文件轮廓定义了文件轮廓该文件轮廓提供了与文件处理有关的信息这是用属性来实现的例如标题作者少量属性用于表示文件轮廓本身有些属性与文件处理有关例如归档检索其他应用其他属性为用户提供用于规定用户特定信息例如组织机构状态的手段文件轮廓给出的某些信息可以重复文件主体中的信息文件轮廓可以单独交换即不带有文件组元的其余部分注文件轮廓中包含的信息用于接收者人和或装置例如关键词有些属性值可能已自动给出例如大小
40、第五部分办公文件交换格式定义了数据流格式该数据流用来交换根据构成的办公文件数据流用一组称为交换数据元素的数据结构来描述这些交换数据元素表示文件的组元文件轮廓客体描述客体类描述显现式样布局式样和内容部分描述依据交换数据元素的格式是用中规定的抽象语法记法一来定义的也规定了一个清晰的文本语言称为办公文件语言它被用来表示和处理根据构成的文件使用中规定的标准通用置标语言它由表示文件组元和属性的名和置标约定的标准集合组成在中规定的文件交换格式可用于在符合的系统之间交换以表示的文件数据结构和语言表示都已标准化以满足不同应用环境的文件表示需求第六部分字符内容体系结构应用于按照定义的体系结构构成的包括字符内容的
41、文件字符内容由图形字符控制功能和间隔字符组合而成对于这种类型的内容体系结构定义了适用于字符内容显现的定位和成像方面的内容还根据其结构属性字符总表控制功能和编码来定义特定字符内容体系结构类第七部分光栅图形内容体系结构应用于按照定义的体系结构构成的包括光栅图形内容的文件光栅图形内容由图片元素像素阵列提供的图示信息的描述性表示组成该图片元素像素阵列按照传真或位图编码方法进行编码对于这种类型的内容体系结构定义了适用于光栅图形内容显现的定位和成像方面的内容还根据其结构显现属性内容布局过程控制功能和编码属性来定义每一光栅图形内容体系结构类第八部分几何图形内容体系结构应用于按照定义的体系结构构成的包括几何图
42、形内容的文件几何图形内容由图片描述信息的描述性表示组成并使用和中分别定义的计算机图形元文卷和其二进制编码这种图片描述信息可以作为元素的有序集诸如线弧多边形这些绘图元素的属性及构成内容部分的元素等对于这种类型的内容体系结构定义了适用于几何图形内容显现的定位和成像方面的内容还根据其结构显现属性有关的参数内容布局过程控制功能和编码属性来定义几何图形内容体系结构类各部分之间的相互依赖关系如果需要交换文件或类属文件就必须一起使用和引言和总则文件结构文件轮廓办公文件交换格式假如只需交换文件轮廓那么只需使用和另外还需使用一个或多个其余部分这取决于所要交换内容的特定类型的内容例如一致性根据表示文件类属文件或文
43、件轮廓的数据流的一致性来定义本系列标准的一致性为了定义一致性有必要区分两种情况文件轮廓属性文件应用轮廓是文件应用轮廓的标识符文件轮廓属性文件应用轮廓没有规定值只有在文件应用轮廓由客体标识符来标识时才能规定该文件应用轮廓这包括在国家标准或建议中定义的或者由登记管理机构登记的文件应用轮廓见附录和参考件当属性文件应用轮廓出现在给定的文件或类属文件的文件轮廓中时如果表示该文件或类属文件的数据流符合规定的文件应用轮廓则它就与本系列标准一致在没有规定文件应用轮廓时应认为表示文件或类属文件的数据流要符合本系列标准第一二四五六七和八各部分这就意味着文件或类属文件可以包含中定义的任何文件体系结构类以及该类允许的
44、组元属性和属性值的任意组合这是一种与中规定的体系结构模型一致的文件由定义内容体系结构类的本系列标准的第六七和八部分定义的任何内容体系结构类以及该类允许的显现属性控制功能编码属性和图形元素的任意组合这是一种与和中规定的体系结构模型一致的文件内容中定义的任何文件轮廓属性中定义的任何一种交换格式类只有和中定义的内容体系结构类只有其他国家标准或建议规定的图形字符集只有规定的几何图形元素及和为这些元素定义的参数值文件应用轮廓文件应用轮廓是本系列标准各部分中定义的特征组合的规范它由根据中的规则得出的唯一客体标识符来标识为了定义有效的组合应按照条给出的规则来选择特征选择属于文件体系结构类的特征来形成文件体系
45、结构级选择内容体系结构类的特征来形成内容体系结构级选择文件轮廓的特征来构成文件轮廓级选择交换格式类文件应用轮廓必须包括一个或多个文件体系结构级一个或多个内容体系结构级文件轮廓级交换格式类文件体系结构特征可以分为三种类别格式化文件体系结构可处理文件体系结构格式化可处理文件体系结构对每一类有组元对每一组元有属性对每一属性有分类必备的非必备的可缺省的分为基本的非基本的允许值缺省值如果属性为可缺省的内容体系结构特征主要取决于内容的类型对于每一种内容类型存在多种内容体系结构类例如对于字符内容体系结构其类有格式化字符可处理字符和格式化可处理字符对于每一种所定义的内容体系结构类有显现属性编码属性控制功能对每
46、一显现属性编码属性和控制功能参数有基本的非基本的允许值缺省值文件轮廓特征有属性对每一属性有分类必备的非必备的允许值本系列标准允许的交换格式有办公文件交换格式分为类类文件交换格式定义文件应用轮廓的总则文件应用轮廓只能对先前列出的特征加以限制而不能扩充这些特征文件应用轮廓应不允许使用超出本系列标准定义目的的属性也就是说文件应用轮廓应不能以任何方式修改本系列标准中定义的属性语义定义文件应用轮廓的规则定义文件应用轮廓的规则由定义文件体系结构级内容体系结构级文件轮廓级和选择交换格式类的规则组成定义文件体系结构级的规则规定了可用于定义文件体系结构级的三种文件体系结构类它们是格式化文件体系结构类可处理文件体
47、系结构类和格式化可处理文件体系结构类对于这些类中的每一种定义了哪些文件结构能用于属于那种类的文件这些结构可分类为必备的或可选的每一类还规定哪些客体和客体类可应用于这些结构同样客体也可分类为必备的或可选的每一类还定义哪些属性可应用于这些客体和客体类并且的正文定义了所有允许值和每一可缺省属性的标准缺省值文件体系结构级定义了哪些结构客体和客体类属性和属性值可允许被包含在属于该级的文件或一般文件内注有时术语超类应用于文件类集或客体类集其下级客体类的层次及相关的属性和属性值都受文件应用轮廓限制对于每一文件体系结构类只能规定一个文件体系结构级例如一个文件应用轮廓不能对可处理文件体系结构类使用两个不同的文件
48、体系结构级下面给出定义文件体系结构级的规则文件体系结构级应属于特定的文件体系结构类即该级应利用只属于该特定文件体系结构类的文件结构客体和客体类文件体系结构级应规定哪些文件结构属于该级属于相应的文件体系结构类的必备的结构在文件体系结构级中应规定为必备的在文件体系结构类中规定为可选的结构在文件体系结构级中可以规定为可选的或必备的注如果使用因子集或部分生成符集则在一般情况下文件体系结构级应将其规定为可选的当文件应用轮廓允许多于一种的文件体系结构类例如格式化可处理格式化可处理进行交换时各文件体系结构级应是一致的例如可处理形式的文件体系结构级中使用的类属逻辑结构应与格式化可处理形式的文件体系结构级中使用
49、的类属逻辑结构相同文件体系结构级应规定哪些客体和客体类属于该级在特定结构中为必备的客体和客体类在文件体系结构级中应规定为必备的规定为可选的客体和客体类在文件体系结构级中可以规定为可选的或必备的文件体系结构级应规定作用于属于该级的文件结构上的任何限制例如可能限制特定结构中允许的层次的级数或者可能要求所允许的特定结构属于某些已定义的文件类在格式化文件体系结构类情况下文件体系结构级应规定页为复合的还是基本的在格式化或可处理文件体系结构类情况下文件体系结构级应规定仅是一个内容部分还是多个内容部分可以与基本客体有关联对于用到的每一客体或客体类文件体系结构级应规定哪些属性是可用的这些属性应包括属于定义的每一客体类型的适当最小的属性集对于每一允许的属性文件体系结构级应规定可用的基本缺省和非基本如果有的话值这些值应取自中属性定义所规定的允许值的范围内注建议用于可缺省属性的缺省值是在相应文件体系结构类中规定的缺省值文件体系结构级可以将在中规定为可缺省的或非必备的属性定为该级的必备属性分类为必备属性的则不能改变文件体系结构级应规定哪些属性可以包括在属性缺省值表中并且必须规定客体类型对此客体类型还