GB T 14814-1993 信息技术 文本和办公系统 标准通用置标语言(SGML).pdf

上传人:confusegate185 文档编号:255600 上传时间:2019-07-13 格式:PDF 页数:160 大小:11.91MB
下载 相关 举报
GB T 14814-1993 信息技术 文本和办公系统 标准通用置标语言(SGML).pdf_第1页
第1页 / 共160页
GB T 14814-1993 信息技术 文本和办公系统 标准通用置标语言(SGML).pdf_第2页
第2页 / 共160页
GB T 14814-1993 信息技术 文本和办公系统 标准通用置标语言(SGML).pdf_第3页
第3页 / 共160页
GB T 14814-1993 信息技术 文本和办公系统 标准通用置标语言(SGML).pdf_第4页
第4页 / 共160页
GB T 14814-1993 信息技术 文本和办公系统 标准通用置标语言(SGML).pdf_第5页
第5页 / 共160页
亲,该文档总共160页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、中华人民共和国国家标准信息处理文本和办公系统标准通用置标语言发布实施国家技术监督局发布中华人民共和国国家标准信息处理文本和办公系统标准通用置标语言国家技术监督局批准实施本标准等效采用国际标准信息处理文本和办公系统标准通用置标语言及修正引言本标准规定了一种用于文件表示的语言称之为标准通用置标语言就其最广泛的定义而言可以将用于排版其范围包括从传统的单一媒体数据的排版直到多媒体数据的排版此外也可以将用于办公文件的处理以满足人们阅读和在排版系统之间进行文件交换的需要背景可以抽象地将文件看成是由多种类型的元素组成的一种结构例如作者可以将若干章组成一本书每章中又含有段落和附有文字性注解的插图又如编辑人员可

2、以将若干篇文章编成一本刊物而每篇文章中又可以含有若干段段中又可以含有文字等等处理程序采用不同的方法来处理上述这些元素例如格式化程序就可用醒目的字体打印标题在段首或各段之间留空这就从视觉上将文件的结构和属性展示给了读者而当为信息检索系统建立标题字典时则可能对标题中的文字赋予特别的含义虽然在文件的属性与其处理之间的这种联系现在看来是清晰的然而就早期的文本处理方法而言这种联系是模糊的在自动化排版出现之前编辑人员先使用特殊的处理指令对底稿进行置标然后再由排版工人按照这些指令排出所要的格式指令和文件结构之间的所有联系完全存在于编辑人员的脑中早期计算机排版继承了上述方法用与处理相关的置标加入计算机可读的文

3、件卷中虽然加入的置标依然由特定的处理指令组成但这些处理指令采用的是格式化程序的语言而不是排版工人使用的语言然而这种文卷如果不改变其中的全部置标就很难再用于其他不同的目的或不同的计算机系统中随着用户水平日益提高及文本处理程序功能日益增强人们开发出许多解决上述问题的方法例如使用宏调用或格式调用将文件中需要处理的地方标识出来而将实际的处理指令放在文件外部的过程之中或宏定义或存储格式之中这样就能够比较容易地对它们进行修改虽然可以将宏调用放在文件中的任意位置上但是用户开始逐步认识到大部分宏调用都是放在文件元素的开头或结尾处于是很自然地选择表示元素类型的通用标识符来命名这些宏调用而不是用特定处理的名字命名

4、例如用代替即用标题代替格式这是实行通用编码或通用化的标记的开始通用编码使自动文本处理系统迈出重要的一步它反映了文件属性与处理之间的自然关系七十年代初通用置标语言的出现为通用编码技术提供了一种形式化语言的基础从而进一步推动了这种发展趋势通用置标语言主要遵循以下两条原则描述性置标起主要作用并与处理指令相区别描述性置标包括通用标识符和文件元素的其他属性它们可调用处理指令处理指令可用任何语言表示并且常被汇集在文件外部的过程中当为了发现置标而扫描源文卷并识别出各种元素后处理系统执行与每个元素和属性相关的过程若用其他处理系统同样的元素及属性可与不同的过程相关联而不必改变文件的置标当需要直接将处理指令放入文

5、件中时它的定界不同于描述性置标这样可以容易地使不同的处理系统找到并修改对每种文件类型都形式化地定义其置标通用置标语言用加入文件类型定义的做法使文件置标形式化类型定义包括哪些元素和属性可以在文件中出现并以何种顺序出现等方面的说明类似于形式文法根据这些信息可以确定对某一文件的置标是否正确即是否与类型定义相符合还能提供被漏掉的置标因为可从其他置标中准确地作出推断注对通用编码和标准通用置标语言概念的更加详细的介绍参见附录参考件目标标准通用置标语言对通用编码和通用置标概念的应用进行标准化它为描述用户选定的内容提供了一种清晰的且无歧义的语法该语言包括用于文件元素的描述性置标的抽象语法将抽象语法与特定的定界

6、符字符和数量相结合的基准具体语法用户可定义变异的具体语法以满足自己的需要置标声明允许用户针对不同的文件类型定义通用标识符和属性的特定词汇对任意数据内容的规定在通用置标中数据是指未用置标语言定义的内容包括特定的并且要求与一般文本作不同解释的数据内容记法如公式图像非拉丁字母前面已提到的格式化文本或图形等实体引用为了引用文件的主数据流之外的内容如分开编写的章节临时补入的字符照片等而采取的一种非系统特定的技术将处理指令与描述性置标相互区别用的专用定界符对于那些不能由过程来处理的情况需要时可以插入处理指令但当文件送到另一个处理系统时又能很容易地找到并修改这些处理指令然而为使通用置标语言成为一种可以接受的

7、标准还需要更多的功能为了满足在复杂环境中使用该语言所需的各种约束条件该语言还必须具有元语言的特征现将主要约束条件以及标准通用置标语言用以满足这些约束条件的方法总结如下该语言置标的文件必须能被广泛使用的文本处理系统和文字处理系统所接受具有全部可选特征的完整语言为高级系统提供了可以利用的通用性和灵活性而功能较弱的系统可以不支持这些特征为了便于在不同的系统之间进行文件交换可用声明描述文件中使用的所有置标特征或具体语法的变异必须支持现有的大量正文输入设备用基准具体语法的文件没有机器帮助也能易于被人们键入和理解因此的使用并不需要等到开发出新一代硬件只需要能在现有机器上处理文件的软件随着用户对越来越熟悉将

8、移植到新一代硬件当它们出现时上也将更加容易由于可在不同的设备上键入文件因而该语言必须不依赖于任何字符集该语言不依赖于某一特定字符集如果一个字符集中含有以位组形式表示的字母数字空格以及定界符等字符那么该字符集就是可以接受的必须具有相对于处理程序系统或设备的独立性由于通用置标主要是描述性的因而它在本质上就具有这种独立性又由于偶然出现的处理指令都被特别加以定界所以当不同的处理程序要放弃与其不相关的指令或要进行文件交换时就可以查找出这些指令并对其进行转换对文件外部部分的引用是间接的对实际系统存储的映射是由出现在文件开头部分中的外部实体声明实现的故在文件交换时能很容易对它们修改可以通过声明来改变具体语法

9、以适应任何保留的系统字符必须没有任何民族语言偏向可以用任何特定民族语言中的字符来扩充用于命名的字符描述性置标中使用的通用标识符属性名以及其他名字都由用户在元素和实体声明中定义置标声明中使用的声明的名字和关键字也都可以改变就象在多语种文件中使用的那样也支持多种字符表该语言必须适应人们熟悉的有关打字机和文字处理程序方面的习惯用便捷引用和数据标记性能支持打字机文本输入方面的习惯对于含有段和引文的常规文本可按照解释尽管没有键入看得见的置标该语言必须不依赖于任何特定的数据流或物理文卷的组织置标语言采用的是虚拟存储模型其中文件由一个或多个存储实体组成而每个存储实体又是一个字符序列对于所有实际文卷的访问都由

10、处理系统完成处理系统确定是否将字符序列看成是连续的或确定字符序列是否表示物理记录的边界已置标的正文必须与其他数据共存只要能够确定出文本的开头和结尾那么处理系统就能够使符合本标准的文本出现在带有其他内容的数据流之中类似地系统可以允许未被定义的数据内容出现在符合本标准的文件之中为了便于交换这类数据的出现由置标声明指明置标对人和程序均是可用的标准通用置标语言的目的是不需要预处理程序就能成为键盘输入和交换的合适接口为了适应用户在文本输入方面的习惯及经验以及各种类型的键盘和显示设备的要求允许对语言进行广泛的剪裁然而人们认识到许多实现者都将试图利用通用置标语言在信息获取能力上的长处以提供智能编辑或从文字处

11、理前端环境中建立文件的功能通过提供下述功能将使能够满足上述这些应用元素内容可以和置标分开存储控制字符可以作为定界符使用文件中允许出现数据表示的混合模式支持多重并发逻辑结构和版面结构组织本标准的内容组织如下实体结构方式的文件的物理组织在第章说明元素结构方式的文件的逻辑组织和采用描述性置标的表示法在第章说明处理指令在第章讨论公用置标构件如字符实体引用以及处理指令在第章说明具有通用性的置标说明注释实体以及特殊标出节在第章说明主要用于说明文件类型定义文件类型元素记法便捷引用映射以及便捷引用使用的置标声明在第章定义主要用于说明链接处理定义链接类型链接属性链接集以及链接集使用的置标声明在第章定义用于说明文

12、件字符集容量集具体语法以及各种特征的声明在第章定义基准具体语法在第章定义文件应用程序的一致性在第章定义最后还有一批附录作为本标准的参考件注本标准是一种计算机语言的形式化说明对于其专长是产生文件而不是编译方面的人员来说阅读本标准可能会有一定的困难附录以一种非形式化的教学方式讨论了其中的主要概念这种方式对大部分读者来说应更容易接受然而读者也应知道这些附录既没有概括的所有结构也没有概括这些结构的所有细节而且为了能够清晰地表示问题某些细微的区别常常被忽略主题内容本标准规定了一种称为标准通用置标语言的抽象语法该语言既描述了如何表示文件的结构和其他属性也给出了对置标进行解释的其他信息规定了将抽象语法与特定

13、的字符和数量相结合的基准具体语法给出了定义变异具体语法的准则根据文件使用的语言成分定义了一致性文件根据系统处理一致性文件以及识别一致性文件中的置标错误的能力定义了一致性系统规定了怎样才能将未被本标准定义的数据如图像图形和格式化的文本包含在一个一致性文件中注本标准没有标出或规定标准的文件类型文件结构或文本结构没有规定一致性系统的实现体系结构或置标错误的处理没有规定怎样创建一致性文件没有规定数据流消息管理系统文卷结构存储或交换一致性文件的物理表示或为此目的使一致性文件可相互转换的字符集或编码方案没有规定数据内容的表示或包含在一致性文件中的图像图形格式化的文本等的表示法适用范围标准通用置标语言可用于

14、被任何文本处理或文字处理系统加工的文件它特别适用于在使用不同文本处理语言的系统之间交换的文件即使使用同一种文本处理语言也可用不同方式处理的文件只以最终图像形式存在的文件不在本标准适用范围内引用标准信息处理信息交换用七位编码字符集语种名称代码信息技术通用多八位编码字符集第一部分体系结构与基本多文种平面信息处理支持工具文件交换格式信息处理支持工具公用文本登记过程下面的引用标准是与示例材料一起使用的信息处理七位和八位编码字符集代码扩充技术世界各国和地区名称代码信息处理文本通信用编码字符集信息处理信息交换用八位代码结构和编码规则信息处理系统计算机图形用于图像描述信息转换与存储的元文卷第二部分字符编码信

15、息处理系统计算机图形用于图像描述信息转换与存储的元文卷第四部分清晰的文本编码信息技术开放系统互连抽象语法表示法基本编码规则规范定义下列定义适用于本标准抽象语法定义如何将置标加入文件数据中的一组规则与表示置标的特定字符无关活动文件类型声明已被系统标识为活动的文件类型注如果一个实体有对应的活动文件类型则依照其活动文件类型对该实体进行语法分析否则就按其基文件类型以及任意活动链接类型对该实体进行语法分析活动链接类型声明已被系统标识为活动的链接处理歧义性内容模型文件实例中的元素或字符串能满足一个以上的初始内容记号的一种内容模型注中禁止使用歧义性内容模型应用文本处理应用程序应用约定在允许用户选择的范围内管

16、理文件正文的特定应用规则注有两类应用约定内容约定和置标约定特定应用信息声明的参数它指明应用和或其结构所需要的信息注例如该信息能够识别一个结构和或一个应用或使一个系统能够确定它能否处理该文件相关元素类型用相关元素类型参数与置标声明对象相关联的元素类型相关记法名用相关记法名参数与置标声明对象相关联的记法名元素的属性既非类型也非内容的特征量属性定义属性定义表的成员定义属性名允许值及缺省值属性定义表由属性定义表声明中的属性定义表参数定义的一个或多个属性定义的集合属性定义表声明将属性定义表与一个或多个元素类型相关联的置标声明属性表属性说明表属性表声明属性定义表声明属性说明属性说明表的成员它说明单个属性的

17、值属性说明表一个或多个属性说明的集合构成的置标注属性说明表出现在开始标记和链接集合中属性值的字面值通过替换引用以及忽略或转换功能字符而被解释为属性值的已定界的字符串可用的公用文本可为一般公众使用的公用文本它的拥有者可以要求为此付款或遵守其他条件序列一个连续的大写字母的序列在一个作为便捷引用的串中它表示最小长度与序列的长度相同的空白序列基文件元素其文件类型是基文件类型的文件元素基文件类型在前导说明中第一个文件类型声明所说明的文件类型基本的文件符合的文件它使用基准具体语法和容量集以及置标最简化特征和注它还可以根据基准具体语法使用特征位二进制数字即或位组位的有序集合可解释为二进制数空白序列和或分隔字

18、符的一个连续序列容量有关文件的大小或复杂性等方面的命名的限制用若干种单位表示用以累计一类对象或所有对象注容量集由抽象语法定义但这些值是由单个文件和系统赋给它们的容量集将数值赋给容量名的赋值集合注在声明中容量集指出文件的最大容量要求实际要求可能稍低容量集也可由应用程序定义以便限制该应用程序实现时必须处理的文件容量要求容量集还可由系统定义以指明系统所能满足的容量要求字符数据实体字符数据实体链接处理的链相继执行并形成一条链的若干处理在链中第一个处理的源是一个基文件类型实例并且除最后一个处理外每个处理的结果都是下一处理的源该链的任何部分都可以重复注例如一个复杂的分页置标应用程序系统可以包含三种文件类型

19、逻辑文件长校样文件和分页文件同时还包含两个链接处理调整版面及估计页数调整版面处理从一个逻辑文件实例创建一个长校样文件实例而估计页数处理将长校样文件实例按顺序创建分页文件实例由于估计页数处理中作出的决定可能要求进一步对长校样文件的大小进行调整所以这两个处理可以重复字符由字符表定义的具有单独意义的信息最小单位注有两类字符图形字符和控制字符一个字符在上下文中的意义是由置标或数据内容记法定义的这样就取消或补充了该字符在字符表中的意义字符类在抽象语法中具有共同作用的字符集如非字符或分隔符字符注有四种不同方法将一些特定的字符指定为字符类由抽象语法明确指定如和由具体语法明确指定如等作为明确指定定界符角色或其

20、他字符类的结果而隐含地指定如和由文件字符集明确指定如字符数据零个或多个出现在一段不识别置标的上下文中的字符但不包括结束该字符数据的定界符这样的字符被归类为数据字符因为它们就是被如此声明的字符数据实体当引用时其正文被看作字符数据的实体并且其正文不依赖于特定的系统设备或应用处理程序字符实体集由通用实体组成的公用实体集它们本身是图形字符注字符实体适用于在文件字符集中无编码表示的字符或不能方便地从键盘上键入的字符或者为了与设备无关其位组不能在所有输出设备上产生正确显示的字符有两类字符实体集定义的和显示的字符编号一个与字符编码表示等值的十进制整数其值是将位组序列看作单个二进制整数而得到的字符引用用单个字

21、符作替换的引用注有两类字符引用命名字符引用和数字字符引用字符表同时使用的字符集合定义了每个字符的意义还能定义多字符的控制序列注当一个字符出现在控制序列中时则该序列的含义替代了单个字符的含义字符集从字符表到代码集的映射这就使每个字符都与其编码表示对应字符串字符的序列类字符类代码扩充使用单个代码表示多个字符而不改变文件字符集注当文件中出现多种民族语言时图形表代码的扩充可能是有用的代码集长度相同的位组的集合按其数值排序这些数值必须是连续的注例如一个其位组为八位的代码集一个八位码可以构成个位组其值的范围从到十进制为到该代码集也可由这些位组的任何连续子集构成代码集位置代码集中位组的数值代码表示一个字符用

22、一个或多个长度相同的位组的序列表示注释置标声明的一部分它含有辅助用户使用该文件的解释或评注信息注释声明只含有注释的置标声明的具体语法抽象语法与特定的定界符数量置标声明名字等的结合具体语法参数声明的参数它标识文件元素以及通常情况下前导说明部分中使用的具体语法注该参数由标识基准语法字符集功能字符回避字符命名规则定界符使用保留名使用以及数量特征等参数组成符合于的应用要求文件是符合的文件且编制的文档满足本标准要求的应用符合于的文件符合本标准全部规定的文件包含元素在其中出现子元素的元素内容文件实例中出现在开始标记与结束标记之间的字符它们可解释为数据真子元素包含的子元素其他置标或上述内容的混合注如果元素有

23、显式的内容引用或其声明的内容为则其内容都为空在这种情况下数据可能由应用本身产生并与内容数据一样处理内容约定控制数据内容的应用程序约定如长度限制允许的字符或大小写字母的使用注内容约定本质上是非正式的数据内容记法通常限于单个元素类型内容模型元素声明中的参数它说明了模型组和例外参数这两者定义了元素中允许的内容内容模型嵌套层次在没有对应或定界符的内容模型中连续出现的或定界符的最大数目内容引用属性一个可隐含的属性其值由应用程序引用以产生内容数据注当元素有显式的内容引用时则文件实例中该元素的内容为空上下文序列一个或多个置标字符构成的序列它必须跟在同一个实体中的定界符串之后从而使该串被识别为定界符上下文中的

24、可选元素即这样的元素只因它是包含元素才能够出现或它在当前适用的模型组中的内容记号是上下文中的可选记号上下文中的可选记号即这样的内容记号它是一个固有的可选记号或它有一个出现指示符并且已被满足或它在一个模型组中该模型组本身是一个上下文中的可选记号且没有已满足的记号上下文中必要的元素一个并非上下文中可选的元素且它的通用标识符是文件类型名或它的当前适用模型记号是上下文中必要的记号注一个元素可以既不是上下文中必要的同时也不是上下文中可选的例如一个元素其当前适用的模型记号出现在一个没有固有的任选记号的组中上下文中必要的记号即这样的内容记号它是其模型组中仅有的一个内容记号或它出现在一个组中并且该组本身就是一

25、个上下文中必要的记号或含有一个已经满足的记号并且它前面的所有记号已经满足或是上下文中可选的控制字符对其后的字符的解释表示或其他处理进行控制的字符例如制表字符控制序列以控制字符为开头的字符序列它控制其后的字符的解释表示或其他处理例如转义序列核心具体语法基准具体语法的一种变异它没有便捷引用定界符内容记号的对应的内容文件实例中对应内容记号的元素和或数据当前属性其当前即最近指定的值成为其缺省值的属性注当带有当前属性的元素第一次出现时不能省略开始标记当前元素其开始标记或由于置标简化而省略最近出现的开元素当前链接集由元素内容中的链接集使用声明或链接处理定义而与当前元素相对应的链接集如果该当前元素没有相关联

26、的链接集则以前的当前链接集仍作为当前链接集当前映射由元素内容中的便捷引用使用声明或者文件类型定义而与当前元素相对应的便捷引用映射如果当前元素没有相对应的映射则以前的当前映射将继续作为当前映射当前层用以得到通用标识符时附加在标记中层词干之后的一个数字对于开始标记它是最近元素的层后缀该元素带有相同层词干或相同分层组中的层词干对于结束标记它是带有相同层词干的最近开元素的层后缀数据文件中表示其固有信息内容的字符这些字符不被识别为置标数据属性符合特定数据内容记法的数据的属性注在大多数情况下数据属性的值必须在数据可据记法进行解释之前知道数据字符或者因为被说明为数据或者因为没有被识别为置标而在其所出现的上下

27、文中被解释为数据的字符数据内容元素内容的一部分它是数据而不是置标或子元素数据内容记法对元素的数据内容或数据实体的特定应用的解释它通常补充或不同于文件字符集的常规含义注数据内容记法对于元素内容是由记法属性说明的对于数据实体则由实体声明中的记法名参数说明数据实体被声明为数据的实体因而引用时不作语法分析注有三类数据实体字符数据实体特定的字符数据实体以及非数据实体一个数据实体的解释由数据内容记法决定此记法由其他标准定义数据标记与一个开元素的数据标记模式相匹配的字符串它既是该开元素的结束标记同时又是包含它的元素中的字符数据数据标记组联系数据标记模式与目标元素类型的模型组记号注在目标元素实例中对数据内容及

28、子元素的数据内容扫描以找出与该模式数据标记相匹配的字符串数据标记模式定义了这样一些串的数据标记组记号即如果这些串出现在适当的上下文中将构成一个数据标记声明置标声明声明子集置标声明的已定界部分在其中可出现其他声明注声明子集只能出现在文件类型链接类型以及特殊标出节声明中已声明的具体语法由声明中的具体语法参数描述的具体语法专用数据字符由每个不可能具有置标含义的字符构成的字符类即它的成员只能被作为数据字符处理缺省实体通用实体引用所引用的实体此通用实体引用使用了未声明的名字缺省值属性定义的一部分没有属性说明时使用的属性值定义性的字符实体集字符实体集其目的是为图形字符定义实体名但并不实际显示它们其公用标识

29、符不包含公用文本显示版本注在处理过程中系统为适合输出设备用对应的显示字符实体集替代定义性实体集定界符字符除名字字符或功能字符外的其他字符构成的字符类它出现在由具体语法作为定界符使用的串中上下文中的定界符在同一实体中一个定界符串之后紧跟一个上下文序列而构成的字符串定界符角色由抽象语法定义并由具体语法指定的字符串所担任的角色它用于标出置标和或从数据中区分置标定界符集对应抽象语法定界符角色的一组定界符串定界符集参数声明中的参数它标识已声明的具体语法中所使用的定界符集定界符串由具体语法赋予定界符角色的字符串描述性置标按照非系统特定方式对文件结构及其他属性进行描述的置标与对它进行的任何处理无关特别是它用

30、标记表达元素的结构公用文本的依赖于设备的版本是公用文本它只通过增加公用文本显示版本而使它的形式公用标识符与其他公用文本不同该版本标识出所支持的显示设备或所用的编码方案数字由到共个阿拉伯数字组成的字符类显示字符实体集与对应的定义性字符实体集具有相同实体名的实体集但它用于字符的显示它是对应定义性实体集的依赖设备的版本文件作为一个单位处理的信息集文件将按特定文件类型分类注在本标准中该术语总是指文件这并不失其准确性文件的体系结构文本处理应用程序的形式化规则注例如文件的体系结构可定义为在各类元素定义中使用的属性语义基于元素所具有的属性的元素分类根据元素分类而定义文件类型的结构规则链接处理以及它们如何被属

31、性值影响与或在文件交换中与文件相伴的信息文件外形文件字符集用于文件中的所有置标以及至少最初用于数据的字符集注当在系统之间交换文件时其字符集将转换成接受系统的字符集文件元素文件类型实例的最外层元素亦即该元素的通用标识符为文件类型号文件实例文件类型的实例文件实例集含有一个或多个文件类型实例的实体结构中的文件实体或子文件实体的一部分它可与元素结构中的基文件元素共同扩充注当使用多文件实例特征时在一个文件中可同时存在多个实例这些实例可共享数据和置标文件类型具有相似特征的文件的类例如杂志文章技术手册便笺等文件类型声明含有文件类型定义的形式说明的置标声明文件类型声明子集出现在文件类型声明的声明子集中的元素实

32、体以及便捷引用集注文件类型声明中引用的外部实体认为是声明子集的组成部分文件类型定义用对特定类型文件置标的规则这些规则由应用确定注文件类型定义的一部分可用文件类型声明说明其余部分如元素和属性的语义或应用约定不能用形式化地表示可以用注释非形式化地表示它们文件类型说明标记的一部分它标识文件类型实例在此实例中将对这些标记进行处理注在一个实体引用中名字组完成相同的功能声明分隔符出现在声明子集中的声明分隔符文件类型定义特殊标出节的有效状态在特殊标出节声明中说明的最高优先状态关键字元素由文件类型定义所定义的层次结构的一个成分在文件实例中用描述性置标标识描述性置标通常为开始标记和结束标记注元素被分类属于某一特

33、定元素类型元素声明置标声明其中含有元素类型定义的形式化说明它涉及内容和置标的最简化元素集汇集在一起使用的元素声明的集注元素集可以是公用文本元素结构将文件组织成元素层次结构的方式且每个层次都符合一个不同的文件类型定义元素类型具有相似特征的元素的类例如段章摘要脚注或参考书目等元素类型定义将应用于特定类型元素的置标的特定应用规则元素类型定义包括表达元素和属性定义表声明的一个形式说明它涉及内容置标最简化以及对于特定元素类型所允许的属性注元素类型定义通常是文件类型定义的一部分元素类型参数元素声明中的参数它标识定义所用的元素类型注说明可以是直接的用单个通用标识符或名字组成员的形式也可是间接的通过分层元素或

34、分层组成员说明空链接集链接集中所有结果元素类型都是隐含的且没有说明其属性空映射对其中所有定界符不作映射的便捷引用映射注空映射不需要也不可能显式地说明但可被其保留名引用在基准具体语法中保留名为结束标记标识一个元素结束的描述性置标实体可以作为一个单位被引用的字符的集合注对于诸如由不同作者编写的书籍章节字符临时补入的字符或照片等对象最好作为单独的实体管理实体的实际存储是系统特定的可采用文卷分区数据集的成员数据结构的成份或符号表中的项等形式实体声明置标声明它将名字赋予一个实体以便引用实体结束信号由系统发出的表示一个实体的替换正文已经结束的信号实体管理程序诸如文卷系统或符号表这样的程序或程序的一部分或若

35、干程序的组合它可以维护并提供对多个实体的访问实体引用用实体作替换的引用注有两类实体引用命名实体引用和便捷引用实体集汇集在一起使用的实体声明的集合注实体集可以是公用文本实体结构将文件作为一个或多个独立实体的组织方式注第一个实体是文件实体它包含实体引用以指明在何处与其他实体有关实体正文实体声明的参数它说明替换正文可以包含在参数字面值中也可用外部标识符指向替换正文等价的引用串由实体引用和可用的和或构成的字符串当文件从支持便捷引用的具体语法转换到不支持便捷引用的具体语法时用该串替换便捷引用转义序列第一个字符为转义字符的控制序列例外参数元素声明的参数它通过允许包含性元素和禁止排斥性元素对元素的内容模型的

36、作用以及出现在该模型中的元素的内容模型进行修改排斥性元素在元素或其子元素内容中的任何位置上都不允许出现的那些元素即使适用的内容模型或包含元素允许它们以可选方式出现显式内容引用在属性说明中指定的内容引用显式链接处理定义链接处理定义在其中可以对结果元素类型及其属性以及链接属性的多个集进行说明外部实体一种正文没有直接在实体声明中的实体但它的系统标识符和或公用标识符出现在实体声明中注文件类型或链接类型声明中可以包括外部实体标识符该外部实体中含有全部或部分声明子集而该外部标识符同时又是实体声明和实体引用外部标识符标识外部实体或数据内容记法的参数注有两类外部标识符系统标识符和公用标识符固定属性其说明值如有

37、必须等于其缺省值的属性形式公用标识符按照本标准中定义的规则构造的公用标识符从而可将其拥有者标识符与其正文标识符的成分相区分形式公用标识符错误在形式公用标识符的构造或使用中出现的错误但不是阻碍它成为合法的最小字面值的错误注只有当声明中说明了才可能出现形式公用标识符错误然而如果一个公用标识符不能成为一个最小字面值则总是一个错误功能字符由具体语法赋予的置标字符它除了可以被潜在地识别为置标外还可以完成某些功能如果在允许出现数据的上下文中没有将它识别为置标则将它作为数据处理除非语言中指出了特殊对待就象和功能字符那样功能字符标识参数声明的参数它标出赋予和等功能的字符并且允许定义附加功能集在图形表代码扩充中

38、表示文件字符集中图形字符的虚拟字符集按其通常在代码集中的位置其字符编号都小于国标拥有者标识符由国标出版编号或字符集登记编号组成的拥有者标识符当公用标识符标识了一个国标出版物或者由一个国标出版物所赋予时或者当公用标识符标识一个已登记的国标字符集时使用它国标文本描述由国标出版物标题的最后一个元素如有不用部分标题组成的公用文本描述在公用标识符标识国际出版物时使用通用定界符角色不是便捷引用的定界符角色通用实体可以在元素的内容或属性值的字面值中引用的实体通用实体引用命名实体对通用实体的引用通用标识符用以标识元素的元素类型的名字通用标识符图形字符显示正文时通常占据一单个位置的字符如字母数字或标点符图形表代

39、码扩充代码扩充用变位功能调用虚拟字符集而将多个图形字符集映射到文件代码集的位置上组参数的一部分由相互配对的和定界符或和定界符划定边界注有五类组名字组名字记号组模型组数据标记组及数据标记模板组名字名字记号或数据标记模板组中不能再含有组模型组中可再含有模型组数据标记组中可含有数据标记模板组唯一标识符引用表其值是引用值表的一种属性值引用值一种属性值是在同一个文件实例中说明为某一元素的值的一个名字值一种属性值它是唯一标识元素的一个名字即它不能与同一文件实例中的任何其他值相同可隐含的属性不需要有属性说明的属性当它没有被说明时其值由应用定义隐式链接处理定义一个链接处理定义其中所有结果元素类型及其属性都由应

40、用暗含但可对多个源元素类型说明链接属性值被包含的子元素不是由包含它的元素模型所允许而由包含性例外参数所允许的子元素包含性元素可以在元素或其子元素内容的任何地方出现的元素尽管适用的模型并不允许它们无效功能字符由功能字符组成的字符类其附加给的功能不起任何作用固有的可选记号这样的模型组记号它具有或出现指示符或它是一个组其记号之一为固有可选的或它是一个或组其所有记号都是固有可选的初始链接集在文件实例开始处的当前链接集文件类型的实例符合文件类型定义的元素层次结构的数据和置标已解释的参数字面值不包含字面值定界符的参数字面值正文其中的字符和参数实体引用都已被替换关键字一种参数它是由具体语法定义的保留名而不是

41、任意的正文注在关键字或名字可由应用定义的参数中关键字前常有保留名指示符因此应用能够定义名字而不必考虑这些名字是否也被具体语法使用链接属性源元素类型的属性它只在对源文件实例进行特定处理的上下文中才有意义链接处理已有文件实例源文件产生新文件实例结果文件的处理过程二者的文件类型可相同也可不同处理过程可以链接因而某个结果文件可成为下一个的源文件注链接处理的例子有编辑源文件和结果文件类型通常相同格式化源文件和结果文件类型通常不同链接处理定义用描述链接处理的特定应用规则链接处理定义包括用链接类型声明表示的源元素与结果元素之间链接的形式化说明包括可用于链接处理的源属性即链接属性的定义注链接处理还可包含对处理

42、的语义进行描述的注释其中包括链接属性的含义和它们在处理中的作用有三类链接处理定义简单的隐含的和显式的链接集由链接集声明所声明的命名的相关集其中源文件类型的元素链接于结果文件类型的元素之上每个元素链接都可说明其源链接属性和结果元素属性链接集声明定义链接集的置标声明链接类型声明置标声明它含有链接处理定义的形式化说明链接类型声明子集在链接类型声明的声明子集中出现的实体集链接属性集链接集及定义链接集使用声明注链接类型声明中引用的外部实体认为是声明子集的一部分锁定换档一直应用到另一锁定换档功能出现时为止的换档功能小写字母到个小写字母组成的字符类小写名字字符由具体语法指定用小写名字字符组成的字符类小写名字

43、开始字符由具体语法指定用小写名字开始字符组成的字符类链接处理定义映射便捷引用映射置标过程在文件中置标特殊标出节为特定目的例如为了忽略其中的置标而被标出的文件的一部分特殊标出节声明对特殊标出节进行标识并规定如何对它进行处理的置标声明特殊标出节结束特殊标出节声明的闭定界符序列特殊标出节开始特殊标出节声明的开定界符序列置标为表达有关文件的信息而加入文件数据中的正文注有四类置标描述性置标即标记引用置标声明处理指令置标字符依据上下文能被解释为置标或数据的字符置标约定控制置标的应用程序约定如实体名的表达规则或允许使用便捷引用定界符子集置标声明控制如何对文件中其他置标进行解释的一类置标注有十三类置标声明它们

44、是实体元素属性定义表记法文件类型链接类型链接集链接集使用特殊标出节便捷引用映射便捷引用使用以及注释置标最简化特征的一个特征用缩短或省略标记或缩短实体引用使置标最简化注置标最简化特征并不影响文件类型定义所以可通过恢复被省略的置标将一个已经最简化的文件传送到一个不支持这些最简化特征的系统中有五类最简化特征和进入置标扫描字符由功能字符组成的字符类由于退出置标扫描字符的出现而被中止的对置标的识别可由它恢复退出置标扫描字符由功能字符组成的字符类它中止对置标的识别直到出现进入置标扫描字符或实体结束为止抑制置标扫描字符由功能字符组成的字符类它中止对同一实体中紧跟其后的其他字符如有的置标识别最小文件符合的文件

45、它完全使用核心具体语法不使用特征并用基准容量集最简化特征置标的最简化特征模型内容模型模型组内容模型的组成部分当被元素的内容模型和其他开元素的内容模型中说明的例外参数修改时规定元素和字符串在元素内容中的出现顺序多种代码的基本具体语法基本具体语法的多种代码变异当用到扩充代码时不识别置标多种代码的具体语法允许扩充代码的控制字符成为字符的具体语法多种代码的核心具体语法核心具体语法的多种代码变异当用到扩充代码时不识别置标名字第一个字符为名字开始字符的名字记号名字字符可在名字中出现的字符包括名字开始字符数字及由具体语法指定的其他字符名字组要求其记号是名字的组名字开始字符可作为名字开头的字符包括字母及由具体

46、语法指定的其他字符名字记号只由名字字符组成的字符串其长度由数量限定注组中出现的名字记号也是记号作为属性值出现的名字记号则不是记号名字记号组要求其记号是名字记号的组命名的字符引用由已定界的功能名组成的字符引用命名的实体引用一个实体引用它由实体声明所声明可能由文件类型说明所限定的通用实体或参数实体的已定界的名字组成注如果声明了缺省实体则通用实体引用可用未声明的名字命名规则参数声明中的参数它标识出对标准名字字母表中字符类的增加还说明大小写替代非字符文件字符集中的字符其代码表示从不在实体中出现非数据实体其字符不根据本标准进行解释的实体因此不在其中识别置标注对非数据实体的解释将遵循其他标准定义的数据内容

47、记法由文件字符集定义的非字符的类属性说明表的规格化长度不计各成分中用于定界和分隔的实际字符将每个成分都以特定数代替后计算所得的长度记法属性其值为记法名的属性它标识元素内容的数据内容记法注显式内容引用当元素内容是空时就不使用记法属性记法声明将名字与记法标识符相对应的置标声明记法标识符记法声明中标识数据内容记法的外部标识符如果记法是公用的则它可以是公用标识符否则它是一种描述性信息或是足以调用一段程序解释记法的其他信息记法名由记法声明赋予数据内容记法的名字数仅由数字组成的名字记号数字记号其第一个字符为数字的名字记号注组中出现的数字记号仍是记号作为属性值出现的数字记号则不是记号数字字符引用由定界的字符

48、编号组成的字符引用对象容量对特定对象类的容量限制如已定义的实体或实体正文中的字符省略标记最简化参数元素声明中的参数它说明对于开始标记或结束标记的合法省略是否当作要报警的置标错误开元素一种元素其开始标记已经出现或由于置标最简化而省略其结束标记还没有出现或由于置标最简化而省略开实体已被引用但其实体结束还未出现的实体打开的特殊标出节声明特殊标出节声明其特殊标出节开始已出现其特殊标出节结束还没有出现拥有者标识符公用标识符的一部分它标识公用文本的拥有者或创建者注有三类拥有者标识符国标的已登记的未登记的参数置标声明的一部分由参数分隔符或是必要的或是可选的定界参数中还可包含其他参数参数实体可在置标声明参数中

49、引用的实体参数实体引用命名实体对参数实体的引用参数字面值由已定界的可替换的参数数据组成的参数或记号分析过的字符数据出现在上下文中的零个或多个字符该上下文中的正文已被分析且置标也已被识别由于在分析过程中没有将它们识别为置标所以将它们归类为数据字符分析过的字符数据实体处理指令实体单位量度容量的单位它大致表示有关的存储要求过程由应用定义的在特定类型元素上进行操作的处理程序注单个过程可以与多个元素类型有关而或多个过程也可在文件的不同点对同一元素类型进行操作过程通常是过程集的一部分过程集针对给定的应用处理而一起使用的若干过程注在应用中处理集通常构成用于链接处理定义的应用处理处理指令由与系统相关的数据构成的置标它对如何处理文件起控制作用处理指令实体一种实体在被引用时其正文作为处理指令的系统数据对待前导说明部分文件或子文件实体的组成部分它含有文件类型和链接类型声明真子元素由包含它的元素模型所许可的子元素参数分隔符出现在置标声明中的参数分隔符公用标识符标识公用文本的最小字面值注文件中的公用标识符可以可选地解释为形式公用标识符系统负责将公用标识符转换成系统标识符公用文本处在单个文件的上下文或系统环境之外

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 国家标准

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1