GB T 14814-1993 信息技术 文本和办公系统 标准通用置标语言(SGML).pdf
《GB T 14814-1993 信息技术 文本和办公系统 标准通用置标语言(SGML).pdf》由会员分享,可在线阅读,更多相关《GB T 14814-1993 信息技术 文本和办公系统 标准通用置标语言(SGML).pdf(160页珍藏版)》请在麦多课文档分享上搜索。
1、中华人民共和国国家标准信息处理文本和办公系统标准通用置标语言发布实施国家技术监督局发布中华人民共和国国家标准信息处理文本和办公系统标准通用置标语言国家技术监督局批准实施本标准等效采用国际标准信息处理文本和办公系统标准通用置标语言及修正引言本标准规定了一种用于文件表示的语言称之为标准通用置标语言就其最广泛的定义而言可以将用于排版其范围包括从传统的单一媒体数据的排版直到多媒体数据的排版此外也可以将用于办公文件的处理以满足人们阅读和在排版系统之间进行文件交换的需要背景可以抽象地将文件看成是由多种类型的元素组成的一种结构例如作者可以将若干章组成一本书每章中又含有段落和附有文字性注解的插图又如编辑人员可
2、以将若干篇文章编成一本刊物而每篇文章中又可以含有若干段段中又可以含有文字等等处理程序采用不同的方法来处理上述这些元素例如格式化程序就可用醒目的字体打印标题在段首或各段之间留空这就从视觉上将文件的结构和属性展示给了读者而当为信息检索系统建立标题字典时则可能对标题中的文字赋予特别的含义虽然在文件的属性与其处理之间的这种联系现在看来是清晰的然而就早期的文本处理方法而言这种联系是模糊的在自动化排版出现之前编辑人员先使用特殊的处理指令对底稿进行置标然后再由排版工人按照这些指令排出所要的格式指令和文件结构之间的所有联系完全存在于编辑人员的脑中早期计算机排版继承了上述方法用与处理相关的置标加入计算机可读的文
3、件卷中虽然加入的置标依然由特定的处理指令组成但这些处理指令采用的是格式化程序的语言而不是排版工人使用的语言然而这种文卷如果不改变其中的全部置标就很难再用于其他不同的目的或不同的计算机系统中随着用户水平日益提高及文本处理程序功能日益增强人们开发出许多解决上述问题的方法例如使用宏调用或格式调用将文件中需要处理的地方标识出来而将实际的处理指令放在文件外部的过程之中或宏定义或存储格式之中这样就能够比较容易地对它们进行修改虽然可以将宏调用放在文件中的任意位置上但是用户开始逐步认识到大部分宏调用都是放在文件元素的开头或结尾处于是很自然地选择表示元素类型的通用标识符来命名这些宏调用而不是用特定处理的名字命名
4、例如用代替即用标题代替格式这是实行通用编码或通用化的标记的开始通用编码使自动文本处理系统迈出重要的一步它反映了文件属性与处理之间的自然关系七十年代初通用置标语言的出现为通用编码技术提供了一种形式化语言的基础从而进一步推动了这种发展趋势通用置标语言主要遵循以下两条原则描述性置标起主要作用并与处理指令相区别描述性置标包括通用标识符和文件元素的其他属性它们可调用处理指令处理指令可用任何语言表示并且常被汇集在文件外部的过程中当为了发现置标而扫描源文卷并识别出各种元素后处理系统执行与每个元素和属性相关的过程若用其他处理系统同样的元素及属性可与不同的过程相关联而不必改变文件的置标当需要直接将处理指令放入文
5、件中时它的定界不同于描述性置标这样可以容易地使不同的处理系统找到并修改对每种文件类型都形式化地定义其置标通用置标语言用加入文件类型定义的做法使文件置标形式化类型定义包括哪些元素和属性可以在文件中出现并以何种顺序出现等方面的说明类似于形式文法根据这些信息可以确定对某一文件的置标是否正确即是否与类型定义相符合还能提供被漏掉的置标因为可从其他置标中准确地作出推断注对通用编码和标准通用置标语言概念的更加详细的介绍参见附录参考件目标标准通用置标语言对通用编码和通用置标概念的应用进行标准化它为描述用户选定的内容提供了一种清晰的且无歧义的语法该语言包括用于文件元素的描述性置标的抽象语法将抽象语法与特定的定界
6、符字符和数量相结合的基准具体语法用户可定义变异的具体语法以满足自己的需要置标声明允许用户针对不同的文件类型定义通用标识符和属性的特定词汇对任意数据内容的规定在通用置标中数据是指未用置标语言定义的内容包括特定的并且要求与一般文本作不同解释的数据内容记法如公式图像非拉丁字母前面已提到的格式化文本或图形等实体引用为了引用文件的主数据流之外的内容如分开编写的章节临时补入的字符照片等而采取的一种非系统特定的技术将处理指令与描述性置标相互区别用的专用定界符对于那些不能由过程来处理的情况需要时可以插入处理指令但当文件送到另一个处理系统时又能很容易地找到并修改这些处理指令然而为使通用置标语言成为一种可以接受的
7、标准还需要更多的功能为了满足在复杂环境中使用该语言所需的各种约束条件该语言还必须具有元语言的特征现将主要约束条件以及标准通用置标语言用以满足这些约束条件的方法总结如下该语言置标的文件必须能被广泛使用的文本处理系统和文字处理系统所接受具有全部可选特征的完整语言为高级系统提供了可以利用的通用性和灵活性而功能较弱的系统可以不支持这些特征为了便于在不同的系统之间进行文件交换可用声明描述文件中使用的所有置标特征或具体语法的变异必须支持现有的大量正文输入设备用基准具体语法的文件没有机器帮助也能易于被人们键入和理解因此的使用并不需要等到开发出新一代硬件只需要能在现有机器上处理文件的软件随着用户对越来越熟悉将
8、移植到新一代硬件当它们出现时上也将更加容易由于可在不同的设备上键入文件因而该语言必须不依赖于任何字符集该语言不依赖于某一特定字符集如果一个字符集中含有以位组形式表示的字母数字空格以及定界符等字符那么该字符集就是可以接受的必须具有相对于处理程序系统或设备的独立性由于通用置标主要是描述性的因而它在本质上就具有这种独立性又由于偶然出现的处理指令都被特别加以定界所以当不同的处理程序要放弃与其不相关的指令或要进行文件交换时就可以查找出这些指令并对其进行转换对文件外部部分的引用是间接的对实际系统存储的映射是由出现在文件开头部分中的外部实体声明实现的故在文件交换时能很容易对它们修改可以通过声明来改变具体语法
9、以适应任何保留的系统字符必须没有任何民族语言偏向可以用任何特定民族语言中的字符来扩充用于命名的字符描述性置标中使用的通用标识符属性名以及其他名字都由用户在元素和实体声明中定义置标声明中使用的声明的名字和关键字也都可以改变就象在多语种文件中使用的那样也支持多种字符表该语言必须适应人们熟悉的有关打字机和文字处理程序方面的习惯用便捷引用和数据标记性能支持打字机文本输入方面的习惯对于含有段和引文的常规文本可按照解释尽管没有键入看得见的置标该语言必须不依赖于任何特定的数据流或物理文卷的组织置标语言采用的是虚拟存储模型其中文件由一个或多个存储实体组成而每个存储实体又是一个字符序列对于所有实际文卷的访问都由
10、处理系统完成处理系统确定是否将字符序列看成是连续的或确定字符序列是否表示物理记录的边界已置标的正文必须与其他数据共存只要能够确定出文本的开头和结尾那么处理系统就能够使符合本标准的文本出现在带有其他内容的数据流之中类似地系统可以允许未被定义的数据内容出现在符合本标准的文件之中为了便于交换这类数据的出现由置标声明指明置标对人和程序均是可用的标准通用置标语言的目的是不需要预处理程序就能成为键盘输入和交换的合适接口为了适应用户在文本输入方面的习惯及经验以及各种类型的键盘和显示设备的要求允许对语言进行广泛的剪裁然而人们认识到许多实现者都将试图利用通用置标语言在信息获取能力上的长处以提供智能编辑或从文字处
11、理前端环境中建立文件的功能通过提供下述功能将使能够满足上述这些应用元素内容可以和置标分开存储控制字符可以作为定界符使用文件中允许出现数据表示的混合模式支持多重并发逻辑结构和版面结构组织本标准的内容组织如下实体结构方式的文件的物理组织在第章说明元素结构方式的文件的逻辑组织和采用描述性置标的表示法在第章说明处理指令在第章讨论公用置标构件如字符实体引用以及处理指令在第章说明具有通用性的置标说明注释实体以及特殊标出节在第章说明主要用于说明文件类型定义文件类型元素记法便捷引用映射以及便捷引用使用的置标声明在第章定义主要用于说明链接处理定义链接类型链接属性链接集以及链接集使用的置标声明在第章定义用于说明文
12、件字符集容量集具体语法以及各种特征的声明在第章定义基准具体语法在第章定义文件应用程序的一致性在第章定义最后还有一批附录作为本标准的参考件注本标准是一种计算机语言的形式化说明对于其专长是产生文件而不是编译方面的人员来说阅读本标准可能会有一定的困难附录以一种非形式化的教学方式讨论了其中的主要概念这种方式对大部分读者来说应更容易接受然而读者也应知道这些附录既没有概括的所有结构也没有概括这些结构的所有细节而且为了能够清晰地表示问题某些细微的区别常常被忽略主题内容本标准规定了一种称为标准通用置标语言的抽象语法该语言既描述了如何表示文件的结构和其他属性也给出了对置标进行解释的其他信息规定了将抽象语法与特定
13、的字符和数量相结合的基准具体语法给出了定义变异具体语法的准则根据文件使用的语言成分定义了一致性文件根据系统处理一致性文件以及识别一致性文件中的置标错误的能力定义了一致性系统规定了怎样才能将未被本标准定义的数据如图像图形和格式化的文本包含在一个一致性文件中注本标准没有标出或规定标准的文件类型文件结构或文本结构没有规定一致性系统的实现体系结构或置标错误的处理没有规定怎样创建一致性文件没有规定数据流消息管理系统文卷结构存储或交换一致性文件的物理表示或为此目的使一致性文件可相互转换的字符集或编码方案没有规定数据内容的表示或包含在一致性文件中的图像图形格式化的文本等的表示法适用范围标准通用置标语言可用于
14、被任何文本处理或文字处理系统加工的文件它特别适用于在使用不同文本处理语言的系统之间交换的文件即使使用同一种文本处理语言也可用不同方式处理的文件只以最终图像形式存在的文件不在本标准适用范围内引用标准信息处理信息交换用七位编码字符集语种名称代码信息技术通用多八位编码字符集第一部分体系结构与基本多文种平面信息处理支持工具文件交换格式信息处理支持工具公用文本登记过程下面的引用标准是与示例材料一起使用的信息处理七位和八位编码字符集代码扩充技术世界各国和地区名称代码信息处理文本通信用编码字符集信息处理信息交换用八位代码结构和编码规则信息处理系统计算机图形用于图像描述信息转换与存储的元文卷第二部分字符编码信
15、息处理系统计算机图形用于图像描述信息转换与存储的元文卷第四部分清晰的文本编码信息技术开放系统互连抽象语法表示法基本编码规则规范定义下列定义适用于本标准抽象语法定义如何将置标加入文件数据中的一组规则与表示置标的特定字符无关活动文件类型声明已被系统标识为活动的文件类型注如果一个实体有对应的活动文件类型则依照其活动文件类型对该实体进行语法分析否则就按其基文件类型以及任意活动链接类型对该实体进行语法分析活动链接类型声明已被系统标识为活动的链接处理歧义性内容模型文件实例中的元素或字符串能满足一个以上的初始内容记号的一种内容模型注中禁止使用歧义性内容模型应用文本处理应用程序应用约定在允许用户选择的范围内管
16、理文件正文的特定应用规则注有两类应用约定内容约定和置标约定特定应用信息声明的参数它指明应用和或其结构所需要的信息注例如该信息能够识别一个结构和或一个应用或使一个系统能够确定它能否处理该文件相关元素类型用相关元素类型参数与置标声明对象相关联的元素类型相关记法名用相关记法名参数与置标声明对象相关联的记法名元素的属性既非类型也非内容的特征量属性定义属性定义表的成员定义属性名允许值及缺省值属性定义表由属性定义表声明中的属性定义表参数定义的一个或多个属性定义的集合属性定义表声明将属性定义表与一个或多个元素类型相关联的置标声明属性表属性说明表属性表声明属性定义表声明属性说明属性说明表的成员它说明单个属性的
17、值属性说明表一个或多个属性说明的集合构成的置标注属性说明表出现在开始标记和链接集合中属性值的字面值通过替换引用以及忽略或转换功能字符而被解释为属性值的已定界的字符串可用的公用文本可为一般公众使用的公用文本它的拥有者可以要求为此付款或遵守其他条件序列一个连续的大写字母的序列在一个作为便捷引用的串中它表示最小长度与序列的长度相同的空白序列基文件元素其文件类型是基文件类型的文件元素基文件类型在前导说明中第一个文件类型声明所说明的文件类型基本的文件符合的文件它使用基准具体语法和容量集以及置标最简化特征和注它还可以根据基准具体语法使用特征位二进制数字即或位组位的有序集合可解释为二进制数空白序列和或分隔字
18、符的一个连续序列容量有关文件的大小或复杂性等方面的命名的限制用若干种单位表示用以累计一类对象或所有对象注容量集由抽象语法定义但这些值是由单个文件和系统赋给它们的容量集将数值赋给容量名的赋值集合注在声明中容量集指出文件的最大容量要求实际要求可能稍低容量集也可由应用程序定义以便限制该应用程序实现时必须处理的文件容量要求容量集还可由系统定义以指明系统所能满足的容量要求字符数据实体字符数据实体链接处理的链相继执行并形成一条链的若干处理在链中第一个处理的源是一个基文件类型实例并且除最后一个处理外每个处理的结果都是下一处理的源该链的任何部分都可以重复注例如一个复杂的分页置标应用程序系统可以包含三种文件类型
19、逻辑文件长校样文件和分页文件同时还包含两个链接处理调整版面及估计页数调整版面处理从一个逻辑文件实例创建一个长校样文件实例而估计页数处理将长校样文件实例按顺序创建分页文件实例由于估计页数处理中作出的决定可能要求进一步对长校样文件的大小进行调整所以这两个处理可以重复字符由字符表定义的具有单独意义的信息最小单位注有两类字符图形字符和控制字符一个字符在上下文中的意义是由置标或数据内容记法定义的这样就取消或补充了该字符在字符表中的意义字符类在抽象语法中具有共同作用的字符集如非字符或分隔符字符注有四种不同方法将一些特定的字符指定为字符类由抽象语法明确指定如和由具体语法明确指定如等作为明确指定定界符角色或其
20、他字符类的结果而隐含地指定如和由文件字符集明确指定如字符数据零个或多个出现在一段不识别置标的上下文中的字符但不包括结束该字符数据的定界符这样的字符被归类为数据字符因为它们就是被如此声明的字符数据实体当引用时其正文被看作字符数据的实体并且其正文不依赖于特定的系统设备或应用处理程序字符实体集由通用实体组成的公用实体集它们本身是图形字符注字符实体适用于在文件字符集中无编码表示的字符或不能方便地从键盘上键入的字符或者为了与设备无关其位组不能在所有输出设备上产生正确显示的字符有两类字符实体集定义的和显示的字符编号一个与字符编码表示等值的十进制整数其值是将位组序列看作单个二进制整数而得到的字符引用用单个字
21、符作替换的引用注有两类字符引用命名字符引用和数字字符引用字符表同时使用的字符集合定义了每个字符的意义还能定义多字符的控制序列注当一个字符出现在控制序列中时则该序列的含义替代了单个字符的含义字符集从字符表到代码集的映射这就使每个字符都与其编码表示对应字符串字符的序列类字符类代码扩充使用单个代码表示多个字符而不改变文件字符集注当文件中出现多种民族语言时图形表代码的扩充可能是有用的代码集长度相同的位组的集合按其数值排序这些数值必须是连续的注例如一个其位组为八位的代码集一个八位码可以构成个位组其值的范围从到十进制为到该代码集也可由这些位组的任何连续子集构成代码集位置代码集中位组的数值代码表示一个字符用
22、一个或多个长度相同的位组的序列表示注释置标声明的一部分它含有辅助用户使用该文件的解释或评注信息注释声明只含有注释的置标声明的具体语法抽象语法与特定的定界符数量置标声明名字等的结合具体语法参数声明的参数它标识文件元素以及通常情况下前导说明部分中使用的具体语法注该参数由标识基准语法字符集功能字符回避字符命名规则定界符使用保留名使用以及数量特征等参数组成符合于的应用要求文件是符合的文件且编制的文档满足本标准要求的应用符合于的文件符合本标准全部规定的文件包含元素在其中出现子元素的元素内容文件实例中出现在开始标记与结束标记之间的字符它们可解释为数据真子元素包含的子元素其他置标或上述内容的混合注如果元素有
23、显式的内容引用或其声明的内容为则其内容都为空在这种情况下数据可能由应用本身产生并与内容数据一样处理内容约定控制数据内容的应用程序约定如长度限制允许的字符或大小写字母的使用注内容约定本质上是非正式的数据内容记法通常限于单个元素类型内容模型元素声明中的参数它说明了模型组和例外参数这两者定义了元素中允许的内容内容模型嵌套层次在没有对应或定界符的内容模型中连续出现的或定界符的最大数目内容引用属性一个可隐含的属性其值由应用程序引用以产生内容数据注当元素有显式的内容引用时则文件实例中该元素的内容为空上下文序列一个或多个置标字符构成的序列它必须跟在同一个实体中的定界符串之后从而使该串被识别为定界符上下文中的
24、可选元素即这样的元素只因它是包含元素才能够出现或它在当前适用的模型组中的内容记号是上下文中的可选记号上下文中的可选记号即这样的内容记号它是一个固有的可选记号或它有一个出现指示符并且已被满足或它在一个模型组中该模型组本身是一个上下文中的可选记号且没有已满足的记号上下文中必要的元素一个并非上下文中可选的元素且它的通用标识符是文件类型名或它的当前适用模型记号是上下文中必要的记号注一个元素可以既不是上下文中必要的同时也不是上下文中可选的例如一个元素其当前适用的模型记号出现在一个没有固有的任选记号的组中上下文中必要的记号即这样的内容记号它是其模型组中仅有的一个内容记号或它出现在一个组中并且该组本身就是一
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
本资源只提供5页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 14814 1993 信息技术 文本 办公 系统 标准 通用 标语 SGML
