1、中华人民共和国国家标准信息技术超媒体时基结构化语言发布实施国家技术监督局发布前言本标准等同采用国际标准超媒体时基结构化语言并在术语惯用语上与信息处理文本和办公系统标准通用置标语言一致本标准定义超媒体时基结构化语言该语言提供表示超文本和多媒体应用中处理和交换的静态及动态信息的设施通过制定本标准为我国信息处理技术主要提供以下内容的标准的应用领域和范围中的定义符号缩写和记法的体系结构形式和属性本标准的附录是标准的附录本标准的附录是提示的附录本标准由中华人民共和国电子工业部提出本标准由电子工业部标准化研究所归口本标准起草单位清华大学本标准主要起草人蒋维杜张素琴陈亮蒋义陈娟陈斌前言国际标准化组织和国际电
2、工委员会是世界性的标准化专门机构国家成员体它们都是或的成员国通过国际组织建立的各个技术委员会参与制定针对特定技术范围的国际标准和的各个技术委员会在共同感兴趣的领域内进行合作与和有联系的其他官方和非官方国际组织也可参与国际标准的制定工作对于信息技术和建立了一个联合技术委员会即由联合技术委员会提出的国际标准草案需分发给国家成员体进行表决发布一项国际标准至少需要的参与表决的国家成员体投标赞成国际标准是由信息技术联合技术委员会制定的附录构成为的一部分附录仅提供参考信息引言本标准定义了超媒体时基结构化语言这种语言提供表示静态及动态信息的设施这些信息在超文本和多媒体应用中处理和交换是信息处理文本和办公系统
3、标准通用置标语言的一个应用支持传统的信息参考分类书目模型同时它能在任何时候描述与任何东西任何地点相连的链接这一模型延伸至计算机化的信息时代即集成的开放超媒体的一个应用领域为文件和其他信息对象内部及其之间的特定互连超链以及多媒体信息在时间和空间上的调度提供了标准化机制如果没有这些信息通常嵌入在负责绘制这些文件的超媒体文稿的处理指令中所以不适用于其他的处理形式如果使用那些独立于特定处理信息的性质可以不只被生成该信息的应用和平台所处理应用设计者和用户可以用这种办法确定从文稿中分离出哪些性质理想的情况只需要考虑这些性质是不是信息的固有性质不必管它们是如何处理的例如本章的标题是固有信息而它所用的字体通常
4、不是固有信息而实际上表示策略会根据不同的情况而变化并且依赖于其他方面的考虑例如信息的预计使用文稿语言的灵活性和性能出于这一原因是高度模块化的从而应用设计者只需使用已有设施对他们所关心的性质进行标准化的描述为标准化表达超媒体的结构化信息而确定的规则叫作体系结构形式它们决定属性的使用属性是对信息对象固有性质的表示模块语言的体系结构形式和属性划分为六个模块每个模块都有所需的设施和选项支持声明指示对模块及其选项的支持基本模块基本模块由独立的实用设施组成有些设施可选必需的设施支持超文本管理使用和性质标识可选的设施则提供属性值和字符内容的词法定义强类型和引用的求解范围控制对文本部分直接访问的优化缺省属性的
5、上下文相关控制公用元素的查找表动作跟踪将多个实体存入单一容器实体以及定义信息对象的性质等度量模块使用定位地址模块中的坐标地址设施和有限坐标空间及绘制模块时需要使用度量模块中的设施在各种应用定义的度量单位中它们提供规定对象的位置和范围的函数定位地址模块不能被唯一标识符定址的对象和外部文件中的对象可以被定位地址模块标识本模块支持三种基本的地址类型名字语义定位和坐标定位也可以进行聚合定位的定址如果支持调度模块也可以对一些对象进行定位这些对象在记法中对于创建该定位地址的应用而言是未知的表达超媒体对象定址的系统无关方式还为其超链和调度能力提供基础超链模块本模块可在对象之间进行连接超链既可以在单个文件内部
6、又可以在构成超文件的文件和信息对象之间进行调度模块本模块可对事件对象的出现在有限坐标空间的坐标轴上进行调度其方式是通过事件之间的相互关系表达它们的位置可以通过时间或空间单位沿坐标轴进行度量绘制模块当使用调度模块时对象修改和或事件投影可以用来表示支配绘制处理的参数对象修改对象修改设施允许对绘制过程中对象的修改顺序进行说明并且可能影响它们的对象修改器如放大器和过滤器注没有定义修改器的语义只定义了其应用序列事件投影绘制过程要求把事件投影到一个能被感知的坐标空间中例如从一个以虚拟时间为坐标轴的坐标空间投影到一个以实际时间为坐标轴的坐标空间事件投影设施允许说明一些因素用于计算目标坐标空间中事件的位置和范
7、围当为一个事件所提供的位置和范围不确定的时候比如当用户之间的相互作用会有影响时原始事件的虚维可以通过一些公式投影到实际空间时间上这些公式出现在任何由用户定义的表达式语言中在求解被投影事件的位置和范围的绘制过程中这样的表达式可在其他方面接受滞后绑定值注不定义格式化的对象的语义来适应新范围应用可以选择把绘制信息包含在超文件的基本部分中也可以把它们包含在处理程序的中这是由所提供信息的本质决定的例如绘制形式在多媒体文件中比在常规文件中是基本的形式应用为各种应用提供了通用层次上的支持不只是某一特定的语义即就像是一个携带者或基本结构应用和之间的界限是可变的完全由设计者确定设计者可以自由地决定哪些信息使用进
8、行标准化表达哪些只是由应用特定的例如在一个数据内容记法中因为体系结构形式的语义和属性的语义是标准化的所以可以实现对各种应用所使用软件和或硬件的支持当定义一个基于体系结构形式的元素类型时应用可以定义附加属性应用自身仅能定义由应用定义的元素类型和属性的语义这些语义可以由工业集团或者正式地由国家或国际标准化组织加以标准化在本标准中属性只有特定的而没有固有的含义但是应用可以隐含地或通过定义适当的元素类型和属性为其加上附加语义例如体系结构形式维引用仅指一个元素的维相对于其他元素的维的计算而应用可以规定如果希望的话使用维引用在元素之间进行同步并可以通过维引用元素类型的通用标识符加以强调元素可以出现在任何应
9、用的和的元允许的地方例如为了表示该上下文中的日历或投影平面有限坐标空间可以出现在记录的段落中相比之下多个段落可以作为一个时序事件的内容出现的客户机包括应用和应用体系结构可以像定义元素一样定义非体系结构形式尽管应用不能给增加新的体系结构形式或对形式进行组合但是它们仍可以创建自己的属性比如来标识自己的体系结构形式集例如如果一个文件同时含有和体系结构形式通过分析器以形式对各个元素的内容和属性进行处理和确认后具有属性的元素由引擎处理和确认而具有属性的元素则可能由其他适当的应用来处理和确认如可能由一个方法辅助完成定义了一些应用所需的参数来完成绘制和某些绘制功能其他参数可以由应用或者由与应用一致的文件体系
10、结构提供为了表达不同需求和服务于不同用户可以同时存在许多不同的与一致的应用和体系结构这些体系结构在非方面可以不相容但必须由单一引擎支持注例如即使一个应用的投影函数非常复杂和特殊它也不必为表示有限坐标空间而定义自己的系统有特定的应用投影函数使用应用选择或自定义的函数语言通过与未投影和投影的有限坐标空间的标准化表示方式相连接来加以表示是专为典型的多媒体应用中的顺序和对齐问题而优化设计的它不是为复合文件的页输出而设计的普遍体系结构求解方法对于后一种情况用其他方法求解可能会更好注但是和其他许多这样的求解方法是相容的例如有限坐标空间可以用来描述页面描述语言的对象所映象到的媒体本标准的组织本标准的组织体现
11、的模块化结构结构如下基本模块第章是其他章节的先决条件它描述的一些设施在的所有应用中都需要度量模块第章描述定位地址和调度模块设施所需要的设施定位地址模块第章超链模块第章调度模块第章所描述的模块各自独立绘制模块第章中描述的模块依赖于调度模块一致性第章描述对文件应用和系统进行一致化所需要的条件本标准还包括如下附录附录该标准的附录定义一些有用的设施包括词法的建模查询和维计算的记法附录该提示的附录提供补充指导和参考资料的来源中华人民共和国国家标准信息技术超媒体时基结构化语言国家技术监督局批准实施范围范围本标准定义一种语言以及用于表示链接及同步静态与动态基于时间的信息的超文件的基本模型这些信息包含在多种常
12、规的和多媒体文件和信息对象中这一语言就是超媒体时基结构化语言即既可以用抽象的或虚拟的意义也可以用用户自定义的实际时间单位来表示时间它还提供了联系这两种方式的办法这样依赖于时间的文件元素可以得到同步注这一设施把曾经局限在常规文件中的从式样考虑来区分固有信息的能力延伸到了对多媒体信息的表示中用于表示时间模型的技术同样可以用于空间和其他领域都可以当作沿不同的坐标空间轴进行度量的系统看待而且它还支持任意交叉引用和基于外部相互作用超媒体的访问路径的时间表示包含足够的信息来导出控制姿态的数据如对音像硬件的控制信息和直观数据如乐谱故事描述或电视画面的存在时间在一个超文件中媒体格式和对象的数据记法可以包含格式
13、化的和未格式化的文件静止图像的音频和视频段以及面向对象的图形等用户可以用各种度量单位和颗粒来规定对象在空间中和在时间上出现的位置和范围通过选择适当的度量单位可以支持应用从动画到投影管理的临时需求注本标准没有对音频和视频数据内容的表示进行表达而只是定义了用其他数字化信息同步这些数据的起始和持续方式本标准也没有特别说明适应于未格式化文件和其他信息对象的特定位置和范围的输出处理是一个使能标准而不是一个限定标准所以构成超文件的对象可以与任何应用体系结构或与由标准规定的文件体系结构保持一致并能以这些体系结构允许的记法表示只有决定超文件成员的中枢文件必须在符合其他体系结构的同时符合满足灵活性和可扩充性设计
14、要求可选子集可以单独实现也可与用户自定义的扩展方式联合实现超媒体时基结构化语言是符合的一个应用本标准推荐使用的超文件交换格式是由规定的文件交换格式而是按规定的抽象语法记法定义的它能按照的基本编码规则进行编码从而可以使用符合开放系统互连模型的协议进行信息交换应用领域的应用领域是集成开放超媒体即超链的书目模型用户可以通过适当的引用在任何时候和任何东西任何地点相连由于的模块化设计和灵活的一致性规则在补充实现中只需支持当前使用的设施由于对完全超媒体解决方案的向上兼容路径的良好定义用户也不必对超文件做任何准备工作可以用作和平台无关的超媒体及同步的和未同步的多媒体应用中信息交换的基础结构应用开发者可以使用
15、结构来设计他们的信息结构和对象并使用语言对其加以表示以用于交换注语言并不是为了在执行应用程序时对信息的内部表示进行编码而专门设计的在绘制的任何阶段从可修改的到优化的交互访问应用能使用来表示包含信息的超文件应用还能选择把一个超文件的绘制转变成适于传输和交互表示的优化形式注的超文件表示能否在局部文件系统中由程序直接访问依赖于超文件的信息类型平台速度和访问该超文件的应用执行的功能引用标准下列标准所包含的条文通过在本标准中引用而构成为本标准的条文本标准出版时所示版本均为有效所有标准都会被修订使用本标准的各方应探讨使用下列标准最新版本的可能性信息处理文本和办公系统标准通用置标语言信息处理支持设施文件交换
16、格式信息处理支持设施公用文本拥有者标识符登记规程信息处理系统开放系统互连抽象语法记法一规范信息处理系统开放系统互连抽象语法记法一基本编码规则规范定义本标准采用下列定义锚点一个由超链连接的对象聚合对象注所谓对象在中并不是一个形式结构一个锚点可以是一个文件一个元素任意块数据或其他当且仅当一个对象被一个超链标识时它才是一个锚点在相同或不同的超链中一个对象可由几个链端标识为锚点应用由应用根据其规则决定的一个有限对象集注这些规则可以由一系列参数自动决定或者由用户挑选或者两种方式都使用一种可能是由应用把中的实体作为起点但允许用户增加或删除实体位组一个位的有序集例如一个字节是或位的组合在字符数据或置标中一个
17、位组表示一个字符但对非字符数据则可以表示数字或其他值有限对象集应用处理的主题一个或多个文件和其他信息对象的集合注有两种和应用维坐标轴上的大小和位置由三部分组成一个位置占据的第一个量程一个量程计数所占据量程的总个数和占据的最后一个量程文件标识为一个单位并能由人感知的信息集文件类型定义由应用决定的把施用于某个特定类型文件的置标的规则一个文件类型定义包括一个在文件类型声明中表达的形式说明说明元素类型元素关系和属性以及能被置标表示的引用从而定义置标的词汇表该置标的语法是由定义的注一个文件类型定义还能包括描述元素和属性语义的注释以及任何应用约定实体描述符一个表示外部实体的数据流的组成部分实体树结点为实体
18、的树型结构可通过以下几步构造出来根结点可以是一个文件实体或子文件实体外部实体集合由该结点中置标声明的外部标识符参数标识该集合由结点的子结点组成作为文件实体或子文件实体的每个子结点可以再被选作一个父结点对每个父结点重复步骤直到树的叶子或层数的最大值注当把层数的最大值作为一个中枢时它是文件的一个属性而且当一个应用被调用时它可以被忽略事件在坐标空间中对象的出现把调度范围与对象相关联注一个事件的调度范围决定对象的位置和大小所有坐标轴第一个量程的集合定义位置而量程计数的集合给出维的说明并定义其大小事件投影事件的调度范围从一个坐标空间到另一个坐标空间的转换从未投影的到投影的注例如从音乐节拍到实际时间或从用
19、户设备坐标系到实际空间单位外部标识符标识一个外部信息对象的置标说明典型的实体说明的参数注它可能有多种形式包括一个形式的公用标识符即全局唯一的公用标识符它允许系统通过一个查找表访问其对象和或一个系统标识符即文件标识符存储位置程序调用数据流位置或在存储体中定位对象的其他系统特定方式中枢文件访问一个超文件的起始文件在一个超文件中中枢文件还为交换绘制或其他处理定义一个注中枢文件不是文件的一个参数状态也不能用一个属性来说明中枢文件的指定是处理过程的一个参数并在调用该应用时被说明如果几个超文件作为中枢文件可以为其定义相同的超文件通过网相互连接的两个或多个文件或者其他信息对象注对超文件的访问是从所指定的中枢
20、文件开始的超链表示两个或多个对象之间联系的信息结构注由超链链接的对象叫做这个超链的锚点锚点由被称为链端的超链性质来标识使用的应用和体系结构可以给超链分配链接类型和名字除超链外文件也可以表示关系例如置标标记的位置表示了文件层次的从属和兄弟关系超媒体应用有超文本和或多媒体能力的信息处理应用注这一定义的含义是超媒体指超文本和多媒体的联合而不是交叉尽管可以在超文本多媒体和超媒体之间维持严格的区分但在本标准中当提到文件或应用时这样的区分并没有多大意义但是事件是特指多媒体而不是超媒体的因为有无超链并不影响事件的本质类似地超链由于没有被它们所连接的对象所影响可以不加区别地被描述为超文本超媒体或冠之以超超媒体
21、文件在超媒体应用中使用的文件或超文件注因为超文件通常用于超媒体应用中它几乎永远是超媒体文件但是并非所有的超媒体文件都是超文件例如一个包含电视画面而不包含超链的文件超媒体时基结构化语言一种用于表示超文本链接时空事件调度和同步的标准超媒体结构化语言提供了基本的标识和定址机制并且独立于对象数据记法超链类型处理和表示功能及其他应用语义不论文件是否可被修改符合或不符合的超文件都可以建立起超链的全部功能支持集成开放超媒体引用的书目模型允许超链在任何时间任何地点链接任何东西而系统只需要支持其表示能力之内的相应子集属性属性其定义包含在的体系结构形式中一个有限对象集由单一文件或超文件构成超文件中的文件和信息对象
22、应存储在单一实体树的结点中注一个引擎可以自动地确定一个实体树的根是中枢文件的文件实体文件文件它从根本上是如本标准的定义表示的注文件通常就是符合的文件见元素元素类型的一个实例元素类型在文件中符合体系结构形式的元素类型注没有定义元素类型自身除了体系结构形式定义的属性外它可有应用特定属性引擎识别文件中结构并对其进行与应用无关的处理的一个程序部分程序或多个程序的组合注例如一个调用可以通过数据库和网络服务器接口来解析和访问锚点它还可以在坐标空间中连续地对事件进行定位计算而不论事件所进入的调度或为定义其范围所采用的度量单位怎样超文件中枢文件为文件的超文件注中枢文件必须能以表示而超文件的其他部件则不需要中枢
23、和其他部件应当符合文件的体系结构系统包括一个引擎的系统超文本可以按多种顺序访问的信息注一个超文本可以是一个单一文件或一个文件库一个超文件例如一本小说通常不是一个超文本一本有注脚或内部交叉引用的书是一个单一文件超文本一本具有外部交叉引用例如书目引用的书是库的一个成员该库作为整体构成一个超文件一本既具有内部又具有外部交叉引用的书既是一个单一文件的超文本又是整体上构成一个超文件的库的成员集成开放超媒体为进行计算机处理对引用的书目模型进行的形式化该引用能表示任何时间任何地点与任何东西的超链链接根据上下文链接可以是一个超链或者一个处理链链接进程链端超链的一个性质它通过定位标识锚点注术语定位在中不是一个形
24、式结构链端能通过名字坐标定位或其他任何语义结构对锚点定位链接处理定义利用来描述链接处理的应用特定规则链接处理定义包括一个正规的说明该说明是通过链接类型说明来表达的它说明了源和结果元素之间的链接其中包括应用于链接处理的源属性的定义链接属性注一个链接处理定义还可以包括对该语义的描述如链接属性的含义及其对处理的影响链接类型超链的一个类它指明了由超链所表示关系的含义包括每个锚点在关系中所起的作用多媒体利用多种方式进行事物间通信比如艺术家作曲家等所采用的交流形式对象修改在绘制时一个对象对另一个对象进行修改注例如通过一个作用框可以路由选择音频信号处理的是修改符的调度而不是修改的语义修补修改符与其所修改对象
25、之间的互连展示能被人感知的一个文件处理状态最近说明元素最近被分析的文件的表示中的元素注当把表示看作一个字符串时尽管一个实体引用可能使其他元素比最近说明元素更近地被分析但通常它仍是最近发生的投影事件投影量程坐标轴上不可再分的可计数的间隔实际时间日常意义上的可以用等度量的时间绘制为准备展示文件而进行的处理除应用特定的处理外还可能包括定义的事件投影和对象修改注为了最终让用户感知展示几个绘制可以按顺序进行绘制可以把事件投影到一个新的坐标空间例如从虚拟时间到实际时间可报告的差错不符合本标准需求的文件而不是如果不处理该文件就不能被发现的差错或在本标准中被标识为不可报告的被调度的范围在坐标空间中的大小和位置
26、它由空间中每一根坐标轴的维所构成打包程序生成数据流的程序解包程序把分解为构成它的实体的程序注如果需要的话解包程序将修改系统中置标声明的标识符参数使其与环境中的存储地址相一致文件交换格式是一种数据结构它可使主文件及其相关文件每一文件可能存储在几个实体中组合成一个单一的数据流进行交换而这种方式又允许接受者重构这些分离的实体注当的超文件交换格式是时如果有多个文件那么主文件是中枢文件处理链接的链接处理特性它允许多个上下文相关展示集合以及与超文件元素相关联的处理说明子文件实体符合其自身的文件类型和链接类型声明并符合文件实体中声明的实体它至少含有一个基本文件类型声明及一个基本文件元素的起始和终止名字通过记
27、法声明的标识标准度量单位的名字验证引擎验证引擎当且仅当存在一个可报告的差错时该引擎能找到并报告之视图对网及与其相连的锚点的表示网共同使用的一个或多个超链的集合注通常超链处理的是共用主题并且或者它们能通过公共锚点被连续遍历并且或者锚点在相同的对象中发生符号和缩略语本标准采用下列缩略语有限对象集文件类型定义有限坐标空间格林尼治时间度量单位超媒体时基结构化语言集成开放超媒体儒略日期链接处理定义度量域单位修改的儒略日期限定的词法类型名字限定的性质名字可报告的差错文件交换格式标准通用置标语言标准度量单位子文件实体等同的格林尼治时间本文件向产业和专有标准产品用户组织和出版物提供一些参考这些参考并不是正规的
28、也不意味着是由或其他国家成员体或分支机构签署的这里提到的任何牌号名字或商标是其各自所有者的私有财产形式定义是本标准的一部分并受到版权保护为了提高的一致在本标准的体系结构形式及附录中元素类型和实例的形式定义可以在如下版权公告中被特定拷贝但是本标准的其他资料不能被拷贝记法的说明是由叙述文本和形式定义组合而成的形式定义用表示注为理解某些词汇的含义读者应当熟悉本文件所使用的由委托的编辑约定在附录中可以找到对这些约定的简短解释和在本文件中使用的子集但是本章描述了使用定义体系结构形式的特殊约定描述每一结构的文本着重强调语义而形式定义提供的主要是对文本描述的严格语法定义有时这些文本会讨论超出形式范围的语法论
29、题从而需要加以解释但是有些内容不在文中论述如属性值或提供的缺省值的论题注出于这一原因在引用定义时最好阅读一下其文本描述尽管定义是在其相关文本之后决定的但是有时先阅读会很有帮助体系结构形式由于是一个使能工具它没有说明单一的文件类型说明或文件体系结构在形式上被定义为一个规则集合叫做体系结构形式应用设计者可以在他们的文件类型定义中对其加以应用体系结构形式是创建和处理元素的规则就象文件体系结构是创建和处理文件的规则一样体系结构形式主要由属性定义来说明其中一种属性是体系结构形式属性其值标识了该形式但是一个体系结构形式还可以包括用于结构符合该形式的元素类型内容模型的规则共有两种体系结构形式元素类型形式这是
30、一个与属性定义表声明相连的元素类型声明属性表形式只用一个属性定义表声明定义它的属性定义只能由所指定的元素类型形式或数据内容记法使用尽管元素类型本身是由应用定义的而不是由定义的但是符合元素类型形式的元素类型即为元素类型即使元素类型本身不是由定义而是由应用定义的一个应用能包括和非元素类型元素类型体系结构形式严格地规定了在何处可以出现这两种元素还定义了一些不同的元素类型符合元素类型形式几个有用的元素和相关的数据内容记法编辑约定结构第一次引入时会在文本中加以描述如果这一结构出现在形式说明中还会同时将其形式名字和英文全名表示出来如下所示元素类型形式完全结构名字名字属性表形式名字属性完备结构名字名字不需要
31、对出现在多处的同一结构做重复描述如几个元素类型形式中的同一属性约定使用声明可以对体系结构形式及元素类型的语法和结构进行严格的规定声明中包括被称为常规注释的注释这些注释跟随在子条目设立的约定之后用来规定构造和由引擎和分析器所加的约束注使用这一技术可以在创建时把说明拷贝成模型使用并能对声明进行正确的分析但是常规注释并不能扩充在本标准中它们只能用作文件的表示方法不必把它们包括在的应用中如果包括的话分析器将像处理其他注释一样将其忽略注引擎应当在根本上了解注释表达的信息即应由创建引擎的程序员而不是引擎本身来阅读注释定义体系结构形式的声明是用小写表示声明名字的定义元素类型不是元素类型形式的说明应服从通常的
32、约定其说明名字应该使用大写字母注不像元素类型名字在中体系结构形式名字并非必须用在中尽管当应用只需要一个符合形式的元素类型时可以使用元素类型形式名字而属性表形式的名字却不然因为里没有与它们对应的部分元素类型形式与属性表声明相连的元素类型说明定义了元素类型形式元素类型声明在元素类型声明中元素类型形式的结构是由一个元内容模型定义的此模型的元意味着其元素类型是真正的体系结构形式并且是指任何符合该形式的元素文本中叙述了是否把任何语义与内容相连如果在文本中没有说明元素作为包含它的元素的内容没有特殊语义而当它们作为单独的元素有其规范语义注例如一个活动跟踪策略元素的内容没有定义特定的语义但是内容中出现的上下文
33、链接元素有一般的语义在本标准定义的一组声明结合起来表示一个元如果在一个文件实例中的元不允许出现它的地方出现了这个元素或者必须出现特定体系结构形式的实例的地方没有出现该形式那么这是一个可报告的差错只约束文件实例而不约束文件类型定义的结构只要其文件实例集符合在文件中允许出现任何符合的文件类型说明注验证引擎能够可选地报告妨碍创建有效的一致实例或导致创建不一致实例的结构如同一般的内容模型可以使用其包含例外来定义元模型该使用方式意味着在文件实例的内容及从属元素的内容中可以随处出现已命名类型的元素应用设计者在他的中可以选择把某些元素作为适当的子元素或包含性元素或两者都有注具有包含的内容模型的一个例子如下文
34、件元素在本标准中组成定义的元包括了的所有可选设施而应用于一个文件的实际元是可变的见但是对于任何系统声明见所有的应用只有一个元也就是说一个由文件支持声明隐含的更严格的元约束是由文件的规定的注一个应用元素类型的声明内容或内容模型可以不同于体系结构形式只要其实例符合体系结构形式元模型例如一个元模型可以是通过使用内容模型应用设计者可以合法地排除的可能性如果实例中出现的不是的话甚至可以是通过记法和常规注释可以对字符数据内容作进一步的规定超出通常的符号此常规注释及其在文件编制属性值中的相关使用将在中加以描述属性表声明在一个元素类型形式的属性定义中第一个属性是标识体系结构形式的必备属性由于必须对每个接受由定
35、义的处理元素进行规定属性是唯一的注通常相同类型的元素具有相同的体系结构形式这样在中允许该值不变但是这并不是必须的例如一个元素类型定义允许其实例是可选体系结构形式之一在中叙述了符合约定的其他属性定义当一个元素类型形式的属性对于元素类型是必须的或者该说明对于元素类型很重要时则元素联系的形式属性表说明中还包括这些属性解释见后例如如果存在必须引用某个形式实例的元素该形式的属性应当包括进来一个元素类型的应用属性表还可以包括来自某个属性表形式的属性属性式表形式名字和关键字属性一起出现在定义的常规注释中属性表形式属性表形式定义了可以在元素类型的属性表中使用的属性包括链接属性表这些元素类型符合一个或多个元素类
36、型形式可以使用属性的元素类型指定如下如果属性表形式的名字是以开头的这些属性可以和任何或非元素类型一起使用也就是公共属性其他情况下属性表声明中包括与关键字使用相结合的常规注释在使用之后有能与这些属性一起使用的元素类型形式名字表而且有两个定义与数据内容记法一起使用的属性表形式详见属性表约定除属性外的所有属性不论是作为元素类型形式还是作为属性表形式一部分都使用本条中的约定进行说明属性名字一个属性定义是由一个属性名字一个声明值描述和一个缺省值描述组成的像在声明中单独定义一样定义的组成部分可以用注释分开注对于一个给定的元素类型一个应用可以通过属性代替属性的标准名字见声明值描述定义的属性的词法和数据内容是
37、由包含关键字或的常规注释规定的此后跟随词法模型记法表示的一个词法模型见此注释出现在属性定义或元素声明中关键字标识一个规范化的词法模型而标识的是非规格化的词法模型注不仅可以进行文件编制它同样是一个设施并能被应用设计者使用属性值的语义约束是在包含关键字约束的常规注释中定义的约束是由可自我解释的注释和或在伴随文本中的附加信息解释的要求引用的声明值规定由关键字或说明或者由常规注释的引用来指明如属性定义中包含关键字的常规注释之后是一个组那么引用的目标必须是符合其名字在组中出现的元素类型形式的元素类型的元素注意组是元其名字是体系结构形式而不是元素类型任何满足本标准的声明值描述都能被应用所使用注这一要求可以
38、这样来满足通过允许求解对象的引用这些对象应满足本标准的声明值规定缺省值描述属性可分为必备的或非必备的以及固定的或可变的如下非必备属性这类属性可在应用中定义但不是必须的如果没有定义为其提供一个值这个值由属性定义的缺省值描述或者由以缺省开头的常规注释记录必备属性这类属性必须在应用中定义并且由该应用通过缺省赋值或在开始标记进行说明在属性定义的缺省值描述中通过出现的关键字或字符串和或通过同时省略属性值与常规注释缺省可以对属性的必备状态进行文件编制注尽管属性不属于上述文件约定但它仍是必备性属性可以通过其名字加以识别一个可选的设施可以具有必备属性而这些属性只有在支持该设施时才是必备性的固定属性包含关键字的
39、缺省值描述标识该属性是固定属性也就是说对于一个给定的元素类型的所有元素固定属性必须有相同的值注在这种情况下中所有的应用都应使用一个值但由于只定义文件实例的一致性这并不是必须的然而验证引擎会可选地对关键字的缺省加以警告可变属性不固定的属性是可变属性通过在缺省值规定中缺省关键字来加以指明在一个应用中不论可变属性是必备的还是非必备的其缺省值描述能够使用许可的任何关键字或属性值说明在本标准中这和属性文件编制的形式是无关的除了如果没有定义非必备属性或者定义的隐含属性没有缺省值并且在起始标记中规定那么引擎使用本标准提供的缺省值注应用可以使用缺省值表设施方便地规定隐含属性见在本标准中被写为或属性应当由应用规
40、范地加以定义注下面表给出了声明值和缺省值规定的例子用于编写属性类型的各种组合必备的固定的必备的可变的非必备的固定的缺省无非必备的可变的缺省不知道缺省语法内容缺省最新指定的基本模块本章叙述基本模块它在所有的应用中都是必需的概念和定义本条叙述与基本模块设施相关的一些关键概念对象表示在文件中用来表示对象本条叙述了与有关的关键结构注不是文件的超文件组成部分不需要用来表示超文件的中枢文件必然是文件所以必须用来表示是一个概念性工具用于对能被人们感知的信息结构叫做文件进行建模同样也是作为表示它们的记法文件可以使用三种主要结构来分析和表示元素可以包含数据或从属元素的建构块通常文件中的元素是段章标题插图和表在超
41、媒体文件中有时是不同类型的超链事件调度事件以及用各种数据记法编码的对象属性与给定类型的元素相关联的性质其值描述元素但不是元素内容的一部分例如章节或表的修改日期的编辑者许多元素类型具有属性它标记了该类型的每个元素从而可以在文件的任何地方明确显式引用它这种引用是通过具有引用属性的元素来完成的而其属性值为引用的元素的标记是由元素属性定义的实体包含部分文件有时是全部的一个信息存储单位在一个文件中实体可以使用名字在一个或多个地方加以引用从而在引用点将其信息包含在文件中见实体独立于元素例如一个实体可以包含部分图片元素或一个半段落元素一个给定文件所允许的结构的特定实例应当在符合该文件的文件类型定义中声明的设
42、计者可以允许特定文件的用户对它的某些部分进行扩展或修改通常通过对中引用实体的再定义来实现该技术提供的灵活性适应多种类型的应用实体结构包括一个被称作实体结构的虚存模型它允许用户为方便管理而任意地划分文件由于从实体到实存的映射与实现有关而且实体与存储对象之间不需要一一对应所以实体结构是虚的通常在定义与应用处理过程相关的结构元素结构的那部分文件类型定义中反映实体结构这种做法并不常见实体结构的独立性是的一大优点并且对于超文本来说是必须的例如它减轻了应用设计者的负担使其不必考虑某些章节是否跨越多个存储对象或者单一存储对象是否包含多个章节数据术语数据用于区分文件中不属于文件结构的信息例如一个段落内的某一字
43、符正文或表示一张图片的光栅信息都是数据如果一个外部实体包含的文件与引用它的文件表示方式不同该外部实体也是数据注类似地一个文件或子文件的递归实例相对于当前实例也是数据这是因为它有自己的而不是在当前所分析的上下文中分析的有时数据又指示为内容但是这样使用是不明确的因为元素的内容并不局限于数据还可以是子元素或同时有子元素和数据在属性值或外部数据实体中数据还可以出现在元素内容之外注在中数据还定义为非置标的这两种定义是一致的在一个文件中数据是非结构化的信息当然也不是置标的反之亦然提供了对各种形式的数据进行定址的设施或者通过结构或者通过能理解数据表示的定位地址来交互实现见第章对象标识和定址超文本的链接和多媒
44、体时间同步具有相同基本功能定址超链通过名字空间中唯一的名字来对其对象进行定址时间同步使用时间轴上事件的坐标地址事件的地址通过与事件的关系表达出来空间对齐是类似的不过轴是用空间单位而不是时间单位度量的名字空间定址的名字空间定址来自名字可赋予应用所定义的信息的成分即元素以及信息的存储段单位即实体大多数时候应用只处理元素并且对存储的管理是透明的所以名字的基本形式在文件的各元素间是唯一的即唯一标识符其他形式的名字在引用时要转换为指明引用对象的基本方式叫做引用象一样它是元素的一个属性为了在当前文件之外进行定位使用了一个标准的标识系统包括公共的和专用的局部的和全局的唯一的标识符见坐标定址的坐标系统叫做有限
45、坐标空间它包括一个坐标轴的集合和对它们进行度量的系统每根轴都作为一个量程的有序集来处理坐标地址由位置第一个量程和坐标空间中各个轴的一定数目的量程组成当支持调度模块时可以在坐标空间中给定对象出现事件的位置可以通过引用其他事件的位置来定义某些事件的位置从而相互对齐这些事件当支持定位地址模块时定位地址元素可以被定义为标识符同坐标地址的联系这类定位地址允许对只由位置标识的对象进行引用注例如句中的第三个词它还允许引用对象的任何部分注例如句中第三个词的第二个和第三个字符语义定址任何记法中的任何对象都能用超文件表示出来整个对象可以是元素所以能有一个对象也可以包括在一个事件中从而具有一个坐标地址当使用定位地址
46、模块时还可以使用未知的语义结构来对一个对象进行定址这种定址是在适应对象自身记法的数据内容记法中做的尽管语义地址是由应用或系统服务而不是由引擎完成的它仍像坐标地址中一样相当于定位地址元素实现的一个超文件管理设施任何的使用都需要超文件管理设施它们包括对象的表示标识和访问以及超文件交换格式对象表示文件的表示设施由提供在中有定义要求使用形式公用标识符特性但并不限制对可能的选项和变化的选择文件表示设施包括文件类型定义能力包括能由应用设计者控制的用户扩充对任何体系结构的表示信息对象的区分包括文件组成部分如元素属性和数据内容部分包含多媒体对象格式的能力这些格式可以以任何内容记法表示把处理说明从固有信息中分离
47、出来的能力把多种处理说明式样与元素类型和单个元素联系起来的能力独立透明的实体结构见注在一个超文件中除中枢文件外的文件和信息对象不一定是文件而且不必用来表示超文件中的文件包括中枢文件要符合文件体系结构对象标识和定址文件中的对象标识设施由提供在中有定义对外部文件和信息对象的标识由符合的公用标识符完成注允许把公用标识符表示成多种格式包括结构和形式公用标识符不必用来表示已标识过的对象不支持的公用标识符形式例如具有语义注释的分布对象引用可以作为语义定址处理见名字空间定址需要对象标识对象访问系统的实体管理部分提供了从对象标识到其物理存储的访问方式它可能调用网络过程从远程数据库获得定位的数据这一过程类似于书
48、库管理员能通过查找本地书库或是查询其他书库目录来找到书超文件交换格式超文件交换格式是将超文件中的独立文件和信息对象合并为用于交换的单一数据流的数据结构中推荐使用的超文件交换格式是中定义的文件交换格式注本标准没有约束超文件实施过程的交换格式应用可以选择最适于传输或相互作用表示的格式是用来定义的它提供了与开放系统互连协议兼容的能力独立于其信息对象的体系结构和应用所以一个实现能支持所有的应用有限对象集超文件是一个或多个超媒体文件和其他信息对象的集合它们是由超链直接或通过网链接在一起的进行处理时超链从被指定为中枢文件的文件开始进行遍历操作在一个超文件中中枢文件的指定还允许在那些用于交换或处理的对象集周
49、围设置界限如果没有界限由于所链接的每个文件可能具有与中枢文件不相连的网会导致引入大量不需要的无关的或不太相关的信息以中枢文件的文件实体为根的实体树时引擎可以自动地确定有限对象集合实体树包括中枢文件中声明的外部实体以及这些实体声明中的外部实体等等只有那些在置标说明中由外部标识符参数说明的实体才能被识别所以如果外部引用是来自使用引用的记法特定形式的数据内容那么除非文件生成器也为其创建实体说明在有限对象集中不会包括该实体可以通过中枢文件的绑定层次或者通过在调用过程中指定一个参数来约束实体树的深度这个参数还可以指定由应用而不是由引擎决定有限对象集此时可以使用一种完全不同的确定方法一种可能是应用把作为起点使用但允许由用户增加或删除实体一个数据流能携带任何有限对象集而非严格地限于超文件特别是交换数据流可能包括单个超文件的所有内容超文件的一部分以及所有或部分其他文件对于所有这些情况保留文件和信息对象的界限以及创建者环境中存在的实体结构打包程序创建的过程应用或引擎应向打包程序提供包含的实体的名字如果存在中枢文件的文件实体该文件实体被标识为的主文件在数据结构中打包程序为每个实体创建实体描述符但是如果实体的外部标识