GB T 29181-2012 术语工作 计算机应用 术语信息置标框架.pdf

上传人:orderah291 文档编号:198693 上传时间:2019-07-14 格式:PDF 页数:48 大小:1.81MB
下载 相关 举报
GB T 29181-2012 术语工作 计算机应用 术语信息置标框架.pdf_第1页
第1页 / 共48页
GB T 29181-2012 术语工作 计算机应用 术语信息置标框架.pdf_第2页
第2页 / 共48页
GB T 29181-2012 术语工作 计算机应用 术语信息置标框架.pdf_第3页
第3页 / 共48页
GB T 29181-2012 术语工作 计算机应用 术语信息置标框架.pdf_第4页
第4页 / 共48页
GB T 29181-2012 术语工作 计算机应用 术语信息置标框架.pdf_第5页
第5页 / 共48页
亲,该文档总共48页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、ICS 0 1. 020 A 22 道B中华人民共和国国家标准GB/T 29181-2012月SO16642: 2003 术语工作计算机应用术语信息置标框架Computer applications in terminology一Terminological markup framework (ISO 16642: 2003 , IDT) 2012-12-31发布2013国06-01实施ks/俨产总d矿郁吨中华人民共和国国家质量监督检验检亵总局也士中国国家标准化管理委员会Q(.IJ 7号-,-0-,一/叮叮江主VJ/ GB/T 29181-2012月SO16642: 2003 目次前言.皿1

2、范围.2 规范性引用文件-3 术语和定义.4 术语信息置标的一般原则与互操作性原则.3 5 语言数据描述的一般模型及其在术语工作中的应用.55.1 导论55.2 结构层次和信息单元的一般表示.7 5.3 术语信息的元模型.8 5.4 以元模型为基础设计术语数据的表示形式5.5 交换、发布和互操作性.5.6 一般模型的XML规范表示.5.7 术语数据集中各种语言的表示法.15 6 定义TML. . 16 6. 1 概论.16 6.2 互操作性条件的定义.16 6.3 TML的实现.17 附录A(规范性附录)GMT格式的XML描述方案.20 附录B(规范性附录)MSCTML . 22 B. 1 简

3、介. 22 B. 2 MSC XML文挡的例子. 22 B. 3 扩展树. 24 B.4数据类目 25 且5结论. . 26 附录C(规范性附录)Geneter TML . 27 C.1 简介.27 C.2 范例z作为TML的Geneter子集的规范.27 C.3 GI 29 C.4 TE 29 C.5 CI . 36 C.6 Geneter 限制和扩展.37 附录D(资料性附录)术语数据与TMF的一致性.40 D.1 概要.40 D.2 示例术语数据.40 D.3 元素内容的描述.41 D.4 与TMF一致.41 GB/T 29181-2012月SO16642: 2003 前言本标准按照GB

4、/T1. 1-2009给出的规则起草。本标准等同采用ISO16642: 2003(术语工作计算机应用术语信息置标框架。本标准代替GB/T16642-2003(术语工作计算机应用术语信息置标框架。与标准中规范性引用的国际文件有一致性对应关系的我国文件如下z一-GB/T15237.1-2000(术语工作词汇第1部分z理论与应用)(eqvISO 1087-1: 2000)。一-GB/T16786-2007(术语工作计算机应用数据类目(ISO12620:1999,NEQ)。一-GB/T17532-2005(术语工作计算机应用词汇)(lSO1087-2:2000,MOD)。本标准由全国术语与语言内容资源

5、标准化技术委员会(SAC/TC62)提出并归口。本标准起草单位E中国标准化研究院。本标准主要起草人z程永红、周长青、于欣丽、肖玉敬、王海涛、刘智洋、苟恩东。阳皿GB/T 29181-2012月SO16642: 2003 1 范围术语工作计算机应用术语信息置标框架为了对术语数据集合中所记录的数据进行表达和描述,本标准针对需要使用的基本原则规定了具有指导作用的框架。该框架包括了元模型和用XML表示的特定术语标记语言(TML)的描述方法。本标准对TML中限定标记的使用方法作了定义,但除了附录B附录D所定义的三种TML之外,本标准并没有为其他TML定义专门的限定标记。本标准适用于计算机应用程序的开发和

6、使用,其目的是有利于处理术语数据以及在不同应用程序之间进行术语数据交换。它并不是对ISO12620及其他相关国际、国家标准中所规定的数据类目和数据结构规范的方法进行标准化。本标准还定义了可以使一种以TML表示的数据映射到另一种TML上的条件,并规定了相应的通用映射工具(GMT)(见附录A)。此外,本标准定义了对语言数据进行描述的一种通用性模型。2 规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单适用于本文件。ISO 1087-1: 2000术语工作词汇第1部分z理论与应用(Terminol

7、ogywork-Voca bulary Part 1: Theory and application)。ISO 12620: 1999术语工作计算机应用数据类目(Computerapplications in terminology Data categories)。ISO 1087-2: 2000术语工作计算机应用词汇(Terminologywork-Vocabulary-Part 2: Computer applications)。3 术语和定义3. 1 3.2 以下及ISO1087-1 :2000, ISO 1087-2 :2000界定的以及下列术语和定义适用于本文件。补充信息compl

8、ement町information;CI 对术语条目中所描述的内容予以补充,并在术语数据集合中共事的信息。注2领域层级关系、机构描述和参考文献信息都是补充信息的典型例子。敢据类目data cat唔0叮关于给定数据宇段的类型说明。ISO 1087-2:2000,6.14J 注1:一个数据类目是一种数据字段类型,如定义。注2:ISO 12620:1999是数据类目的目录,也就是一种DCR(见3.3户.1 GB/T 29181-2012月SO16642: 2003 3.3 3.4 3.5 3.6 数据类目注册库data category registry; DCR 为了对TML予以描述而被用作规范性

9、参考文件的数据类目规范。注:ISO 12620: 1999在本标准的话语环摸中是一个典型的DCR.数据类目选集data categoselection ; DCS 限定信息内容范围并构成TML说明的组件。注z信息内容可以受到限制,例如通过规定允许使用的数据类目种类以及各个数据类目的使用方法等.扩展树expansion tr臼在某给定TML中,构成元模型某个层面的一组XML元素及其结构关系所形成的列表。通用映射工具generic mapping tI;GMT 术语信息置标框架XML模型的标准形式。3.7 全局信息global inCormation; GI 应用于整个数据集合的技术性和管理性的信

10、息。示例z数据集的标屈、历史修订记录。3.8 3.9 3. 10 3. 11 3. 12 3. 13 3. 14 3. 15 2 信息单元information unit; IU 附于元棋型某层面上的某项不可拆分的基本信息。语言段language s四tion;LS术语条目上的片段,包含与某一种语言相关的信息9注=一个术语条自可能包含种、两种或多种语言的信息.目标语言object language 被描述的语言迦结构层structural ltvel 可附加一项或多项信息单元的元模型层面。结构骨架structural skeleton 按照元模型的要求而对某术语数据库的实例所作的抽象描述。样式

11、style 与数据类目相关的一组属性,决定着用XML表述该数据类目的方式。术语组件段term component section; TCS 术语段中的片段,用以给出术语各组成成分的语言学信息。术语段term section; TS 语言段中给出术语信息的片段。示倒z术语用法、术语元素等信息。3. 16 3. 17 3. 18 3. 19 3.20 3.21 3.22 术语数据集合Jterminological data11民tion;TDC包含特定专业领域有关各种极念的信息数据集合。ISO 1087-2: 2000 ,2. 21J GB/T 29181一2012/ISO16642: 2003

12、注z本标准假定术语数据集除包含严格意义的术语信息外,还包括Gl(3.7)和CI(3.1)0 术语条目terminological entry; TE 包含各种术语单元信息的条目。示例z学科专属性概念、术语等.注:TE中的所有元素都可与CI(3.1)、其他条目,以及同条目中的其他元素链接。术语标记语言terminologi四Imarkup language; TML 用于对TDC(3.16)进行描述、且遵循本标准阐述的限定标记方法的XML应用规范。统一建模语言unified modelling language; UML 用于对软件系统的各种特征进行描述、可视化、构建和文档化的语言。词汇表voc

13、abulary 用于根据样式(3.13)实现数据类目的字符串集合。工作语言working language 用于描述对象的语言XML提纲XML outline 一个术语数据库的组成部分,对应于元模型的XML实现方案。4 术语信息置标的一般原则与互操作性原则对某个特定的TML进行描述,可以看成是一个有着多种知识源、并在各种层次上互相作用的过程。这个过程引出了TML需要进行规范的两个重要方面=一一TML的各种信息属性,即其对与术语描述相关的某项给定信息的表示能力z一一表达TML的方式,例如作为一个XML文档。图1表示了构成本标准的基础,以及可形成TML总体规范的各种知识源。上述知识源中有两项内容是

14、所有TML共享的,可作为本标准的参照资料。元模型描述了结构层次的基本级别,所有TML都应遵循,正如本标准所定义的情况。DCR是一组数据类目规范,任何特定的TML都应以其为依据建立自己的数据类目集。对于本标准的实际应用,ISO12620构成了参照使用的DCR,用于某个TML规范的各种信息单元。另外两种知识源用于定义给定TML的各种特定信息单元。该定义是从其信息属性和其在XML中的表示形式两方面出发进行的。一-DCS描述了可在给定TML中使用的数据类目集。DCS可包含DCR的子集和特定应用环境需要的任何特殊指定的数据类目。一一专用语规范(专用语)包括将给特定TML作为XML文档进行描述时所需要的各

15、种元素。这G/T 29181-2012/ISO 16642: 2003 些元素包含扩展树(3.5)、数据类目实例化样式(3.13)以及相应的词汇表(3.20)。从术语相关的角度讲,元模型和某个给定DCS的相结合涵盖了TML所有的信息属性,足以对互操作性的条件进行定义。任何与这类条件相应的信息结构都可以用GMT表示法来规范地表达为XML文档。两种不同的TML之间的互操作性,完全取决于在这种层次上(见图2)它们之间的兼容性。GMT L户户于册伽即126?一一一术语置标语言(TML)非标准语言一一扩展树一一数据类日样式+词汇圄1描述TML所涉及的各种知识源/卢/ TMF: 术语信息咒标框架TML:

16、术语信息标记语育GMT: 通用殃射工具MSC: 附录B中的TML实例Geneter:附录C中的TML实例圄2使用GMT时两种TML之间的互操作性更准确地说,两种TML之间的互操作性可以通过把它们各自的规范进行相互比较来确定,如果两种TML基于同样的DCS,那么任何以其中一种TML表达的术语数据集合都可以转换成以其他格式表示的术语数据集舍,而且不会丢失信息。尤其是当用某种TML的XML实现形式来表达互操作条件时所需要的附加规定,并不会影响两种标记语言之间的互操作性级别。以上所述互操作性原理导致两个直接结果z4 一一证明了当以一种TML表达的数据转换成以另一种TML表达的数据时,GMT作为一种主要

17、标记语言的作用zGB/T 29181-2012/ISO 16642: 2003 一一当两种TML基于两个不同的DCS时,GMT的作用是提供某种框架,用来识别哪些信息能够在这两种格式之间进行转换,以及在转换时哪些信息将会丢失(不充分的互操作性条件)。专用语信息与各种互操作性条件结合在一起,提供了用XML表达给定的TML所必需的信息。5 语言数据描述的一般模型及其在术语工作中的应用5. 1 导论5. 1. 1 -lMt原则从组织严密的数据(例如术语数据库到松散结构的信息(例如简单标注了名称、日期等的文本),这些格式多种多样的信息资源、中都存在着各种语言学结构。诠注语料库的表示形式是不分层级的,但却

18、是建立在针对多种视角所作的表述基础之上的。这里所说的视角代表着各种层面的语言信息,而相应的表述通常要指向基本数据(例如词性标注),或指向其他说明(例如基于基础短语结构注释所作的参考注释)。下面的模型确立了一类文件结构,可用来覆盖大量的语言诠注格式,并且提供了一种可以通过使用XML语言而得以实现的框架。每种文档类型都是通过三层信息结构模式来描述的,这种三层信息结构模式描述的对象是z一一元模型,代表由与语言学描述相关的结构结点所组成的一种层级体系;一一各种特定的信息单元,可以与元模型中任一结构结点相关联z一一相关的注释,可以用来限定给定信息单元关联值的部分内容。每个结构结点都可以使用一组基本的或复

19、合的信息单元来予以限定。基本信息单元描述的是可以用数据类目直接表达的属性。复合信息单元常对应于某个层级上数个基本信息单元构成的组合,该组合反映的是一个完整连贯的信息单位。例如,一个复合信息单元可以用来表示某项事务应属于某个事务类型、具有某种责任,以及发生在事务日期这样的事实信息所形成的信息单位。基本信息单元,无论是直接附着在一个结构结点,还是附属在复合信息单元之内,可以具有两种非排他类型的值z一一原子值(atomicvalue) ,或者对应于某个XML方案(XMLschema)中的简单类型(simpletype) ,例如数、字符串、选择列表的元素等,或者对应于注释文本下的浪合内容类型(mixe

20、dcontent type) ; 一一结构结点的调用值,目的是表达该结构结点与当前结构结点之间的关系。基本信息单元和复合信息单元都可以作为结构骨架中与具体结构结点相联系的一些特征值结构(feature-value structure)予以抽象地表述。例如,一个Geneter子文档内容为 通过确定与元模型相对应的结构骨架,以及将所对应的信息单元与该结构骨架中的每个结构结点相关联,上述XML文档可以映射成为本节中所描述的抽象模型,见图3.GB/T 29181-2012/ISO 16642:2003 此处的数据类目可以映射到ISO12620中规定的相应数据类目zIS0 12620: 1999 GB/

21、T 16786 数据类目编号数据类目编号id A.10.15 条目标识符A.10.15 subjectField A.4 学科领域A.4 definition A.5.1 定义A.5.1 lang A.10.7.1 语育标识符A.10.7.1 terrn A.1 术语A.1 terrnType A.2.1 术语类型A.2.1 fullForrn A. 2. 1. 7 全称A. 2. 1. 7 D 符识标RR 条-L学科领域=manuf画.cturing定义=A value. 柏户=斗叫咀切d啕ph术语类型=缸fullF,阳ormE语言标识符=h 3 卢标识符=旷3 E术语=胁 图3将XML文挡

22、映射成为抽象的模型5.2 结构层次和信息单元的一殷表示5.2. 1 语言数据可以用一个一般性的架构来表示。该架构是一个由众多基本结构结点所形成的体系构成的。其中各结构结点上附着有一个或多个信息单元。图4用统一建模语言(UML)图表示了这种架构。图4表达了以下所定义的类(class)对象之间的关系。这些类包括z一一结构结点s包含有一个属性(LevelName)的类,用来在给定语言资源(LR)格式的背景范围内标识本类型的对象。语言资源(LR)格式的实例,例如可以是各种术语库的术语条目(TE)格式。一一信息单元=包含有3个属性的类,这3个属性分别用来标识与某个给定数据类目(lUName,如Defin

23、i tion, PartOfSpeech等)相关的本类型对象,描述其内容的某种类型(C一type),以及提供实际的内容的值(C_value)。注:C_type的值可以属于如XML标准第2部分数据类型中所定义的简单类型(simpletype)集合,或属于5.2.2中描述的MIXED(混合)型.属于这两个类的对象可能以下列方式相关z一-association(关联):表示一个结构结点通过层级链接与另一个结构结点相联系。对链接的数量或由这些链接创立的网络结构(诸如树图、有向无环图等)没有限制(0.铃)。一一-hasContent(内容包含):将一个结构结点和一些信息单元例如加在一个术语条目上的定义)

24、联系起来。一个信息单元的实例能且只能加载于一个结构结点之上(1.1)。7 GB/T 29181-2012/囚o16642: 2003 F一-refinement(细化):将一些带有附加信息的信息单元与另一个信息单元。U)联系起来(例如,这个IU可以是一项注释、或补充说明、或一个定义)。一个用来作细化(补充说明的IU与且只能与一个被细化的IU有联系(1.1)。父1. .1 hasContent 结构结点s0. * 关联0. LevelName: 0.* NMTOKEN 信息单元子IUName, NMTOKEN C-Type 得MIXEI),Inte,_ger, Date. . .) C-Valu

25、e: 被细化IU细化过程圈4结构结点和信息单元的UML图表5. 2. 2 MIXED(谓合类型是文本内容和一些信息单元构成的有规则的组合,可以对应于任一种注释内容,在UML中可以通过使用聚合操作符来表示,如图5所示。圄5M皿ED(混合型对象类如果接受并使用这种一般性的定义,可以引出了下述情况,即文本内容中的注释可由其他信息单元进一步细化(例如指明注释内容是在何时由谁来完成)。5.3 术语信息的元模型术语信息的元模型是以ISO704标准中所描述的术语管理原则与方法纲要为基础的,其中术语管8 GB/T 29181-2012/ISO 16642: 2003 理内容包括了术语条目的制作。与词典编撰的条

26、目相比,术语条目的最大特点是面向概念。一个术语条目涉及给定语言中的一个概念。在多语言的术语条目的情况下,一个术语条目涉及一个或多个在不同语言中完全或部分等价的概念。然而词典编撰的条目却只包含一个词目(单一词汇单位的基本形式),以及一个或多个由一种或更多语言表示的定义(表示不同的释意。本国际标准表示的元模型为术语条目提供了指导。众所周知,在这样的前提下,虽然词典编撰的条目十分典型地包含着与词或词位(例如语音部分、性等)相关的信息,但是这样的一些词典编撰信息也经常包括在术语条目之中。一个术语数据集包括了关于该集合的全局信息和一些术语条目,每个术语条目有三个功能z一一用一种或多种语言描述一个概念,或

27、描述两个或更多个完全等价或部分等价的概念F一列出指定慨念的术语称谓z描述术语本身。每个条目可以有多个语言段(3.的,而且每个语言段可以有多个术语单元z每个条目中的各个数据元素可以与各种描述性、管理性信息相联系F此外,还会有其他一些信息资源,它们不属于任何一个条目的组成部分,但是可以与一个或多个条目链接。这些其他资源包括参考书目信息、知识本体结构的描述,以及诸如用于解释说明概念的图像等二进制数据。通过把5.2中表述的一般体系架构具体化(instantiating),术语元模型可由结构结点类衍生出的7个实例进行描述。一-TDC(术语数据集合):包含在术语系统中的所有信息的顶级容器。-GI(全局信息

28、):适用于一个文件中表述的所有元素的信息,与那些仅仅属于文件某些特定部分所具有的信息相对。全局信息通常包括(XML)文件的标题、文件的建立单位或个人、地址信息、版权信息、更新信息等。一-TE(术语条目):属于某个单一概念的信息。通常包括如,关于概念的描述性信息和相关概念的管理信息。术语条目可以包括一个或多个语言段(3.9) ,但要根据术语库是单语种的、双语的或是多语种的情况而定。一一CI(补充信息):通常包括如,驻留在文件之内或之外的文本文献或管理信息、静态或动态的图像、视频、音频,或任何可能的其他种类的二进制数据(即blob型数据),也可能包括引用其他术语资源或相关文本语料或本体结构的背景链

29、接。这些补充信息信息项目经常被指定为共享资源,因为它们对术语库各点都是开放的,并且不在各个不同条目下重复。一一LS(语言段):包含了用于某术语条目上给定语言的所有术语段和其他相关信息,通常包括与该语言或该语言术语相关的定义、上下文等。一-TS(术语段):关于术语的信息。通常包括诸如用于指称术语条目主题概念的单一术语,和与该术语相关的任何其他信息(例如定义、上下文等)。一TCS(术语组件段):关于词素、词或构成多语素(或多词素术语的连续字符串。例如在汉语中,术语的读音、核心词语的切分等。德语或英语,没必要区别构成多词术语的单个组分的信息。而其他语言,例如法语或西班牙语,对于构成多词素术语的单词,

30、存在着像词的性别等类信息,将这些信息包括在内非常重要,因为术语在文本中使用时,这些信息是必要的。这些结构层级的实例通过对关联基数的限定实现了联合(association)关系见图的,也可以用图7中的框架图显示。一一-一个TE可包含任何数量的LS(O.提); 一个LS可包含任何数量的TS(O.铸); 一个TS可能包含任何数量的TCS(O.时;一个TDC一定包含正好一个GI(1.1),至多一个CI-层级(0.1)和任何数量的TE(O.祷); 一一用于描述每种关系的双基数(1.1)限制条件保证了层级组织结构。9 GB/T 29181-2012/囚o16642: 2003 父结点。结构结点LevelN

31、ame, NMTOKEN 子结点TE-层级LS-层级TS-层级TCS-层级LevelName, i .weIName, Lcv甘N础le,LevelName: TE (术语条目LS (语言段)TS【术语段TCS (术语组件段. 联合0. 联合0. TDC-层级GI层级CI层级LevelName: LevelName: LevdName: TDC GI(全局信息CI (补充信息术语数据集合联合圄6术语元模型一-UML国表术语数据集合(TDC) 将充信息(CI)全局信息(Gl)马。中。术语组件段(TCS)固7术语元模型一一简略视图10 GB/T 29181-2012月SO16642: 2003 5

32、.4 以元模型为基础设计术语鼓据的表示形式应该根据一些用户群的真实需要配备DCS,DCS应由来自DCR(例如ISO12620)的一系列数据类目以及对每种数据的限定条件所构成。所谓限定条件应包括对每个数据类目取值的限制(取值范围从表示上下文实例的标记文本到语法词性的选择列表气也会有一些特殊数据类型,例如XML标准第二部分数据类型中所定义的类型,还可以是用来描述数字或日期的值。对描述性数据类目的限定条件还要包括条目中特殊数据类目出现位置的限制,元模型的核心结构即TE、LS、TS和TCS)将为此提供可以选择的选项。通过选择基于元模型的结构、选定一定的数据类目,以及为元模型类对象TE、LS、TS和TC

33、S限定适用的数据类目取值,元模型可以根据实际的应用情况具体实施,成为大量可行数据模型的基础。 所有符合本标准的XML格式都基于上述元模型z 本质上源于ISO12620的DCS的子集z XML DTD或XML方案。符合本标准的术语数据库应用系统都应基于z 本元模式z 本质上源于ISO12620的DCS子集3 通过实体关系图定义的数据模型。5.5 交换、发布和互操作性交换所涉及的是两种计算机系统之间的信息传递。这种信息传递虽然经常是双向的,但并不总是需要如此。交换是利用中间格式完成的。发布是单向的,要么用于另一个计算机系统,要么用于人们使用时所面对的视图。遵照元模型和ISO12620的DCS而构造

34、的数据格式应该是可以互操作的,也就是应该能够将数据从一种格式转换到另一种格式或再次转换还原而不丢失信息(有时称为元损循环勺。如果数据是这样严格定义的,那么对于数据导人者来说便没有必要为了解释数据而去与数据原创人建立联系,该互换是无需干预的一全盲的。当只有两个互换方且二者彼此了解,此时全盲性就不是问题的关键。但是当涉及必须用单一例程导人多重来源的术语数据时,尤其如果希望添加更多的来源而不改变导人例程时,这种全盲性就变得很重要。在双向交换中,目标通常最大限度地保全信息。但在发布的情况下,数据的表示形式可能特意做得不完整,而省去原始数据集合中本来存在的一些信息。例如,对于翻译人员来说,面向发布的数据

35、不必包括管理信息,因为这些信息仅与术语专家维护数据库相关。特定XML格式的细节会因其应用的目的(即为了发布还是为了交换),或因对元干预性操作是否有所要求而受到影响。无论是什么指导着数据库应用系统或XML格式的设计,设计一旦完成,数据库结构或XML格式就开始了自身的生存,并用于表示各类数据。但不能排除设计者始料不及的情况。通过遵循本标准所描述的集成化方案,所设定的数据格式会更有可能适应各种情况,并且会和其他的数据库结构或数据格式相兼容。5.6 一般模型的XML规范表示5.6. 1 引言可以在XML中通过对5.3所描述的抽象结构的具体化,并将信息单元与该结构相关联,来实现对元模型的层级组织体系和每

36、个结构层的限定说明。元模型可以用一般性元素(struct)(用于结构类型代表,这种元素可以递归表达一个术语数据集合中各种信息表达层级的嵌套。元模型的每个结构结点应该通过一个与(struct)元素相关的类型属性GB/T 29181-2012/ISO 16642: 2003 予以标识。类型属性的可能值应是元模型层级的标识符,即TDC,GI,CI,TE,LS, TS, TCS等。可以用(feat)(用于特征元素表示与结构结点相关的基本信息单元。可以用(brack)(用于括弧元素表示复合信息单元。这种元素本身需要包含某个(feat)元素,该(feat)元素之后还可以有任何(feat)元素和(brack

37、)元素的组合。每个信息单元必须由类型属性限定说明,而且应该选取ISO12620中的数据类目名称或用户定义的数据类目名称作为值的内容。最后,(feat)元素内容模型可以包含通过(annot)(用于注释)元素表达的注释内容。(annot)元素也需由一个类型属性进行限定说明,该类型属性应根据ISO12620中的数据类目或对等的用户定义数据类目取值。5.6.2 范例下列例子解释了使用GMT格式对5.1.2中所述的MSC术语条目所含有的信息进行编码的方法。该条目只包含基本信息单元,而且仅映射了元模型的三个层级,即TE,LS和TS。(? xml. version = 1. 0 encoding = iso

38、-885 9-1?) (tmf) (struct type = TE ) (feat type= entry identifier)lD67(/feat) (feat type= subject field)manufacturing(jfeat) (feat type=definition)A value between 0 and 1 used in. (jfeat) (struct type=LS) (/struct) (/ struct) (feat type= language identifier )en(jfeat) (struct type= TS) (feat type= t

39、erm)alpha smoothing factor(jfeat) . (/struct) Element样式将信息单元作为XML元素予以实现,其本身是给定锚点的子元素。词汇代表本XML元素的名称,与给定信息单元相关联的值被当作本XML元素的内容。示例zGMT表示法MSC表示法(struct type=TS) (tig) (feat type= term )alpha smothng factor (term) alpha smoothing factr(/terro) (/feat) (/tig) (/struct) GMT表示法Geneter表示法(锚点:(tJ) (struct type

40、= TS) (tl) (feat type= term barbed wire(jfeat) (Term) barbed wirl!(/Term) (/struct) (/tl) TypedElernent样式将信息单元作为XML元素予以实现,其本身是给定锚点的子元素,并由某个XMLtype(类型户进一步说明。词汇代表该XML元素的名称和XML属性type(类型)的值。与特定信息单元相关联的值被当作该XML元素的内容。示例zGMT表示法MSC表示法(struct type=TE) (termEntry . ) (feat type=飞ubjectfield) manufacturing (de

41、scrip type=subject field) (/feat) manufacturing (/ descrip) (/struct) (/ termEntry) GMT表示法Geneter表示法(struct type=TE) (terminologicalEntry . . ) (feat type= subject field) manufacturing (free type= subj ect field) manufacturing (/feat) (/free) (/struct) (/ terminologicalEntry) 18 GB/T 29181一2012/ISO1

42、6642: 2003 ValueElement样式将信息单元作为XML元素予以实现,其自身是给定锚点的子元素,并且由XML属性value(值)进一步说明。词汇代表该XML元素的名称。与特定信息单元相关联的值被当作XML属性value(值)的内容来实现。TypedV al uedElement样式将信息单元作为XML元素予以实现,其本身是给定锚点的子元素,并且由XML属性type(类型)进一步说明。词汇代表该XML元素的名称以及该XML属性的名称。与特定信息单元相关联的数值被当作XML属性type(类型)的内容来实现。6.3.3.3 信息单元数据类型的限制尽管使用Element或TypedElement样式实现的信息单元可包含附加标记值(尤其是因注解而产生的标记),但是使用Attribute或者ValuedElement样式实现的信息单元将不包含任何这类附加标记值。在为给定TML定义DCS时,要求在这方面进行一致性检查。6.3.3.4 外部标记模型DCS可以包括对外部标记模块的引用信息。这些外部模块可以在信息

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 国家标准

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1