1、ICS 0 1. 020 A 22 中华人民共和国国家标准G/T 19100-2003 术语工作概念体系的建立Terminology work一-Establishmentof concept system 2003-05-14发布中华国家人民共和国监督检验检瘦总局2003-12-01实施发布前本标准是术语数据库的系列国家标准之一。已经发布的系列标准有zGB/T 10112-1999术语工作原则与方法百主FE司GB/T 16785-1997术语工作概念与术语的协调GB/T 19101-2003 建立术语语料库的一般原则与方法GB/T 19102-2003 术语部件库的信息描述规范本标准的附录A
2、、附录B是资料性附录。本标准由全国术语标准化技术委员会提出。本标准由中国标准研究中心归口。本标准由中国标准研究中心、北京大学计算语言学研究所等单位起草。本标准主要起草人g程永红、胡俊峰、宋敏、何燕、叶盛、陈玉忠、肖玉敬。GB/T 19100-2003 I GB/T 19100-2003 术语工作概念体系的建立1 范围本标准规定了术语工作中建立概念体系的一般原则与方法。本标准适用于术语工作中概念体系的建设。在其他涉及概念体系建设的工作中也可参照使用。2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于
3、本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。GB/T 10112-1999术语工作原则与方法(neqISO/DIS 704 , 1997) GB/T 15237.12000术语工作词汇第1部分z理论与应用GB/T 167851997术语工作概念与术语的协调(eqvISO 860 ,1 996) 3 术语和定义GB/T 10112-1999、GB/T15237. )-2000确立的术语和定义适用于本标准。为了便于使用,本标准重复了其中的部分术语和定义。3. 1 3.2 3.3 3.4 3.5 术语term 在特定专业
4、领域中一般概念的词语指称。GB/T 15237. 1-2000,3. 4. 3J 概念concept 通过对特征的独特组合而形成的知识单元。注.概念不受语种限制,但受社会或文化背景的影响。GB/T 15237. 1-2000,3. 2. lJ 概念体系concept system 根据概念间相互关系建立的结构化的概念的集合。GB/T 15237.1-2000,3.2. 11J 首选术语preferred term 指称某一概念(3.2)的诸术语中作为第一选择的术语(3.1)。GB/T 15237. 1-2000,3.4. 15J 领域特异性domain sp配ific特定专业领域所特有的、与专
5、业领域的主题密切相关的特性。GB/T 19102-2003 ,3. 7J 1 GB/T 19100-2003 4 概念体系4. 1 概述概念体系是建立术语体系的基础,一个概念只对应一个术语。现有术语的分析、定义和新术语的确立都应在概念体系的指导下进行。建立完备的概念体系是一件复杂而费时的工作,应在术语体系建设的同时,结合领域的特点,有针对性地选取概念间的关系,逐步建设该领域的概念体系。概念体系建设的目标是确立该领域概念体系的基本框架,明确概念之间的相关关系,从而进一步达到.a) 为术语的一致化与标准化提供基础;b) 为跨语种的概念对应提供帮助,c) 为术语定义提供帮助;d) 为术语规范化和新术
6、语的定名提供依据。参见,GB/T 16785 1997 4.2 概念的确定与表示概念的确定与表示是面向特定领域,选取具有领域特异性的概念并给出合理的表达方式。概念的选取与确定可以在概念体系的构建过程中进一步的补充与完善。其过程主要分为以下的步骤2确定专业领域。分析用户需求。收集该专业领域的备选术语=在收集过程中应考虑术语的领域特异性。一一确定该领域的概念:将备选术语按所指称的概念分类,以此确定该领域中的概念。确定概念的形式化表示t概念的形式化表示主要用于在计算机中对概念数据的存储、管理与分析。般可采用概念的专业分类和指称同一概念的备选术语的集合作为概念的形式化表示。在一个明确的专业领域内部(不
7、包含进一步细分的专业领域也可仅使用指称同一概念的备选术语集合作为概念的形式化表示。例如2在通信领域内部表示分组交换的概念,通信.(分组交换) ; 在计算机领域内部表示包交换的概念,计算机.(包交换) ; 在信息科学与技术领域内部表示与分组交换、包交换相关的概念:(信息科学与技术,(分组交换,包交换)。选定概念的工作指称:概念的工作指称主要用于在确立概念和建立概念体系工作过程中进行交流与讨论。-般可以用概念的备选术语集中任一选定的术语作为概念的工作指称。4.3 概念之间关系的确立与表示4. 3. 1 概念之间的关系类型概念之间的关系-般分为层级关系和非层级关系两大类型。在层级关系中包含属种关系和
8、整体部分关系两种类型。具体到不同的应用领域,依据不同的分类标准又可以派生出多种不同的分类方式,定义出不同类型的关系。参见GB/T15237.1-2000.3.2 4.3.2 概念之间的关系的选择概念体系由一组概念和概念间的关系所组成。对于不同的专业领域,不同的应用需求可侧重不同的概念之间的关系来构建本领域的概念体系。例如在医药领域中,属种关系就可以体现为=根据药品化2 学结构的分类、根据药理作用的分类和根据临床应用的分类等不同的分类方法。4.3.3 概念之间的关系的表示概念之间的关系可以用形式化或图示的方法来表示。详见附录A,4.3.3.1 概念之间的关系的图解表示详见附录A.2 , 4. 3
9、. 3. 2 概念之间的关系的形式化表示详见附录A.3。5 建设概念体系的一般流程与方法GB/T 19100-2003 概念体系的建设是对特定领域的一组相关的概念之间的关系进行描写。每一个概念应在概念体系中有确定的位置。其基本流程主要包含以下步骤g选定专业领域及应用目标g确立并描述领域概念;确立概念体系所包含的概念之间的关系p一一确立每一个概念在概念体系中的位置;一一一根据概念之间的关系评价、优化对概念的定义,一一给出概念的指称。一般可在指称概念的候选术语集合中选择出一个首选术语作为概念的唯一指称,也可以根据需要定义新的术语作为概念的指称。概念体系的建设可采用由底向上和自顶向下两种方式进行.自
10、底向上是指通过概念间的聚类分析找出相关的上位概念并以此递推构建完整的概念体系。自顶向下是将所研究的概念按照领域的理论模型、物资分类等进行归类。在建设概念体系的具体操作中常常是两种方式的结合。术语概念体系也可以根据术语内部的结构特征来进行构建(参见附录B)。3 GB(T 19100-2003 附录A(资料性附录)概念之间的关系的形式化和图解表示A. 1 引言概念体系中往往可以包含有不止种关系。完整的概念体系往往是由多种关系构成的一个复合体。图解表达能够比较清晰的描述概念间的关系p概念的形式化表达有利于概念体系计算机辅助管理与构建,也为基于概念体系的计算机检索与推理系统的开发创造条件。A.2 概念
11、之阔的关系的图解表示A. 2. 1 层级关系的图解表示层级关系是一种有向关系,包含种属关系和整体部分关系两种。A. 2. 1. 1 种属关系的图解表示种属关系可以用下面形式的有向图来表示:其中,箭头所指的代表属概念(小概念).箭头发出的概念为种概念(大概念)。A.2. 1. 2 整体部分关系的图解表示A. 2. 2 并列关系的图解表示A. 2. 2. 1 双向的并列关系如z朋友关系、同一个系列的产品关系等。A. 2. 2. 2 单向的循环并91J关系如=春、夏、秋、冬等单向非循环关系可认为是层级关系的一种特例。4 GB/T 19100-2003 A.3 概念之间的关系的形式化表示A.3. 1
12、层级关系的形式化表示1. 1 2 二31 2. 1 2.2 2. 2. 1 2.2.2 其中,概念标号从右至左每一层加点前的概念标号都表示本概念的上位概念。如.概念2.2就是2. 2. 1, 2. 2. 2的上位概念。概念2就是2.1,2.2的上位概念。A. 3.2 非层级关系的形式化表示概盘AIll概垂8非层级关系的形式化表示可采用二元组的方式表达。如:概念A,概念B。其中概念A和概念B构成并列关系。5 GB/T 19100-2003 附录B(资料性附录)根据术语内部的结构倍息来辅助构建概念体系B. 1 术语和定义B. 1. 1 单词术语single-word term 由单个词语构成的术语
13、。GB/T19102-2003, 3. 3J B. 1. 2 多词术语multi-word term 由多个词语组成的术语。GB/T19102-2003, 3. 4J B. 1. 3 术语部件term component 组成多词术语的词。特定专业领域中结合紧密、生成能力强、使用稳定的语言片断也可看作是术语部件,如可移植、随机性等在信息科学技术领域中也可看作是术语部件。GB/T19102 , 3. 5J B. 1. 4 左部件left component 如果一条术语可以拆分为一个术语部件与另外一条本专业的术语,且该部件位于术语的左方,则该部件称为该条术语的左部件。如z报文分组交换中报文是该术
14、语的左部件产分组交换中分组是该术语的左部件;但解码器中解码并不是该术语的左部件。B. 1.5 右部件right component 如果一条术语可以拆分为另外一条本专业的术语与一个术语部件,且该部件位于术语的右方,则该部件称为该条术语的右部件。如:解码器中器是该术语的右部件s虚拟空间中空间是该术语的右部件。B.2 根据术语内部的结构信息辅助构建概念体系B. 2. 1 概述为了解决术语概念数目巨大,构建概念体系工作十分复杂的问题,可以通过多词术语的结构特征来指导术语概念体系的构建。以种属关系为基础的概念体系的底层往往是由多词术语所指称的概念所组成,而多词术语一般是由一个或多个修饰性成分(包括词和
15、词缀)对母术语进行修饰而成的。如2无线通信、手写输入系统、超大规模可编程门阵列等,这些术语中往往包含有一个甚至多个本领域的术语。如z无线通信中的无线、通信,超大规模可编程门阵列中的可编程门阵列和门阵列。多词术语由组成它的术语部件以及由术语部件的组合方式引导出的该术语与构成该术语的母术语之间的上下位关系。例如在收集14万条的信息科学与技术领域候选术语集中=由可编程为左部件的术语有可编程门阵列,可编程只读存储器,可编程功能键盘,可编程通信接口,可编程线路适配器等计167条。由于可编程作为术语左部件时可以引导出该术语与构成该术语的母术语之间稳定语义关系即:GB/T 19100-2003 如果术语Y的结构可以分析为:Y=可编程+X(X为本领域的术语),则术语Y在大多数情况下可以被解释为g采用可编程技术的X,或者可编程的X。在这种情况下,可以直接利用术语部件的属性引导构建概念间的种属关系如下图所示。其中术语带下划线的部分为引导出概念种属关系的术语部件.需要说明的是,因中用斜体表示的不可编程只读存储器表示一个为了保持概念体系完整丽新造的术语,在实际使用中并不存在。通过术语部件信息辅助构造概念体系的方法可进一步参见GB/T19102-2003, 存储嚣A蛊存储器皇室-存储器可编程只霞存储器至豆璧罩只读存箍霉同步静态存储器笙笙可编程只读存储器革壁望只读存储器电害性只瞌存储量