1、GB/T 17532 1998 前兰主忆二本标准等效采用ISO/DIS1087-2-2,1996 定义引用的术语用黑体标出,并在后面用括号注明条目编号例i注除了条日编号之外.优先术语和定义仅在适当的地j出现。1 范围本标准规定了在术语工作和术语编寨中用于语言和信息处理的术语。本标准适用于术语数据库的研究、开发、维护及管理工作,在其他涉及术语数据处理的工作中也可参考使用。2 引用标准下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被修订.使用本标准的各方应探讨使用下列标准最新版本的可能性。GB/T 12200.2一1994汉语信息处理词汇
2、02部分z汉语和汉字GB/T 12991-1991 信息处理系统数据库语言SQL(idtISO/IEC 9075: 1989) GB/T 15237 1994 术语学基本词汇(neqISO 1087: 1990) GB/T 527 1. 8-1993 数据处理词汇08部分:控制、完整性和安全性(eqvISO 2382-8: 1986) I50/IEC 2382-1:1993信息技术词汇第1部分z基本术语I50 2382-4: 1987信息处理系统词汇第4部分.数据的组织I50 2382-6: 1987信息处理系统词汇第6部分:数据的准备和处理I50/IEC 2382-9 :1994信息技术词汇
3、第9部分:数据通信ISO/IEC 2382-23: 1994信息技术词汇第23部分文本处理国家质量技术监督局1998-11-05批准518 1999- 06-01实施GB/T 17532-1998 3 一般概念3. 1 信息information 信息处理关于客体(如事实、概念、事件、思想、过程等)的知识.它在定的土下文中具有特定的患义。注1丰条引自ISO/IEC2382-1。2在其他的应用领域,信息的定义,卜间。3. 2 数据data 为进行通信、解释和处理而使用的信息(3.1)的形式化表现形式。注z本条改自IS0/IEC2382- , 3.3 数据处理data processing DP
4、对数据(3.2)进行的系统操作。例:对数据进行算术运算或逻辑运算,数据的归并(9.5)或分类(9.1),程序的汇编或编译,以及对文本(3.6)的操作,如文本编辑(12.3)、分类、归并、存储、检索、显示(9.6)、打印等。注:本术语不能作为信息处理(3,4)的同义术语。3. 4 信息处理informatlon processng 对信息(3.1)进行的系统操作,它包含数据处理(3.3)。?于l本条改自IS0/IEC2382- 1, 2本术语不能作为数据处理。,3)的同义术语。3. 5 语言处理language processing X1语言进行的系统操作,官包括数据处理(3.3)巴3. 6 文
5、本lexl 以字符(6.1)、符号、词、短语、句子、段落、表格或其他的符号序列的构成的用于表达意义的结构化数据(3.2)。其解释主要根据阅读文本的人对于某种自然语言或人五语言的知识来进行。?占.本条引自IS0!lF.C2382- 1, 3.7 文本语料库text corpus 语料库corpus 根据预先确定的规则所准备、编码或存储的机器可读文本(参阅7.4)或文本的某些部分的有组织集合。l:t文本语料库可按专业领域、容量或时代做不同的限定,例如,从1986年以来的某些特定的期刊、数学文本等。文本语料库可用作进一步的语言分析或术语工作的原材料。3.8 类型type 文本(3.6)中代表丰个确定
6、类别的语言单位。注2这种语言单位通常是未用定界符(3,10)隔开的不间断的字符串。3.9 类例token 自然语言处理类型(3.的在文本中的具体表现形式。例:在英语中,如果把good的所有词形定义为类型,那么good,better和best等都是词形good的类例。3. 10 定界符delimiter 分隔符separator 用于指明一个字符串(6.13)的ff始或结尾的一个或多个字符(6.!)。510 GB/T 17532-1998 注1本条寻l自ISO2382一4,2空白或标点符号经常用作定界符。3- 11 词形word form 给定词的任何形态句法变体。例:在英语中,indicate
7、 : indica tes , visitor: visitor s. 注I在屈折语中,i司形经常是屈折形式.例如,英语的go.gOf:S;以及go.went. gone 0 2这个定义不包含正词法方面的变体e3. 12 词形变化范型paradigm 自然语言处理属于某一给定i司的各个词形(3.11)的类聚。3- 13 基本词形base form 参照词形reference form 根据词典编篡学的惯例选出的用以表示个词形变化范型(3.12)中的各个形式的词形(3.11)。例:在英语中.bind是bi时,bound,bin巾,binding等的基本词形。往I本条改自GIl/T15237-19
8、940 2术语基本词形也可以应用于词组型术语u3. 14 词组型术语multi-word term 包括两个以上词的术语。3.15 压缩形compressed form 规定形normalized form (拒用)缩减形red uced form (拒用)经过压缩(8.4)的字符串。例E字符串叮In呻pu川t/outpu山t-a剖19伊orithm旷变成其压缩形1mnp阳utou川tp归utalgo旧r口lt由hm旷注z术语缩减形和规定形可能会导致误解,建议避免使用这两个术语。3- 16 取消屈折deioflectioo 取消词形(3.11)中的屈折成分。J 17 取消屈折的词形deiofl
9、ected word form 在取消屈折(3.16)之后余下的词段(3.18)。3. 18 词段word part 词片word segment 为了某种特殊用途从一个词形(3.11)中取出的字符串(6.13)。3. 19 词形还原lemmatizatioo 从某-给定词形(3.11)生成基本词形(3.13)的过程。例.在英语中,飞。是goes通过取消屈折(3.16)而得到的基本词形(3.13);而自。是went通过不规则动词变换得到的基本词形(3.13),这种变换不符合标准的屈折规则。注2这样的结果也称为词形还原。3.20. 剖析parsing 根据给定的算法,将给定的结构分解为其组成成分
10、的操作。例:在英语句子allunsaturated atty a口dsare not degradable by biological methods中电allunsaturated fatty acids和biologicalmethods可看成是词组型术语(3.4),它们可以被抽取(8阜9)。520 GB!T 17532-1998 注:剖析不定必须提供对某句子的完整分析。3.21 术语数据集合terminological data collection 包含特定专业领域有关各种概念的信息(3.1)数据(3.2)集合。3. 22术语条目terminological entry 术语数据集合(
11、3.21)中所包含的关于4个概念的术语数据(3.2)。注z个术i吾条目可以包含两个以上的记录(7.9)。3. 23 罔形词homograph 两个以上的具有相同书写形式但表示不同的概念(语义同形)或不同句法功能(句法同形)的词形或词。例z在英语中,lead(铅Pb)和lead(领导hbark(吠)和bark(树皮。在汉语中,仪表(人的外表)和仪表(测量温度、压力等的仪器); 杜鹊(布谷鸟)和杜鹊(映山红)。应2具有不同书写形式但经过压缩(8.4)之后变为同形的词形(3.11)不算同形词e3.24 歧义消解disambiguation 通过赋予同形词贴切的概念或贴切的句法功能从而分化同形词(3.
12、23)的过程,或者通过赋予同形词组以不同的语言解释来分化同形词组的过程。例:在汉语中,分化白跑和自纸中的白分别为副词和形容词P分化学习文件的句法结构分别为动宾结构和偏正结构。4 数据组织4.1 分类值sort value 排序值sorting value 根据预先确定的顺序,字符集(6.2)中某一元素的位置。例:在法语中,字母A具有比字母B较低的分类值。一个小写字母是否与它相应的大写字母具有相同的分类值,取决于实际应用的需要。带发音符号的字母有时按其相应的基本字母来处理,有时按不同的字母来处理。4.2 分类关键字sort key 排序键用于满足分类(9.4)和归并(9.5)操作要求的字符串(6
13、.13)。例2当给图书数据分类以便产生作者目录时,作者的姓是第一分类关键字,作者的名是第二分类关键字。如果间J个作者有两个题目,则把出版年份或题目作为附加的分类关键字e4.3 字母排序alphabetical ordering 在组织字符串(6.13)时,表中的每一个串(6.12)的位置唯一地由从该串(6.12)头部开始的分类值(4. 1)来确定。注l带有发音符号和连音符号的字母以及带有数字上标、下标的其他符号都可以作为特殊的分类值。2字母排序的规则可以因语言的不同而不同。4.4 逆字母排序reverse alphabetlcal ordering 在组织字符串(6.13)时,表中的每一个串(
14、6.12)的位置唯一地由从该串(6.12)尾部开始的分类值(4. 1)来确定。4.5 频度顺序frequency order 在特定的文本(3.6)或文本语料库(3.7)中,根据类fJJJ(3.引出现频度上升或F降的顺序来排列的521 GB!T 17532-1998 类型(3.8)的顺序。7主2在;常情况F.表的类型是词形(3.11)频度表或!原形词频度表。4.6轮排permutation 使词组型术语:扣每个实i司都作为关键词进行的排序。例:在英语中.X、I字符串millionsof instructions per second MIPS轮排时,inst ru r: t ions , mi
15、l 110ns of per seconds, second , mllimns of mstruetlormper等形式分别出现在instrumor刊和HCOnd等实词的排序表中,这样可以保证术语中任何想要的成分都可以出现在相应字母的排序位置。注牛二条政自GB!T15237 -1994 4.7 毗连concatenation 两个以上的字符串(6.13)按特定的顺序fT并,形成一个新的串(6.12).其长度等于各个字符串(6.13)长度的丰1105 术语数据的筛选5. 1 非用词表exclusion Iist 停用词表stop word list 在数据处理(3.3)中任意选择的不予考虑的字
16、符串(6.13)组成的表。注l在术语工作中,产生忽略功能词(代词、冠词等)的词在可能是有益的。2有时,非用词表中的字符串可以被保留下来(例如在词语索引(5.4)中).但是不注明其频度。5.2 拟用词表inclusion Iist 加用词表plus word list 要保存或认为要进一步数据处理(3.3)的字符串(6.13)组成的衰。例:凡包含bank(银行)或creditins1tution气信用机构)的所有的句子都抽出;凡以M起头的所有的条目在名字索引中都检索出来?凡以ant卜开头的所有的单词都选出来。注2如果适合的话,拟用词表也可以包含词段(3.18)或其他的字符串(6.13),5.3
17、自由文本搜索free-text search 在文本语料库(3.7)中进行的,能够检索任何类型(3.别的搜索(8.7)。5.4 词语索引concordance 从一个出处摘出的并属于同一类数据元的有序字符串(6.13)汇集表。住:本条改自GB(T15237-1994. 5.6 术语索引term index 参照词汇或术语数据库(7.6)中的术语条目(3.22)而编制的索引(5.5)。注z术语索引中的术语可以按照字母来排序,也可以按照其他系统来排序。5. 7 字母索引alphabetical index 按字母顺序排列的索引(5.5)。5.8 系统索引Isystematic index 所有的术
18、语排列能反映特定专业领域中概念之间的系统关系的索引(5.5)。5.9 轮排索冒Ipermuted index 522 GB/T 17532-1998 按轮排(4.6)方式列出的术语索引(5.6)。5.10 逆序索I reverse index 按避字母排序(4.4)列出的索引(5.5)。5. 11 倒排索引inverted index 列出文本(3.6)中的全部类型(3.的以及全部对应类例(3.9)的索引(5.5)05.12 词形索I word f orm index 词索引word index 文本(3.6)中所有词形(3.11)的索引,其中在文本(3.6)中出现两次以上的词形(3.11)用
19、一个单独的类型(3.8)来代表,并指出其出现次数(p相应的类例(3.9)以及它们的原文参照。5.13 还原词索引lemmatized word index 用词形(3.11)的基本词形(3.13)来代表的词形索引(5.12)。6字符6. 1 字符character用于表示、组织或控制数据(3.2)的元素集中的成员。注l本条引自ISO2382-40 2字符可以分为图形字符和控制字符。6.2 字符集character set 不同字符(6.1)的有限集合,它对于一定的目的而言是完整的。例,ISO646的国际参照本,128个ASCn字符。注本条寻|自ISO2382-40 6.3 享母表alphabe
20、t 按公认的线性次序排列的字母字符(6.6)集。注l本条改自I以)2382-40 2这个定义也覆盖了由字符(6.1)组成的自然语言的字母表,这些字符(6.1)包含带发音符号的字母。6.4 图形字符graphlc character 种具有视觉表示的,通常可以书写、印刷或显示(9.6)的字符(6.1),它不同于控制字符(6.5)。注1本条引自ISO2382-4. 2图形字符可以是字母字符佣的,报字(6.7)或特殊牢符(6.9).6.5 控制字符control character 在特定上下文中并实现某种控制功能的字符(6.1)。注l本条引自ISO2382-4。2控制字符(6.1)启动、修改和停止
21、戴帽处理(3.3)的操作.6.6 字母字符alphabetlc character 图形事符(6.4)中用于书面表示给定语言的字母。注B它包括带发音符号的字母.6. 7数字dlglt 数字字符numeric character 表示非负整数的字符(6.1)。523 GB/T 17532 -1998 注:本条例自ISO2382-40 6. 8 字母数字字符alphanumeric character 或者是字母字符(6.6) ,或者是数字(6.7)的任何字符(6.1)。6.9 特殊字符speciaI character 不是字母数字字符(6.们的图形字符(6.4)。9IJ ,任何标点符号,and
22、符号&丁,百分符号%J,加号+J等都是特殊字符。注:本条改白IS()2382-40 6. 10 间隔字符space character 引起打印或显示位霞沿着直线向前移动一个位置的控制字符(6.5)。注本条改自ISO2382-4. 6.11 空白blank 在图形字符(6.4)串中表示一个空位置的字符(6.1)。注本条引自ISO2382-4。6.12串string由具有相同性质的元素组成的作为总体来看的序列。例:字符(6.1)、二进制位或脉冲等组成的序列。注:本条改自己o2382-40 6.13 字符串character string 未被空白隔开的由多个字符(6.1)组成的序列。注z一个字符
23、串常常代表一个单词。6.14 模样pattern 当用组合字符(6.1)替换某些字符(6.1)时定义的串(6.12)。注:本条参照GB/T12991。6.15 汉字Chinese character 记录书面汉语的文字。6. 16 汉字字形character form 特指构成方块汉字(6.15)的二维图形。注:本条引自GR/T12200.20 6.17 笔画stroke 构成楷书汉字字形(6.16)的最小连笔单位。汉字最基本笔画有横(一)、竖(J)、点(、)、撇(川、折(乙)等。注:本条引自GB/T12200.20 6.18 笔顺stroke order 书写每个汉字(6.15)时的笔画(6
24、.17)的次序和为向。注:本条弓|自GR/T12200.2. 6.19 笔数stroke count 构成一个汉字(6.15)或汉字部件(6.20)的笔画(6.17)数。注.本条引自GR/T12200.20 6.20 汉字部件Chinese character component 52.1 由笔画(6.17)组成的具有组配汉字(6.15)功能的构字单位。现代汉字部件按是否成字可分为成二严部件与非成字部件。例:成字部件:木心口也非成字部f牛,/1 IJ 丰i ,丰条寻|自GII/T 12200. 2。GB/T 17532 - 1998 6.21 部首indexing component 一部分可
25、以成批构字的部件。凡含有某一部件构成的字在字典中均排列在一起,该部件作为领头单位排在开头,成为查字的依据,称为部首。部首多为形旁构成n例z木(松、柏、杨、架、杏、林、相)注z本条引自GB/T12200.2. 6.22 偏旁radical 合体字的构字单位的传统称呼,旧称合体字(由两个或两个以上汉字部件构成),左为偏,右为旁.现代统称偏旁。偏旁本为独体字,在古代汉字(6.1日中偏旁一般与单独成字时形状相同,现代汉字(6.15)偏旁有一些变化,如心在左为.t 气3俨勺J刀r:J在右为右边的邑均作目等。注:本条引自GB/T12200.2. 7 数据存储7.1 数据媒体data medlum 用来记录
26、擞据(3.2)并且检索数据(3.2)的物理媒体。例z磁盘,光盘,缩微胶片。注l 本条改自ISO/IEC2382-), 2 在图书和文献工作的领域,数据媒体被看作数据载体自?2 格式format 数据(3.2)预先确定的组织形式。庄:格式可进一步分为输入格式、存储格式和输出格式。7- 3 数据采集data acquisition 收集数据(3.2)或将数据(3.2)装入、存储在数据处理系统中的过穰。7.4 机器可读数据macbine-readable data 可直接装入数据处理系统的数据(3.幻,简称机读数据。注z通常指磁盘、磁带和光盘中的数据,在一定环境下.采用光学字符识别()CRl的办法,
27、印刷物上的数据也TLJ:被看成机器可读数据。7. 5 数据库database 按照概念结构组成的数据(3.幻的集合。注z本条改自ISO/IEC2382-), ?6 术语数据库terminological database 包含术语数据的数据库(7.5)。n 数据库集data bank 包含管理框架的数据库(7.5)的集合。7.8 术语库集term bank 术语数据库集terminological data bank 含有术语数据(3.2)的数据库集(7.7)。7.9记录record 作为一个单位来对待的数据元(7.11)的集。注2本条引自JSO2382-4. 7.10 文件file 文卷作为
28、一个单位来存储或处理的命名记录(7.的的集。525 GB/T 17532 1998 注本条寻|自1502382-4。7- 11 数据元data element 在一定的上下文中具有区别特征的数据(3.2)单元。注.该条改自1502382-4 , 7.12 数据字段data field 为特定的数据元。.11)而保存在一个记录中的变长或定长的部分。7.13 数据字段目录data f1eld directory 在一个记录(7.9)内的数据字段。.12)的位置索引(5.5),包括在该记录。.9)之内的每个数据字段(7.12)的标号(7.16)、长度和位置。7. 14 数据类目data catego
29、ry 数据元类型da ta elemen t type 关于给定数据字段(7.12)的类型说明。7. 15 标识符identlfier 用于标识或命名一个数据类目(7.14)的一个或多个字符(6.1)。注l 该条改自1502382-4。2 标识符的命名可表明该戴据类吕(7.14)的某些性质。7. 16 标号label 数据元(7.11)集内或附加到数据元(7.11)集上的用于标识数据(3.2)的标识符(7.15)或关键字。注:该条改自ISO2382- 4. 7. 17可重复类目repeatable category 在同一个记录(7.9)中能够出现两次以上的数据类目(7.14)。例z在多语言术
30、语条自(3.22)中,有些记录(7.们的某些类目可以对每一种语育都重复出现。在单语言术语条目(3.22)中.诸如同义术语、出处、上下文等类目也可以重复出现。8 信息检索B. 1 信息检索information retrieval IR 从存储的数据(3.2)中查找信息(3.1)的行动、方法和过程。注i本条改自150/IEC2382-. 2 f吉息检索可以在交互式处理或批处理中进行。8.2 查询语盲query language 用户用来检索或者修改存储在数据库(7.5)中数据(3.2)的数据操纵语言。8.3 截断truncation 倩息检索为了搜索或选择而将词形(3.11)变为词段(3.18)
31、的过程。注:截断过程可以自动地进行.或者让用户自行选择e截断的方向可以从左向有.也可以从右向左。8.4 压缩mpresslon 为了撇据处理(3.3)的目的,把词形(3.11)转换为简化形式的操作。注:压缩一般是指去摊发音符号.消除空白(6.)和各种特殊字符(6.9)以及不管大小写的区别a例如,当把某岭拼写变体中立化以便生成但引(5.5)时.就需要使用压缩。8.5 搜索调searchword 搜索关键字search key 用于提供访问记录(7.9)的字符串(6.13)。52h GB/T 17532-1998 注搜索词可以是术语、词、字等英语中还包括单词或者单词的一部分8.6 词干搜索slem
32、 search 递降分析degrada tion 按照预先确定的规则,逐次去掉字符串(6.13)中的字符(6.1) ,使用自动生成的搜索词(8.5)随意提问的过程。注:根据不同语言中构词方式的不同,其顺序可以从右到左,也可以从左到右。B.7 搜索search 信息检索自动地检查擞据(3.2)的集合,以匹配(8.的或抽取(8.9)具有给定特性的元素。例:在姓名的集合中查出所有以J开头的姓名。8.8 匹配match 通过比较来确定不同的数据(3.2)集之间项的同一性,以便选择或分离具有同一饨的项。8. 9 抽取extract 信息检索从一组项中,选择并取出某些符合预先确定的性质的项。8.10 加权
33、ranking 信息检索根据搜索响应对于相应的搜索提间的相关程度的不同,给它们指派不同权值。9 数据管理9.1读read从数据媒体(7.1)获取擞据(3.2),并保持数据不变。注2本条改自ISO2382-6。9.2写write将数据(3.2)长期或暂时记录在数据媒体(7.1)1:0注z本条改自ISO2382-6. 9. 3拷贝copy 复写将数据(3.2)从源数据媒体(7.1)读(9.1)出,保持源数据不变,然后写(9.2)到目标数据媒体上。例:将一个文件从硬盘上拷贝到软磁盘上。注本条改自ISO2382 9.4 分类sort 按指定的准则将一些项分离成若干个组,对其加以排列整理的动作。注g本条
34、改自ISO2382-6. 9.5 归并merge 将两个以上的具有相同给定顺序的数据(3.2)的集合中的项合并成具有该顺序的一个更大的集,6. . 注:本条引自ISO2382-6. 9. 6 显示dlsplay 在屏幕上对数据(3.2)进行可视的显现。9. 7 屏蔽码mask 掩码利用某一字符(6.1)楠样(6.14)来控制另一字符(6.1)模样(6.14)中那些要保留或者要删除的部分。例:所有的元音84.i,od都可用表示无音类别的字符V来替换。注:本条政自ISO2382-6. :)27 GBjT 17532 -1998 9. 8 转摸convert 将数据(3.2)的表示从一种形式改变成另
35、-种形式,而不改变数据所负载的信息(3.1)内容。例z代码转换模拟数字转换媒体转换注2本条引自I凯)2382-6. 9. 9转写transliterate 用一种字母表(6.3)中的字符(6.1)表示另-种字母寝(6.3)中的相应字符。注,ISO 2382-6中有适合信息处理的定义e10 数据验证10. 1 数据验证data咽lidatlon用于确定数据在形式上是否准确、完备、合理的过程。注2本条改自GB!T527 1. 8。10.2 重复杂目检查double-entry cbeck 确定数据条目是否重复存储过的数据验证(10.1)。注s有时允许重复条目是有益的,例如当一个术语可用于不同的专业
36、领域时,可允许重复条目存在.10.3 一致性检查consistency cbeck 确定彼此依赖的条目是否遵守预先确定的条件的数据验证(10.1)。WlJ ,交叉引用的检查。10.4 拼写检查spelling check; spell check 确定所有的词是杏遵守预先确定的拼写规则的数据验证(10.1)。注,ISO!IEC 2382-23在信息处理中,定义了文本编辖中上下文的拼写检查错。10. 5 完备性检查completeness cbeck 确定所要求的数据是否都出现的数据验证00.1)。注1本条政自GB/T5271.8. 2数据必须在强制的擞据宇段(7.12)内出现10.6 格式检查
37、format cbeck 确定数据(3.2)是否符合于指定格式(7.2)的数据验证(10.1)。注z本条改自GB!T527 1. 8。10.7 合理性检查plausiblllty check; reasonableness check 确定数据(3.2)是否符合于特定准则的数据验证(lO.1)。注g本条改自GB/T5271.8. 11 操作11. 1 批处理batcb proc四sing数据(3.幻的处理或者作业的完成都以事先累积起来的方式进行,在工作过程中不再接受用户的*步影响。11.2 交互式处理interactive processing 在用户和计算机系统之间的以对话方式进行的一系列输
38、入和响应的操作。11. 3 数据保护data protection 528 实施一套合适的管理、技术或物理等手段,以防止有意地或偶然地泄漏、修改或破坏数据(3.2)同一程序在不同类型的数据处理系统巾不必转换成另外的程序语言.或不必修改或者只作很少的修改就能执行的能力。注z本条改自ISO/IEC 2382-1。11- 7 兼容性compatiblllty 功能部件不做可感觉到的修改而满足不同接口要求的能力。注:本条引自I50/IEC2382-1 , 11. 8 用户终端user termlnal 在个系统或通信网络中,使用户能够与计算机进行通信的功能部件。注2本条改自I50/IEC2382- L
39、 11- 9 选单menu 数据处理系统显示(9.6)的项目表,用户从此表中能够选择将要进行的行动。注z本条寻|自I50/IEC2382-1. 11.10 数据通信data communicatlon 根据数据传输(11.11)协议和数据交换的协调规定,在功能单元之间进行的数据(3.2)传迭。注2本条引自ISO/IEC 2382-9 , 11. 11 数据传输data transmlssion 通过通信设施,从一个点到另一个或多个点的数据(3.2)传送。注2本条号i自I叹J/IEC2382-9 , 11. 12 文件传送file transfer 通过电子手段,一个或多个文件从一个数据处理系统
40、到其他的数据处理系统的转移。11. 13 上戴upload 把程序或数据(3.2)从相连的计算机或数据媒体(7.1)转出到另外的计算机中。11. 14 下载download 把程序或数据(3.2)从相连计算机转入到另外的计算机或数据媒体(7.1)中。12 相关的应用领域12.1 计算机辅助compllter-alded; computer-assisted 机助CA借助计算机完成人的部分工作的高关技术或过程。例:计算机辅助术语工作,计算机辅助翻译,计算机辅助辞书编寨。12.2 文本处理text processing 语词处理word processing 对文本(3.6)进行的数据处理(3.3
41、)操作。注1:4:条改自ISO/IEC 2382-23 , 2典型的操作有输入、编街、分类、归并、检索、存储、显示或打印等。12.3 文本编辑text editing 529 GB/T 17532-1998 编辑editing 日的在于操纵文本(3.6)的文本处理。注l本条改自ISO/IEC2382-23。2典型的操纵包括重排、改变、添加、删除和格式化等。12.4 醒目显示highJighting 通过改变文本(3.6)中所强调部分的可视属性,使其显示(9.6)更加醒目。12. 5开窗口windowlng 显示屏幕分成两个或多个界线清楚的区域,使得不同的文本或图形能够同时显示,共同地或分别地操
42、作。i主,ISO/IEC 2382-23中文本处理上F文中有定义。12.6浏览browse 在显示屏幕上快速地查看一批文档或文件(7.10)中的某些记录(7.9)。注,ISO/IEC 2382-23中文本处理上下文中有定义a530 GB/T 175321998 中文B 笔画笔数笔1颐. 编辑标号. 标识符. . . 部首. . . C 参照词形.查询语富. . . . . . . . 抽取. . 查检.日M条复段串重词词干搜索. . . . . . . 词片词索引词形. ., 词形变化范型. . . 词形还原. . 惆形,.引.词语曹引.词组型术语. . . . D 附录A(提示的附录)中文索
43、引序号6.17 6. 19 6. 18 12.3 7.16 7.15 6.21 3. 13 8.2 8. 9 6. 12 10.2 3. 18 8. 6 3. 18 5. 12 3. 11 3. 12 3.19 5.12 5.4 3.14 倒排,.引递降分析.8.6 定界符. . .,. . 3. 10 读. F 非用词表. . . . . 分隔符. . 分樊. 5. 1 3.10 9.4 中文. . . . . . . . . . .序号。马咽144 字键关值类类分分复写. . G 格式. . . 格式检查更新. . 归并. H 汉字. . . 汉字部件. . . . 汉字字形. . 合理性
44、检查. . . . . . . . 还原词索引J 机器可读数据. 机助. 基本词形. 计算机辅助. . . . . . . . 记录加权.0 加用词表. . . 闽南字符川. 糠害性. 交互式处理. . . . . 10 截断. I 00 K 开窗口. . 拷贝. 可重复类目. . . . . 可移植性. . . . . 空白. . . . 控制字符9. 3 7.2 10.6 11.4 9.5 6. 15 6. 20 6.16 10.7 5.13 7.4 12.1 3. 13 12. 1 7. 9 8. 10 5.2 6.10 11. 7 11. 2 8. 3 12.5 9.3 7.17 11
45、. 6 6.11 6.5 531 GB!T 17532-1998 中文. . . . . . 序号L 类例. ., 类型., . . .,. . . . . . . 3. 8 浏览. . . . . 轮排. ., . . .,. 4. 6 轮排索引. .,. .,. . . 5. 9 M 模样. . . . . . 6. 14 N 拟用词寝. . 5.2 逆序黛引.,. . . . . . . . 5. 10 迦字母排序. . . . 4.4 P 排序键. . . . . . 4.2 4. 1 11.1 4. 7 8.8 6.22 10.4 4.5 排序值. . 批处理.,. .,. . 毗连. . E配.偏旁.拼写检查. 频度顺序. 屏蔽码. . . . . .,. . . . 9. 7 剖析. . . ., .,. . 3. 20 Q 雌义消解取消屈折.,. . 取消屈折的词形. . 3.24 3. 16 3. 17 s 上戴. . . . 11.13 术语库集. . .,. . . . 7.8 术语撇搪集合. . . .