GB 12200-1990 汉语信息处理词汇 第1部分 基本术语.pdf

上传人:李朗 文档编号:207153 上传时间:2019-07-14 格式:PDF 页数:12 大小:381.17KB
下载 相关 举报
GB 12200-1990 汉语信息处理词汇 第1部分 基本术语.pdf_第1页
第1页 / 共12页
GB 12200-1990 汉语信息处理词汇 第1部分 基本术语.pdf_第2页
第2页 / 共12页
GB 12200-1990 汉语信息处理词汇 第1部分 基本术语.pdf_第3页
第3页 / 共12页
GB 12200-1990 汉语信息处理词汇 第1部分 基本术语.pdf_第4页
第4页 / 共12页
GB 12200-1990 汉语信息处理词汇 第1部分 基本术语.pdf_第5页
第5页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、中华人民共和国国家标准汉语信息处理词汇01部分:基本术语CI Part 0们1: Fundamental阳msGB 12200.1- 90 本词汇涉及到汉语信息处理的各个主要方面,其中包括基本术语、汉语和汉字、汉字编码、汉字识别、汉语语音处理、汉语理解、机器翻译、汉语信息处理设备、汉语信息处理系统软件、议i吾信息处理技术应用及其他等约11个部分。在学科方面,本词汇具有相对的独立性和系统性。1 主题内容与适用范围1. 1 主题内容本标准规定了最重要的或最基本的汉语信息处理术语,它们是其他各部分的基础。1.2 适用范围本标准适用于有关汉语信息处理领域的科研、设计、生产、使用、维护、管理、教学和出版

2、等方面。2 引用标准GB 2312信息交换用汉字编码字符集基本集GB 5271 数据处理词汇3 遵循的原则和规则3. 1 词条词条是本标准为使用者提供的便于查检和参阅的基本单元。3.2 词条的组成本标准的词条一般由下述几部分构成z8. 索引号(不同语种文本都是一致的hb. 术语;C. 术i沓的缩写;d. 允许用的同义术语;e. 术语的英译名gf. 术语的英文缩写;g. 术语的定义sh. 以例:开头的一个或几个示例;i. 以注2开头的一个或几个注释(用以说明术语应用的特殊情况hi. 团、图表或表格曰3.3 多义术语当一个术语有几个不同的意义时,分别在不同的i司条中给予定义,以便于译成宾他诸种。国

3、凉技术监督局1990-02-01批准1990-08-01实施362 GB 12200.1-90 3. 4 缩写句吨术语具有常用的缩写,但在定义、示伊j及注释巾,不采用这种缩写。3- 5 符号的用法3. 5. 1 圆括号的用法有些术语使用时,在不引起误解的情况f,可以省略掉凭中一部分,叮省略的部分为黑体字.并用阪l扫号括起。在定义、示例和注释巾.只用完整的术语。有且与术语后因括号内的非黑体字,不是术语的组成部分,而是用来说明该术语的使用须知和特殊向用形式戎语法形式的a3. 5.2 万括号的用法当几个术语使用扣d-个定义格式(个别词不相同)时,日J将它们合并在个词条中u个另1J不相|斗的币l放在方

4、恬号中,表示可以替换方括号前面的词。方括号及其中的词在术语及定义中出现的顺序必刘l致。3. 5. 3 黑体7lj51号术语在定义、示例和注释中用黑体字印刷时,表示该术语已在本词汇的其它词条中给过定义.并且只有它在另一扫条1首次山现时才印成黑体字。如果有两个已分别在不同的词条中给过定义的术语连在4起使用时,则用星号脊将这两个术语隔开c3. 6 英译名术语所对应的英文采用美同习用的拼法。3.7索寻|本标准附有汉语索引和英文蒙别。索引包括本部分的全部术语。根据汉语索41或英文索引,可查出术语在文的索引号。4 术语和定义4. 1 基本术活4. 1. 1 般术i肯4.1.1.1 苦苦信息处理langua

5、ge informaton proccssng 用计1丰机对自然语言的背、形、义等信息进行处理。即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作与加二。4.1.1.2 汉语信息处理Chine如informationproce且ing用l算机对汉语的青、形、义等信息进行处理,有时又称中文信息处理。4.1.1.3 汉字信息处理Chinese character information proces.c;,:ing 用计算机对汉字表示的信息进行的操作和加仁,如汉字的输入、输出、识别等。4.1.1.4 汉宁输入Chinese charac.ter input 利用汉字的形、音或相关信息

6、通过各种方式,把汉字输入到计算机中去的过程。4.1.1.5 汉字输出Chinese character output 将计算机内以数据形式表示的汉字在显那终端、印字机等设备输出的过程。4. 1. 1. 6 多文种信息处理multlingual information processing 在两种或两种以k语言文字字符集编码体系基础上,实现对多文种信息的兼容处JL4.1.1-7 民族语言支撑能力National language support NL.C;(缩写)使i-算机具备能够处理民族语言的汗发能力。例.中文化,汉字化。4.1.2 r击;1文于1:14、iGB 2200.-90 4. ,.

7、2. , 活言language 为f传递信息而使用的一组字符、约定和规则。沌2同GB527. 7的07.02.01条。4.2.2 自然语言n副urallanguage 一种语言,其规则是根据当前流行的用法而不是用明确的形式规定的。注:同GB527!. 7的07.02.03条。4.2.3 人t语言artificial language 种语言,其规则在使用前己明确地规定了。注,I司GB5271.7的07.02.03条。4.2.4 受限语言restricted language 在词汇、句法、语义及语用等方面受到人为限制的自然语言的真子集。4.2.5 语言模型linguistic model 对自

8、然语言的数学描述。分为生成模型、分析模型和识别模型三种。4.2.6语音speechsound 人类发出的能表达一定恿义的声音。4.2.7 文字scnpt 人类记录相传达语言的书写符号系统u4.2.8 t司word最小的能独立运用的语言单位。例大、国家、奥林匹克E4.2.9 词汇vocabulary 种语言中所有的词与固定词组的集合。4. ,. 2. , 0 i1号t去grammar语言的结构规则。自然语言的语法具有一定的民族特点和相当的稳定性。4.2. 句法syntax 词或词组之间的组合规则。4. ,. 2. 12 语义semantics词或词组与它们的含义之间的关系。4.2.3 语用pra

9、gmatics 词或词组与它们的解释和使用之间的关系a4.2.14 文本text 语言的符号串,文字信息处理的对象。4.2.15 语言资料库corpus 文本的有序集合。各种分类、检索、综合、比较的基础。4.2.6 语言知识库language knowledge恼sej-算机所存储的语言知识的集合。它是计算机从语音、文字、词汇、句法、语义、语用等角度也I语言进行信息处理的基础。4.2.7 t十算语言学computational Iinguistics 话言学的一个分文学斜。它应用计算机技术来研究和处理语言铮文字,内容包括:宁频和I.j 频统计、语音的识别与合成、机器词典的编篡、机器翻译、自然语

10、言理解、计算机的fl然话:l接u宰。4. ,. 3 汉语和汉字4.3.1 Y且i轩ChmeseGB , 2 2 0 0. 9 0 汉族的语言。中国境内全要的通用活言,也是国际通用活育之一。属汉藏语系。4. ,. 3. 2 巾文Chinese 特指汉语。4.3.3 现代汉语contemporary Chinese language 现代汉民族语言。包括它的主要地域分支s北方话、吴i菁、湘语、赣语、粤语、客家i吉、闽语等。它的规范化语言是普通话。4.3.4 普通话Putonghua 现代汉民族共同语。它是规范化的现代汉语.以北京活音为标准音,以北方话为基础方百.以典范的现代臼话文著作为语法规范4.

11、 ,. 3. 5 汉语拼音(方案)scheme of thc Chinese phonetic alphabet. Pinyin 给汉字注音和拼写汉语赞普通话铃语音的h今案。方案采用26个拉丁字母,有声母表和韵母表及拼写规则,对声调符号和隔音符号的标记也有规定。4.3.6 汉字Chinese character , Hanzi 记表汉语的书写符号系统。汉字也被其他些国家或民族用作为书写符号。4. ,. 3. 7 现代通用汉字current commonly-used Chincsc character 现代通行的记录现代汉语的书写符号系统。例:(l)GB23120 (2)(现代汉语通用字表)

12、4. ,. 3. 8 汉字属性attribute of Chincsc characters 汉字本身所具有的音、形、义三方面的特征及附加的有关特征。你:笔画、笔顺、部首、部件、汉语拼音方案、问角号码等。4. ,. 3. 9 汉字属性字典Chinese character attribute dictionary 包括汉字部首、汉语拼音方案、笔函数、笔顺、使用频度、组1司能力、文字结构、标准部件、标准字形点阵码等属院反其电报码等相关信息的数据库或字典。4.1.3.10 简化字simplified Chinese ch旧acter采用同音代替、改换声旁、草书楷化、偏旁简化类推等方法制定的一批笔画

13、较少的汉字。这些字取代了对应的笔画较多的汉字作为通行的正体。特指1986年重新公布的4简化字总表队只:2 235字。例:后後J.亿t健J,发没J,说二lt丁,难蝶丁。4.3. 繁体字unsimplified Chinese character 被简化字代替的笔画较多的汉字。例:带专J,型圣J,卒宁J.妇口口,楼机Jo4.3.12 异体字variant Chinese charactcr 汉字通常写法之外的一种音同、义同,只是字形笔画或结构不同的字。例:升升、阻J,迹胁、脑J,泪i厌。4. ,. 3. 3 分词单位word segmentation unit 汉语信息处理使用的、具有确定的语义和

14、(或)语法功能的基本单位。4. ,. 3. 4 汉语分词Chinese word segmenting 从工程观点出发,按照特定的规范,对汉语按分词单位进行划分的过程。4. ,. 4 汉字编码4.4.1 汉字汉语词语编码Chinese charactcr Chincse word and phrase Jcodir鸣接照一定的规则,对指定的汉字议语词语1集|斗的元素编制相院的代码。4.4.2 汉字编码字符集Chinese ch盯actcrc咀edcharacter set 、.C) n ,:l GB , 2 2 0 O. , . 9 0 按定的规则确定的包含汉字及有关基本图形字符的有序集合.丰

15、规定该集合中的子符与744码表示之间一一对应的关系。例:GB 23120 4. ,. 4. 3 yJ.字编码方案Chin四echaracter c叫ingschemc 汉字集兀素映射到其他字符集元素的组完整规则。4.4.4 汉字编码(键盘)输入方法Chin回echaracter codin且(keybcard)inpLLt method 运用某种编码方案、键盘设备及计算机资源,由操作各向H饥输入汉字的方法。4. ,. 4. 5 汉字编码输入方法评估evaluation of Chinesc ch盯actcrc咀inginput mcthod 按照约定的或法定的规则和步骤.对汉字编码(键盘)输入

16、方法的素质和特性进行走坠的测试和定性的评价等。4. ,. 4. 6 汉字(信息)交换码Chinese character code for information interchange 汉字信息处理系统之间或者信息处理系统与通信系统之间应行汉子信息交换的代ipj4.4.7 汉字内部码Chinese character internal code 汉字在信息处理系统内部最基本的表达形式,棋布储、处理、传输1.1.宇用。1宜=立与汉字信息交换码有一定的对应关系,通常借助于某种特定标识信息来表明它与单字节丰符(.)1: WL 4.4.8 汉宁控制功能码Chincse character contr

17、ol function c叫e说明汉字数据的传送控制、格式处理、汉字扩先及设备控制等的代码。4.4.9 汉宁字形码Chin回echaracter font code 表达汉字字形的字模数据,通常用点阵、矢量民数等方式表示。4.4.0 汉字点阵宇形Chinese character dot matrix font 计算机中以点阵形式表示规范化汉字字形的-种形式。4. ,. 5 语音和文字自动处理4. ,. 5. , 汉字识另IJChin国echaracter recognition 利用iI算机抽取汉字字形特征,实现对汉字的自动输入。可分为联机子写体汉字识别、印刷体汉字识别和手写体汉字识别。4.

18、 1. 5. 2 汉语语音识别Chinese speech recognition 利用语音分析技术,抽取语音特征,实现对汉语语音的自动识别。可分为特定人和r特定人的种。4. ,. 5. 3 汉语语音分析Chin四espeech analysis 将汉语语音模拟信号转换为语音数字信号,抽取汉语语音的特征,建立汉语语音模型的过程。4. ,. 5. 4 叉话语音合成Chine均espeech synth出18利用汉语语音信息库和语音的合成系统,合成出所需汉字、单词、短i吾或整句的汉语语音泊LE 4.5.5 汉语语音信息库Chinese speech information library 利用语音

19、分析、压缩技术,根据汉语语音特征模型(声母、韵母、声调、音节、语调、语气)建立的汉语语音数据、参数、特征数据库。4. ,. 5. 6 汉语语音数字信号处理Chinese speech digital signal processing 利用语音采祥、分析、存储、合成、传输等技术,实现对汉语语音的识别、求放、合成和通信功能。4.5.7 汉语语音信息处理Chin回espeech information proc回smg利用计算机系统、汉语语音的编码技术和汉语语音数字信号处理技术,实现汉语语音输入、输出、理解、翻译、语音和文字相互转换以及语音信息通信等信息处理功能。4. . 6 汉语理解和机器翻译4

20、.6. 汉语理解Chinese language understanding 3日6GB 1 2 2 0 O. 1 - 9 0 计1:1.机基于语言知识和背景知识对汉语进行的分析、判断和推理。4. ,. 6. 2 机器翻译machine translation MT(缩写)用fl贸市L将伞种自然语言(源语言)转换成另一种自然语言(目标语言)的过程。4.6.3 机器i,;j典machine dictionary 以人用词典为主主础,通过对i司法、句法、语义等信息的规rl1化和形式化描述,做成的存储在1 讲机中的词典。4.6.4源语言sourcelanguage 在机器翻译中.被翻译的语言。4.

21、,. 6. 5 日标语言target language 在机器翻译中.所译成的语言。4.6.6 句法语义分析parsmg 1日计算机在句法和语法层次上对句f进行分析,1主要通过语言中各种成分的句法功能和语义关系来描述句子的结构与层次。4.6.7 汉语分析Chin四eanalysis 将输入计算机的汉语句子或篇章,利用给定的分析h法.确定每个成分的词法、句法和语义等信息,并将其转换成便于计算机进4步处理的中间表示。4.6.8 汉活牛成Chincsc gcneration 从计算机中的某种语言信息的中间友示出发.通过必要的语法和语义知识转换生成汉语的41jf戎篇章。4. ,. 7 汉语信息处理设备

22、和l软件4.7. 汉语语词处呢机Chinese wor processor 种专用的汉字信息处理系统,用于汉语文稿的输入、编辑、存储、印刷及传送。4. ,. 7. 2 多文种语词处理机multi1ingual word pr田essor-种能处理两种及两种以上语言文字信息的具有键jj输入、显示、校改、文本编辑、印刷l输出等功能的设备。该设备通常也具有简单的文档管理功能。例:巾英文电子打字机。4.7.3 汉字印字机Chinese character printer 能实现:中、英文输出的印字设备。通常分为击H式和非ili打式两种,一般都配有中、英文字形库。4. ,. 7. 4 iJl.字终端Ch

23、inc.;e charactcr tcrminal 能完成汉字输入、输出功能的计算机终端,通常分为简易型、通用型和智能础。4.7.5 汉字输入键盘Chinese ch盯acterinput keyb回rd使f输入汉字的专用键盘。它口分为整字咽、部it(字根)型等类型。它在键位布局和结构设计等H面有别于传统的商文键盘。4.7.6 i又卡Chin四ccharactcr card 将汉字编码输入方法的码表和有关程序及汉字的字模数据国化在ROM器件巾的一种逻辑电路插件。4.7.7 汉字字形JIfChinese character font library 建立在计算机存储媒体上的汉字的字模数据集合。4

24、.7.8 汉语川话库Chinese word and phrase library 建tI在计算机在储媒体l二汉语的词和短i苦的集合,该集合可接词语关系的结构作有序的排列,可以按收词多少、词语性质、功能、结构等分类。4.7.9 汉字公用程序Chinese character utility programs .I; 7 GB , 2 2 0 O. , 9 0 支援计算机系统在汉字方式下实际运行的辅助程序。例:汉字造字、排序、编辑及打印等程序。4.7.0 多文种信息处理系统multilingual information proce四mgsystem 能处理由多种语言揭文字所表述的信息的系统。它

25、们可分为两类:一类是在原有单文种系统基础上扩充而成的,在这类系统中新纳入的文种应用的范围往往受到限制;一类是以能容纳多种文字字符的大字符集为基础设计的系统,可不受七述限制。4. ,. 8 汉语信息处理技术应用4.8. 通用型汉字信息处理系统general purpose Chin四echaracter informatof、processingsystem 适用于各种数据处理和汉字信息处理的il算机系统。其特点是通用性强,汉字输入输出手段多,操作方便。4.8.2 电子出版系统electronic publishing system EPS (缩写)利用以计算机为主的电子技术代替传统的人士编辑、

26、铅字排版的自动化印刷出版系统。4.8.3 中文情报检索系统Chinesc information retrieval system 对中文情报进行收集、存储、检索、加工、编辑和分发传送的信息处理系统。4.8.4 汉语计算机辅助教学系统Chin田ccomputcr-aide instruct旧nsystem 368 通过教员或学员与计算机之间的交瓦活动,辅助编辑教材,选择i孟子学员个人的学习程序和课程内容,达到教学汉语目的的种信息处理系统。GB 1 2 2 0 O. 1 -9 0 附录A汉语索引(参考件)E 汉字编码输入h法评估. .4.1.4.5 汉字编码字符集. . . . . . . .

27、. 4. L 4. 2 i司. . . . . . . . . . .4.1.2.8 汉字点阵字形.4.J.4.10词汇. . . . . ., . . ., . . .,. 4. 1. 2. 9 汉字公用程序. . . . . . . .4.1.7.9 D 电子出版系统. . . . . . . . . 4. 1. 8. 2 多文种信息处理. . . . . 4. 1. 1. 6 多文种信息处理系统.4.1.7.10多文种语词处理机.4.1.7.2F 汉字(信息)交换码. . . . . 4. 1. 4. 6 汉字控制j功能码. . . . . 4. 1. 4. 8 汉字内部码. . . .

28、 . . . . . . 4.1.4.7 汉字识)rl .,. . . . . . . . . 4. 1. 5. 1 汉字输出. . . . . . .4.1.1.5 汉字输入. . . . . . . . 4. 1.1. 4 汉子输入键盘. . . . . . . . . . . . . .1. 1.7.5 汉字属性. . . . . . . 4. l. 3. 8 繁体字. . . . . . . . 4. 1. 3. 11 汉字属性字典. . . . . . . . . . . 4. 1. 3. 9 分词单位. . . . . . . 4. 1. 3.13 汉字信息处理. . . . .

29、. . 4. 1. 1. 3 H J.卡. . . . . . . . . . 4. 1. 7. 6 汉语. . 4. 1. 3. 1 汉语词语编码. . . . . . . 4. 1. 4. 1 汉语i司i吾1年. . . . ., . . 1. 1. 7.8 J. if分同. . . . . . . . . . 4. , 3. 14 汉语分析. . ., . .,. . . 4. 1. 6. 7 汉语计算机辅助教学系统.4.1.8.4汉语理解汉语拼音(方案).4.1.3.5汉语生成. ., .4.1.6.8 汉语信息处理. . . . . 4. 1. 1. 2 汉语语i司处理机. . .

30、.4. 1. 7.1 汉语语音分析. . . . 4. l. 5. 3 汉语语音合成.4.1.5.4汉语语音识另IJ. ., . . . . . 4. 5. 2 汉语语音数字信号处理. . .1.1. 5.6 汉语语音信息处理. . . . . . 4. 1. 5. 7 汉语语fT信息库. . . . . . 4. 1.岳.5 汉字. ., . . . . 4. 1. 3. 6 汉字编码. . . . . . . . .4.1.4.1 汉字编码方案. . ., . . . . . . . 4. 1. 4. 3 7叉子编il)(键盘)输入方法.4.4.4汉字印字机. . . .4.7.3 aq

31、哼t4丛丁端抽队、字人句Q74 aqa斗库码形形字字字宁汉汉J 机器词典机器翻译. . 4. 1. 6. 3 4.1.6.2 . . . .,. . . 计算语言学. . . . . . . . 4. 1. 2. 17 们l吃d9,宇化法简句句法语义分析. . .,. . . 4. 1. 6. 6 M 民族语言支撑能力. .,. . .;1.1.1.7 目标语言. . . . .4. 1. 6.5 P 普涵忻. . . . .4.1.3.4 R 人Ii轩言.1. 1. 2. :l 川、qGB 12200.1 -90 s 语法. . . . 受限语言4.1.2.4 阳mt芋,处型怠H模信十一-n

32、u昌言语语语T 语言知识库. . . 通用型汉字信息处理系统. . . 4. 1. 8. 1 语言资料库. . . . w i吾义.语音. ., .,. 文本.,. . 语用.4. 1. 2. 14 4.1.2.7 源语J7文字. . X Z 字汉语用汉通代代现现统系索检报古口青语文文然中中自4. L 3. 3 4. L 3. 7 Y 异体字. . . . . . . . . 4. 1. 3. 1 2 附录B英文索引(参考牛)A arti日ciallanguage . . . . . .,. . . . . . . . . . . ., . . .,. . . .,. ., . attribu

33、te of Chinese characters . ., . . .,. . . .,. ., . C Chinese Chin咀. ., . . . . . .,. . . . . . . . . . . . . .,. . . . . . . . . .,. . . . . . . . . . . . . . ., . . .,. . . .,. . . Chinese analysis . Chinesc charactcr Chinesc charactcr attribute dictionary Chinese character card . ., . . ., . . . .

34、 . Chinese character code for information interchange . Chinese character coding . Chinese character coding (keyboard) input method ., . . . . Chinese character coding scheme Chincse character coded character set . . . . . . Chincse character control function code Chinese character dot matrix font .

35、 . . . . . ., . .,. ., . . . . . . . . . . . . . Chincse character font code .,. . :17() 4.1.2.10 4.1.2.1 (1. 1. 2. 5 41. 1 l 1. 1. 2 16 4. 1. 2.15 4.1.2.12 4.1.6 1.1.2.1:1 4.1.6.4 1. 1. 3. 2 4. l. 8. 4. . 2. 2 4.1.2.3 4.1.3.8 4.3.1 4. 1. 3. 2 4.1.6.7 4. . 3. 6 4. . 3. 9 4.1.7.6 4.1.4.6 4.1.4.1 4. 1

36、. 4.4 4.1.4.3 .1. .4.2 4.1.4. .1. . 4. 1 (1 4.1.4.j GB 12200.1 90 Chinese character font library . . . . . . . . . . . . . . . . . Chinese character information processing . . . . . . . . . . . Chincsc charactcr input Chit、esecharacter input keyboard Chinese character internal cod巳. . . . . . . . .

37、. . Chinese character output Chinese character printer . . . . . . . . . . . . . . . . . . . Chinese character recognition . . . . . . . . . . . . . . . . . . . . . . Chinese charactcr tcrminal . Chine艳characterutility programs . Chincsc computer-aided instruction system Chinese gencration . Chinese

38、 information proce田ing. . . . . . . . . . . . . . . . . . . . . . . . . Chnese nformation retrieval system . . . . . . . . . . . . . . . . . Chincsc language understanding . . . . . . . . .- . . . . . . . Chinesc spcech analysis . . . . . Chinese speech digital 日gnalprocessing . . Chinese speech inf

39、ormaton library Chin已回spccchinformation processing Chinese speech recognition . . . . . . . . . . . . . . . Chinese speech synthe.;ls . . . . . Chinese word and phrase coding Chinese word and phrase library Chinese word processor Clne胆wordsegmenting . . . . . . . . . . . . . . . computational linguistics . . . . contemporary Chinese language . . . . . . . . . . . corpus current commonly-used Chinese charac

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 国家标准

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1