GB T 26235-2010 信息技术 信息处理用蒙古文词语标记.pdf
《GB T 26235-2010 信息技术 信息处理用蒙古文词语标记.pdf》由会员分享,可在线阅读,更多相关《GB T 26235-2010 信息技术 信息处理用蒙古文词语标记.pdf(20页珍藏版)》请在麦多课文档分享上搜索。
1、GB ICS 35.040 L 71 和国国家标准11: ./、中华人民G/T 26235-2010 信息处理用蒙古文词语标记信息技术Information technology-Mongolian word and expression marks for information processing 2011-05-01实施2011-01-14发布发布中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会伪防饲数GB/T 26235-2010 目次前言.皿1 范围2 术语和定义-3 标记的范围4 标记的级别及命名方法5 词语标记代码I GB/T 26235-2010 剧昌本标准是依
2、据现代蒙古语)(1964)等语法著作为基础,规定了信息处理用的蒙古文词语标记。本标准由全国信息技术标准化技术委员会提出并归口。本标准起草单位:中国电子技术标准化研究所、内蒙古大学、内蒙古师范大学、内蒙古教育出版社、内蒙古自治区蒙古语文工作委员会、北京北大方正电子有限公司、撵坊北大青鸟华光照排有限公司。本标准起草人:那顺乌日图、何正安、青格乐图、确精扎布、六十三、淑琴、贺喜格都仁、唐英敏、吕建春、阿荣塔娜。mm GB/T 26235-2010 信息技术信息处理用蒙古文词语标记1 范围本标准规定了信息处理用蒙古文词语标记,只包括某种语文现象或单位的标记符号。本标准适用于蒙古文的各种语料库、词汇集-
3、词典、语文知识库等。2 术语和定义下列术语和定义适用于本标准。2. 1 蒙古文信息处理Mongolian information processing 用计算机对蒙古文形、音、义等信息进行输入、排序、存储、输出、统计、提取等。2.2 标记单位tagging unit 蒙古文信息处理中使用的词汇、词法、正宇法及其他单位,如单词、复合词、固定词、习用语、成语、缩略语、构形附加成分、连接元音、字母、数字、标点符号等。2.3 2.4 2.5 2.6 2. 7 2.8 2.9 词类word class 词的语法分类,根据词法形态、句法功能、语义特征划分出来的类。不确定词ambiguous word 无法
4、确定词性的词或词素,包括:a) 无法确定词性的同形兼类词(如没有上下文环境的形式); b) 不能单独使用的复合词成分,如y(句olan),tomsi (tog_a tomsi gey) , say (gaJar say gey) , xu(xu luubang); c) 形容词最高级形式:ub(ubulagan) , xab(xab xar_a)等。复合词compound word 由两个实词(有时也包括辅助意义的词)组成,语法和词汇上都构成一个单位的固定短语。固定词fixed word 由一个实词和一个虚词组成,连用成型且未转义的固定短语。习用语habitual usage 由一个转义形容词
5、和一个实词组成,主谓结构且表达一个词汇意义的固定短语。成语idiom 由3个或3个以上词组成,充当一个句子成分的固定短语。缩略语abbreviation 专有名词或常用语的简略形式。1 GB/T 26235-2010 2. 10 2. 11 构形附加成分morphological forms 只增加语法意义的词法形态。连接元音connective vowel 辅音结尾的词干后,加接以S,G,N,M,R,L,Y辅音开头的附加成分时,词干后增加的元音或音节。2.12 标记tag 对文本中标记单位的类别进行标注的代码。3 标记的范围本标准包括词类、复合词、固定词、习用语、成语、缩略语、构形附加成分、
6、连接元音、字母、数字、标点符号等的标记。4 标记的级别及命名方法4. 1 第一级标记的命名方法用大写英文字母标记第一级。如:A (来自adjective):形容词S (来自sula):语气词4.2 第二级标记的命名方法用小写英文字母标记第二级。如:Qn (来自noun):名量词Qc (来自cag):时间量词Qv (来自verb):动量词4.3 第三级标记的命名方法用数字标记第三级。如:FaO:形容词级附加成分的原级Fal :形容词级附加成分的比较级4.4 第四级标记的命名方法用数字标记第四级。如:Fall:形容词级附加成分的比较级lFa12:形容词级附加成分的比较级25 词语标记代码本词语标记
7、代码分为词类标记代码、构形附加成分标记代码、其他标记代码。以下是词语标记内容。注:表中右上角的数字表示该项所包含的附加成分或连接元音数;-:代表与词干分写的附加成分;2代表任意成分。为了简化分类,将动态词尾放在连接元音部分。5. 1 词类标记代码词类标记代码见表1。2 GB/T 26235-2010 表1词类标记代码标记代码序号语文现象/单位词类名称代码说明第一级第二级第三级1 N 名词noun 2 Ne 普通名词eng 3 slrege Ne1 可数名词4 usu Ne2 不可数名词5 Nt 专有名词tusxay 6 batusxe Nt1 人名7 xxexota Nt2 地名8 。brmo
8、nggol-un yexe surgaguli Nt3 机构名9 dagur Nt4 其他专有名词10 A 形容词adjective 11 yexe Ac 性质形容词cinar 12 olJatay Ax 关系形容词xanc、:ag_a13 口lontuAi 区别形容词ilgaxu 14 mge 如f数词numeral 15 Q 量词quanttty 16 jsm Qn 名量词noun 17 jil Qc 时间量词cag 18 daxin Qv 动量词verb 19 。时位词oron 20 dooraxi On 名词性时位词noun 21 emnet Oa 形容词性时位词adjective 2
9、2 magsl Od 副词性时位词adverb 23 R 代词pronoun 、,24 bi Rb 人称代词bey_e 25 egun Rj 指示代词Jlgaxu 26 xamlg_a Ra 疑问代词asaguxu 27 ber Ro 返身代词ber 28 yamarba Rx 范围代词xuny_e 29 xen cu Rt 不定代词todorxay 30 Janm Ri 区别代词ilgaxu 31 mggl , tege Rv 动作代词verb 32 V 动词verb 33 Ve 普通动词eng 34 jalgamJila Ve1 及物动词3 GB/T 26235-2010 表1(续)标记代
10、码序号语文现象/单位词类名称代码说明第一级第二级第三级35 tacgna Ve2 不及物动词36 tege Vt 代动词tlgen 37 xe口lenVx 联系动词xolboxu 38 Vz 助动词助动词的z39 lrexu Vz1 第一类助动词40 bay Vz2 第二类助动词41 xabur T 时间词tl口le42 D 副词adverb 43 neng , masl Dx 程度副词xln 44 xaya , daruy Dc 时间副词cag 45 xag_a, balba Db 状态副词bayidal 46 naSl , emun_e Do 地点方向副词oron 47 tung tang
11、 Dd 基拟副词daguriyaxu 48 nexer Dq 情态副词排列49 lab H 情态词排列50 U 事拟词drslex 51 gilas gilas Ub 状态摹拟词bayidal 52 ser ser Ud 声响摹拟词dagu 53 G 后置词排列54 met,slg Ga 比较后置词adalidxaxu 55 tursi, dagus Gc 时间后置词cag 56 dagaw , tal_a Go 地点方向后置词oron 57 bolgan, bri Gx 范围后置词xuny_e 58 tula , bolxor Gs 原因后置词siltagan 59 tlge q 目的后置词
12、jorilg_a 60 xrtel_e Gb 限定后置词排列61 garuy Gg 估量后置词排列62 tuxay Gt 论述后置词tuxayilaxu 63 tutum , tusum Gd 递进后置词dabsiguraxu 64 xamtu Gm 共同后置词xa口lturaxu65 S 语气词sula 66 uu Sa 疑问语气词asaguxu 67 yum Sb 肯定语气词batulaxu 68 bs Su 否定语气词geysxex 4 GB/T 26235-2010 表1(续)标记代码序号语文现象/单位词类名称代码说明第一级第二级第三级69 la Sx 强调语气词xucu 70 biJ
13、e St 猜测语气词ts凸gelex71 bol Sd 提示语气词排列72 口11mSf 返身语气词返身的f73 Ja Sj 允许语气词jbsiyerex 74 口laSg 给予语气词og 75 cu Sq 欠缺语气词欠缺的q76 a Sh 呼叫语气词呼叫的h77 bile Ss 叙述语气词state 78 basa Sc 重复语气词排列79 C 连接词conUnctlOn 80 ba cj 并列连接词或式jergeceglx 81 -bar baraxu gey basa Ca 递进连接式axigulxu 82 buyu Cz 选择连接词或式排列83 xu-aca bisi bisi Cd
14、对立连接式排列84 xann Cr 转折连接词或式erglxu 85 xerbe bol Cb 假定连接式bolJoxu 86 uClr m Cv 原因连接词uc、:ir87 tegebel Cx 归纳连接词xuriyangguyilaxu 88 xedy bol tedy Cc 进层连接式排列89 I 感叹词mte勾ectlOn90 xa Is 情感感叹词sedxilge 91 口la1d 叫唤感叹词dagudaxu 5.2 构形附加成分标记代码构形附加成分标记代码见表20表2构形附加成分标记代码标记代码序号构形附加成分构形附加成分名称代码说明第一级第二级第三级第四级1 F 构形附加成分su
15、ffix 2 Fp 数范畴plural 3 Fpl 数范畴14 nar Fpll 5 nar Fp12 6 -ud2 Fp2 数范畴25 GB/T 26235-2010 表2(续)标记代码序号构形附加成分构形附加成分名称代码说明第一级第二级第三级第四级7 -nugud Fp3 数范畴38 cud Fp4 数范畴49 cuul Fp5 数范畴510 d Fp6 数范畴611 s Fp7 数范畴712 Fc 格范畴case 13 零形式FcO 主格14 Fcl 属格15 零形式FclO 属格。16 -yin5 Fc11 属格l17 u Fcl2 属格218 ay Fcl3 属格319 Fc2 与格
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
本资源只提供5页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 26235 2010 信息技术 信息处理 蒙古文 词语 标记
