ImageVerifierCode 换一换
格式:PDF , 页数:10 ,大小:374.90KB ,
资源ID:209653      下载积分:5000 积分
快捷下载
登录下载
邮箱/手机:
温馨提示:
如需开发票,请勿充值!快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
注意:如需开发票,请勿充值!
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【http://www.mydoc123.com/d-209653.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(GB T 20532-2006 信息处理用现代汉语词类标记规范.pdf)为本站会员(dealItalian200)主动上传,麦多课文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知麦多课文库(发送邮件至master@mydoc123.com或直接QQ联系客服),我们立即给予删除!

GB T 20532-2006 信息处理用现代汉语词类标记规范.pdf

1、ICS 01. 040. 01 A 22 中华人民共和国国家标准GB/T 20532-2006 信息处理用现代汉语词类标记规范Standard of POS tag of contemporary Chinese for CIP 2006-。18发布2007-03-01实施中华人民共和国国家质量监督检验检茂总局串舍中国国家标准化管理委员会品叩Gn;T 20532-2006 自次前言. . . . .四l 范固2 术语和定义;1 总则-4 词类及其他切分单位分类5 词类及其他切分单位标记代码表. I 前言本标准由教育部语言文字信息管理司提出。本标准由教育部语言文字信息管理司归口。本标准起草单位:

2、教育部语言文字应用研究所。本标准主要起草人:靳光瑾、肖航、郭曙伦、富丽、章云帆、于桂英、陈玉泉、玉立。GB/T 20532-2006 而出信息处理用现代汉语词类标记规范1 范围本标准规定了信息处理中现代汉语词类及其他切分单位的标记代码。本标准适用于汉语信息处理,也可供现代汉语教学与研究参考。2 术语和定义下列术语和定义适用于本2. 1 2.2 2.3 2.4 汉语信息处理用计算机对汉语形切分单位词类词的语标记tag 对文本中切3 总则3. 1 切分单位的范本标准的切分单非语素字、标点符号、非3.2 词类划分的原则;POS 本标准的词类分类体系要。本标准根据汉语信息处理的3. 3 标记代码的制定

3、原则理盟陆翻拯、朱德熙、胡裕树等先生GB/T 20532-2006 的词、短语及其后接成分、语素字、中学教学语法系统提依据国际通常做法,标记代码主要采用英文术语的字母。例如,名词飞采用英文术语noun的首字母n作为标记代码;数词,采用英文术语numeral的第三个字母m作为标记代码。汉语独有的,或使用英文术语字母不便的,依据国内通常做法,标记代码采用汉语拼音字母。如,缩略语,采用汉字简汉语拼音的首字母j作为标记代码;语素宇,采用汉字根汉语拼音的首字母气作为标记代码。4 词类及其他切分单位分类本标准将词类划分为13个一级类,16个二级类;其他切分单位划分为7个一级类,13个二级类。用户可根据需要

4、自行增补。1 GB/T 20532-2006 4. 1 词类划分及标记代码4. 1. 1 名词(时,表示人或事物的名称,在句子中主要充当主语和宾语。4. 1. 1. 1 普通名词(ng),表示事物的名称。如:人马书教师飞机电冰箱阿姨桌子木头道德理论历史思想文化因素作风哲学4. 1. 1. 2 时间名词(nt),包括一般所说的时量词。如:年月日分秒现在过去昨天去年将来宋朝星期-4.1. 1. 3 方位名词(nd),表示位置的相对方向。如:上下左右前后里外中东西南北前边左面里头中间外部4.1. 1. 4 处所名词(nl),表示处所。如:空中高处隔壁门口附近边疆一旁野外4.1. 1. 5 人名(nh

5、),表示人的名称的专有名词。华罗庚阿凡提诸葛亮司马相如松赞干布卡尔马克思4. 1. 1. 6 地名(ns),表示地理区域名称的专有名词。如:亚洲大西洋地中海阿尔卑斯山加拿大中国北京浙江景德镇呼和浩特中关村4. 1. 1. 7 族名(nn),表示民族或部需名称的专有名词。如:回族藏族壮族蒙古族维吾尔族哈萨克族4. 1. 1. 8 机构名(ni),表示团体、组织、机构名称的专有名词。如:联合国教育部北京大学中国科学院4.1. 1. 9 其他专有名词(nz)。如:五粮液官爆鸡丁桑塔纳4. 1. 2 动词(时,表示动作、行为,心理活动、生理状态及事物的存现、变化等,在句子中主要充当谓语。4. 1. 2

6、. 1 及物动词(vt),能够带宾语。如:吃打擦洗喂借送买捧提填喜欢告诉接受羡慕考虑调查同意发动4.1.2.2 不及物动词(vi),不能够带宾语。如:病休息咳嗽瘫痪游泳睡觉4.1.2.3 联系动词(vl),表示关系的判断。如:是4.1.2.4 能愿动词(vu),表示可能、意愿。如:能够能应该可以可能情愿愿意妥4.1.2.5 趋向动词(vd),表示趋向。如:(走)上(趴)下(进)来(回)去(llB)上来(掉)下去(提)起来(扔)过去4. 1. 3 形容词(a),表示性质、状态,在句中主要充当谓语、定语、状语和补语。4. 1. 3. 1 性质形容词(aq),表示性质。如:好高关大勇敢危险漂亮干净伟

7、大4.1.3.2 状态形容词(as),表示状态。如:雪白黠黑通红冰凉绿油油亮堂堂白花花冷冰冰4. 1.4 区别词(f),表示事物的区别性特征,在句子中只能做定语修饰名词或跟助词的组成的宇结构。如:男女公母雌雄微型国产军用4. 1.5 数词(m),表示数目和次序。如:零一半百千百万一百零八第一第十八4. 1. 6 量词(q),表示人、事物或动作的单位。如:个条片匹辆尺斤两吨支回次边千瓦时4. 1. 7 代词(r),起替代和复指作用。如:我你他这那谁我们你们他们这个那个大家自己什么哪里,怎么怎么样GB/T 20532-2006 4. 1. 8 副词(d),修饰或限制动词和形容词,表示范围、程度等。

8、在句子中做状语。如:都只就仅很再三屡次将不却总共正在常常重新曾经竟然居然4. 1. 9 介词(p),引介名词性成分,不单独充当句子成分。如:才已被从向对凭按照对于为了自从关于4. 1. 10 连词(c),连接词、短语或句子,表示两者之间所具有的某种关系。如t和同与及并或并且而且或者因为所以4. 1. 11 助词(u),附着在词、短语、句子后面表示某种附加意义。如:的地得了看过等等似的一样4. 1. 12 叹词(的,表示感叹、呼唤或应答,可独立成句或在句中充当独立成分。如:啊嗯唉哎哼哦哎哟哎呀4. 1. 13 拟声词(0),模拟自然界事物的某种声音,不能单独成句。如:砰滴答扑通咕咚丁T当当4.2

9、 其他切分单位划分及标记代码4. 2. 1 习用语(i),一种相沿习用的定型短语。4.2. 1. 1 名词性习用语(in)。如:海市屉楼井底之垃妹丝马迹4. 2. 1. 2 动词性习用语(iv)。如:跑龙套打官腔吃老本与时供进励精图治4. 2. 1. 3 形容词性习用语(ia)。如:丰宫多彩艰苦朴素光明正大4. 2. 1. 4 连词性习用语(ic)。如:总而言之由此可见综上所述4.2.2 缩略语。,专有名词或常用语的简缩形式。4. 2. 2. 1 名词性缩略语(jn)。如:人大五四奥运4.2.2.2 动词性缩略语(jv)。如:调研离退休4.2.2.3 形容词性缩略语(ja)。如:短平快高精尖4

10、.2.3 前接成分(h),词根前面的附加构词成分。如:3 GB/T 20532-2006 阿老初第4.2.4 后接成分(k),词根后面的附加构词成分。如:子儿头化们式性者4.2.5 语素宇(剖,汉字字符集中一般不单独使用的汉字。4. 2. 5. 1 名词性语素字(gn)。如:民农材4. 2. 5. 2 动词性语素宇(gv)。如:抒究涤4.2.5.3 形容词性语素宇(ga)。如:珠遥伟4.2.6 非语素宇(x),汉字字垃琵蜘踌鸯4.2.7其他(w)4. 2. 7. 1 标点符号(,。4.2.7.2 office 4.2.7.3 5 序号1 2 3 4 5 6 7 8 9 10 11 12 13

11、14 15 4 a c d E g h ga gn gv la lC 形容词性语素字名词性i吾素字动词性语素字前接成分|习用语|形容词性习用语连词性习用语根的汉语拼音首字母-adjective根的汉语拼音首字母-noun根的汉语拼音首字母喃verbidiorn idiorn-adjective idiorn-conj unction GB/T 20532-2006 表1(续)标记代码序号类别名称代码说明一级类二级类16 m 名词性习用语idiom-noun 17 lV 动词性习用语idiom-verb 18 缩赂语简的汉语拼音首字母19 Ja 形容词性缩略语简的汉语拼音首字母唰adjectiv

12、e20 Jn 名词性缩l略语简的汉语拼音首字母【noun21 JV 动词性缩略i吾简的汉语拼音首字母【verb22 后接成分依据通常做法. 23 口1数词numeral 24 n 名词noun 25 nd 方位名词noun-direction 26 ng 普通名词noun-general 27 nh 人名noun-human 28 m 机构名noun-mstltutlOn 29 nl 处所名词noun-location 30 nn 族名noun-natlOn 31 ns 地名noun-space 32 nt 时间名词noun-tl口le33 nz 其他专有名词noun-专的汉语拼音首字母34

13、。拟声词onoma to poela 35 p 介词preposltlOn 36 q 最词quant1ty 37 r 代词pronoun 38 u 助词auxiliary 39 v 动词verb 40 vd 趋向动词verb-direction 41 Vl 不及物动词verb-intransitive 42 vl 联系动词verb-linking 43 vt 及物动词verb-transitive 44 vu 能愿动词verb-auxiliary 45 w 其他依据通常做法46 wp 标点符号依据通常做法47 辆IS非汉字字符串,- -_! W-stnng 48 wu 其他未知符号w-unknown 49 X 非语素字依据通常做法, CON-N的山ONH闹。华人民共和国家标准信息处理用现代汉语词类标记规范GB/T 20532-2006 国出,* 中国标准出版社出版发行北京复兴门外三旦河北衔16号邮政编码:100045 网址电话,6852394668517548 中国标准出版社秦皇岛印刷厂印刷各地新华书店经销* 印张O.75 字数12千字2007年3月第一次印刷开本880X12301/16 2007年3月第一版定价14.非书号:155066 1-28954 7G 如有印装差错由本社发行中心调换版权专有侵权必究举报电话:(010)68533533G8fT 20532一2006

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1