GB 13131-1991 信息交换用汉字编码字符集 第三辅助集.pdf

上传人:李朗 文档编号:254024 上传时间:2019-07-13 格式:PDF 页数:5 大小:103.83KB
下载 相关 举报
GB 13131-1991 信息交换用汉字编码字符集 第三辅助集.pdf_第1页
第1页 / 共5页
GB 13131-1991 信息交换用汉字编码字符集 第三辅助集.pdf_第2页
第2页 / 共5页
GB 13131-1991 信息交换用汉字编码字符集 第三辅助集.pdf_第3页
第3页 / 共5页
GB 13131-1991 信息交换用汉字编码字符集 第三辅助集.pdf_第4页
第4页 / 共5页
GB 13131-1991 信息交换用汉字编码字符集 第三辅助集.pdf_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

1、ICS 35. 240. 20 L 67 GB 中华人民共和国国家标准G/T 17961-2000 印刷体汉字识别系统要求与测试方法Requirements and test methods for identify system of printed Chinese character 2000- 01-03发布2000- 08-01实施国家质量技术监督局发布G/T 17961-2000 前占一一口本标准是非键盘输入标准,它规定印刷体汉字识别系统的功能、技术要求、测试方法,该标准的制定和实施将正确引导印刷体汉字识别系统的研制与开发。本标准的附录A是提示的附录。本标准由中华人民共和国信息产业部

2、提出。本标准由中国电子技术标准化研究所归口。本标准起草单位八六三计算机智能主题专家组。本标准主要起草人:顾小凤、丁晓青、X1J迎建、钱跃良。中华人民共和国国家标准印刷体汉字识别系统要求与测试方法1 范围Requiremcnts and test methods for identify system of printed Chinese character 本标准规定了印刷体汉字识别系统的功能、技术要求和测试方法。本标准适用于印刷体汉字识别系统,也适用于其他有关系统。2 引用标准G/T 17961-2000 下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均

3、为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。GB 2312-1980信息交换用汉字编码字符集基本集GB/T 7589一1987信息交换用汉字编码字符集第二辅助集GB/T 7590一1987信息交换用汉字编码字符集第四辅助集GB/T 12345-1990 信息交换用汉字编码字符集辅助集GB 13000.1-1993 信息技术通用多八位编码字符集UCS)第1部分:体系结构(idt ISO/IEC 10646.4,1993) GB 13131一1991信息交换用汉字编码字符集第三辅助集GB 13132-1991 信息交换用汉字编码字符集第五辅助集3 系统功能3.

4、1 基本功能3. 1. 1 预处理将普通纸媒体文本在自动或人工干预下通过光学输入设备将印刷信息转换成适合识别的灰度(含二值图像。3. 1. 2识别将上述图像所包括的印刷符号转换为GB2312、GB/T7589、GB/T7590、GB/T12345、GB 13000.1、GB13131和GB13132所规定的编码信息。3. 2 扩展功能3.2.1 版面分析应将版面自动分成块,并正确标明每个块的属性,对文字块还需标明各块之间连接关系的逻辑序号。3. 2. 2 表格识别应能正确识别表格线,并可将表格和文字建立对应关系。国家质量技术监督局20-01-03批准2000- 08-01实施C/T 17961

5、-2000 4 要求4.1 识别率对于正式出版物及打印质量与其相当的打印文件的识别率应大于95%。4.2 误识率对于正式出版物及打印质量与其相当的打印文件的误识率应小于2%。4.3 识别速度使用6.3版本,识别速度应大于10字/秒。5 测试方法5.1 测试样张测试时参照采用附录A给出的测试样张,在实际测试时,有关测试机构可依据样张的字体、字号和版面布局随机提供多种测试样张,测试样张至少应包含103个印刷符号。5.2 识别率、误识率测试5.2.1 测试设备应采用通用操作系统及与其相适应的微型数字电子计算机。5.2.2 测试样张测试样张采用5.1规定的样张。5.2.3 测试结果识别率测试结果按式(

6、1)计算:识别率=(C/N) X 100% . ( 1 ) 式中,C一一测试样张中被正确识别的印刷符号数;N一测试样张中印刷符号总数。误识率测试结果按式(2)计算:误识率=(E/N) X 100% . .( 2 ) 式中E测试样张中被错误识别的印刷符号数;N 测试样张中印刷符号总数。测试结果应符合4.1和4.2的要求。5.3 识别速度测试5. 3. 1 测试设备采用5.2.1规定的测试设备。5. 3. 2 测试样张测试样张采用5.1规定的样张。5.3.3 测试结果识别速度测试结果按式(3)计算:式中,N测试样张中印刷符号总数;识别速度=N/T T一一识别系统从开始读取测试数据至将识别结果记录到

7、媒体上所用的时间。识别速度应符合4.3的要求。( 3 ) G8/T 17961-2000 附录A(提示的附录)测试样张客中作李白兰溪掉歌戴叔伦兰F主是酒郁金香,玉碗盛来就踊光。但使主人能醉客,不知何处是他乡。凉同组眉庄柳洁,越申山色镜申雪。兰溪三日桃花雨.半夜鲤鱼来上滩。宣州谢跳楼能别校番叔霎李白衰我去者,昨日之日不可留。讯我心者,今日之日多烦爱。畏凰寓里送秋雁,勤此可以酣高楼。蓬莱文章建安骨,中间小甜又清货。俱慷逸舆肚思莉,欲上青天攫明月。抽刀断水水更流,粤杯销愁愁更愁。人生在世不稿意,明朝散爱弄扁舟。春望杜甫国破山河在,城春草木深。感时花溅泪,恨别鸟惊心。烽火连三月,家书抵万金。白头搔更短,浑欲不胜替。将进酒李白君不见黄河之水天上来,奔流到海不复回。君不见高堂明镜悲白发,朝如青丝暮成雪。人生得意须尽欢,莫使金搏空对月。天生我材必有用,千金散尽还复来。烹羊宰牛且为乐,会须一饮三百杯。岑夫子,丹丘生,将进酒,君莫停。与君歌一曲,请君为我倾耳听。钟鼓馍玉不足贵,但愿长醉不复醒。古来圣贤皆寂寞,惟有饮者留其名。陈王昔时宴平乐,斗涌十千选欢谑。主人何为言少钱,径须沽取对君酌。五花马,千金袭,呼儿将出换美酒,与尔同销万古愁。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 国家标准

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1