1、中华人民共和国电工子业推荐标光学字符识到打印规范Prlnting 5pecifications for oPtical chl racter recoqnition o 5 制定本标准的目的纸和打印的工业标字符识别(OCR)系统以及,并帮助在这类系统中加以贯彻和使用。5JjZ 9079 87 150 1831 1980 飞是文件互换所用的本标准规寇了有关识别和测量方法,制定了这些参数的规范并给出了使用它们的指南。0.1 标准说明打印系统定义为一种单斗的设备,包括打印机、打印纸和色带后者只有在打印过程中才需要。产生用于OCR的打印材料的打印系统,称作OCR打印系统。本标准的涵义适用于OCR打印材
2、料,而不涉及打印系统、字体(OCRA、OCR B)以及特殊应用。对打印图象的尺寸和光学特性给出了三个质量等级。每个参数的公差极限都有规定。这些极限值至少都应达到,并且所有参数都应保持在极限以内。如呆这些参数当中某些参数发生统计性的变化,偏离规寇的极限,为减少这些变化的数量和等级,可采用特别的预防措施,诸如精选OCR打印系统的元器件,较频繁的维护打印机,降低打印速度,以及缩短色带的使用期限等。如呆任光学字符识别系统的性能发生统计性的变化,并且如果在不超过公差极限的情况下,去生字符被拒认或识错,同样为减少这些变化的数量和等级,可采用特别的预防措施,诸如较频繁的维护识别系统等。0.2 标准的使用本标
3、准给出了在应用。CR中所使用的测量方法以及各种。由于打印和识别系统两者所引起的统计性质的偏差,而不能远续、完全地达到这些数值,则可能去生字符的拒认和识错。拒认和识错所允许的数量取决于OCR应用的目的,并且应以统计项目的形式,在用户、打印系统供方和识别系统供方之间协商队。在打印系统的保证书中,打印系统的生产方有权规定打印系统的维护周期和所采用的易耗品如打印纸和包带。在识别系统的保证书中,识别系统的供货方有权规定环境条件温度、温度、照明度、机械振动和电磁干扰的最大数值等),并制定读出器的维护等级。依靠特性检验,统计抽样方案可用来检查这些保证书是否被遵守,如果这些方案是量控制中通常使用的那些方案相关
4、的,一且抽样方案被确定,样品的尺寸即受试字符或文本的数量就由方案规定了。中华人民共和国电子工业部198711一27批准 1 SJ/Z 9079 87 考虑到对打印系统进行检测,本标准给出了被测打印材料的有关参数和测量方怯。当对识别系统进行检验时,只允许使用符合本标准规定指标的打印材料,或者按照协议,也可以使用通过的有代表性的试样。在后-种情况,应必需按照本标准来评价拒认0.3 附录附录不是本标准的组成部分,只是给出了附加资料。1 适用范围本标准包括OCR用纸和打印材料的基本定义、测试要求、规范和建议。本标准适用于OCR媒体的打印文件包括毛个主要参数,即$O. 用纸的光学性能zb. 生成OCR字
5、符的油墨的光学与形状性能,C. 关于OCR字符在纸面上排列的基本3町、。每个区域与OCR有关的主要因素都已指出,给出了这些项目的意义,并确立了量的基础。规定了适用于所有OCR材料的基本规范,并且制寇了具体贯彻于某一个OCR系统议。2 有关150216 书写纸和打印资料的某些种类一-裁切尺寸-A和B系列。1501073/1 (光学识别字母数字字符集-一第一部分:OCR A字符集,打印固的形状与尺寸。1501073/2 (光学识别字母数字字符集一一第二部分:OCR B字符集,打印形状的图象与尺寸。1502471(纸和纸板一一不透明庭的测定纸底衬一一漫反射法。CIE出版物15(E1.3. 1) 19
6、71一一比色试验一一政府推荐。5光3.1 概述本章规定了与OCR应用范围有关的光谱频带。对光谱频带必需乍规定是因为字符读出机工作在特意的光谱区域内,并且考虑到用纸和油墨的特性随波长而变化。3.2 光谱频带本条中给出的-组频带被规定为用纸和打印图象规范的基准频带。这一组光谱频带的使用和测量程序在纸的反射系数、纸的不透明庭和PC5测量等条中作了规定。 2 SJ/Z 9079 87 表1 带峰徨辛苦宽nm nm 50份水平B425 425士550或低于B460 460士560或低于飞B490 490:于560或低于-.一-一一一B530 530士560或低于8570 570士10100或低于B620
7、 020士10100或低于-一一一一一-B680 680士10120或低于一一一B900 900士10400或低于-一一一一带B42S.-.B900表示整套测试仪器先源、泼、旅器、检波器所要求的光谱响应。频带的晌应特性应是平滑的曲线,不应出现两次峰值,并且除了规定的50%的水平之外,响应曲线不应再出现较突出部分。波长短于400nm的照应能量不应届过所考虑的特别频带的5%。4 OCR用纸规范4.1 概注OCR应用领域里所使用的纸应注:臼鱼(见附录A).低先译和高不透明庭见附录A)。应iai兔有引起反射系数变化的因素诸如污物、不平整的结构、水泣痕迹,荧光添加物。在特殊的OCR应jjj领域里,纸的某
8、些机械性能(诸如扰拉强庄、多孔结构,抗强庭以及平整皮等可能非常重要。建议使用特殊纸,根据。CR系统的用户与生产厂之间的协议,规定用纸的光学和机械性能。4.2 纸的先照反射系数Ro反射系统应使用I502469规寇的反射计逃行测量,或使用经上边反射计技准的仪器量。量反射系数应该使用理想的温反射体反射系数100%),但在实践中使用硫钢(BaSO,)代替就能满足精度要求。在不能满足精应要求的情况下,应该佳用理想的提反射体逃行测量。4.2.1 斤。的寇义 3 SJjZ 9079 87 一照度反射系数R。就是利用以黑色为衬底从单页纸上得到的反射系数,亦即被测样品应以反射系数不超过0.5%的黑色为衬底。反射
9、系数是-个用百分比表达的比卒,即在同样条件下从物体上得到的辐射反射与从理想混反射体上得到的辐射反射之比。4.2.2 恻量RoRo应采用和1502471规寇相-致的方法选行测量,但要使用如下所述的适当的滤波器。4.2.3 光谱R。在425,-500nm区域内应大于60%,在500-700nm区域内应大于70%。对于白色或者浅色但必需是单颜色的纸,用下述两种滤波器选行测量完全可以满足需求。B425, CIEjY滤波器或者波峰在530-570nm之间,并且带宽不大于100nm的任-洁、披器。在对测量结果去生怀疑的情况下,应通过观测光谱选行测量,例如采用3.2条所描述的B425,-_ B680的滤波阳
10、。注z如果使用中等不透明度的统(见4.4.3.2) Ro值应分别用50惕和60%代替.4.2.4 近似纽外线当考虑近似纽外线光CIR)光谱时,R 0值在900nmat应不低于70%。注z如果使用中等不透明度的纸(见4.4.3.坊.Rot直应用60份代替.4.3 纸的污染纸面上局部夹杂外来的灰尘颗校,会相应发生无反射,因为这类局部尺寸内无反射,可能引起OCR扫描器误认为是油墨区域,因此外来污物的数量和尺寸要小是非常的。以下介绍两种评价纸巧染的方毯。方法A可以进行快速评价,而方法B适用于较具体的研究。两种方法的光照明条件均应符合CIE出版物15的规定。4.3.1 方法A网格检寇怯4.3.1.1 设
11、备应包括下列设备z网格1m x 1m C3 .28ft x 3.28ft)的框架用细金属丝分成100个方格。工作台放置用纸和摇架并能允许从0.5mC1.64ft)左右的距照明设备。照明设备应严格接近于IEC推荐的光源D65。推荐的照皮级为750,-1500Lx清洁器或真空吸尘器用来清洁,悻品表面上的污物或尘埃。 , 4 SJ/Z 9079 87 计时器能指示0.5min或1min 。计记录含有尘埃的方格数目。4.3.1.2 抽样及测试面积以总面积为6m2(64.58ft2)的试样来代表-卷或-叠纸。卷纸应在两端抽取6x 1 m (3.28ft)的试样,其宽度就是出广原纸的宽度必要时可在上述卷纸
12、中以原纸生产的次序从其外端抽样。叠纸应在足够多的纸片中从六个位置取样。4.3.1.3 测试步从最顶边展开样品。清除散蓓在纸面上的活物和尘埃。把网格放在样品上、启动计时器,在1min内按I荫序扫描所有的方格。用计数器-次性的记录下发现有尘埃粒子或颗粒的方格数目。重复测量其余的5x 1m2 (53.82ft2) ,记录下6m2中(64.58ft2)含有尘埃颗粒的方格数目。这一数目不得也过200。注s为了比较不同单元的结果,被评定的样品应在各组观测值之问进仔互换校对.由于交换测试,观察员之间的差异可能会引起超过偏差值,可以用对被试品进行比较并舍去过高或过低的数值来选择观察值.观员的比较应司期地进行.
13、4.3.2 方法B一一污物计数污物的分布应当用超过寇尺寸的表面能吸收光线的所有颗位数来确定。当20份试样中每份试样的直径大于O.lnm(0.004in)颗位的算术平均数少于每平方米(10.76ft2) 250个,以及其中19份试样的直径大于0.2mm(0.008in)的颗粒数最多为每平方米25个时,这种纸才算满足本标准的要求。试样最好等于1m2(10.76H2) ,但也可以小于1m2,但不得小于0.125rnz(1.345ft2) ,即IS0216规寇的A3尺寸。这些纸应当是相互无关的,并且对所有被测纸型具有统计的代表性。4.4 纸的不透明皮纸的不透明度应使用IS02469所规定的反射计选行测
14、量,或者使用被上述反射计选行校准过的仪器选行侧且。4.4.1 纸的不透明皮定义纸的不透明度纸的背景是个用百分比表达的比值,即以黑色为背景的单页纸的光照反射系数Ro与同纸样品的固有光照反射系数R之比。(该定义与IS02471相一致。4.4.2 纸不透明度的测量纸的不透明度应使用IS02471描述的方法选行测量。应使用与基本仪器的光学特性相一致的滤波器,所有的晌应特性与3.2条所描述的光谱特性相符。4.4.3 不透明度的级别 5 5J/Z 9079 87 4.4.3.1 高不透明度纸高不透明度纸,其不透明度应大于85%。4.4.3.2 中不透明度纸中不透明皮纸,其不透明度应大于10%但低于85%。
15、4.5 用纸反射系数的偏差反射系数的测量是用很小的光阑在纸表面的许多位置上完成的,因而所得的会有偏差。这种偏差不得超过给寇的极限。由于反射系数的统计性质,用纸反射系数的偏差极限规定以O.2mmCO.008in)直径的光阑测量:所得的允诗偏差系统为依归。用纸反射系数的偏差规定有两个等级。对于高不透明度的纸s标准偏差1&0内1 i咱水平脚线字体AI二二二:?工工-.芒丰工-;w! 一 图5切边极限线SJjZ 9079 87 因7b带切边极限线的罔字符调整 12 长方形的尺寸如表4所示,I喝字体和尺寸大小不同而异。带切边极限线的样板举例切边量tj;:COL最小COL周7a不带切边极15良线的字符调整
16、国6-ili!l 一一 ill-SJjZ 9079 87 表4 高宽字体尺寸 mm 1n mm 1n A.B 2.40 0.094 1. 40 0.055 A.B E 3.20 0.126 1. 52 0.060 人N 3.80 O. 150 2.04 0.080 B N 3.60 0.142 2.10 0.083 注s上述对切边极限线所规定的长方形,对于最小COL字符不应有切边.长方形的水平线的位置应该对准字体A字符的垂直中心线,并且对准字体B宇符的垂直基准线。长方形的垂直位置由长方形的基准线与字符水平基准线之间的距离dv规定(见图5)。距离dv的尺寸如表5所示。表5距离dv字体尺寸mm 1
17、n 0.00 0.00 A E 0.00 0.00 N 0.00 0.00 0.13 0.005 B E 0.18 0.008 N 0.20 0.008 在测量样板中,字符的切边极限只规定最大COL的内边,如图6所示。对于那些受切边影响的笔划,对切边中心线的规定如下z切边中心线是在切边极限与不超出最小COL内部线之间画出的一条所有圆心的几何轨迹。在切边极限线与样板笔划单元最小COL的交点上,该切边中心线必须与样板中心线相吻合。5.4 参数测量 13 5J/Z 9079 87 5.4.1 为使用机器识别打印图象,所有部分的打印对比信号CPCS)应足够高,即应该。为了从背景中辨别出图象,必需有很高
18、的打印对比信号。为使读出能获最佳的可靠性能,字符的主要部分应具有较高的PCS值,应高于规范所允许的任特小面积部分最小值。随打印质量不均句以及读出字符的增多,会导敦降低诙出可靠性。5.4.2 测量;方法本标准规寇有三种测量方法z目测站,仪表机械法,计算机辅助站。这三种方法按顺序排列,后种方法比前一种更加完善精益求精。目拥IJr.去旨在大面积应用中使用,对字符进行快速和简略地检查。用目测怯不以下所规寇的所有参数。仪表机械法需要有反射计,这种仪器能测量打印对比度。实践中使用第二种方法能获得满意的结果,但需要寇的测试时间。计算机辅助法要求有高分辨率的扫描装置,以及为了运算各种测量值和参数值需要有专门的
19、程序和计算机。采用计算机测量的结果可靠性能高,当然也要求A寇的时间。经过寇努力,使用目测法、仪表机械法和计算机辅助法之间,可以获得接近一敦的测量结果。实际上采用不同的测量方法,相互间所得的结果不可能总是一a致,当选行时总会发生某些差异。在两种测量方法所得结果去生矛盾的情况下,应相信较完的测量;技术。打印区域Z中列出的要求和测量数值,只有采用计算机辅助法。5.4.3 各种参数的般寇义以下给出的打印图象各种参数的般义是针对般测量项目给出的。比较准确的寇义应根据每种测量方法连同测试捍序说明加以规寇。应当指出,用目测法不能测量以下PCS 字符内部PCSPCSmax PCSmin CVR 5.4.3.1
20、 打印对比度z字符反射系数与打印字符用纸的反射系数之差。5.4.3.2 打印对比信号CPCS):这是个比值,即打印对比度除以打印有字符的纸面的反射系5.4.3.3 最佳配合z字符上面COL样板的位置使字符尽可能多地充满最小COL,同时尽可能少地;m出最大COL。5.4.3.4 字符内部打印对比信号=沿中心线测量的PCS值。5.4.3.5 PCSmau沿中心线字符最黑部分的增益。5.4.3.6 PCSmirk沿中心线字符最亮部分的增益。 14 SJ/Z 9079 87 5.4.3.7 字符内部对比度变化率(CVR): PCSmax除以PCSmin之比闹。5.4.3.8 空白z最小COL内部某些与
21、其余区域相比明显地发亮的区域。5.4.3.9 笔划边缘z在笔划附近区域与背景之间,其反射系数的变化值近似为-半的那一组点定义为笔划边啡。5.4.3.10.边缘不规则性z部分的笔划边缘延伸至最小COL以内或者超出最大COL之外。5.4.3.11 斑点z最大COL外但IJ某些与背景之间存在对比度的区域。5.4.4 目测法5.4.4.1 仪器泪量仪器包括与字符表相符合的COL样板组,以及适当的光学放大器例如玻璃放大镜。5.4.4.2 扫.印对比庭打印对比度(PC)表示打印有字符的纸面与字符本身的反射系数之差。5.4.4.3 最佳配合最佳配合应在要检查的字符上面移动样板,用目测的方法获得。字符的最佳配
22、合是字符应尽可能多边充满最小COL,同时尽可能少地不超出最大COL5.4.4.4 空白见图9)最大COL+COL 国8样板处于最佳配合空臼是指最小COL内部某些与打印图象相比浓度明显较低的区域。可允许与不能允许的空白之间的差别,应根据测量它们的尺寸与距离的大小而定。 15 一可允诲的空白、C/3阪iU;11t/5J/Z 9079 87 不能允许的空白llmm 空白圈9空白段大COL蜒4、E飞II如呆空白组括整个直径为0.2mm(0.008in)的检验园,以及空白的总面积小于1/3的检验圆面积,有这样一个或多个空白是允许的。如果空i司的总面积大于1/击的检验圆面积,但是空白包括在整个检验圆以内,
23、而且空臼圆心与检验困直径。.2日1m,0.008in)的圆心之间的距离覆盖最近的空白或一组类似的空白,所具有的总面积大于1/3的检验固,员Ij该距离至少应大于1mm (0.04 n)。5.4.4.5 边缘不规则性(见图10)最大COL最小COL最小COL放大COL0.-3 不能允许的边缘不规则怜先诗篇边缘不规则性划边gt主:O. 3 国10边缘不规则性字符超出最大COL外侧,在最小COL内恤1存在着字符部分缺陷,则生成了边 16 SJ/Z 9079 87 缘不规则性。如果沿最大COL测量字符突出部分,或沿最小COL测量字符凹陷部分,均不超过0.3mm1/3圆面积允lmm 最大COL小COL图1
24、1斑点SJjZ 9079 87 光阑口径。径为0.2mmCO.008in)。之差。照明几何结构z单光源与纸面呈450。照明面积应扫描器儿何结构s与纸面呈900。试样表面的光光谱响应特性z见3.2。白色基准s见4.2。5.4.5.2 打印对比度见图12)打印对比度表示字符反射系数Rr与打印用纸的反射系pc= Rw- Rp (0.0059 式中zRw是为求PC与打印位置反射有关的面积内找出的最大反射系数(在测量打印图象的过程中,这一有关面积取一长方形,高约两倍于正常字符的高,宽度为两倍于正常字符的宽度,其中心定位于被测字符的中心。也是以P点为中心的一个小面积内得出的反射系数。反射系数Rw和RrI莲
25、在直径为0.2mm(0.008in)的圆或者边长为O.15mmin)的正方形的面积内选行单位.mm Rw +0.1 也0.2 li-ill f一i r iH|1ll-飞一一同时N 基准线N 18 打印对比度图12SJjZ 9079 87 反射系数规范只涉及到提反射,并且用于测量的反射光应消除由镜面反射的光。量反射系数R与和匙,决定PC值时应以BaSO,100%的值为基准。测量反射系数应使用黑色为背景的方法。打印图象任点的PC值,在很大程度上取决于打印图象所使用的油墨的光谱性能。5.4.5.3 打印对比信号打印对比信号(PCS)由下式决寇,Rw-Rp PCS=RPCS与在打印有图象的纸面上所选择
26、某点进行测量反射对比庭有关。虽然一般丘射系数的数值都是以BaSO,dOO%的值为参考,但这对确定PCS并非是必需的。PCS值只取决于Rw和Rp相对的反射系数值。5.4.5.4 最佳配合以下所描述的所有测量,均应把COL样板放在字符的最佳配合位置上。由佳配合可以通过目测法检查获得,即应使打印图象完全充满最小COL,同时尽可能地不超出最大COL。具体就是在最小COL内部的所有反射系数应该最小。如果在字符的各处都能满足这一条件,使样板处于最佳配合位置上,在最大COL外侧就能得到最大的反射系数。在最小COL内侧有发亮部分,并在最大COL外侧有2t黑部分,应邀行边缘不-、空白和斑点检查。最大COL最小C
27、OL因13标尺处于最佳配合位置. 5.4.5.5 字符内部的打印对比信号5.4.5.5.1 基本数值以下所叙述的大部分参数都是由基本PCS数值组提供的,具体如下z在字符上按照要求的区域放置样板选行测量,样板上应带有最小COL、最大COL和中心线。沿样板整个中心线,以O.lmm0.60,区域Y:PCSso%0.50。一对某些OCR应用领域,区域Y给出的PCSa0伪数值可能太严格,这时可与有关方协商相应偏离这些数值。5.4.5.6 PCSmax PCSmax是PCS最大平均值,字符中心线长度太子2mm(O.08in)肘,是三2.个连续的基本PCS的最大平均值,当字符中心线长度小于2mm(0.08i
28、n)时,就是五个这样的连续的5.4.5.7 PCSmin PCSmin是PCS最小平均值,字符中心线长度大于2mm(0.08in)肘,是三个连续的基本PCS的最小平均值,当字符中心线长度小于2mm (0.08in)时,就是五个这样的连续值的最小平均值。5.4.5.8 字符内部对比度转化字符内部对比度的变化由对比度变化率寇义zCVR= CVR必细描足下列条件s区域X:CVRd,是可允许的F在这点上出现的空白如果两个相邻点有PCSe该斑点是不能允许的? 21. 5J/Z 9079 87 b. 如果最多在一个位置有PCSe,该斑点是可允许的,C. 如果在两个位置上有PCSe,光阑应对准PCS较小的一
29、个位置,并且以0.1mm 巴,该斑点是不能允许的F如果未在第三个位置上发现PCS巴,只有该斑点与同样类型班点的距离,以及与最大COL的距离均大于1mm 0.60区域zpcsso伪0.50区域:PCSg 0 份0.35对于某些OCR应用领域,在区域Y和区域Z里所给出的PCSso伪数值可能太严格。偏离这些数值必需经有关部门同品。5.4.6.6 PCSmax PCSmax是沿中心线在O.2mm0.40区域:PCSmin0.35 24 区域=PCSmin0.305.4.6.10 字符形状和笔划宽度5.4.6.10.1 笔划边缘定义SJjZ 9079 87 ! 为定义笔划边缘,首先应确定算术平均!在PC
30、S10 PCS是沿样板辛苦划中心线或沿切边中心线测量出的所有等于或大于PCSs0侈的PCS值!有算术平均值。然后由PCS寇义笔划JU,:a瓢PCS,: 0.50 (PCSs)若PCSs0.6 0.3若PCSs2.5mm 页边空摹准边缘图18页边空白 29 SJ/Z 9079 87 6.12 行间隔行间隔是某打印行的边界上线与紧邻的上-打印行的边界下线之间垂直距间。影晌行间隔的参数有行间隔规范,行偏斜、垂直成行性、字符高度和笔划宽度。最小的行间隔应不小于z对于尺寸1:O.65mm(O.026in) 对于尺寸III:1.50mm(O.06in) 对于尺寸凹:2.00mm(O.08in) 如果字符的
31、尺寸混杂,对于任意两行的行间隔限制要适应于两行内的最大字符。6.13行间距(见图19)行间隔是一行所有打印字符的平均水平中心线的位置与下一行所有打印字符的平均水平中心线之间的垂直距离。字符胁的平均中心线-一-一一一-一.一-行间mI I行间隔-一一一-一字符边界的平均中心筝行边界图19行间距行间距不应小于z对于尺寸1:4.20mm(O.16in) 对于尺寸皿:4.80mm(O.19in) 对于尺才凹:5.30mm(O.21in) 如果字符尺寸混杂,应采用适合最大尺寸的限制。当用尺寸I字符的小写字体肘,行间距不应小于4.80mm(O.19in)。o 30 5J/Z 9079 87 .;_:Z;.
32、四-附录A纸的性参考件Al先Al.l OCR文件光谱性能任一OCR扫描器,般都是对限定的波长频带敏感。具有代表性的扫描器都是晌应蓝一绿,绿戎近似纽外波长。因此,对OCR用纸的基本要求就是在扫描器响应的波长范围内应是种很好的反射器。Al.2 颜色大力推荐OCR文件使用白色纸。因为在OCR扫描器敏感的光波长范围内,臼鱼。纸都能适应。同时,如果采用白色纸,则与光谱性能不会发生冲突。所以技术规范排除了使用大多数有颜色a的纸,特别是那些视觉清晰的各种颜色纸。包践,而且文件上整个OCR区域的颜色是单一的,可能符合规范关于平均反射系数的规定。Al.3 测量住解Al.3.1 实现B900的方法为实现出00测量
33、可用以下器件z照明光源s白炽灯F传感器=硅光电转换器pz低通滤戳器,约在800nm截止。Al.3.2 荧光添加剂一般用纸都不可避免地存在低级荧光添加剂,比如日常经常使用的纸就是这类纸,应尽量械少此种污染。用于OCR的纸,在生产中一般不应使用荧光添加剂。、必须消除读出困难需利用特殊设备和用纸分类麻烦有的用添加荧光物质。应当承认,其它的阅读机为了识别目的,而允许慎重地加入荧光添加剂.A2 纸的不透明度A2.1 纸的不透明度不透明度是指OCR文件由于背景材料的原因,在扫描时所引起用纸反射系数的变化。如果OCR设备的文件传输系统在扫捕时有一个给定的反射能力一致的表面,那就可以采用中等不透明庭的纸。 3
34、1. 5J/Z 9079 87 然而,某些系统扫描文件时,却是以其它打印文件为背景,或者传输系统提供反射能力不致的背景表面。这时需要采用不透明度较高的纸,或者OCR信息要求较高的PCS倍。A2.2 建议对OCR用纸要求的最低不透明度,取决于扫描方式和应用。般,不透明度涉及到用纸重量,有较高的重量就有较高的不透明度。显然,不透明度与用纸厚度之间存在类似的关系。因此,采用填充物和徐覆材料对增加不透明度有效果。一般,JJ级的不透明度超过85%即可用。如果应用需要并考虑到光学扫描系统以后,可利用不透明度较低的纸。不透明度低于70%的纸不能用。很多油墨都具有掺透到纸张相当深度的性能。为补偿这种作用,当需
35、要()Ci文件在两面打印时,可采用不透明度较高的或者较厚的纸。A3 纸的光泽A3.1 OCR文件光沛的意义元;手是具有光彩的或类似镜面所呈现的一种表面响应性能。这是对入射光线以类似镜面的反射现象。光泽的效果是以类似镜面的反射方式,能反射较多的元钱,而减少散射。光泽是去生在所有的入射角,并且不应与纸面土经常去生的类似镜面人射余角的反射相梅淆。对于OCR系统不需要纸的光择,因为它会改变纸的亮度,因而影响打印对比信号。A3.2建议OCR文件用纸应限制为低尤泽种类。应避免使用表面涂覆或超级压光纸,或其它有光泽的纸。A4 的变化系数应利用很小的光阑在纸面的不同位置上进行测量变化的结果而获得。别反射系数,
36、测量可用显微镜直观选行,反射系数的符号为品。这些变化不应超过给寇的极限倍。反射系数的平均变化,取决于乱的变化。也反射系数的最大变化称作f,它取决于Rf的最高值与最低值之比,A4.1 仪器配置阳明=白炽灯。照明几何结构z单光源与纸面呈450。照明面积大于扫描器几何结构z阑。 32 SJjZ 9079 87 与纸面呈900。在样品表面上光阑直径为0.2mm(.008in)。光谱见表7。表7尺寸峰健带宽检波器nm501jb nm I 425-400 30-60 可见光E 530-570 30-60 频带宽度(1) 620-680 30-60 w 300-1000 200-400 白色基准E测量反射系
37、数应以完全漫反射体000%反射为基准。实际上硫酸顿(BaSO,) 可用来获得足够的精度。在有争议的情况下,测量应以完全温反射体为基准,而测量设备也必需校准到从测量中获得的读数山IoE.1iG 量应在采用的具体读出设备只寸E目前很少有意义对应的光谱区域内进行。不了解全面情况时,对所有尺寸必需遵守上述给出的规定极限。经验表明,在这种况下遵守尺寸凹的极限,即可完全符合要求。A4.2 要求射系数的变化应建立一个以黑色为背景的样品(该背景的反射系数不应超过3%)。从测量Rf平均值所得到的平均变化值,其变化系数不应大于3.5%。另外假定正常分布,一切被测的最大1%的值可能超过Rf0.00土0.10)范围,
38、即对应f= 1.20 的极限值。两个极限值应符合规定。按A4.3得到的变化平均值,可能不低于按4.2.3和4.2.4规定的照明反射系数最小值的5%。A4.3 测试程序和评价在A4.3.四日A4.3.2中给出的两种程序可供选择。用纸的测试应在机器的上侧和交叉方向的上侧进行。A4.3.1 离散点量纸面反射系数品的变化p应在长方形的尺寸为20mm(O. 78in) X 40mm( 1. 57in) 的测量面积内取200个点。各测量点的中心距离,至少应相距2mm0.6PCS. = 1. . _ _ . 结0.3,若PCSsPCS, 式中:K是与各公差区域有关的常数。该公式应注意zO. 斑点不属于正确的
39、打印字符,般情况下,班点会降低机器的可读性能。b. 用高于PCS4数字化级的PCS级别鉴别斑点无现实意义。因为i卖出机在其规寇的数字级上仍然能读出那些斑点。i诵值较高会导致减小斑点的尺寸,检验时部分斑点会被忽略。因此,FCb采用丁PC马的上限。C. 对于较小的PCSmin值,斑点的阔值PCSs提到的PCSmin 一敦井,成比例。对PCS矩i年最大COL以外部分的阔倪赋值以后,余下的待检查的提点与其尺寸有关。为此目的,挝直径为lmm的圆的中心置于数字化PCS矩碎的每个点上,用斑点琦阔的覆盖情况选行鉴别e若因被覆盖不超过其1/10困在耳积,则这些,斑点是可允许的。本方出对照以下规范很清楚地表明,.
40、 ,Ft用11:径为lmm的i国能保证;王意两个或多于两个斑点之间的间距小于lmm时,能间时确定它们的单面积。b. 能同样处理延伸到最大COL以外的笔划。C. 斑点面积覆盖范围的极限是因积的1/10。斑点的覆盖范围测量是用直径为0.2mm的光闲,移动步距为O.2mmoC6 却盘输出量输出取决于用户规范,可产生下Il行或多行的行武打印机的输出z。.对于每个字持都有一打印信息行,它表示被测参数值是否符合本标准。b. 字符的PCS矩阵和数字饨的PCS矩阵。C. 削盘文量字符,则统计分析数据。 48 5J/Z 9079 87 D 字符定位件01 字符定位要求的目标字符定位规范格式规则以确保读出装置能看
41、见文件上的OCR字符,而不受其它OCR字符或非OCR字符的干扰。本标准给出规则(在以下各条款中解释是作为最低的要求,而具体系统可能需要充补更多的规则。02 文件的参考边在OCR系统中使用的文件必须可移动并适当寇位以便打印和读出OCR信息。用文件的个或多个边缘作为这些操作的基准。因为这些OCR文件的多样性,所以有时确定一个基准边缘较方便例如报刊梅筒纸)J其它情况可能需要确定两个边界(例如支,通常规定基准底边和右手侧川蝠碍J。一行。CR字符的平均水平中心线和页首或页尾基准边缘之间的距离公差,对满足系统功能是非常重要的。在本规范中未给出具体的公差尺寸,因为系统要求极不相同,但其重要性不可忽视。03
42、元宇区,打印区和页边空白OCR打印必须与文件上的所有其它打印或符号隔离以便读出装置豆容易识别OCR信息。这种隔离应保证在OCR资料与文件其余部分之间维持一个空白的边界。由此会出现打印区之间的差别。打印区必须包含全部OCR字符和个较大的无字区,无字区包围着打印区且不应含有其它任何打印或符号。如果无字区和打印区边界之间的距离接近所规定的最小距离则必须适当考虑打印公差;(纵向不成行性等以及所预料的用纸尺寸的变化。在文件设计的实践中应尽可能提供富裕的无宇区。打印区的边界应完全保持在纸边缘之内,即有一个较大的页边空白。这样作的优点是,即使文件中的页边空白不完整也会影响它的读出性能。但是也有某些特殊情况,
43、尺寸小的文件采用大页边空白是行不通的,并且打印区边界不得接近文件边缘,例如带式读出设备。只有在系统中的全部。CR设备都能处理这些文件的基础上才能放宽该规范求。打印区的只寸及其对文件边缘的相对位置对读出机是很重要的,它影响寻找行的能力。04 行间距行间距只对具有许多行的文件有意义。本标准的目的是限制在给寇的垂直距离范围 49 SJjZ 0079 87 内可能出现的打印的行数。在行间距的补充要求中必须有这种限制。因为行中的字符可能全都低于全字符高度例如减号。这种情况下一行的字符阳距定要保持在可允许打印的全字符高度。字体给定的公差,所允许的最大的行压缩密度,对于三种字符尺寸大致如表8所列。表8E 尺
44、寸E l 回归一每2.54mm6 4 s 。n)的行数J臼.-_.回阳圃虽然这些数值可以接受,但是影响行间隔的参数公差(见D5)必须要低于所规寇的最大值。最大值适于较宽的间距影响行间隔的参数有2行间距垂直方向不成行性、字符高和笔划宽度。一般,行间距应保持尽量大,以便与系统的其它要求相容。05 行间隔行间隔定义为OCR信息相邻行之间所要求的阳同。这些文件可能要求并允许OCR资料行与行之间的问距比建议的5.5mm(O.lin)行隔翼紧密,见D4。三种字符尺寸,每种字符的行间隔最小绝对值己给出。其中最小值经过努力是可以边到的。通过控制字符的成行性,字符的笔划宽度以及行间距能保证尽量较大的行间隔。06
45、 字符边字符边界是根据检查实际打印图象定义的而不是理想的字符。这样作是为了限制字符与字符以及行与行之间的间隔分配,对任何质量的打印都是现实和活用!的。07 字符间距本标准的字符间距要求就是寇义在同一行内任意一对字符的边靠边的横向关系。这样就能满足最大最小字符间隔的要求。当采用可变间距或可变宽度字符组(例如可变间距打字机,印刷字体就不能符合6.7.2所述的字符间距的规范。因为这些类型的打印在字符宽度和字符间距方面均采用宽皮可变方式,所以可能给OCR装置带来困难,因此必须特殊考虑以便给出能遥合打印和读出设备川和何阻。08 隔., 50 SJ/Z &075一87字符间隔是OCH.的最基本要求,它指在
46、同一行内对边靠边的字符之间应隔离不打印纸面空栏。这间隔构成个垂直的区间其宽度不应小子5.3.1所定义的正常的笔划宽度)它可能不介入字符轮廓的i王一.1):7.r0 为满足最小字符间隔的要求,在正常字符间距接近最小值的困难情况下应特别注意以下儿点。.笔划宽度变化。b. 字符偏斜。C. 在字符图象中给出的其些字符的中心线与垂直参考线间存在的差异。例如iOCR-B字符j(尺寸1)该距离为O.18mm(O.007in)。D9 字符不成行性字持的垂直不成衍性受到降低成本和OCI说备复杂性的限制,应力求与一般的和相对不复杂的打印设备兼容。不成行性可能发生的原因zC. 个别的打印表面的不成行性打印机中心文件不成行性,引起一次所打印的企组字符敬向移动或者倾斜。C. 打印之前、期间或之后文件的局部琦奕草草茹埠。本标准中的第6卒限制了相邻字符非成行性的程庭和一衍内压何两个字符非成行性总限皮。不同的打印设备,于不同时间打印各种字符段会引起此类非成行性。因此对具体的应用确寇可能的非成行性和要求以建立规范和撞制是非常重要的。一一 51