人民币冠字号码识别研究

1冠字号码区域定位

人民币在扫描过程中,难免会发生倾斜,为了得到没有倾斜的冠字码,在进行其他操作前,需要对得到的***像进行倾斜校正。如***4所示,CIS采集的人民币***像中不含有纸币区域的灰度值为255,利用灰度梯度变化可以很容易找到纸币的四条边缘(***4a)。通过霍夫变换得到边缘对应的角度后,可以通过***像旋转去除人民币***像的扫描倾斜(***4b)。由于扫描时纸币的正反和朝向不同,如***5所示,冠字码可能出现在扫描***像的四个位置。为了快速确定纸币的朝向从而找出冠字码区域位置,我们提出一种基于降分辨率和模板匹配的扫描朝向判断方法。给定一幅经过旋转校正的人民币扫描***像,我们提取该***像两侧大小为W×H的区域作为朝向检测区域。将该区域分辨率降为(W/5)×(H/5),然后和储存的四个方向的朝向检测低分辨率模板做匹配,共能得到八个匹配结果,最匹配的结果即对应此时人民币的扫描朝向(***6)。本文根据扫描***像中人民币的大小设检测区域的宽度W为350个像素,高度H为670个像素。由于冠字号码在人民币***像中的位置固定,得到人民币边缘和扫描朝向后,我们可以通过先验知识确定冠字号码的大致区域,如***7a所示。

2冠字号码区域二值化

由于灰度冠字码***像受到复杂背景和圆圈的影响,直接从灰度***像中提取冠字码十分困难,我们首先将得到的冠字号码区域二值化,然后从二值化的结果中提取单个冠字码字符。

2.1占空比的二值化方法

通过对第2节得到的冠字号码区域做水平和垂直方向投影,我们可以进一步得到更加精确的冠字码区域,如***7a矩形框所示。通过观察发现,每张人民币的冠字码字符笔画在精确定位的区域内所占空间比例几乎相同,由于冠字码相对背景的灰度值较低,我们认为处在直方***低P(t)比例的像素点为冠字码字符笔画,而其余区域为背景。由于采集到的人民币***像大小相同,对应的冠字码所占像素比例也相同,通过对采集到的冠字码区域进行估计。

2.2基于笔画宽度的二值化方法

不同人民币***像冠字码字符的宽度几乎是一致的,而且字符笔画的灰度值比背景的灰度值低。根据字符笔画的这两个特点,我们提出了一种基于笔画宽度的二值化方法。对于***像中的一个像素点i,如果以其为中心、一半笔画宽度r为半径的区域R内,所有像素点的灰度值都小于其在d角度邻接区域Kd内像素的值,则认为该像素属于字符笔画。本文中,Kd为区域R邻接的d角度方向相反的四个像素点。基于笔画宽度的二值化方法结果见***7d。

2.3块间对比度的二值化方法

块间对比度二值化[5]方法主要利用了字符笔画上像素点的灰度值低于背景像素灰度值的特性。对于***像中的每个像素点i,求以其为中心、半径为W的***像块的均值,然后和与该块邻接的四个方向上同样大小的***像块均值作对比,如果该像素点对应的块均值比d方向上相邻的两个***像块的均值都低,则认为该像素属于d方向的字符笔画。块对比度二值化方法利用笔画宽度信息,可以有效抑制圆圈、褶皱以及污损对***像二值化造成的影响,其结果如***7f所示。为了得到更好的字符分割结果,我们将基于占空比和块间对比度的二值化方法进行了融合,当前像素点只有同时被两个二值化方法认为是字符笔画时,它才被赋值为1,否则为0,融合结果见***7g。

2.4后处理

通过后处理操作可以进一步优化二值化结果。首先,由于冠字码字符的大小较大,二值化结果中面积小于三个像素的连通区域被认为是背景区域。其次,我们将得到的二值化冠字码***像做水平和垂直方向投影,投影结果外的***像区域为背景。最后,我们利用八方向运算模板[7](如***9所示)去除分割结果中字符笔画的单像素毛刺。后处理结果见***7h。

2.5冠字码字符提取

从二值***像中提取单个冠字码字符分为水平方向和垂直方向定位两个步骤。水平方向定位确定每个字符的左右边缘,垂直方向定位则寻找字符的上下边缘。由于每张人民币***像中冠字码字符宽度和水平间隔都基本相同,我们首先利用冠字码字符分布的先验知识给出水平方向的粗定位结果,然后分别计算每个字符的水平质心。根据质心对字符的左右边缘进行偏移调整,同时去掉字符笔画与水平边缘的空隙。重复以上两个操作直到字符边缘位置不再发生变化,就可以得到精确的字符左右边缘。由于在***像分割结果中,字符笔画的上下边缘可能粘连被误判为前景的圆圈和背景纹理,而且冠字码字符的高度不一致,垂直方向的字符定位比水平方向复杂很多。本文使用一种基于局部灰度对比度[6]的边缘定位方法。首先,我们假设每个字符的高度为冠字码字符串水平方向的投影高度,从而得到字符的候选垂直边缘。然后根据每个字符垂直方向的质心分别对上下边缘的位置y进行调整。针对每条边缘(上边缘或下边缘),我们计算其上下ω个像素范围内的局部灰度对比度,最大局部对比度的位置即对应字符最优的垂直边缘。字符的上下边缘分别用Vt和Vb表示,Ct和Cb分别为上下边缘的局部灰度对比度,最优边缘的搜索范围W=[y-ω,y+ω],Avgt和Avgb为候选边缘垂直方向宽度为字符宽度、高度为H的邻域灰度均值。ε是大于0的常数,确保公式(8)和公式(10)的分母不为0。本文中,搜索范围ω为5个像素,H取值10。

3实验及讨论

3.1冠字码区域二值化结果

我们对上文中提出的三种二值化方法和传统的Otsu二值化方法[8]进行了测试和分析。性能评价标准采用国际文档***像二值化竞赛DIBCO2011[9]中的召回率、精度、F准则F-Measure、峰值信噪比PSNR(PeakSignaltoNoiseRatio)、距离倒数失真度量DRD(DistanceReciprocalDistor-tionMetric)和误判惩罚度量MPM(Misclassifica-tionPenaltyMetric)。实验结果见表1。从实验结果可以看出,针对含有复杂背景的人民币冠字码***像,基于占空比和块间对比度的二值化方法比基于笔画宽度的方法性能更好,这两种方法融合的结果经过后处理操作,召回率可以达到82.55%,精度达到92.74%。基于块间对比度的二值化方法利用***像块的均值判断当前像素点是否属于字符笔画,比需要逐像素对比灰度值的使用笔画宽度的分割方法更为鲁棒,可以抗一定的噪声干扰,结果也更加准确。上文中三种针对字符区域的二值化方法性能都明显优于传统的Otsu方法。

3.2冠字码字符提取结果

为了测试识别预处理算法提取单个字符的性能,我们标定了500张扫描的人民币***像,包含5000个冠字码字符。这些人民币***像含有大量的背景纹理和圆圈,同时受到采集光照变化和污损的影响。本文参用三个标准来评价字符提取的准确度,分别为传统的重叠度量BOM(BasicOverlapbasedMetric)、基于阈值的重叠度量TOM(ThresholdedOverlapbasedMetric)[10]和ICDAR重叠度量IC-DARmetric[11]。这里TOM方法的阈值T设置为0.75,即当单个字符召回率(精度)为75%时,则认为找到该字符。其中,***像的二值化采用了基于占空比和块间对比度相结合的方法。我们分别计算每张***像的BOM、TOM和ICDARmetric,最终的提取结果为所有***像提取单个字符准确度的平均值。如表2所示,依赖于精确的***像分割和鲁棒的字符边缘定位,我们获得了很高的提取精度。在实验中,我们发现二值化结果对字符提取的影响非常大,特别是当字符周围残留的背景纹理较多时,则很难定位字符的边缘。

4结束语

本文针对复杂条件下的人民币冠字码识别,提出了一套完整的预处理方案,其中包括纸币***像采集、边缘检测、倾斜校正、扫描朝向判断、冠字码区域定位和二值化以及字符提取等操作,并对三种不同类型的文字区域二值化方法进行了比较和分析。实验结果表明,对含有复杂背景纹理、光照变化和污损的人民币***像,我们的识别预处理方法可以准确高效地提取冠字码单个字符,为后续的识别做准备。在今后的研究中,我们将尝试跳过单个字符提取,直接利用字符串识别技术识别冠字码字符串。

作者:冯博远 任明武 张煦尧 杨静宇 单位:南京理工大学计算机科学与工程学院 中国科学院自动化研究所

人民币冠字号码识别研究

转载请注明出处学文网 » 人民币冠字号码识别研究

学习

OIL石油互保组织

阅读(48)

OIL石油互保组织成立至今已有40多年时间,为欧美主要能源企业提供互助保障相关风险,已成为世界能源保险市场重要组成部分,也是会员单位重要的财务风险转嫁手段。OIL对于中国乃至亚洲能源企业仍是一个新鲜事务。就OIL的基本情况、会员构成与

学习

浅析选煤厂选煤技术现状及发展趋势

阅读(56)

本文为您介绍浅析选煤厂选煤技术现状及发展趋势,内容包括选煤厂重介选煤技术,选煤技术最近发展。摘要:文章介绍了我国选煤技术的现状,对选煤方法、常用工艺作了分析,最后探讨了选煤技术的发展趋势。

学习

西周至战国时期的曾侯乙编钟

阅读(45)

本文为您介绍西周至战国时期的曾侯乙编钟,内容包括曾侯乙编钟在博物馆第几层几号厅,战国曾侯乙编钟。一、曾侯乙编钟

学习

校园宽带网组网方案

阅读(20)

本文为您介绍校园宽带网组网方案,内容包括校园网上网组网方案,校园网宽带拨号组网。摘要:本文主要介绍了铁通辽宁分公司对于当前校园网的典型的组网案例,通过对校园宽带网进行全面对比,从网络拓扑设计、网络规划、网络的需求分析等方面进行

学习

保密管理制度系列

阅读(23)

本文为您介绍保密管理制度系列,内容包括保密要害部门管理制度,手机使用保密管理制度。保密管理制度

学习

跨线桥桥梁设计的几点认识

阅读(19)

本文为您介绍跨线桥桥梁设计的几点认识,内容包括跨线桥是指什么桥梁,跨线桥设计要求。摘要:跨线桥设计是所有桥梁设计中的重要组成部分,跨线桥设计有许多优势,例如技术先进、经济节约、性能齐全、布局合理、桥型优美等,其建设条件、构造设计

学习

钻井废弃泥浆的固化处理

阅读(39)

本文为您介绍钻井废弃泥浆的固化处理,内容包括钻井废弃泥浆固化处理,油田钻井废弃泥浆处理多。【摘要】钻井废弃泥浆中含有较多的有害物质(高价金属盐、有机聚合物、油类、酸碱物等),直接排放会造成污染,破坏植被。固化处理就是向钻井泥浆沉

学习

试驾湾流G650

阅读(26)

本文为您介绍试驾湾流G650,内容包括湾流g650实拍,湾流g650内部空间。为了能与竞争对手拉开差距,G650的远程巡航速度比G550快55.6千米/时,航程比G550长402千米。此外,G650使用了与“猎鹰”7X类似的电传操纵系统。不过最为重要的是,G650的客舱

学习

懵懂无知范文精选

阅读(24)

本文为您介绍懵懂无知范文精选,内容包括年近30还是懵懂无知的人,懵懂无知到成熟的句子小学。《懵懂无知》点击将本文复制到电脑,方便打印和收藏

学习

国学大师:刘文典

阅读(37)

本文为您介绍国学大师:刘文典,内容包括国学大师刘文典完整版,国学大师刘文典的故事。刘文典(1889~1958年),当代文史大师,校勘学大师和研究庄子的专家。安徽合肥人。刘文典学贯中西,通晓英、德、日多国文字。他讲授的课程,从先秦到两汉,从唐、

学习

韩国首位女总统朴槿惠

阅读(27)

2012韩国大选结果近日揭晓,朴槿惠当选韩国首位女总统的。60岁的朴槿惠性格坚定冷静,被韩国人称为“冰公主”,至今未婚。朴槿惠日常还非常热爱体育运动,游泳、乒乓、网球、跆拳道样样精通,真可谓多才多艺。

学习

浅谈绿色壁垒及其影响

阅读(23)

本文为您介绍浅谈绿色壁垒及其影响,内容包括关于绿色贸易壁垒的提问,绿色贸易壁垒英语怎么写。【摘要】在经济全球化的背景下,作为国际经济一体化主要推动力的国际贸易得到了前所未有的发展,各国之间的贸易竞争也越来越激烈。由此发达国家

学习

人民币女郎,追求生活真味

阅读(23)

1980年版的贰角人民币不少人都使用过,对于钱币上两位美丽可爱的少数民族姑娘,很多人都认为那是画家画出来的。实际上,两位姑娘确有其人,其中左边那一位名叫黄其萍。那么,黄其萍当初是怎样被选为“人民币女郎”的?她现在又在做什么呢?

学习

境内外人民币汇率差异的原因分析

阅读(21)

本文为您介绍境内外人民币汇率差异的原因分析,内容包括分析现行人民币汇率制度的缺陷,境内外人民币汇率差异原因。摘要:笔者在汇率决定微观模型基础上,依照国内外各种要素作出了修正,进一步研究了可能造成境内外人民币汇率差异的原因,同时进

学习

常见的几种指纹识别技术概述

阅读(17)

本文为您介绍常见的几种指纹识别技术概述,内容包括基于各个技术的指纹识别优劣对比,指纹识别技术什么时候发明的。摘要:作为个人身份识别的重要依据——指纹识别技术已得到人们的广泛认可,本文将就指纹识别的特点对指纹的采集、识别的方法

学习

人脸识别算法综述

阅读(19)

本文为您介绍人脸识别算法综述,内容包括人脸识别算法公司排名,综述型人脸识别。[摘要]本文通过工业界世界级人脸测试,说明人脸识别发展现状,分别从二维、三维角度,阐述了人脸识别算法现状,并对人脸识别算法发展趋势予以说明。

学习

如何识别“放心肉”

阅读(34)

本文为您介绍如何识别“放心肉”,内容包括放心肉哪个牌子最好,放心肉哪个牌子好吃。近来,人们对肉品卫生的担心似乎有增无减。在被冷落的肉铺前面,总是挂着:××放心肉。然而,前来问津的人依然寥寥无几。所谓“放心肉”,是指不带病毒、细菌、

学习

追寻六必居文物遗产传承老字号品牌文化

阅读(20)

六必居始创于明朝嘉靖9年,迄今已有近480年的历史,是京城历史最悠久,最负盛名的中华老字号之一。六必居老酱园坐落在北京市前门粮食店街三号,店堂内悬挂的“六必居”金字大匾,据传出自明朝严嵩之手,几经战乱,保留至今,现已成为稀世珍品。

学习

基于STAR模型的人民币实际有效汇率波动分析

阅读(21)

本文为您介绍基于STAR模型的人民币实际有效汇率波动分析,内容包括实际有效汇率指数统计,人民币汇率预测模型的实证分析。摘要:人民币实际有效汇率指数的波动分析,对于汇率风险的防控具有重要作用。本文基于非线性STAR模型对人民币实际有效

学习

人民币应自由兑换

阅读(22)

人民币自由兑换后,国家将不需要维持过高的外汇储备,只要外债总体规模的管理得体,人民币的稳定与安全可比目前更有保障