基于特征矩阵的高效数字识别算法

摘要:传统的数字识别算法存在识别速度、识别准确率和识别方法复杂度三者无法兼顾的问题,为解决该问题,提出了基于特征矩阵的高效数字识别算法。该算法首先在预处理的基础上获取字符的特征矩阵,然后用特征矩阵对字符的特征横线、竖线等特征进行提取,最后利用结构语句识别的方法实现数字识别。实验结果表明,基于特征矩阵的高效数字识别算法思路简单、速度快,且识别率达97% 以上。

关键词:特征矩阵;数字识别;***像处理;识别率

中***分类号:TP312 文献标识码:A 文章编号文章编号:16727800(2014)001005903

作者简介作者简介:徐敬(1989-),女,北方民族大学电信学院硕士研究生,研究方向为嵌入式与信息处理;刘炜(1963-),男,北方民族大学电信学院副教授、硕士生导师,研究方向为智能仪器。

0 引言

数字识别技术是***像处理领域中的一个研究热点,在食品、化妆品、药品等外包装生产日期提取上具有重要的实用价值。近年来,随着人们对数字***像识别算法的不断研究,数字***像识别方法也越来越多,主要有基于神经网络数字***像识别[1]、基于最小距离法的数字***像识别,以及基于模板匹配的数字***像识别[2]。在实际应用中,人们发现数字识别算法的识别率一般较低,个别识别率较高的算法比较复杂,且收敛速度普遍较慢,缺少两方面性能皆优的方法。针对目前存在的问题,结合印刷体数字的特点,笔者提出了一种基于特征矩阵的高效数字***像识别算法。该算法首先在预处理的基础上提取字符

的特征矩阵,

利用特征矩阵对简单的特征[34](横线)进行提取,然后应用结构语句识别方法将数字中的多数识别出来。再采用排除法缩小识别数字的范围,并对其中的数字特征凹陷区域进行分析和比较,同时采用上述同样的方法对数字进行识别使算法简单,识别速度快且识别效果好。

1 数字***像预处理

***像预处理是对采集到的***像画面在进行数字识别之前所做的一些相关工作,主要包括***像灰度化、二值化、梯度锐化、中值滤波、分割、归一化、细化等步骤,具体流程如*** 1 所示。对***像进行预处理非常必要,它能够有效地去除***像噪声,减小各类干扰对***像识别的不利影响,为特征提取和识别奠定了基础。***像预处理的每一步结果如***2-***9所示。

***1 数字预处理流程

***2 原始***像 ***3 灰度化 ***4 二值化

***5 梯度锐化 ***6 中值滤波 ***7 分割

***8 归一化 ***9 细化

2 数字识别算法

经过细化之后,通过从上到下,从左到右对***像进行扫描,提取字符的特征矩阵。由于细化后矩阵的边界可能存在全为0的行或列,为了便于后续特征提取,需要将其全为0的行列全部删除,得到类似如***10所示的矩阵,记为juzhen[m][n]。设前景像素为1,背景像素为0。

对0~9这10个印刷体数字,首先可以根据是否存在横线将数字分为两个子集,其中1、2、4、5、7存在横线记H=1。0、3、6、8、9不存在横线记H=0。在H=1的集合中,因为横线存在的位置不同,可以将其再分为3个子集:1、2存在下横线;5、7存在上横线;4横线位置记为其它。这样数字识别的范围又进一步缩小了,接下来可以在小范围内进行特征比较来实现数字的识别。如5、7特征比较发现,5上半部分存在左凹陷区,下半部分存在右凹陷区。对于凹陷区域的识别可以依据矩阵在凹陷区域内像素值为0,限定区域范围统计0的行数即可,该区域范围仅针对每个特定数字而言,这样5就可以识别出来,运用排除法7自然而然也被识别出来。1、2特征比较发现,1存在竖线,2没有这个特征,4不需进行特征比较即可得出结果,为了使识别结果更加准确,可以加上竖线这个特征。在H=0的集合中,0的结构较简单,特征也较明显,把它作为一个集合来对待。它是一个封闭的圆圈,圆圈内没有像素则通过矩阵在一个较大区域内像素1的个数小于阈值的范围来提取。3、8、6、9作为另一个集合,特征比较发现,3上、下两部都存在右凹陷区,6上半部分存在左凹陷区,9下半部分存在右凹陷,除此之外就是8。这10个数字中的1较特殊,有的字体底部没有横线,有的底部存在横线,所以除了上述判断还要考虑没有横线的情况。数字识别流程如***11所示,其中上半部分左凹陷区域记为上左,上半部分右凹陷区记为上右,下半部分右凹陷区域记为下右,下半部分左凹陷区域记为下左。识别顺序按照从上到下、从左到右进行。对于易识别错误的字符进行了多处特征比较,如字符3、5等。数字特征提取条件如表1所示,特征的提取需要用到以下自定义函数:

3 实验结果与分析

在上述数字***像预处理基础上,利用上述识别算法对***像进行数字识别,结果保存在文本文件中,***像识别的结果如***12所示。

***12 数字识别结果

为了检验本文的算法对数字识别的效果,对0~9这10个印刷体数字包括不同字体在内的单个字符各100幅***像进行识别测试,测试硬件环境为 AMD Athlon 1.91 GHz、内存2 GB,采用C语言,并结合数字***像处理和计算机软件平台OpenCV,在VC6.0 集成开发环境中实现

以上算法编程。 单个字符可在6ms内完成整个识别过程,

实验结果如表2所示。识别率等于 99% 的 0、1 两个数字

本身结构比较简单,容易识别;识别率在98%的有 3、5、6、9这4个数字,只要能够限制准确数字凹陷区的起始行、起始列、结束行和结束列,数字识别率还可以提高;***像数字2、8的识别率分别建立在3、5和6、9的识别率的基础之上,所以数字2、8 的识别率比3、5和6、9的识别率要低一些;数字***像4、7在细化后容易对字符造成损害,再加上特征提取的条件较为简单,因此,很容易识别为1和8。

4 结语

本文提出了一种基于特征矩阵的高效数字识别算法,并对从0~9的每个数字字符***像进行了测试。结果表明,该算法的思路简单、速度快,且识别率达97% 以上。通过分析发现,使用该方法发生误判时,错误源可能来自于***像的不规范,比如***像本身的不完整、预处理技术的缺陷,以及特征选取的局限性。

参考文献参考文献:

[1] 张翼成,陈 欣,杨红***,等.基于组合特征的BP神经网络数字识别方法[J].计算机系统应用,2013,22(3):113116.

[2] 陈爱斌,陆丽娜.基于多特征的印刷体数字识别[J].计算技术与自动化,2011,30(3):105108.

[3] 陈***胜.组合结构特征的自由手写体数字识别算法研究[J].计算机工程与应用,2013,49(5):179184.

[4] 马斌,边树海.特征信息的新数字***像识别方法[J].沈阳建筑大学学报:自然科学版,2011,27(6):11871192.

转载请注明出处学文网 » 基于特征矩阵的高效数字识别算法

学习

学生厌学基础教育

阅读(24)

本文为您介绍学生厌学基础教育,内容包括学生厌学教育方法,学生厌学心理教育稿。[摘要]当前中小学生厌学现象较为严重,作为一种青年亚文化现象,有其滋生的文化土壤。从文化的视角分析,中小学生厌学的根源主要表现为:中国传统文化价值取向的影

学习

学习达尔文 发展达尔文

阅读(28)

(一)他,与牛顿安葬在一起。他的寿命只有73岁,但他浓须长髯,像一个百岁老人。他在伦敦郊区的唐恩小村住了40年,很多岁月在病中度过,但他执着地研究生物学的许多重大课题,出版了多卷著作,直到逝世前十几天还在《自然》杂志上发表了最后一篇论文。

学习

刘继平:地方特产掘金人

阅读(46)

逢年过节,礼尚往来,人们总喜欢给亲朋好友带上几份本地特产聊表心意。在湖北,本地特产最符盛名的莫过于鄂州樊口的武昌鱼、武汉的热干面、鸭脖子,各大售卖商店总是人满为患。在诸多经营湖北地方特产的加工、商贸企业中,一家以生产销售“

学习

打井水作文400字

阅读(19)

本文为您介绍打井水作文400字,内容包括挖水400字作文,井水作文400字。打井水你们知道吗?在我家门前有一口井,那儿的井水冬暖夏凉。人们都爱到井边的小石板上洗衣服,也都爱拿那儿的水洗用。然而,要想取到井里冬暖夏凉的水,可一定要会打水。今

学习

小井眼随钻扩眼技术

阅读(39)

针对中原油田开窗侧钻井小井眼钻井井身质量差、钻速低、环空间隙小、盐膏层井段缩径、固井质量差等技术难题,探索采用合适的随钻扩眼工具:机械式扩眼工具、双心式随钻扩眼工具、压差式随钻扩眼工具、液压式扩眼工具、可扩眼钻头等,解决小井

学习

论生态景观设计中人文元素的融入

阅读(41)

本文为您介绍论生态景观设计中人文元素的融入,内容包括景观生态学与景观设计,园林景观中涉及到的生态设计。【摘要】生态景观设计是景观设计发展的理想目标和要求,人文元素则是生态景观设计发展的精神支柱。而当前在经济发展全球化的战略

学习

试论中西面点加工工艺的区别

阅读(31)

本文为您介绍试论中西面点加工工艺的区别,内容包括中西面点工艺专业适合大专女生吗,中西面点工艺有什么限制。【摘要】中西方面点在制作理论和技术上相互融合,各取所长,但由于中西方饮食的差异,在加工制作方法上还有一些不同。本文以紫薯面

学习

丝绸古道上的传奇故事

阅读(27)

本文为您介绍丝绸古道上的传奇故事,内容包括丝绸之路上的传说故事,丝绸古道真实故事。提起“丝绸之路”,你可能就会联想到浩浩荡荡的马匹队伍驮着五光十色的丝绸锦缎,在夕阳的映照下泛着金色光芒……实际上,当初张骞开辟“丝绸之路”充满了

学习

浅谈青少年不良行为的形成及矫正

阅读(37)

本文为您介绍浅谈青少年不良行为的形成及矫正,内容包括对青少年不良行为的讲解,如何预防和矫正青少年的不良行为。当今社会,受社会不良风气的影响,在青少年学生中存在着不良品德行为的问题。这必须引起教育工作者的重视,研究青少年学生不良

学习

不做乖乖女

阅读(25)

本文为您介绍不做乖乖女,内容包括不做你的乖乖女免费小说,不想做乖乖女小说。咨询案例:“我想自杀。”12岁的云云坐在咨询室里低着头、痛苦地说出这句话。云云患了重度抑郁,上课无法集中注意力,脑海里总有很多的担忧。更让她痛苦的是,自己不

学习

新晋商 新发展

阅读(20)

本文为您介绍新晋商 新发展,内容包括新时代新晋商精神,新晋商案例。【文章摘要】晋商作为中国的传统商帮,在明清时期创造了自己的辉煌,但是随着时代的发展,晋商逐渐淡出中国商业舞台。在新的历史时期下,晋商如何重塑辉煌就成为了一大课题,本

学习

色鲜味美的摊黄儿

阅读(31)

摊黄儿是将调好的面糊,舀在特制的鏊子上烙制而成的一种食品,在华北各地又有煎饼、摊饭、象鼻子等多种叫法。过去普遍流行于农村,偶尔也出现于城镇小吃摊担,现在则食品超市和大型酒楼饭店也时有所见,且颇受食者欢迎。制作摊黄儿的用料多为小米

学习

才有梅花便不同

阅读(54)

本文为您介绍才有梅花便不同,内容包括寻常一样窗前月才有梅花便不同,才有梅花便不同全诗。趁着天黑,去邻家院子边,折一枝梅回来。这有偷的意思了。我实在架不住它的香。它香得委实撩人。晚饭后散步,隔着老远,它的香就远远追过来,像撒娇的小女

学习

话说浙东运河

阅读(24)

本文为您介绍话说浙东运河,内容包括浙东运河的过路费,浙东运河典故。癸巳新春,回宁波省亲过年。特地到三江口去兜兜,寻觅着少时的记忆。伫立在江厦公园眺望,广告林立,高楼夹风,仿佛闻到一阵阵海腥加香水的气味;三叉沿江道上车水马龙,昔日行人在

学习

详解移动硬盘无法识别故障排除方法

阅读(25)

本文为您介绍详解移动硬盘无法识别故障排除方法,内容包括移动硬盘故障修复教程,移动硬盘硬件故障怎么解决。最近在网上与很多网友交流移动硬盘的使用心得,发现大家都会遇见一些问题,例如移动硬盘接上不读盘,电脑提示移动存储设备无法正常使

学习

人脸识别签到系统分析与设计

阅读(43)

本文为您介绍人脸识别签到系统分析与设计,内容包括人脸识别签到系统,人脸识别签到机怎么替别人打卡。[摘要]人脸识别技术发展到今天,已经很成熟,但是由于达到准确且精确识别人脸需要投入的硬件软件成本都很大,所以其在中小型公司和单位中的

学习

CORDIC算法基本原理研究

阅读(39)

【摘要】函数的FPGA实现通常都是基于查表的方法,为了达到高精度要求,常常需要耗费大量的ROM资源去建立庞大的查找表。文中探讨了的CORDIC算法与其基本原理,可有效地节省FPGA的硬件资源,提高运算速度。【关键词】CORDIC算法;基本原理;FPGA1.引

学习

智能计算主要算法的概述

阅读(19)

本文为您介绍智能计算主要算法的概述,内容包括计算智能从概念到实现,常用算法之智能计算。摘要:为了解决传统智能方法无法突破的问题,推进机器智能化的进程,计算智能应运而生。计算智能的兴起引起了机器智能领域广泛的关注。该文系统阐

学习

基于pairwise的改进ranking算法

阅读(21)

摘要:传统基于pairwise的ranking算法,学习后得到的模型在用NDCG这样的ranking标准评价时效果并不好,对此提出了一种新型ranking算法。该算法也是使用样本对作为训练数据,但定义了一个面向NDCG评估标准的目标函数。针对此目标函数非平滑、难

学习

基于LLE算法的人脸识别方法研究

阅读(24)

本文为您介绍基于LLE算法的人脸识别方法研究,内容包括基于人脸识别算法的研究与实现,人脸识别与算法参考文献。非线性降维作为当前流行的机器学习算法,是研究人员的研究热点。局部线性嵌套和等距流形映射是两个基本非线性降维方式,局部线

学习

人脸识别系统综述

阅读(31)

本文为您介绍人脸识别系统综述,内容包括人脸识别综述是什么意思,有遮挡人脸识别方法综述。【摘要】人脸识别系统以是现在科学研究的热门之一,本文对人脸识别系统的流程及发展前景做了简单的回顾。对该系统的应用做了简单的分析并对人脸识

学习

生物识别技术浅析

阅读(21)

本文为您介绍生物识别技术浅析,内容包括生物识别技术及其发展趋势展望,人社生物识别认证系统。生物特征识别技术作为一种身份识别的手段,具有独特的优势,对信息安全具有重要意义,近年来已逐渐成为研究热点。文章介绍了常见的生物识别技术和