基于BP算法的数字字符识别技术的研究
来源:岁月联盟
时间:2010-08-30
1 引言
数字识别技术是图像处理领域中的一个重要研究方向。是机应用领域中的热点之一。它又分为在线手写体识别和离线手写体识别。前者系统通过记录手写数字的抬笔、落笔、笔迹上各像素的空间位置,以及各笔段之间的时间关系等信息,对这些信息进行处理,在处理过程中,系统以一定的规则提取信息特征,再由识别模块将信息特征与识别库的特征进行比较、加以识别,最后转化为计算机所使用的文字代码。后者相对于前者没有笔划信息,因此难度更大、应用更广泛,如银行票据、工商报表、财务报表、统计报表等各种表格系统,是目前研究的一个重点,也是一个难点。本文将介绍如何用神经网络反向传播算法(BP算法)实现离线手写体数字的识别。2 BP算法实现手写数字的简单流程
利用BP算法实现数字识别的简单流程为“预处理“和“BP字符识别”具体如图1所示。3 BP神经网络进行数字识别
3.1 BP神经网络结构与描述
BP网络是一种单向传播的多层前向网络。网络除输入输出节点外,还有一层或多层的隐层节点,同层节点中没有任何耦合。输入信号从输入层节点依次传过各隐层节点,然后传到输出节点。每一层节点的输出只影响下一层节点的输出。其节点单元特性(传递函数)通常为Sigmnid型
3.2 神经网络的设计和训练
将要识别的目标是从0到9的10个数字字符。每个字符被分成5×7的小块进行数字化,分别用一个向量来表示。1 0个含 35个元素的输入向量被定义为一个输入向量矩阵,向量代表某个字母,其相应有数据的位置值为 1,而其他位置值为0。共有两类这样的数据作为输入:一类是在理想的状态下的信号;另一类是用随机方式生成含有噪声的信号。对网络进行快速训练,学习速率初始值选在0、01——0、7之间。连接权值取(-1,1)之间的随机数,期望误差的初始值为(0,1)之间的随机数。 网络通过输出一个具有1 0个元素的输出向量来区分这些数字字符,例如字符1对应的向量,其第一个位置的元素值为 1,而随后位置的元素值都是0。确定好输入输出后可进行网络结构的设计。第1层为输入层,根据以上待识别的数据分析可确定神经网络输入层有3 5 个节点;第2层为隐含层,常规的确定方法是输入层接点的两倍,但依靠经验和尝试的方法来确定节点数目,通过对不同结构网络的误差测试确定本系统隐层结点为10个节点,参见表1。表1 不同隐含层对含有噪声的信号训练及测试误差表隐层神经元数目 | 训练误差 | 测试误差 |
5 | 0.099121 | 0.308258 |
10 | 0.098804 | 0.129052 |
15 | 0.099700 | 0.225840 |
寻找合适的训练方法,结果发现随着样本数的增加,单独采用B P法 或自适应学习率B P法训练结果并不理想,而兼有自适应学习率和动量项的B P算法的训练效果很好,所以采用这种训练函数来训练神经网络。为了使产生的网络对输入向量有一定的容错能力,最好的办法是既使用理想的信号又使用带有噪声的信号对网络进行训练。因此本实验中,第1次只使用15组理想信号对网络进行训练;而第2次先使用1 5组 带有噪声的信号再使用1 5组理想信号对同一网络进行训练。其中采用了1 0种递增的噪声信号,这是通过对理想信号字母表加入平均值为0 标准差从0 .05到 0 .5变化的噪声来得到的。网络训练的误差变化情况如图3所示。


4 实验结果及分析
基于 BP 神经网络的识别方法,将整个字符直接作为神经网络的输入。选取了500个数字字符,其中 200 个作为训练样本, 剩余的样本作为测试数据。测试的实验结果见表2。表2
项目 | 总样本数 | 识别数 | 误识数 | 拒识数 | 识别率 | 误识率 | 拒识率 |
训练样本 | 200 | 200 | 0 | 0 | 100% | 0% | 0% |
测试样本 | 300 | 282 | 9 | 9 | 94% | 3% | 3% |
实验结果表明:基于神经网络的字符识别方法具有较强的容错性和很强的自适应学习能力,所以是一种较好的识别方法。[1] 边肇祺.模式识别.北京:清华大学出版社.2002[2] 杨淑莹.图像模式识别------VC++技术实现.清华大学出版社.2005[3] 陈咏梅.前馈网络模式识别预处理方法在手写体数字识别中的应用.北京: 中科院半导体所.1995[4] 杨勇,谢刚生.基于神经网络的手写数字识别.华东地质学报,2003,26(4):383-386 .[5] MICHAELWRoth. SurveyofNeural Network Technologyfor Automatic Target Recognition .IEEE Trans Neural Networks, 1990, 1( 1) : 28- 43
上一篇:使用控制模型及其应用的分析与研究
下一篇:基于本体的专利知识发现体系研究