基于卷积神经网络的手写数字识别算法 下载本文

内容发布更新时间 : 2024/12/27 3:55:35星期一 下面是文章的全部内容请认真阅读。

龙源期刊网 http://www.qikan.com.cn

基于卷积神经网络的手写数字识别算法

作者:张红

来源:《电子技术与软件工程》2017年第22期

针对手写数字算法需要人工预处理和特征提取的问题,将卷积神经网络应用于手写数字识别中。利用卷积神经网络本身具有局域感受野、权值共享和次抽样的特性,能直接从原始数字图像中提取样本的特征信息,作为神经网络的输入,能有效减小特征,缩小神经网络的规模。通过试验结果证明,采用卷积神经网络能减少前期处理工作量,并具有较高的网络识别率。 【关键词】卷积神经网络 手写数字识别 模式识别 特征提取 1 引言

手写数字识别的基本原理是把输入数字样本的特征与标准样本的特征进行模式匹配,以最大相似度为度量原则,输出识别结果。在整个识别过程中,关键的是特征的选择提取额分类器的设计。目前应用于手写数字识别的算法有BP神经网络、贝叶斯估计、支持向量机等,这些方法在识别前需要人工确定预处理步骤和特征。在大量实践证明,这样的方法存在局限性,无法适应各种各样的字符特征。卷积神经网络预处理工序少,可进行特征学习的有点,让其对数字自负平移、缩放和扭曲等特征具有很强的纠错能力,故把卷积神经网络应用于手写数字识别,为手写数字识别提供一种新的工具。 2 卷积神经网络

卷积神经网络主要应用于二维数据处理,它能够通过大量学习,求解出输入与输出之间的关系。卷积神经网络是由卷积层和采样层交替组成,每一层中包括多个特征提取器。卷积层中的每一个神经元与上一层中的局部区域进行连接。通过卷积层的卷积运算,可以提取二维数据的特征信息,并且降低噪声对特征的干扰。采样层对二维数据进行抽样,降低其分辨率,在尽量保留图像的特征信息的同时降低数据处理的维度,提高信息处理的速度。 2.1 卷积神经网络模型

下面介绍典型的卷积神经网络模型,包括输入层,共有7层。其网络模型如图1所示。 输入层负责接收输入,它是由32×32个节电组成。接着是卷积层C1,它是由6个大小为28×28的特征图组成,特征图是卷积核对图像进行卷积运算后,通过激活函数作用形成的。采样层S2是由6个14×14的特征图组成,然后采用mean-pooling方式对C1区域内2×2个像素求取均值,然后通过激活函数输出结果。卷积层C3,它是由6个大小为10×10的特征图组成,每个特征图接收采样层S2若干个特征连接。C5层由120个大小为1×1的特征图组成,卷积核大小为5×5。F6层是与C5曾全连接的84个神经元。输出层是0-9工10个字符组成的神经元,采用RBF径向基函数进行分类。

龙源期刊网 http://www.qikan.com.cn

2.2 卷积神经网络的训练

下面对卷积神经网络的实现进行介绍。以参数l表示当前层,那么当前层的输出为下式: x1=f(u1),u1=w1x1-1+b1 (1)

u1为当前层的输入,w1表示当前层的权值,x1-1表示上一层的输出,b1表示当前层的额外偏置。f为激活函数,在文中采用sigmoid函数作为激活函数。

在卷积层中,使用卷积核对上一层的特征图进行卷积,然后通过激活函数,得到卷积层的特征图。卷积层的计算公式如下: (2)

其中,l表示当前层数,xj1表示采样层的第j个神经元输出,xi1-1为上一层第i个神经元输出,w1ij表示上一层的第i个神经元与当前层第j个神经元之间的连接权值。b1表示当前层的额外偏置。f为激活函数,Mj为输入特征图的集合。

在采样中,对上一层的特征图进行采样处理,具体计算公式为: (3)

其中,n表示从卷积层到采样层的窗口宽度。 对于多个样本(x,y),它的误差能表示为: (4)

式子中,E是输出误差,yij是期望输出,oij是卷积神经网络的输出。λ为惩罚系数,防止过度拟合。

3 实验结果及分析 3.1 试验数据

实验用的数据来自MNIST手写数字字符数据库,其中包含0-9的训练样本集和测试数据集,选择其中10000个包含不同手写数字的样本作为训练样本集,选取1000个样本作为测试样本,每张图片的大小为8×8,灰度级为8。如图2所示,为数字3的手写样例。 3.2 试验结果与分析

龙源期刊网 http://www.qikan.com.cn

为了分析卷积神经网络的性能,利用MNIST手写数字字符库的数据对卷积神经网络惊醒训练,并与几种常用的手写数字字符识别算法进行对比,结果如表1所示。

从表1可以看出,卷积神经网络在MNIST手写数字字符的正确识别率为98.9%,相比其他常用方法,正确识别率更高,说明卷积神经网络应用于手写数字识别方面具有其独特的优势。 4 结束语

本文将卷积神经网络应用到手写数字识别研究之中。研究结果表明,卷积神经网络能够快速有效提取二维图像的特征,并具有较高的识别率,正确识别率达到98.9%。 参考文献

[1]何西麟.基于深度学习的手写体字符识别研究与实现[D].中山大学,2015.

[2]尚磊,刘风进.基于支持向量机的手写体数字识别[J].兵工自动化,2007(03):39-41. 作者简介

张红(1970-),女,内蒙古自治区人。大学本科学历。现为乌海职业技术学院副教授。研究方向为电子技术、计算机技术。

马静(1982-),女,山东省人。研究生学历。讲师。研究方向为自动化技术、计算机技术。 作者单位

乌海职业技术学院 内蒙古自治区乌海市 016000