内容发布更新时间 : 2025/1/24 0:57:40星期一 下面是文章的全部内容请认真阅读。
预处理就是在图像分析中,对输入图像进行特征抽取等前所进行的处理。输入图像由于图像采集环境的不同,如光照明暗程度以及设备性能的优劣等,往往存在有噪声,对比度不够等缺点。另外,距离远近,焦距大小等又使得人脸在整幅图像中间的大小和位置不确定。为了保证人脸图像中人脸大小,位置以及人脸图像质量的一致性,必须对图像进行预处理。图像预处理的主要目的是消除图像中无关的信息,滤除干扰、噪声,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取的可靠性.
人脸图像的预处理主要包括人脸扶正,人脸图像的增强,以及归一化等工作。人脸扶正是为了得到人脸位置端正的人脸图像;图像增强是为了改善人脸图像的质量,不仅在视觉上更加清晰图像,而且使图像更利于计算机的处理与识别。归一化工作的目标是取得尺寸一致,灰度取值范围相同的标准化人脸图像[4]。
2.1 几何规范化
由于图像在提取过程中易受到光照、表情、姿态等扰动的影响,因此在识别之前需要对图像做归一化的预处理[4],通常以眼睛坐标为基准点,通过平移、旋转、缩放等几何仿射变换对人脸图像进行归一化。因为人脸虽然是柔性的三维曲面,同一人脸因表情变化会有差异,但相对而言人的两眼之间的距离变化不会很大,因此双眼的位置及眼距,就成为人脸图像归一化的依据。
定位眼睛到预定坐标,将图像缩放至固定大小。通过平移、旋转、缩放等几何仿射变换,可以对人脸图像做几何规范化处理,仿射变换的表达式为:
a11a12[x,y,1]?[u,v,1][a21a22a31a3200] (2-1) 1其中(u,v)表示输入图像中像素的坐标(x,y)表示输出图像中像素的坐标。将上式展开可得
x?a11u?a21v?a31y?a12u?a22v?a32 (2-2)
平移变换就是给图像中的所有点的坐标都加上?u和?v ,其变换表达式为
100[x,y,1]?[u,v,1][010] (2-3)
?u?v1将图像中的所有点相对于坐标原点逆时针旋转?角的变换表达式为
cos?[x,y,1]?[u,v,1][?sin?0sin?cos?000] (2-4) 1缩放变换既是将图像按给定的比例r放大或缩小,当r?1时图像被放大,当0?r?1时图像被缩小,其变换表达式为
r00[x,y,1]?[u,v,1][0r0] (2-5)
001本论文在对人脸图像特征提取之前,首先对所有的图像进行几何规范化,将两个人眼的位置固定在同一位置上,结果如图2.1,图2.2所示。
图2.1 几何规范化之前的人脸图像
图2.2 几何规范化后的人脸图像
2.2 灰度级插值
图像经过空间变换后,变换后的空间中各像素的灰度值应该等于变换前图像对应位置的像素值。但实际情况中,图像经过几何变换后,某些像素会挤压在一起或者分散开来,使得变换后图像的一些像素对应于变换前图像上非整数坐标的位置,为此需要通过插值求出这些像素的灰度值,通常采用的方法有最近邻插值、双线性插值和双三次插值。
2.2.1 最近邻插值
最近邻插值是一种最简单的插值方法,输出的像素灰度值就是输入图像中预期最邻近的像素的灰度值,这种方法的运算量非常小,但是变换后图像的灰度值有明显的不连续性,能够放大图像中的高频分量,产生明显的块状效应。
2.2.2 双线性插值
双线性插值输出像素的灰度值是该像素在输入图像中2*2领域采样点的平均值,利用周围四个相邻像素的灰度值在垂直和水平两个方向上做线性插值。这种方法和最近邻插值法相比,计算量稍有增加,变换后图像的灰度值没有明显的不连续性,但双线性插值具有低通滤波的性质,会导致高频分量信息的部分丢失,图像轮廓变得模糊不清。
2.2.3 双三次插值
双三次插值利用三次多项式来逼近理论上的最佳正弦插值函数,其插值邻域的大小为4*4,计算时用到周围16个相邻像素的灰度值,这种方法的计算量是最大的,但能克服前两种插值方法的缺点,计算精度较高。
2.3 灰度规范化
灰度规范化是通过图像平滑、直方图均衡化、灰度变换等图像处理方法来改善图像质量,并将其统一到给定的水平。
2.3.1 图像平滑
图像平滑处理的目的是为了抑制噪声,改善图像质量,可以在空间域和频域中进行。常用的方法包括:邻域平均、空域滤波和中值滤波等。邻域平均法是一种局部空间域处理的方法,它用像素邻域内各像素的灰度平均值代替该像素原来的灰度值,实现图像的平滑。由于图像中的噪声属于高频分量,空域滤波法采用低通滤波的方法去除噪声实现图像平滑。
中值滤波是一种非线性处理技术,能抑制图像中的噪声。它是基于图像的这样一种特性:噪声往往以孤立的点的形式出现,这些点对应的像素数很少,而图像则是由像素较多、面积较大的小块构成[12]。
无论是直接获取的灰度图像,还是由彩色图像转换得到的灰度图像,里面都有噪声的存在,噪声对图像质量有很大的影响。进行中值滤波不仅可以去除孤点噪声,而且可以保持图像的边缘特性,不会使图像产生显著的模糊,比较适合于实验中的人脸图像。
中值滤波的步骤:
(1)将模板在图中漫游,并将模板中心与图中某个像素位置重合; (2)读取模板下各对应像素的灰度值; (3)将这些灰度值从小到大排成一列; (4)找出这些值里排在中间的一个;
(5)将这个中间值赋给对应模板中心位置的像素。 由以上步骤可以看出,中值滤波的主要功能就是让与周围像素灰度值的差比较大的像素改取与周围像素值接近的值,所以它对孤立的噪声像素的消除能力是很强的。由于它不是简单的取均值,所以产生的模糊比较少。换句话说,中值滤波即能消除噪声又能保持图像的细节[13]。
实例如下:
图2.3原始图像与5*5中值滤波后的效果图
2.3.2 直方图均衡化
灰度直方图反映了图像中每一灰度级与具有该灰度级的像素出现的频率之间的关系,可以表示为:
P(rk)?nk (2-6) N其中,rk表示第k个灰度级,nk为第k级灰度的像素数,N为一幅图像的像素总数,灰度直方图是图像的重要统计特征,可以被认为是图像灰度概率密度函数的近似,直方图均衡化就是将图像的灰度分布转换为均匀分布。对于对比度较小的图像来说,其灰度直方图分布集中在某一较小的范围之内,经过均衡化处理后,图像所有灰度级出现的概率相同,此时图像的熵最大,即图像包含的信息量最大。以r和s分别表示归一化了的原图像灰度和直方图均衡化后的图像灰度,T(r)为变换函数,则在[0,1]区间内任意一个r经变换后都对应一个s,s?T(r)。T(r)应满足下列条件:
1.s在[0,1]区间内为单调递增函数;
2.在[0,1]区间内,反变换r?T?1(s)也存在,且为单调递增函数。
条件1保证了灰度级从黑到白的次序,条件2确保了映射后的像素灰度在允许的范围内。有概率论论可知,已知随机变量r的概率密度函数为Pr(r),而随机变量s是r的函数,则随机变量s的概率密度函数Ps(s)可由Pr(r)求出。假定随机变量s的分布函数Fs(s),根据分布函数的定义:
srFs(s)??Ps(s)ds??Pr(r)dr (2-7)
????根据概率密度函数和分布函数之间的倒数关系,将上式两边对s求导得:
?s-?Ps(s)?Pr(r)dr|r?T?1(s) (2-8) ds从上式可以看出,通过变换函数T(r)可以控制图像灰度的概率密度函数,因为直方图均衡化有Ps(s)?1,则:
ds?Pr(r)dr?d[T(r)] (2-9)
两边积分得: