第一章绪论
1.1选题背景
人脸识别发展到今天,诞生的大多算法都可以在理想条件下取得较高的识别率,及简单单一的背景下表现出良好的识别能力,这种基于人脸特征的身份识别系统理想条件指的是正面人脸、姿态无倾斜无旋转、光照正常等。但是从实际应用考虑,生活中的实际情况可能并不会有很多完美的背景条件,比如无法在单一背景下获得人脸图像,被采集图像的人员不配合和采集到的人脸图像分辨率太低等,当外界光照条件不满足、人脸姿态多种多样、人脸有遮挡的时候,人脸识别系统的识别率急剧下降。所以如何提高这种情况下人脸识别能力已经成为人脸识别领域下一步的研究重点。
而随着人脸识别算法的完善以及它的广阔商业背景,我们可以看到在国内外有很多在做人脸识别相关课题的商业公司。如表1.1所示:
上述公司所做的人脸识别系统大多基于特定背景条件下,不但要求光照条件是完美背景条件,还对采集人有姿态、距离的要求,同时为了保证获得较高的分辨正确率,也要求人脸识别算法与基因、虹膜、指纹相结合的形式。虽然获得了很高的分辨率,但是因为有特殊背景条件的要求和其他生物识别特征相结合的方式,所以扩展应用性不大。
由于在复杂背景条件下的人脸识别技术具有广阔的发展前景以及强烈商业需求,现在国内外很多研究机构和学校都对此展开了研究工作,比如美国的卡耐基梅隆大学的机器人研究所,诺丹特大学的机器人视觉研究室,韩国的科学技术学院和微软亚洲研究院,在国内的相关机构主要依托于各大名牌高校,还有中科院自动化所和计算所等[46]。所以如何在复杂背景条件下获得高分辨率是本文重点讨论对象。
……
1.2人脸识别的研究现状
人脸识别技术在四十多年的研究中经历了三个主要的发展时期:
一、人脸识别技术发展初期:在计算机诞生前的时期,由于受到达尔文遗传进化论的影响,主要通过心理学和遗传学的角度来研究不同个体之间的差异,进而实现人脸识别;
二、人脸识别技术发展的第二个时期是基于面部图像的几何特征:由于每个人的面部几何特征和纹理特征的不同,所以可以直接进行人脸识别,这其中出现了很多著名的算法包括基于几何特征矢量的人脸识别算法,基于代数子空间特征方法(PCA,LDA),基于连接机制的非线性方法,基于形状和纹理的算法(AAM,PCA+LDA),基于多模态信息融合和HMM隐性马尔科夫模型进行的人脸识别研究,同时配合人工操作可以有效的提高分辨的正确率;
三、人脸识别的第三个阶段主要通过人机交互的方式实现人脸检测,由于计算机的广泛使用和处理能力的进一步增强,在这一阶段通过使用高维向量来表征人脸的图像特征,通过计算欧式距离测量人脸特征之间的相似度,实现人脸识别。
上面描述的主要是人脸识别的不同发展时期的技术算法综述,而在实际研究中人脸识别系统包括人脸检测和人脸识别两个部分。人脸检测可以看作是人脸识别系统中的第一步,主要作用是将人脸从图像中分离出来,其中经常用到的算法是Adaboos算法,该算法中包括两部分:选择特征和训练分类器。在训练分类器中,通过将多个弱分类器级联成一个强分类器,选取的训练样本能通过这个强分类器的就是最后的人脸图像。相比于人脸识别,可以将人脸检测看作是一个二分类问题。人脸识别是通过对已有的人脸模型进行特征提取,通过比对特征向量,来获得我们需要的人脸图像,这是一个多分类问题,是从一堆人脸中寻找需要的一个人脸图像。
……
第二章预处理阶段
2.1图像的颜色空间转变
图像在计算机中的显示和存储主要是数字化的形式,根据数字图像处理方面的理论知识,我们可以用颜色空间来表示图像,有时也用亮度空间来表示,根据不同的情况可以选择合适的表示方式。常用的颜色空间包括:RGB空间、HSV空间、HIS空间、CMY空间、YCbCr空间、YIQ空间、YUV空间等,本小节主要介绍的是RGB颜色空间和YUV颜色空间。
根据色彩理论,人类把可以用红色、绿的和蓝色作为原色将大部分的其他颜色表示出来,RGB颜色空间就是根据上述原理建模。在图中,我们可以看出RGB颜色空间是一个三维的坐标系,三个坐标轴分别代表:R(红色)、G(绿色)和B(蓝色)。全部的色彩都可以在0(0,0,0)到M(0,0,0)表示。例如图中的X(R1,B1,G1)是一种颜色,可以分别用它在三个坐标轴的投影表示,投影的取值范围是(0,255)。如果X在圆点O时代表X是黑色,X在M点代表它是白色。用RGB颜色空间可以将人类感知到的颜色用三维坐标轴的形式表现出来,所以在一些电视剧、电脑的屏幕端经常使用。但是因为它无法很好的区分亮度啊、色度和饱和度,所以在图像处理中,我们引入了YUV颜色空间。
根据人眼的生理构造,研究发现人眼对亮度的改变远比色彩的改变明显。而在RGB中,亮度通常隐含在色彩的三个坐标轴里,无法直接的调整和改变。为了方便,我们引入YUV颜色空间。Y代表亮度,U、V代表色差。其中色差的表示形式有两种,分别是PbPr和CbCr,在里面b代表蓝色色差分量,r代表红色色差分量,P和C代表颜色。当我们使用YCbCr的颜色空间来表示一个色彩时,可以看出只有Y一个变量来代表亮度的强度信息,研究者发现RGB颜色空间和YUV颜色空间可以通过固定的系数矩阵和常数矩阵进行转化,可以将RGB颜色空间转换成YUV颜色空间。
……
2.2光线补偿
在完美的光照条件和简单单一的背景下,我们获得的人脸图像可以直接用于人脸识别,但是现实生活中获得的人脸图像因为受到各种各样复杂因素的影响会偏离原始的颜色,导致人脸主要信息不突出,图像噪声大。所以为了解决这种问题,我们就需要对输入的人脸图像进行光线补偿,使图片恢复本来的颜色。光线补偿方法有很多种,在本文中用到的光线补偿方法是“参考白”线性校正法和Y值校正法。
在数字图像处理中,我们经常需要对图形图像进行分割来获取所需要的图像内容。人脸识别系统的预处理阶段和数字图像处理有着异曲同工地方,因为图像预处理阶段对后期的人脸检测和人脸识别的识别率有着很大影响,所以我们同样也需要首先把原始输入图像分割成形状、分辨率相同的小图像。在图像分割中,本章会详细介绍阀值分割法。
这个时候就体现出自适应阀值的优点。自适应阀值分割法可以看作是多个图像的整体阀值分割法的体现,过程是将原始输入图像分割成大小相同的若干小图像,因为每个图像的背景和目标图像情况都是不同的,所以阀值就会有若干个,这样分割后图像有着更好的分离特性,但是缺点是计算量大,而整体阀值分割法的缺点同样存在于自适应阀值分割法。所以对比后可知,整体阀值分割法更适合目标图像和背景图像区别很大的情况,而自适应阀值分割法可以适当的用在小图像数量少的情况中。
……
第三章人脸检测.........................21
3.1AdaBoost算法........................21
3.2Haar特征...........................25
3.3积分图计算特征值................26
3.4实验仿真...........................28
3.4.1基于AdaBoost算法的人脸检测.........28
3.4.2基于AdaBoost算法的人眼检测.........31
第四章人脸识别............................33
4.1基于主成分分析法PCA的人脸识别.......33
4.1.1K-L变换........................33
4.1.2PCA算法...........................35
4.1.32DPCA算法...........................37
4.1.4加权模块的2DPCA算法................39
4.2基于最大散度差鉴别分析法MSD的人脸识别......40
4.3基于图像熵值的人脸识别..................41
4.4基于支持向量机SVM的人脸识别............43
第五章实验仿真..............................48
5.1ORL人脸库中仿真情况.....................48
5.2AR人脸库中仿真情况...................49
5.3自定义低分辨率人脸库中仿真情况...........51
……
第五章实验仿真
5.1ORL人脸库中仿真情况
经过前面对人脸识别的多个算法的详细介绍后,在这一章的主要工作就是对这三个算法在人脸库中进行实验仿真。我们选取三个不同的人脸库,分别是ORL人脸库、AR人脸库和自定义的低分辨率的人脸库,其中在AR人脸库中会对待测样本和训练样本有无遮挡的情况进行分开仿真。我们对输入的人脸图像都会做一样的图像预处理,人脸图像大小是统一的92×112分辨率。实验环境是在MATLAB2012中,实验硬件条件是:台式服务器,处理器是双核的英特尔I5-2520(M),可扩充至四个,高速缓存4MB,内存16G(DDR3)。
图中基于模块的2DPCA算法我们用圆点加三角形的深蓝色的线表示,基于2DPCA和SVM算法用黄色的线表示,基于2DPCA和MSD算法用黑色的线表示,用浅蓝色的线表示论文中提出的改进算法SPM+(基于SVM算法、基于2DPCA算法、基于MSD算法和图像熵值)。根据实验结果可以看出随着训练样本的增加所有算法的识别率都提高,而本论文提出的改进算法在识别率的正确性有着明显的优势。
……
结论
因为在日常生活中,设备采集到的人脸图像样本不可能都是完美的,所以根据实际的需要,需要对低分辨率,复杂背景下的情况进行实验仿真。具体在自建的人脸库过程中,通过对原始输入的人脸图像加入高斯噪声、椒盐噪声以及不断缩小需要进行识别的人脸图像的大小来获得高噪声、低分辨率人脸库,在处理过程同样需要对输入的图像进行图像预处理、光照补偿和几何角度调整。选取三十个人的人脸图像,图像分辨率小于前面的提到的92×112分辨率,但是为了能够成功识别,必须大于15*15。同样选取五幅图像作为训练样本
实验结果可以看出在低分辨率下人脸识别的整体识别率是低于前面两个人脸库的,因为本身这个实验人脸图像就是经过低分辨率处理的,前面的人脸库在输入人脸图像时不会增加多余的噪声。可见分辨率的高低对人脸识别是有一定影响的。但是可以看出本文提出的改进算法在低分辨率条件下优势更加明显。
根据上面的实验结果可以看出在低分辨率下人脸识别的整体识别率是低于前面两个人脸库的,因为本身这个实验人脸图像就是经过低分辨率处理的,前面的人脸库在输入人脸图像时不会增加多余的噪声。可见分辨率的高低对人脸识别是有一定影响的。但是可以看出本文提出的改进算法在低分辨率条件下优势更加明显。
参考文献(略)