人脸检测概述(人脸检测与识别技术文献综述)
通过阅读人脸检测与识别技术的文献,总结了传统身份识别、人脸检测与识别技术的背景、意义和国内外发展现状,并着重介绍了人脸检测与识别的方法。
关键词:人脸检测;人脸识别;sub 空之间的分析;核主成分分析。
面子不仅有很强的自我稳定性和个体差异性,而且直接友好。与传统识别相比,更符合人类的视觉习惯。一个完整的人脸识别过程一般包括两个部分:人脸检测和人脸识别。人脸检测是指计算机在包含人脸的图像中检测人脸,并给出人脸所在区域的位置和大小等信息的过程。人脸识别是指将待识别的人脸与已知人脸进行比较,得到相似度的相关信息。这里所指的人脸识别是狭义的识别,是广义人脸识别的子过程[2]。近年来,人脸检测和识别技术的研究取得了很大进展。
1人脸识别的背景和研究意义
身份识别和验证是人类社会日常生活中的基本活动之一。虽然可能是无意识的,但我们每天都要判断很多人的身份。同时,每个人都要用各种方式方法证明自己的身份。目前,在大多数情况下,我们仍然依靠传统的认证手段来完成身份识别过程。这些手段包括身份证、学生证等各种身份证明文件、钥匙、密码等。但是这些方法不方便、不安全、不可靠,文件和钥匙也不方便携带。目前广泛使用的依靠证书、密码等传统方式确认个人身份的技术面临严峻挑战,已不能满足现代科技发展和社会进步的需要[4-6]。随着社会的发展和信息化水平的不断提高,人们对识别的准确性和实用性提出了更高的要求,传统的识别方法已经不能满足这些要求。生物识别有利于深圳生命网,它利用了指纹、虹膜等人类特有的生理特征。或者诸如签名、声音等行为特征。基于生物特征的身份认证技术是一种新的安全技术,也是本世纪最有前途的技术之一。
人脸检测与识别技术的发展
人脸检测是自动人脸识别系统中的关键环节和极其重要的一步。人脸检测的早期问题可以追溯到20世纪70年代,当时由于技术原因,人脸检测的研究处于停滞状态。直到20世纪90年代,由于人脸识别系统和视频解码的广泛应用,人脸检测的研究得到了新的发展,并提出了更鲁棒的运动、颜色和综合信息等方法来变形模板。弹性曲线等特征提取的许多进展使得人脸特征的定位更加准确。目前,国内外关于人脸检测的研究很多,如国外的MIT和CMU,清华大学、北京理工大学、中国科学院计算技术研究所、中国科学院自动化研究所等。
近年来,人脸识别研究受到了众多研究者的青睐,出现了许多技术方法。尤其是1990年以来,人脸识别取得了长足的进步,每年都有大量的学术论文发表。现在几乎所有的理工科名校和IT行业的大公司都有从事人脸识别研究的课题组。人脸识别的研究大致可以分为四个阶段。第一阶段,以Bertillon、Allen和Parke为代表,主要研究人脸识别所需的面部特征;第二阶段是人机交互识别阶段;第三阶段是真正的自动机器识别阶段;第四阶段是鲁棒人脸识别技术的研究阶段。目前国外很多大学和研究机构已经开发出了一些不错的人脸识别原型系统和一些成熟的商用人脸识别系统,如德国的Cognitec、美国的Indentix、Eyematic等[8]。
3.人脸识别的研究方法
近年来,人们在人脸检测识别方法和三维人脸重建方法的研究方面取得了很大进展,研究方法也越来越多。目前,人脸识别技术的研究主要分为以下两类:人脸检测和人脸识别。人脸检测的方法有四种:基于知识的方法、基于特征的方法、模板匹配的方法和基于外观的方法。根据特征提取和选择方法的不同,以及出现的时间顺序,人脸识别方法分为三类:早期的几何特征方法和模板匹配方法、神经网络方法和统计方法。分类只是相对的,有些方法也可能交叉[10]
框图如下:
3.1人脸检测方法
3.1.1基于知识的方法
基于知识的方法之一是基于规则的人脸检测方法。规则来自研究人员对人脸的先验知识。一般来说,很容易提出简单的规则来描述人脸特征及其关系。
杨和黄使用基于分层知识的人脸检测方法[11]。他们的系统由三层规则组成。在最高级别,通过扫描输入图像窗口并应用每个位置的规则集,找到所有可能的人脸候选区域。在中,较高级别的规则通常描述人脸的样子,而较低级别的规则则取决于面部特征的细节。多分辨率分层图像是通过平均和二次采样生成的,如图2所示。
编码规则通常确定分辨率较低的人脸候选区域,包括人脸中心部分的浅阴影部分,其中基本上有相同的灰度单位。
图2杨、黄检测方法
图2杨、黄的检测方法
3.1.2基于特征的方法
基于特征的方法不仅可以从现有的面部特征中检测人脸,还可以从人脸的几何关系中检测人脸。与基于知识的方法相反,它是寻找人脸的不变特征进行人脸检测。在推断人脸的存在之前,已经提出了许多方法来检测人脸的面部特征。眉毛、眼睛、鼻子、嘴巴和发际线等面部特征通常由边缘检测器提取。根据提取的特征,建立一个统计模型来描述特征之间的关系,并确定存在的人脸。基于特征的算法存在的问题是由于光照、噪声和遮挡等因素导致图像特征严重受损,人脸特征边界弱化,阴影可能造成强边缘,使得算法难以使用。
3.1.3模板匹配方法
Sakai等人使用眼睛、鼻子、嘴巴和面部轮廓等子模板来建模和检测照片中的正面人脸。每个子模板由线段定义。基于最大梯度变化提取输入图像的线,然后与子模板匹配。计算子图像与轮廓模板的关系来检测人脸的候选区域,并在候选区域完成与其他子模板的匹配。
Craw等人提出了一种基于正面人脸的形状模板,即人脸形状定位方法。利用Sobel算子提取边缘,将边缘组织在一起,根据多个约束条件搜索人脸模板。头部轮廓上的位置。
Govindaraju等人提出了一种两阶段人脸检测方法。人脸模型是根据边缘定义的特征构建的。这些特征描述了正面左侧、发际线和右侧的曲线。面部必须垂直、通畅、正面。
3.1.4基于外观的方法
基于外观的方法首先通过学习在大量训练样本集的基础上建立一个能够正确识别人脸和非人脸样本的分类器,然后对检测到的图像进行全局扫描,利用分类器检测扫描到的图像窗口是否包含人脸,如果包含人脸,则给出人脸的位置。
Moghaddam和Pentland提出了一种概率视觉学习方法,该方法在高维空间中使用了特征之间的分解密度估计空[12]。主成分分析用于定义子空以便最好地表示人脸模式集。主成分保留数据中的主成分,并丢弃那些次成分。在该方法中,向量空被分解成两个互斥且互补的子向量空,在主子向量空之间或者在特征向量空与其正交子向量空之间。因此,对象密度被分解成两个分量被主分量空之间的主分量展开的密度,其垂直分量(标准PCA中丢弃的二次分量)如图3所示。使用多元高斯和混合高斯密度分布来学习局部人脸特征的统计量。这些概率密度然后被用于基于最大值计算概率密度
基于似然估计的目标检测。该方法已应用于人脸定位、编码和识别。与传统的特征脸方法相比,该方法具有更好的人脸识别性能。
图3图像空分为主子空和垂直补码空
图3将图像空间分解成
主子空间及其正交补
3.2人脸识别方法
3.2.1早期几何特征方法和模板匹配方法
最早的人脸识别方法是基于几何特征的方法[13]。其基本思想是提取人脸代表部位(如眉毛、眼睛、鼻子、嘴巴等)的相对位置和相对大小。)作为特征,然后借助人脸轮廓的形状信息对人脸进行分类识别。模板匹配是模式识别中最简单的模式分类方法。在人脸识别中,将数据库中的人脸图像视为已知模板,然后根据待识别图像与已知模板之间的相关性进行分类。
3.2.2神经网络方法
基于神经网络的人脸识别方法也是早期的方法之一。目前,基于动态链接结构的弹性图匹配方法比较流行,并取得了一定的成功。它利用Gabor小波提取和描述人脸中的一些局部特征点(节点),并以标记图的形式将它们连接起来,通过标记图之间的相似度来度量人脸图像之间的相似度。弹性图匹配方法不仅反映了人脸中的几何特征信息,而且通过标记图的弹性变形来描述人脸的一些变化,因此可以达到更好的识别性能。
3.2.3统计方法
统计方法是目前最流行的方法之一。它的想法是通过学习
对人脸的统计特征,并进行分类判断。其学习和识别过程的模型如下
4.
图4统计方法识别模型
子空间分析是主要方法之一。其思想是通过线性或非线性变换,将松散分布在高维空中的人脸图像压缩到低维子空间空中,从而将人脸图像分布在低维子空间空中,此外,将高维计算简化为低维计算。目前,成功应用于人脸识别的线性子空分析方法包括主成分分析(PCA)、线性判别分析(LDA)、独立成分分析(ICA)、非负矩阵分解(NMF);基于核技术的非线性子空之间的分析包括核主成分分析(kpca)和核Fisher判别分析(kfda)。
核主成分分析如下:
基于线性子分析的人脸识别空实际保存了实际的人脸图像
表情、姿势、光照等复杂变化被线性简化,无法完整描述。核技术的思想是利用非线性映射将原始空之间的数据映射到隐藏特征空::x &:isin;Rn &。rarrf & ampisinf,然后分析隐藏特征空中的数据,这样就可以有效地分析原始数据的非线性关系。在计算中,不需要显式计算这种非线性变换,只需计算隐藏特征空 (3.1)之间F中成对向量的点积即可。隐藏特征空之间的f用这个点积来描述。
k ( x,y)= ((x)*(y)) (3.1)
常用的点积核函数有三种:多项式点积核函数、径向基点积核函数和
Sigmoid点积核函数[14-16]。
核主成分分析最早由Scholkopf等人[17]提出,其思想是把核技术
和主成分分析。首先通过内核技术将原始数据投影到隐藏特征空之间的F中,
经过线性主成分分析,得到相对于原始空的非线性主成分
空。根据主成分分析原理,求解隐藏特征空之间的f中的主成分相当于求解
下列特征值问题:
w=Sw (3.2)
其中,s表示样本在f中的投影在隐藏特征空之间的色散矩阵。
因为在隐藏要素空之间进行线性变换,所以有一个对应于& ne;0
的特征向量w必须存在于由(x1)、(x2)、…,(xN)。数学
w可以用公式(3.3)表示:
(3.3)(3.3)
将(3.3)代入(3.2),求解特征值的问题将改变
要理解以下特征值问题:
N =K (3.4)
矩阵k是n&:次;n,Ki,j= k(xi,xj)=((xi),(xj)),
=(1 ,2,…(北)台.
同样,前m个大特征值的特征向量可以选择为隐藏特征之间的f空
在主分量中,原始空之间的数据x在w上的投影为:
(3.5)(3.5)
4.总结与展望
随着社会的不断发展,传统的身份识别技术已经不能满足人们的需求。与其他生物识别技术相比,人脸识别在可用性方面具有独特的技术优势,主要体现在:可以隐蔽操作,特别适合安全监控;非接触采集,无创,易接受,不会对用户造成生理伤害,容易被大多数用户接受;具有方便、快捷、强大的事后跟踪能力;图像采集设备成本低;更符合人类识别习惯,互动性强[18]。
人脸检测是人脸信息处理领域的重要课题,也是计算机视觉和人机交互领域的研究热点。这一问题的突破将为人脸识别、人脸表情识别、视频监控、身份验证等相关领域的研究带来巨大的推动力[19]。人脸检测和识别是一个具有挑战性的研究课题,还有许多问题需要进一步研究和解决。人脸检测和识别非常困难。经过几十年的研究,人脸识别技术已经达到了环境可控条件下的实用水平。但在考虑光照、姿势和表情的影响时,其应用范围受到很大限制。
近年来,为了进一步解决人脸识别中的表情和姿势问题,3D人脸识别技术得到了极大的发展,3D人脸模型重建方法日益增多。然而,如何将三维识别的结果融入到2D识别中,从而建立有效的识别标准,还有待进一步探讨,人脸特征选择和提取算法还需要进一步优化[20]。