研究文章|开放获取
Kwame Appati法官,Huzaifa Abu法官,Ebenezer Owusu法官,Kwaku Darkwah法官, "人脸识别优化技术的分析与实现”,应用计算智能与软计算“,, 卷。2021, 文章的ID6672578, 13 页面, 2021. https://doi.org/10.1155/2021/6672578
人脸识别优化技术的分析与实现
摘要
在提出的广泛的识别方法中,这些算法仍然面临着对光照、姿势和面部表情不能产生最佳精度的挑战。近年来,相当多的关注已经在使用群体智能方法来帮助解决这些持久的问题。本研究采用具有降维特性的主成分分析(PCA)方法进行特征选择。利用粒子群优化(PSO)算法对所得到的特征进行优化。为了进行性能比较,还采用遗传算法(GA)和人工蜂群(ABC)对所得到的特征进行了优化。采用欧氏距离(EUD)、k -最近邻(KNN)和支持向量机(SVM)作为分类器,对优化后的特征进行识别。在ORL数据集上的实验结果表明,PSO和KNN的准确率为99.25%,ABC和GA的准确率分别为93.72%和87.50%。在中心,PSO, GA和ABC在YaleB数据集上的实验结果是100%的准确性,证明了它们比最先进的方法的效率。
1.简介
自动生物识别作为21世纪最值得信赖的安全系统正在迅速获得认可圣世纪。这可能归因于最近并行处理技术的重大进步,以及由于全球犯罪急剧增加而对最可靠安全系统的搜索。最早用于自动识别的生物特征包括指纹,其中利用了独特的脊状皮肤模式。其他包括视网膜、虹膜、手掌、皮肤和鼻尖。众所周知,指纹、视网膜和虹膜识别系统可以产生非常准确的结果[1),但惯于犯罪的罪犯,由于敏感地意识到安全问题,大多会避免将自己的生物特征提供给数据库。因此,自动人脸识别系统现在是显而易见的选择[2因为人们无法一直在安装的闭路电视摄像机面前隐藏自己的面部图像。这使得这项技术成为侵入性最小的技术,也成为研究人员不断提出优于现有算法的新算法的温床。
由于自动人脸识别研究与指纹识别和其他已经提到的研究相比是新的,与之相关的问题仍然突出。如张、罗、莱、唐[3.]意识到面部标志检测的问题,这是系统开发的中心重点之一。人脸识别研究中的其他挑战与遮挡、姿势变化、照度正常化、年龄和性别有关[4].在不受约束的环境中,识别精度显著降低,从而难以准确识别人脸。因此,需要有技术来提高这些环境中的人脸识别。土、李、赵[5]尝试用DL-Net和N-Net方法解决光照和姿态问题。然而,该方法不能充分解释大规模归一化反照率图像和野外人脸识别。人脸识别研究中的另一个挑战与测试实验结果的有效性有关。目前还没有被研究界普遍认可的用于测试的标准数据集。具体数据集的使用取决于个人研究人员的选择。大多数数据集都是预先准备好的,因此不能代表现实世界的场景。在种族方面也存在挑战。目前,还没有一个数据集能够很好地平衡种族、性别和年龄。
当照明条件以不同角度变化时,也会出现不均匀照明的问题。因此,脸部反射的光线比例是不同的。这种现象会导致对个人的错误识别[6].同样,由于个体运动引起的随机旋转也会导致4D识别中的错误分类。由于图像的旋转,输入图像和人际图像可能看起来不相似[7].本研究的主要目的是探讨目前流行的计算方法,并提出一种利用计算成本的方法。此外,这种方法将考虑照明,姿势,和面部表情。本文提出的方法利用优化技术方法增强了主成分分析(PCA)技术的结果。此外,本研究中准确性的提高转化为生物识别锁安全性和完整性的普遍提高。
在这项研究中,我们探索了哪个是最好的或合适的优化算法来最大化识别的问题。它还响应于哪种分类器适合推荐的方法,以及哪种方法使用较少的计算资源和时间。本研究提出的方法需要对图像进行预处理;然后,使用主成分分析对特征进行检测和提取。接下来将使用PSO、ABC和GA对上述特征进行增强,并对整个过程进行分类。
2.相关的工作
人脸识别主要分为四个阶段,即签证。,feature extraction, face detection, face synthesis, and recognition [8].Chihaoui等。[9]指出,人脸识别技术主要分为三类。第一个是使用程序,需要使用整个面部作为输入。第二种方法是只考虑面部的某些特征或区域,最后一种方法是同时使用全局和局部面部特征。此外,许多数据集都是针对特定的人脸识别问题的解决方案,这些数据集是在实验室条件下采集的。然而,有一些数据集试图解决多个问题,并在现实世界条件下采集[9].法齐洛夫、米尔扎耶夫和米尔扎耶娃[10]研究了一种增强高维物体分类的算法。该算法将相关图像组成一个子集,然后选择一个特征表示,在代表特征的子空间中建立初等变换模型。该算法追求识别精度的提高,学习时间的增加,最终目标识别时间的增加。He, Wu, Sun,和Tan解决了由于大样本和训练样本可用性有限而导致的人脸识别精度低的问题[11他们提出了异质人脸识别(HRF)的跨模态图像。该研究提出了Wasserstein CNN框架,该框架利用一个网络将近红外和视觉图像投射到欧几里得空间。提出的方法是一种用于NIR-VIS HFR的模态不变深度特征学习架构。随后计算分离近红外和VIS分布的Wasserstein空间,然后在连接层上征收相关性,以缓解小近红外数据集上的过拟合。
同样,拉希姆扎德、阿拉什卢和基特勒[12]利用GPU的处理能力,利用马尔可夫随机场(MRF)模型解决了MAP推理的优化问题。采用多分辨率分析技术、增量次梯度法和高效消息传递法来获得最大的效率增益。通过使用多分辨率雏菊特征来获得对遮挡和光照的不变性,提高了效率。与基线方法相比,所提出的方法减少了200%的计算成本。同样,Chan等人。[13]尝试了训练问题,并使深度学习网络适应不同的数据和任务。Chan等人提供了一种将图像传递到级联主成分分析(PCA)滤波器中用于训练PCANet的方法。PCANet随后用于使用MultiPIE、扩展的YaleB、AR、FERET和LWF数据库进行特征提取。此外,PCANet也是回顾包含大量图像分类的高级深度学习架构的参考。还有邓、胡、吴、郭[14]提出了针对光照变化和姿态变化分别创建人脸图像的方法,并仅使用一张正面人脸图像建立了扩展的通用弹性模型(GEM)和多深度模型。通过线性回归学习姿态感知度量学习(PAML),在相应的度量空间中综合每个姿态,准确率为100%。陈等人。[15],另一方面提出了一种基于残差的深度人脸重建神经网络,用于不同姿态和光照下的特征提取。该方法改变照度并将图像置于平均光照条件下的正面图像。通过比较所提出的三态损耗和欧几里得损耗,实验证明后者的性能优于前者。然而,本研究只使用了一个数据库,没有结果可以与所提出的方法进行比较。
土、李、赵[5]还通过使用DL-Net和归一化网络(N-Net)解决了光照、姿态和表达问题。DL-Net清洗光照,然后将输入图像重建为反照率图像。N-Net通过监督学习对反照率图像进行归一化和特征提取。MultiPIE数据库建立了所提出的方法在光照、表情和不同姿势下提高人脸识别精度的效率。研究表明,所提取的特征可以改进传统的特征提取方法。张等。[16]还提出了一种比SOTA模型准确率更高的情绪识别模型。他们提取了七种不同情绪的面部表情。利用香农熵和多尺度特征提取相结合的方法对提取的图像进行滤波,并利用模糊支持向量机(SVM)对图像进行分类。本研究采用分层交叉验证作为验证指标,总体准确率为96.77%。迦西和以基乃[17]通过使用两个深度CNN模型(VGG-Face和lighlit)在大型数据集上预训练,提高了遮挡、照明变化和面部特征不对准下的准确性。然后使用这些数据集提取面部特征。他们还使用了5个数据库来尝试解决这个问题。使用AR面部数据集作为面部阻塞影响的分析工具,CMU PIE和扩展耶鲁数据集B分析照明的变化。使用颜色FERET数据库对视图不变性进行影响分析,使用FRGC数据集对多视图目录进行评价。然后,作者使用面部包围框扩展扫描整个头部并提取深层特征,从而改善了结果。他们将面部包围盒扩展与其他方法的结果进行了比较,结果有显著改善[18].而Zhang等人利用特征属性中的补充数据对人脸地标检测进行了优化。该研究提出了使用四个卷积层进行特征提取。这些层中的每一层都生成几个特征映射,这些特征映射使用整流线性单元激活。然后使用max-pooling将层耦合以生成共享向量。多属性面部标志(MAFL)、AFLW和加州理工学院野外遮挡面部(COFW)都受到平均误差和故障率验证的影响。研究得出的结论是,通过学习动态任务系数,辅助任务更有效,这反过来又使所提出的方法对遮挡人脸和显著视图不变性更具鲁棒性[19].
这种方法鼓励了丁和陶[20.]提出了一种单应姿态归一化方法,该方法可以处理PIFR中语义对应的丢失、遮挡和非线性面部纹理包裹。该方法首先将三维人脸标志格投影到二维人脸中进行特征提取。其次,利用由位姿变化引起的单应性校正纹理变形来评估最佳翘曲。这是围绕本地补丁上的每个地标执行的。恢复的遮挡特征用于使用已建立的人脸描述符进行人脸识别[20.].然而,Sharma和patath [21他提出了一种技术,通过维奥拉-琼斯算法来识别人脸。然后,通过所提出的混合主成分分析发现眼睛、鼻子和嘴巴。随后使用LBP对发现的每个部分进行特征挖掘。然后将PCA应用于提取的每个特征进行识别。采用ORL人脸数据集,以识别率作为识别指标。研究结果表明,采用SOTA、PCA +小波、CA、2DPCA + DWT和局部二值模式算法对不同的面部表情和姿态进行斑点处理时,所提出的混合PCA方法具有更高的识别率。他们声称这种方法可以扩展到光照、年龄或部分遮挡问题。有趣的是,Duong, Luu, Quach和Bui [22]提出了一种利用深度玻尔兹曼机(DBM)准确捕捉大变化下形状和纹理变化的深度外观模型(DAM)方法。DAM取代了主动外观模型(AAM)。该方法首先利用DBM方法确定人脸数据上的标志性分布点,然后将人脸数据向量化为纹理模型。然后通过构造和使用高级层来解释这两个层(形状和纹理)。实验使用LFW、Helen和FG-NET数据库。与受控方法(双三次法和AAM法)相比,所提方法的RMSE值在识别率上有显著提高[22].
段、谭[23]还提出了一种不需要先验位姿信息而学习位姿不变特征的低复杂度方法。所提出的方法从人脸图像中去除姿态,并通过这样做提取局部特征。首先从人脸图像中生成自相似特征,当评估分离不同不重叠块的特征的距离时。然后,从局部特征中减去线性变换,通过减小姿态变化特征之间的距离得到变换矩阵。在创建这个矩阵的同时,保留了人与人之间的歧视性信息。然而,Singh, Zaveri和Raghuwanshi [24]提出了一种用于姿态图像分类的粗糙隶属度分类器(RMF)。使用log-Gabor进行特征提取,并使用SVD来减少冗余特征。最后将KNN分类器应用于约简Gabor特征。ORL,格鲁吉亚人脸数据库,CMU PIE,头部姿态图像数据库,使用与Duan和Tan相似的性能指标[23].研究得出的结论是,该方法最适合用于执法中的大头照。此外,该方法提高了具有遮挡的人脸图像的识别能力,并利用建模技术对该方法进行了增强,以获得更好的识别效果。然而,使用三种方法进行测试降低了所提出的方法对具有不同图像的大量数据集的最优性。然而,赵、李、刘[25首先,使用仿射不变性多尺度自卷积(MSA)变换提取特征;此外,利用主成分分析进行了这些特征的去相关和MSA比例的降低。最后,利用KNN对特征值最高的主成分进行分类。实验表明,该方法在MSA特征提取阶段的计算成本很高。
Abdalhamid和Jeberson [26]提出了一种基于人工蜂群优化k -最近邻分类器(ABC-KNN)的有功能的位姿不变FR系统。该方法使用视频作为输入转换成帧。在对转换后的图像进行预处理时,采用自适应Lee滤波器(ALF)对图像进行去噪增强。然后使用Viola-Jones (VJ)算法从右侧的眼睛、鼻子和嘴巴进行人脸分割。当从分割图像中提取怪癖时,使用完全lbp (CLBP)、中心对称局部二值模式(CS-LBP)特征、Gabor特征(GF)和梯度方向幅度模式(POEM)描述符。采用ABC-KNN算法对图像进行分类。识别精度是性能评价指标。27]提出了一种基于深度学习的特征学习的PIFER框架方法。PCA-Net使用在特征学习过程中未标记的正面图像。后者因此被CNN用于横跨分隔非正面和正面面孔的空间的特征映射。然后使用地图生成的新描述来描述非正面人脸,以实现描述任意人脸的标准特征。然后使用单个分类器对不同姿态的多视图鲁棒特征进行训练。在实验阶段和识别阶段使用BU-3DFE Static FEW作为性能评价指标。在将该技术与其他技术和框架进行对比之后,所提出的过程似乎优于SOTA技术。此外,该方法可以用于训练时的姿态鲁棒特征提取,而不是训练模型的不同姿态变化。
最后,桑、李、赵的[28使用联合贝叶斯分类器将纹理和深度融合到框架中。然后使用输入和人脸数据库之间的相似性估计器来识别输出。然而,在大型人脸数据库中,人脸图像的识别具有较高的计算成本。此外,针对各种姿势进行了广泛的实验,并且没有将多种方法与当前方法进行比较。
3.研究方法
本研究的研究设计包括图像预处理、PCA特征提取、PSO、ABC和GA特征优化、KNN、SVM和EUD目标分类。这项研究的数据集是YaleB和AT&T,通常被称为ORL。选择这些数据集的理由是,它们具有验证面部识别算法所需的明确定义的挑战。后续章节将详细解释研究设计的主要部分。
3.1.特征提取
设计的这个部分从给定的图像中获取相关的生物特征描述符。在此过程中,由于获得了大量的数据,因此有必要只选择高贡献的描述符。有几种技术可以完成这项任务;但由于PCA在该领域的普及和效率,本研究采用PCA [29].
3.1.1.主成分分析
人脸识别的主成分分析的主要目标是将高维数据转换为称为特征脸的较低特征子空间。这个特征空间表示特征标志的协方差矩阵的轨迹。尽管它很有用,但在给定高维数据时,它们的计算成本很高。这就需要采用一种具有类似性质和结构的替代算法[30.]作为PCA,但相对便宜的被称为奇异值分解(SVD)。取一个矩阵X与维N x m, PCA可以定义为协方差矩阵的特征分解 .这就产生了一个特征值用它对应的特征向量W.这些特征向量被用作上的变换算子X得到一个新的矩阵T与X如
方程(1中的所有组件(即列)是校长。然而,在实践中,这些组成部分中的一些预计是多余的;因此,是由 .有顺序的 ,可以使用第一种方法执行截断r用于分析的组件。言下之意,我们做到了作为一个米通过r给出新的变换后的矩阵Tr所示
如前所述,PCA的操作是昂贵的,在数学上与PCA属性相同的SVD是首选的实现。方程(3.的SVDX. 在哪里是左奇异向量,右奇异向量的共轭转置,和在对角线上包含奇异值。计算特征值分解XTX用公式(3.)以取得 ,很明显W等于V,而有序奇异值( )成正比 .同样,有这样的性质而且V是酉矩阵吗 在哪里我是单位矩阵。由方程式(1)及(3.),并指出W等于V,我们有
这些方程进一步证明了为什么SVD比计算协方差的PCA在计算上便宜 .取方程的主成分(7),我们有
最后,由于需求是W而不是的特征分解 ,SVD可以有效地进行计算W.
3.2.功能优化
研究部分描述了用于特征优化的群体智能算法。这些方法包括人工蜂群、遗传算法和粒子游泳优化。
3.2.1.人工蜂群
人工蜂群算法(artificial bee colony, ABC)是根据蜜蜂的觅食行为设计的一种基于群体的算法。ABC行为模型的四个组成部分主要是食物来源、侦查蜂、围观蜂和受雇蜂。当侦查蜂进行全局搜索时,食物来源表示可能解决聚集问题的方法。这种搜索是随机进行的,而旁观者和采用蜜蜂搜索相邻的解。随后,被雇佣的蜜蜂根据先前存储在内存中的解决方案评估解决方案的精度。这些信息被依次传递给在舞蹈区域围观的蜜蜂。这确保了最好的食物来源被选择,在已经设定的周期内停滞的食物来源被放弃,并被新的食物来源取代。重复这一过程,直到有一个收敛,以获得最优解。数学上,我们有以下步骤。第一步:随机初始化解 ,在哪里代表每个食物来源,FS代表总食物来源。此外,初始化旁观者和雇用蜜蜂使用随机函数发生器在 在哪里 向量是长度的吗D与而且的最大值和最小值jth维度。第二步:由每个被雇佣的蜜蜂迭代找到新的解决方案 在哪里 的局部范围内的新解决方案 而且 .样本点与其簇中点之间的欧几里得距离之和已知与所有候选源的适应度值成反比。在源的选择中,通过比较新旧位置的适应度值,采用贪婪算法。第三步:概率解决方案计算时使用 在哪里的适应度值是 围观蜂利用这个概率选择新的值通过搜索局部最优值,同时按照第二步计算适应度值。步骤四:如果旁观者和被雇佣的蜜蜂在经过一些预定义的迭代后,无法通过局部搜索确定新的和更好的候选解决方案,则解决方案被丢弃,代之以侦察蜂的新溶液。然后,这些“侦察兵”使用随机的全局选择来寻找新的解决方案。步骤五:重复步骤二到步骤四,直到满足定义的停止条件,返回最优输出
3.2.2.遗传算法
遗传算法(GA)是基于遗传学和自然选择理论的。它是一种随机算法,通过在更大的空间中有效地寻找全局最优来找到最优解。利用适应度函数得到非负的适应度值。这个值用来总结最优解与全局最优解的接近程度(Mahmud, Haque, Zuhori, and Pal, 2014)。遗传算法首先生成具有种群大小的随机数(称为染色体)n.计算每个染色体的适应度值,并对停止准则进行检验。进一步解释了遗传算子,如选择、交叉和突变,以推动染色体向收敛。
选择.这个操作员通过类似于生物生命形式中的自然选择的过程,从现有种群中创造后代。选择再一次强调了群体中个体的更好表现。这有助于他们的后代有可能将遗传信息传递给下一代。因此,选择过程的大小对收敛性有很大的影响。因此,选择标准应该通过保持种群多样性和交叉和突变操作的平衡来防止过早收敛。
交叉.交叉运算符以与有性繁殖相匹配的方式混合双亲之间的信息。杂交手术的目的是“生下”一个改良的后代。这是通过探索搜索空间的不同部分来实现的。
突变.突变过程改变每个字符串中随机选择的位的值,从而通过遗传数据的分散防止遗传算法停留在局部最小值,从而保持种群的变异。重复这个过程,直到达到最优解或经过预定的代数。
3.2.3.粒子群优化
粒子群优化(PSO)也是一种受生物学影响的优化算法。它是通过观察一群鸟和鱼的集体行为和群集而得出的[30.].该算法由称为种群的解组成,每个解都有一系列参数,这些参数表示多维空间中的一个坐标。此外,这些粒子的集合成为一个种群,这些粒子探测搜索空间以找到最优解。每个粒子在内存中跟踪它以前的最优解,然后将这些解标记为个人最佳解和全局最佳解。的轨迹我th粒子在d -多维空间中的定义为
蜂群的数量为
然后,粒子迭代更新它们在参数空间中的位置,当搜索最优解时使用 在哪里速度的分量是我th沿着d维的粒子t而且t +1,表示该进程连续运行两次。速度我th粒子定义在方程(15)中有三个术语:第一个术语是惯性,它阻止粒子急剧改变方向,第二个术语描述了粒子返回到先前已知的最佳位置的能力,最后一个术语描述了粒子向最佳位置移动(群集): 在哪里是个人最好的粒子,是全球最好的吗而且 ,在…范围内 ,分别为认知系数和社会系数。最后,R1而且R2这两个对角矩阵是由[0,1]中的均匀分布随机生成的吗?这确保了社会和认知成分对方程中的速度更新有随机影响(15).由于粒子是由个人最优解和全局最优解的收敛性导出的,因此两个加速项和轨迹的随机权值是半随机的。这要求方程(14)及(15迭代,直到满足停止条件。从算法上讲,我们有以下伪代码。
3.3.PSO算法
(1)N粒子初始化(一)初始化位置 (b)初始化粒子的最佳位置到其位置 (c)计算每个粒子的适应度,如果 ,初始化全局最佳as=xj(0)(2)重复操作,直到满足条件(一)更新粒子速度根据公式(15) (b)使用公式更新粒子位置(14) (c)评估粒子的适合度 (d)如果 ,更新个人最佳成绩:= (e)如果 ,全球最佳更新:= .(3)把最佳解决方案分配给在迭代过程的最后。3.4.分类
在对提取的特征向量进行优化后,建立分类模型来解决人脸识别的挑战。对于给定的特性集,该任务有无数个预定义的模型。其中包括SVM, KNN, K-means,欧几里得距离,VGGNet和CNN。其他预先训练的人脸分类器,如vg - face也存在,它估计主题的人脸图像与从数据库中人脸图像中选择的相关特征之间的相似性。在本研究中,使用了欧几里得距离(EUD)、k -最近邻(KNN)和支持向量机(SVM)。
4.方法实施
4.1.实现管道
本研究的实现管道如图所示1.从图中可以看出,每一张图像都要经过一系列的预处理和后续的特征选择,最后进行特征优化。对这些优化后的特征进行特征匹配训练。
4.2.环境设置
本研究中实现的人脸识别系统是在HP桌面处理器Intel®Core™i7-770T CPU @ 2.90 GHz, Linux Ubuntu 20.04 LTS操作系统上使用Matlab R2018b开发、训练和测试的。
4.3.图像预处理
图像分析的第一步是对图像进行预处理,以消除不必要的噪声。这些成分不利于图像的检查,因此通过预处理去除。所有尺寸大于96 × 84像素的图像都将进行下采样。接下来是将所有彩色图像转换为灰度。图像输出分为训练集和测试集。80%的图像被认为是训练集,20%作为测试集。该预处理的实现降低了计算复杂度,缩短了计算时间。
4.4.特征提取
本节将进一步说明本研究中使用的特征提取方法。本研究的目标之一是使用优化技术实现一个离线面部识别系统,该系统具有改进的鲁棒特征提取方法。这种方法将使用AT&T和YaleB人脸数据集进行测试,因为它们包含不同光照、不同姿势、遮挡脸、不同表情或它们的组合。计算特征的均值,选取每个图像的第一主成分特征。AT&T和YaleB数据集的平均面如图所示2而且3.,分别。
4.5.降维与特征选择
给定训练数据的计算平均面,将二元单例展开函数作为一个按元素计算的算子。所得图像用单值分解函数进行分解,以减少用于表征图像的系数。对角线矩阵的平方和的累积和计算得出主成分与第一个k所选组件的特征值。然后将特征向量归一化为特征面。这个过程在AT&T和YaleB数据集上的示例输出如图所示4而且5,分别。
再次,利用二元单例展开函数对测试数据进行均值面变换。然后对这些转换后的训练和测试数据进行优化,以获得更好的分类结果。
5.结果与讨论
本节详细介绍了实验结果和对结果的分析。此外,还将讨论使用同一数据库和三种不同分类器的其他优化方法之间的比较。
5.1.数值结果
通常,在记录面部识别模型的性能时,会使用诸如准确性、召回率、精度、F-measure等统计指标。为了有效地评价和与现有研究的有效比较,选择了精度度量。在不同的数据集上采用不同的优化方法计算了所有分类方法的识别精度。表1- - - - - -7显示使用不同分类方法的数据集的平均、最大和最小识别精度。该实验进行了1500次迭代,有/没有考虑提取特征的优化。
|
|
|
|
|
|
|
5.2.讨论
从节中显示的结果4.1,可以观察到,该模型在AT&T数据集上的性能总体上相当低。这可能是由于遮挡,不同的姿态,以及面部图像中表现出的表情,使其自然难以建模。相反,该模型的表现相对较好,因为它只包含不同照明的图像。从表1,可以看出,在YaleB数据集上,KNN和SVM的准确率最高,均为100%。然而,使用遗传算法优化特征后,KNN分类器显著降低到70%,使用欧几里得距离法降低了9.8%,如表所示3..如表所示,没有损失2而且4在进行ABC和PSO优化时,对KNN和SVM进行优化。然而,当使用EUD分类器时,PSO和ABC分别减少了4%和5%。因此,使用AT&T数据库的识别精度存在很大差异。如表所示,在未使用优化方法的情况下,AT&T数据库EUD、KNN和SVM的识别率分别骤降至29.94、77.84和82.051.然而,使用PSO优化技术可以将KNN的平均识别精度提高到80.46%。SVM分类器的平均识别率为59.85%,识别率下降明显。EUD对PSO的平均识别准确率为28.46%,如表所示5.相反,在使用KNN时,GA和ABC的平均识别准确率分别下降到47.05和66.78,在使用SVM时分别下降到54.86%和35.55%,分别从表中可以观察到6而且7.实验顺序如下。pca + eudpca + knnpca + svmpca + pso + edpca + pso + knnpca + pso + svmpca + ga + edpca + ga + knnpca + ga + svmpca + abc + edpca + abc + knnpca + abc + svm
通过观察,PCA + PSO + EUD的识别准确率为15.19%,低于79.83%,这是PCA + EUD对YaleB数据集的识别准确率。这表明粒子群算法对特征的优化效果较好,84.81%的实验结果较好。此外,KNN的识别精度没有变化。这一点与PSO不减少结果时,优化技术的执行。相反,SVM的识别准确率低于90%,不到1%。这表明,超过99%的PCA + PSO + SVM结果的识别准确率超过90%,95%的识别准确率为100%。因此,PCA + SVM减少5%可以认为是不显著的。最后一点,粒子群算法对EUD和SVM的优化效果很好。同样,PCA + GA + EUD的结果优于PCA + EUD的71%。而KNN和SVM分别比PCA + KNN和PCA + SVM的结果高60%和100%。 Yet still, PCA + GA + KNN shows significant decay of results from its default 100%. SVM, on the other hand, displays a negligible reduction in average recognition accuracy. With this, SVM seems to produce better results than both KNN and EUD with respect to the use of the GA optimization algorithm.
同样,YaleB数据集PCA + ABC + EUD的结果比默认的PCA + EUD的79.83%增加了28%的数据。然而,ABC优化的KNN和SVM的识别结果没有明显的损失,KNN和SVM的平均识别准确率分别为100%和99.6%。结果表明,ABC优化和KNN分类的结果适用于YaleB数据集,ABC对KNN和SVM的优化效果较好。表格8展示了使用EUD、KNN和SVM分类器在YaleB数据集上实现的PSO、ABC和GA优化算法的前20个总实验结果。然而,使用AT&T数据集时观察到的结果的大幅减少源于识别参数的增加。AT&T的数据集包含被遮挡的图像,它也有不同的姿势和表情。AT&T人脸数据集的PCA + PSO + EUD产生的结果平均低于数据库的PCA + EUD。1500个结果中51%的结果低于默认的29.94%的PCA + EUD。而AT&T数据库PCA + PSO + EUD的总体平均识别率为28.46%,如表所示5.可以看出,平均识别的恶化被其他识别的较大值所抵消。48%的结果高于默认的29.94%,这不是微不足道的,但这是一个很小的百分比。另一方面,KNN有31%的结果高于77.84%的默认识别。尽管如此,平均识别精度还是比默认情况高出3%。因此,80.46%的KNN与PSO优化特征(PCA + PSO + KNN)的平均识别精度是AT&T数据库的最佳组合,因为SVM的结果没有一个高于其82.05%的基线识别。PCA + GA + EUD的平均识别准确率为28.78%。这与以EUD为分类器的3种优化方法的平均结果相似。而遗传算法和ABC算法对KNN分类器的平均识别准确率分别为47.05%和66.78%。这说明GA的结果从77.84%萎缩到47.05%,ABC的结果是66.78%。 GA suffers 30% degradation, while ABC saw an 11% reduction in average recognition accuracy. Moreover, the average recognition accuracy for both GA and ABC for the SVM classifier plummeted further than that of KNN. A 27% reduction in average recognition accuracy using the SVM classifier for GA supersedes that of ABC, which has 46.5% reduction. Thus, it concludes that GA and ABC using SVM as the classifier is not suitable for this approach. The first 20 results are shown in Table9.
|
|
在实验过程中,SVM分类器再次使用线性核。与其他SVM核相比,该核具有提高计算时间的倾向,适用于高维数据[31].然而,这个实验中的线性核似乎牺牲了计算时间的准确性。因此,所选择的内核不会产生好的结果。其他核如多项式、高斯、径向基函数(RBF)或方差分析(ANOVA)可以在未来的研究中用于支持向量机,并将结果与所提出的方法进行了比较。同样的,表1表示在使用线性核和不使用优化算法的情况下,支持向量机是更好的分类器。因此,AT&T和YaleB数据集都为SVM产生了最好的结果。现在,比较表格2- - - - - -4,可以认为,对于所有元启发式算法和分类器的最大值,实现了100%的完美识别精度。这表明,无论使用哪种分类器,所有优化方法都可以用于YaleB数据库。相反,用于增强的算法的最大识别精度给人的印象是KNN分类器更好。这意味着PSO + KNN、ABC + KNN和GA + KNN具有比SVM更好的识别精度。这表明优化算法对SVM分类器产生的结果进行了降级。尽管如此,GA的最大识别效果还是优于默认的支持向量机(PCA + SVM)。因此,在选择具有线性核的SVM分类器时,应优先采用遗传算法。此外,该算法仅提高了EUD分类器所达到的最高识别精度。在此基础上,选择PSO作为YaleB和AT&T数据集的理想优化算法。将所提出的方法与其他方法进行比较,如表所示10所提供的方法比其他SOTA方法有效。本研究的成果提出了所提出的优化方法和分类器,并给出了表中各自的数据集11.
|
|
最后,表12显示每个实验所花费的时间。可以看出,PSO实验的平均时间最低,EUD、KNN和SVM的平均时间分别为1.594秒、1.592秒和55.46秒。PSO + SVM在所有实验中计算成本最高,为55.46s。而PSO + EDU和PSO + KNN试验所需时间小于2秒。随后,ABC和GA元启发式算法产生了与PSO相似的结果,但PSO的计算成本低于两者。
|
6.结论
本研究着眼于如何利用所选的优化方法增强主成分分析特征,以提高人脸识别模型的准确性。所提出的实现表明,选择PSO作为优化方法在真实世界的无约束环境中效果良好,因为姿态、遮挡和表情是在无约束环境中发现的主要人脸识别问题。对于支持向量机和KNN分类器,YaleB的默认识别准确率均为100%。然而,由于数据集的固有性质,ORL数据库并没有达到完美的识别。尽管如此,在所选特征上使用优化算法后,EUD的识别精度从82.63%提高到最高100%。这表明,这三种进化算法都可以用来提高结果的准确性。然而,由于ORL数据库迎合了3个参数,最大识别率没有达到100%,只有99.25%,使用PSO算法和KNN分类器是有希望的。最后,由于PCA + PSO + KNN方法能够处理参数的增加,并且优于其他SOTA算法,因此本文选择PCA + PSO + KNN方法进行研究。这些参数的增加使识别更接近真实世界的人脸识别。展望未来,本研究可以通过查看其他领域中使用的其他最近的群体智能优化模型来扩展,其属性是成本更低。其他具有更严格挑战的私有数据集可以用于进一步验证该模型。 This remains a limitation to this study.
数据可用性
用于支持本研究结果的辅助数据源可从AT&T数据库(https://www.kaggle.com/kasikrit/att-database-of-faces)和YaleB数据库(https://github.com/Suchetaaa/CS663-Assignments/tree/0426d951d0212ed3dd831377a0df11551670ab87/Assignment-4/1/CroppedYale).
利益冲突
作者宣称他们没有利益冲突。
参考文献
- S. Li和W. Deng,“深度面部表情识别:一项调查”,2018,http://arxiv.org/abs/1804.08348.视图:谷歌学者
- R. D. Labati, A. Genovese, E. Muñoz, V. Piuri, F. Scotti和G. Sforza,“自动边境控制中的生物识别”,ACM计算调查,第49卷,no。2, pp. 1-39, 2016。视图:出版商的网站|谷歌学者
- 张飞,余宇,毛q,苟杰,詹勇,“基于姿态鲁棒特征学习的面部表情识别,”计算机科学前沿,第10卷,no。5, pp. 832-844, 2016。视图:出版商的网站|谷歌学者
- S. Zafeiriou, C. Zhang和Z. Zhang,“野外人脸检测的调查:过去、现在和未来”计算机视觉与图像理解“,, vol. 138, pp. 1-24, 2015。视图:出版商的网站|谷歌学者
- Tu H., Li K.,和Q. Zhao,“姿态和表情标准化反照率图像辅助的鲁棒人脸识别”,ACM国际会议文集2019年第93卷。视图:出版商的网站|谷歌学者
- x.c hen, x.a an, g.a Liang, J. Liu, and n.c Zheng,“通过三重损失训练深度重建模型的姿态和光照不变人脸表示,”多媒体工具及应用,第76卷,no。21,页22043-22058,2017。视图:出版商的网站|谷歌学者
- C. Ding, C. Xu, D. Tao,“多任务姿态不变人脸识别”,IEEE图像处理汇刊:IEEE信号处理学会的出版物,第24卷,no。3, pp. 980-993, 2015。视图:出版商的网站|谷歌学者
- C. Ding和D. Tao,“关于姿态不变人脸识别的综合研究”,智能系统与技术汇刊,第7卷,no。3, 2016。视图:出版商的网站|谷歌学者
- M. Chihaoui, A. Elkefi, W. Bellil和C. B.。Amar,“2D人脸识别技术研究”电脑,第5卷,no。4,页41-68,2016。视图:出版商的网站|谷歌学者
- S. K. Fazilov, N. M. Mirzaev和G. R. Mirzaeva,“基于初等变换模型构造的改进识别算法”,计算机科学2019年,中国科学院学报,vol. 150, pp. 671-678。视图:出版商的网站|谷歌学者
- R. He, X. Wu, Z. Sun和T. Tan,“Wasserstein CNN:学习NIR-VIS人脸识别的不变特征,”模式分析与机器智能汇刊,第41卷,no。7,第1761-1773页,2019年。视图:出版商的网站|谷歌学者
- S. Rahimzadeh Arashloo和J. Kittler,“GPU上使用超耦合多分辨率马尔可夫随机场的快速姿态不变人脸识别”模式识别信《中国科学》,vol. 48, pp. 49-59, 2014。视图:出版商的网站|谷歌学者
- 郭宏源。Chan, K. Jia, S. Gao, J. Lu, Z. Zeng和Y. Ma,“PCANet:用于图像分类的简单深度学习基线?”IEEE图像处理汇刊,第24卷,no。12, pp. 5017-5032, 2015。视图:出版商的网站|谷歌学者
- W. Deng, J. Hu, Z. Wu,和J. Guo,“从一到多:用于单样本人脸识别的姿态感知度量学习,”模式识别2018年,中国科学院学报,vol. 47, pp. 426-437。视图:出版商的网站|谷歌学者
- Z. Chen, W. Shen,和Y. Zeng,“姿态不变人脸识别的稀疏表示”,国际工程建模杂志,第30卷,no。1-4页,第37-47页,2017。视图:谷歌学者
- 张涛,郑文文,崔智,宗毅,颜杰,颜凯,“一种基于深度神经网络驱动的多视角面部表情识别方法”,IEEE多媒体汇刊,第18卷,no。12, pp. 2528-2536, 2016。视图:出版商的网站|谷歌学者
- M. M. Ghazi和H. K. Ekenel,“基于深度学习的人脸识别表征的综合分析”,在IEEE计算机学会计算机视觉和模式识别研讨会论文集,第102-109页,美国内华达州拉斯维加斯,2016年7月。视图:谷歌学者
- M. M. Ghazi和H. K. Ekenel,“在野外使用静态和动态表示集合的自动情感识别”,在ICMI 2016会议记录-第18届ACM国际会议记录关于多模式交互,第514-521页,日本东京,2016年11月。视图:谷歌学者
- Z. Zhang, P. Luo, C. C. Loy,和X. Tang,“学习带有辅助属性的人脸对齐的深度表示,”模式分析与机器智能汇刊,第38卷,no。5,页918 - 930,2016d。视图:出版商的网站|谷歌学者
- C. Ding和D. Tao,“基于同构归一化的姿态不变人脸识别”,模式识别, vol. 66, pp. 144-152, 2017。视图:出版商的网站|谷歌学者
- R. Sharma和M. S. patath,“一种新的混合方法,使用PCA进行姿势不变人脸识别,”无线个人通讯第85卷,no。3,页1561-1571,2015。视图:出版商的网站|谷歌学者
- C. N. Duong, K. Luu, K. G. Quach和T. D. Bui,“深度外观模型:用于人脸建模的深度玻尔兹曼机方法”,国际计算机视觉杂志,第127卷,no。5,第437-455页,2019年。视图:出版商的网站|谷歌学者
- 段x,段志宏。Tan,“一种基于空间自相似性的不同姿态下人脸识别的特征学习方法,”模式识别信2018年,中国科学院学报,vol. 111, pp. 109-116。视图:出版商的网站|谷歌学者
- K. Singh, M. Zaveri,和M. Raghuwanshi,“基于粗糙集的基于面部照片的姿态不变人脸识别”,智能与模糊系统学报,第26卷,no。2, pp. 523-539, 2014。视图:出版商的网站|谷歌学者
- Y. Zhao, L. Li,和Z. Liu,“一种使用仿射不变特征进行姿态变化人脸识别的新算法,”计算机与电气工程, vol. 46, pp. 217 - 230,2015。视图:出版商的网站|谷歌学者
- K. H. Abdalhamid和W. Jeberson,“基于人工蜂群优化knn分类器的姿态不变人脸识别”,动力与控制系统高级研究杂志,第11卷,no。8,页525-539,2019。视图:谷歌学者
- Y.-D。张,Z.-J。杨,小时。Lu等人,“基于双正交小波熵、模糊支持向量机和分层交叉验证的面部情绪识别”,IEEE访问, vol. 4, pp. 8375-8385, 2016。视图:出版商的网站|谷歌学者
- G. Sang, J. Li,和Q. Zhao, 2016,基于RGB-D图像的姿态不变人脸识别。
- M. Haghighat, S. Zonouz和M. Abdel-Mottaleb,“CloudID:值得信赖的基于云的跨企业生物特征识别”,专家系统与应用,第42卷,no。21, pp. 7905-7916, 2015。视图:出版商的网站|谷歌学者
- M. Tiwari和A. K. Shukla "基于PCA和PSO的人脸识别系统(FARS)的实现”,人脸识别技术的最新进展,卷211007号6,页225-229,2016。视图:谷歌学者
- K. Sasirekha和K. Thangavel,“使用粒子群优化进行人脸识别的k近邻优化”,神经计算及应用,第31卷,no。11,页7935-7944,2019。视图:出版商的网站|谷歌学者
- S. Ahmadi和M. Rezghi,“基于多个变换对的广义低秩逼近矩阵”,模式识别《中国科学》,2020年第108卷。视图:出版商的网站|谷歌学者
- B. B. Benuwa, B. Ghansah,和E. K. Ansah,“基于局部敏感的人脸识别判别稀疏表示”,科学的非洲, vol. 7, Article ID e00249,2020。视图:出版商的网站|谷歌学者
- 周磊,李文伟,杜勇,雷波,梁生,“基于局部非线性多层对比特征的自适应光照不变人脸识别,”视觉传达与图像表示杂志中国科学院学报,vol. 64, Article ID 102641, 2019。视图:出版商的网站|谷歌学者
- 徐勇,钟哲,杨杰,尤杰,张丹,“一种新的基于$l_{2}$正则化的鲁棒人脸识别判别稀疏表示方法,”IEEE神经网络与学习系统汇刊,第28卷,no。10,页2233-2242,2017。视图:出版商的网站|谷歌学者
betway赞助
betway赞助版权所有©2021法官Kwame Appati等人。这是一篇开放获取的文章,在创作共用署名许可协议它允许在任何媒介上不受限制地使用、传播和复制,前提是正确地引用原始作品。