在进化中,人类的大脑已经学会了对人类的面孔格外敏感,有时人们从一些非人事物中也能看出“人脸”形状就是这种能力的表现之一。
众所周知,人脸识别在摄像头无法捕捉到完整面部图像的情况下很难获得理想的效果。最近布拉德福德大学的研究人员在不完整面部识别方面获得了突破性进展,实验表明,扫描整个面部的3/4、甚至1/2的识别准确率能够达到100%!
但如果面部只有一半区域可见,人们还能识别出眼前的面孔吗?近日,布拉德福德大学的研究人员的新发现表明,人工智能可以做到。
基于计算机的人脸识别已经成为一种成熟且可靠的机制,实际上已被应用于许多访问控制场景,不过目前面部识别或认证,主要使用全正脸面部图像的“完美”数据来执行。但实际上,有许多情况下比如闭路电视摄像机往往只能拍到脸的一侧,或者如果被拍摄者戴了帽子、口罩等遮挡物,就无法获得完整的正脸。因此,使用不完整面部数据的面部识别是一个亟待开发的研究领域。
通过使用人工智能技术,该团队对四分之三和一半人脸的识别率都达到了100%。这项研究发表在《未来世代计算机系统》(Generation Computer Systems)杂志上,是第一次使用机器学习来测试人脸不同部位识别率的试验。
来自布拉德福德大学的研究团队的最新研究在不完整面部识别方面,取得了突破性进展,实验使用最先进的基于卷积神经网络的架构以及预先训练的VGG-Face模型,使用余弦相似度和线性支持向量机来测试识别率。团队在两个公开可用的数据集(受控的巴西FEI和不受控制的LFW)上进行了实验。
首席研究员、布拉德福德大学的哈桑·尤格里(Hassan Ugail)教授说:“人类识别人脸的能力令人惊叹,但研究表明,当我们只能看到人脸的一部分时,这种能力就会开始减弱。”
实验表明,扫描整个面部的3/4、甚至1/2的识别准确率能够达到100%!除此之外,团队还研究了面部的某个独立的部位,比如鼻子、脸颊、前额或嘴巴的识别率,以及图像的旋转和缩放对面部识别主体的影响。结果发现,如果只针对面部的某个独立的部位,比如鼻子、脸颊、前额或嘴巴,识别率总是相对较低。
“在从大量人脸中识别一张人脸方面,电脑已经比人类表现得更好,所以我们想看看他们是否也能在部分人脸识别方面表现得更好。”
据悉,这是第一个使用机器学习来测试面部不同部位识别率的研究,论文已发表在Future Generation Computer Systems上。下面新智元对本次实验进行介绍。
研究小组使用了一种被称为“卷积神经网络”的机器学习技术,利用了一种名为VGG的特征提取模型。
人类可以不受环境影响的识别人脸,那么计算机也可以吗?
他们使用的数据集包含了来自巴西大学的200名学生和工作人员的多张照片,共计2800张,男女人数相同。
面部是人类生命中视觉系统中绘制得最多的图片,所以大部分人类拥有卓越的面部识别能力。一般来说,我们不需要像面部识别AI那样必须正视别人的正脸才能识别出对方,通常对于我们只要一瞥即可分辨。
在第一个实验中,研究小组只使用完整的面部图像来训练模型,然后他们进行了一个实验,看看计算机识别人脸的能力有多强,即使只显示其中的一部分。
www.337.net,普遍认为大脑通过记住重要的细节,例如与眼睛,鼻子,前额,脸颊和嘴巴相对应的关键特征的形状和颜色,对面部进行区分。此外,人类大脑可以应对不同光线环境下、不同面部表情,以及远处面部的显著变化。
实验结果证明,电脑能够百分之百地识别完整的人脸,但对四分之三的人脸以及只有上半部分或右半部分人脸的识别也取得了百分之百的成功。然而,电脑识别人脸下半部分的准确率只有60%,识别眼睛和鼻子的准确率只有40%。
然而,与此相反,任何在光线、表情、姿势和即眼镜或胡子等等的变化,都可能对计算机的识别率产生巨大影响。不过,因为计算机处理海量数据的能力不断提高,可以认为机器算法至少在面部匹配方面拥有优异的表现。
在使用部分面部图像对模型进行训练后,他们又进行了一次实验。这一次,对于下半张脸,对于只有眼睛和鼻子的人脸,甚至对于看不见眼睛和鼻子的人脸,电脑的得分都有了显著的提高,达到了90%左右的正确识别率。
顺着这个逻辑,研究团队使用有遮挡的不完整人脸照片作为测试集,下面是一个测试集的示例图片,以及计算机对不完整人脸照片的识别过程。
在两个实验中,鼻子、脸颊、前额或嘴巴等面部单独部位的识别率都很低。
哈桑教授说,研究结果很有希望:“我们现在已经证明,从只显示脸部部分的图像中进行非常精确的面部识别是可能的,我们已经确定了哪些部分最有用。这为安全或预防犯罪技术的使用开辟了更大的可能性。”
示例图片
“我们的实验现在需要在更大的数据集上进行验证。然而,在未来,用于面部识别的图像数据库很可能也需要包括部分人脸图像,这样,即使有些人脸图像不是全部可见,也可以对模型进行正确的训练来识别人脸。”
本文转自前瞻网。转载目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与我们联系,我们将在第一时间删除内容!
识别过程
使用CNN和VGG-Face,利用两个分类器进行不完整人脸的识别
团队主要研究面部的不同部分如何有利于识别,以及在机器学习场景中如何在对面部照片进行不同程度旋转、缩放的识别。实验使用基于CNN的架构以及预训练的VGG-Face模型来提取特征。然后使用两个分类器,即余弦相似度和线性SVM来测试识别率。下图表现了特征提取步骤的概述:
遮挡脸部的示例图片
基于VGGF的特征提取过程
VGG-Face模型
目前最流行和广泛应用于人脸识别的是VGGF模型,由Oxford Visual Geometry Group开发。该模型在一个超过2.6 K个体的2.6M面部图像的巨大数据集上进行训练。
在VGGF中,其中13层是卷积网络,其他是ReLU、pooling的混合体,最后一层是softmax。
13个卷积层
为了确定VGGF模型中用于面部特征提取的最佳层,通常必须进行一些试验和错误实验。在本实验中,团队发现最好的结果来自第34层。值得注意的是,该层是完全连接的层,位于神经网络的末端,这意味着提取的特征代表代表了全脸。
特征分类:为什么使用余弦相似度和线性SVM
本次实验中,研究团队使用了余弦相似度和线性SVM分类器。做出这样的选择基于两个原因:首先,团队测试了其他分类器后发现CS和线性SVM的效果最好;其次,通过实验和分析,团队发现这两个分类器能够更准确地分离数据。
余弦相似度
两个向量间的余弦值可以通过使用欧几里得点积公式求出:
给定两个属性向量, A 和B,其余弦相似性θ由点积和向量长度给出,如下所示:
这里的Ai和Bi分别代表向量A和B的各分量。
本次实验需要计算CS以通过使用Eqs找到测试图像和训练图像之间的最小距离。如图8所示:
线性SVM
SVM是一个二元分类算法,线性分类和非线性分类都支持。经过演进,现在也可以支持多元分类,同时经过扩展,也能应用于回归问题。在本实验中,研究团队对两种SVM都进行了测试,发现当使用部分面部作为测试集的时候,线性SVM能够获得更好的效果。
例如,对于右脸颊,线性SVM的识别准确率达到了24.44%,而具有径向基函数的非线性SVM的识别率仅为2.77%。
本文由www.337.net发布于科技中心,转载请注明出处:鬼都藏不住,人脸识别新突破!就算遮住半张脸