你好,欢迎访问达普芯片交易网!|  电话:010-82614113

达普芯片交易网 > 新闻资讯 > 时事热评

多方案竞逐人脸姿态场景 “特征层”对齐能否破解精度难题?

 

为了解决这种现实无约束场景下影响人脸识别精度的类似问题,算法端需要做很多的针对性的工作。其中,主要以如何实现非正面角度下人脸对齐为重,即实现人脸识别的正面化修正。有受访企业发言人对记者介绍:“目前,业内在显示人脸对齐方面的工作主要有几大类,第一个就是SPAE,这是一种采用自动标定AutoIncoder的网络将人脸识别进行正面化的操作,提升人脸识别模型在大姿态应用下的鲁棒性。考虑到单个网络很难很好的将不同的大姿态人脸进行矫正,这个工作就提出了使用多个堆叠的网络将侧面姿态的人脸逐步矫正到一个正面的姿态。”

 

具体来讲,这种方法是将采集到的90度人脸预先通过一个AutoIncoder网络转到60度,然后再从60度转到45度,通过这种方式逐步将有角度的人脸图像转换成正面的人脸图像,实现人脸图像的正面对齐。不过,这种方案也有缺陷,该受访人认为:“它的不足之处在于,没有把人脸识别特征的表示和人脸正面化的过程同时考虑到,来进行整体化的学习。”

 

AA4.jpg

 

而另外一种,则是通过生成对抗网络设计带有编码和解码能力的网络模型,来提高在现实情况下人脸识别精度。其中,编码器的输入是任意姿态的人脸,解码器的输出就是网络生成的特定姿态的人脸,生成器的输入是人脸图像,包括姿态编码和随机噪声。这个工作虽然会生成一张任意姿态的人脸,该受访人解释到:“但是它在做人脸识别的时候是采用姿态解耦和特征向量来进行姿态识别的,然后在人脸识别的精度方面也有了一定的提升。它的核心出发点就是要把人的身份信息特征和表示人姿态的特征进行解耦,解耦以后得到了带有身份信息的模型就更适合做人脸识别。”

第三种方案则是LDF,这也是一个显示人脸正面化的方法。该受访人进一步补充到:“这个工作也是从学习偏移场出发,并结合深度学习网络,实现了姿态鲁棒的人脸识别。LDF分两个阶段,第一个阶段是学习一个从侧面到正面姿态的偏移场,这也是通过卷积神经网络来学习的,通过偏移场进行网络的初始化,在得到正面的人脸之后,第二个阶段就是使用卷积神经网络进行特征的表达,而这两个部分,都是通过端到端来进行训练。”

但在张杰看来,上述方案或多或少都有自身的缺陷,而且流程繁琐,不适宜广泛化的推广普及。中科视拓则采用的是特征层上的人脸对齐方案,张杰表示:“我们考虑到人脸识别最终用的是特征,因此我们把特征层面的对齐和人脸识别特征的抽取进行学习。和之前介绍的方案相比,我们的方法不需要恢复正面的人脸,而且可以处理任意姿态下的人脸识别的问题,在测试过程中我们也是不需要姿态信息进行输入的。”

那么,如何在特征层面进行人脸对齐呢?张杰认为:“传统的方案用在物体检测上面,比如猫和狗都是非刚性的物体,而人脸则是刚性的,具有很强的结构性,考虑到人脸的结构性,我们就考虑到学习偏移场的时候方向上也需要有一致性,为此,我们提出了DFN方法,设计的偏移场生成器从浅层特征上跟人脸进行对齐的。和上述不一样的是,我们是在特征层面上进行对齐的,不需要使用偏移场去对齐,省去了很多繁琐的流程。同时配以损失函数,一起作用之后就能实现不同特征下的人脸对齐。一般来说,在90度的条件下,人脸正面化的效果可能就不太理想,但由于我们是在特征层面上进行识别的,因此在90度的角度下,结果显示我们的方案取得了很好的效果。这种方法不仅拥有更强的特征一致性,而且在一定程度上还能够解决姿态对人脸识别精度的影响,同时还一并能够支持姿态信息对模型进一步扩展,模型精度也有了进一步的提升空间。”

不过,在解决因实际场景中人脸姿态造成的精度问题上,任何一种方案的实际效果仍有待市场和应用端的长期检验。毕竟,正面人脸生成过程中的处理方法各不相同,即使再具优势的方案,不同场景和环境下的表现也会迥异,甚至某些情况下还会出现能够还原出一张完整漂亮的人脸,却并不一定是能够进行正确识别的问题。更何况,抛去精度以外,人脸识别在实际场景中还有更多更现实的问题,比如多场景下的数据采集和难以获取清晰数据等等,这也是人脸识别算法提供商未来需要长期耕耘和攻坚的方向。因为,随着网络结构的不断强化,未来市场必定需要更具鲁棒性的算法方案。如何利用现有的2D技术结合3D方案,提升人脸识别的精度和准确性,向全3D人脸识别方向过渡,才是真正实现高精度人脸识别大规模实用化的最佳路线。

 

热点排行

在线人工客服

点击这里给我发消息

点击这里给我发消息

点击这里给我发消息

010-82614113

客服在线时间周一至周五
9:00-17:30