RFID世界网 > 新闻中心 > 行业动态 > 正文

人脸识别三部曲：人脸检测到人脸识别

作者：本站收录

来源：赛迪网

日期：2016-11-17 10:25:52

摘要：就像电影里用于识别特定人物一样，当今的安防领域也需要人脸识别技术抓捕犯罪嫌疑人，而且已成为案件侦破的关键利器。

关键词：人脸识别人脸检测生物识别身份认证

　　追捕目标的特工逆行在人群中，目之所及，每位迎面走来的行人，都会被特工所戴的隐形眼镜捕捉面部画面进而识别身份信息，电影《碟中谍4》中这令人赞叹的经典一幕，依靠的正是人脸识别技术。

　　电影《速度与激情7》中的“天眼计划”同样让人惊叹：头戴一个黑框眼镜，就可以对海底、地面和天空中的任何物体扫描图像，迅速识别符合特征的目标物，从而找到开启“天眼”的关键人物。

　　电影场景中神秘的人脸识别技术其实早已走进生活变为现实。就像电影里用于识别特定人物一样，当今的安防领域也需要人脸识别技术抓捕犯罪嫌疑人，而且已成为案件侦破的关键利器。

　　人脸识别技术是基于人的面部特征信息进行身份识别的一种生物识别技术，如此神奇的技术背后是需要一整套复杂的程序完成的，主要包括人脸检测、关键点检测和人脸识别“三部曲”。人脸检测主要依靠摄像头等硬件捕捉图像，关键点检测和人脸识别则依靠深度学习算法、三维动态人脸识别和超低分辨率人脸识别技术。

　　找到“脸在哪”是基础

　　人脸识别技术是通过人的面部特征进行身份识别的，所以首先需要找到“人脸图像”，从众多图像中定位“脸在哪”，这就是人脸检测的环节。看似一个简单的“挑选”过程其实大有门道。面对多种物体的图像信息时，需要采用特定算法才可智能挑选出“人脸图像”，找到“脸在哪”。我国已研发出“深度卷积检测网络”，从而同时学习人脸和非人脸的特征，帮助计算机准确找到“脸在哪”。此算法中，图像从层级结构的最低层开始被输入，然后再依次传输到不同的层，每层通过一个数字滤波器去获得图像的最显著特征。这个方法可以保证在图像平移、缩放或旋转下获得稳定的检测结果和图像特征。该算法已通过FDDB(Face Detection Data Set and Benchmark)公开数据库平台的测试，目前已在多个场景下的人脸检测中使用，为人脸识别技术的后续环节做好铺垫。

　　算法的先进和优越保证了准确定位“脸在哪”的顺利完成，这主要是在收集众多图像信息后进行的，不免让我们思考：能否在图像采集的同时就利用该算法智能定位“脸在哪”?

　　如此一来可以过滤掉非人脸图像，提高人脸识别效率。

　　多数情况下，图像采集通过摄像头完成。试想，如果所有图像都进入人脸检测环节，会加大运算负担、降低效率。就像“天眼计划”那样，从全世界的所有物体中搜索图像，工作量极其庞大，这也导致该计划只能停留在电影中。对此，很多企业开始加快芯片研发速度。上海凌简信息科技有限公司副总经理张亮指出，安防企业目前主攻研发可以内置于摄像头的智能芯片，实现采集图像的同时准确找到“脸在哪”，从而大大加快工作效率。如此看来，也许“天眼计划”真的能走进生活，让每个人通过一副眼镜“想找谁就找谁”。

　　弄清“这是谁的脸”是核心

　　在准确找到“脸在哪”之后，就进入了人脸识别技术的核心环节——关键点检测、人脸识别了。这个核心环节在于，通过眼睛、眉毛、鼻子、嘴巴、脸颊轮廓特征关键点和面部表情网，找出彼此之间的关联，最终判定这些图像是否为同一个人。就像《碟中谍》中的特工可以识别特定人物那样，捕捉关键点信息和特征后，对人脸图像智能分析就可快速知道“这是谁的脸”。

　　两大环节是人脸识别技术的核心，当然离不开强大的技术支撑。其中的三大利器——深度学习算法、三维动态人脸识别、超低分辨率人脸识别正是最吸引人之处。这三大技术合力，可以达到最高99.77%的识别准确率，即使是录像中的超低分辨率的图像也可以准确还原，让犯罪分子“原形毕露”。

　　为了更好了解相关技术的更多细节，本站为此采访了一家人脸识别解决方案提供商——旷视(Face++)。据相关部门负责人介绍，在算法的研发上，已经针对人脸识别应用设计了自己的“CNN卷积神经网络”，并通过卷积层和降维层大大降低了需要处理的数据量和计算量，提升了计算速度。算法提升依靠海量大数据的积累。通过标注化的图像数据对人脸识别算法进行训练，再通过产品和行业应用为用户提供智能化服务，海量大数据随着用户数量和调用次数而增长，这些数据又进一步为算法训练提供了教材，已经实现了数据、技术和产品的良性循环。

　　现实中，人脸图像多数是在人体活动时捕捉到的，并非一张简单的正面照。这种情况下的人脸识别会难度陡增，针对动态人脸，目前已研发出“三维动态人脸识别”技术，可以针对运动中捕获的人脸图像进行准确识别。通过人脸骨骼轮廓进行识别，保证在不同的光线、动态的情况下也能精确识别。这可以大大扩展人脸识别技术的应用场景，对环境不佳情况下采集的图像仍能弄清“这是谁的脸”。就像天眼计划里设想的那样，任何光线、动态、静态的场景下的人脸图像都能识别，就算化成灰也认得出来。

　　该负责人进一步说到，这个问题在技术上可以通过人脸区域自动曝光和3D降噪等技术实现人脸区域的优化。识别效果既与前端摄像机的硬件水准相关，也需要在算法上不断提升，二者缺一不可，双管齐下才能更好应对“不同的脸”。

　　在安防应用中，人脸图像不仅会面临动态中获取到欠清晰图像问题，还会面临所获取的图像分辨率极低的可能。试想，有的图像只有几厘米大小，像素分辨率只有不到10k，如此一说人脸识别技术就败下阵了?面对挑战，人脸识别技术选择迎难而上，这主要依靠“超低分辨率人脸识别”技术。据清华大学电子工程系教授苏光大介绍，对公安部门获取的犯罪嫌疑人的超低分辨率人脸图像，已研发出特定的图像还原技术。提取有限特征后，利用已掌握的人脸图像规律还原图像，之后与图像数据库中的每个人脸图像进行反复对比，从中选出相似度最高的人脸图像作为还原结果。据介绍，目前还原图像与实际人脸的相似度最高可达到99.77%。这也就意味着，只要在摄像头里“露脸”了，不管隐藏多深，都将无所遁形。

　　计算能力成瓶颈

　　从关键点检测和人脸识别来看，目前已经可以完成多条件、多场景下的人脸识别，甚至对像素很低的图像进行准确还原。但是，安防需求日益增长之下，所获取的图像也进入“大数据时代”，只有先进的算法显然“独木难成林”，还必须依靠计算能力的提升。试想，只有先进的算法，但计算机无法负荷海量图像同时分析，那人脸识别技术只能成为空谈。

　　对于提高计算能力的问题，行业内通行做法是采用多核CPU+GPU的处理器的方法，从硬件配置上提高计算能力。但是这种方法是一种类似“设备堆砌”的传统方式，如果运算量一直增长，单靠多核的方法是力不从心的，而且还会造成某种程度的资源浪费。因此，清华大学电子工程系教授苏大光认为，应该从根本上优化计算方法，利用高效地处理方法把人脸识别技术从硬件堆砌中解放出来，最大限度利用每个处理器的运算能力，整体上减少硬件配置数量。

　　为此，苏光大和其团队共同研发了“二维处理计算方式”，实现在单位系统时钟内处理上百个数据，提高以往的一维计算方式的运算速度和CPU使用率，事半功倍地高速处理海量人脸图像信息。据悉，此方式已通过专家组考核认证，未来将会大面积推广。提高计算能力将人脸识别技术的应用扩展到更多领域，而且也会让我国的人脸识别技术从处理器等硬件配置上摆脱对国外的依赖。优化计算方法后，可以用最少的CPU完成最多的图像处理，自主创新地发展中国的人脸识别技术。