视频中有光人脸光比被遮往的花镜头,怎么去掉

1.一种用于户外或光扰条件下人脸咣比识别特征码采集与识别的方法其特征在于:它包括采集图像多维的模拟光源以及采集图像信息的图像采集设备,通过图像采集设备获取被识别对象的多维度脸部特征码; 所述模拟光源是在指定场所,根据须进行人脸光比识别现场的光学条件应用电光源设备,模拟出與现场相近相似的光学环境; 所述图像采集设备是经对光学图像传感器进行处理,并加装遮光罩仅显示感光被识别对象脸部特征,能采集到清晰的被识别对象脸部特征的设备; 所述多维度脸部特征码是在模拟环境中,通过图像采集设备录取的以模拟光源数量为基数嘚各维度被识别对象的脸部特征,通过模数转换器芯片转换成数字信号再经计算机程序整合为完整的被识别对象脸部特征码,存储于身份卡或特征码库即数据库内供现场识别用的数据。

2.根据权利要求1所述的用于户外或光扰条件下人脸光比识别特征码采集与识别的方法其特征在于:将所采集的脸部多维特征码存储于被识别对象身份识别卡,在通过识别系统时被识别对象刷卡后读取到的脸部多维特征码,與现场拍摄扫描的脸部图像比对获得较多相吻合特征码,得以大幅提高识别通过率

原标题:关于人脸光比识别的最铨研究!

来源:北京物联网智能技术应用协会

本文内容涵盖人脸光比识别发展历程、市场研究、核心技术、商业应用以及产业落地、个人看法等干货研究注意,本文干货满满约有2万7千字,强烈建议大家先收藏后学习!

(3) 微软:2012年6月 微软亚洲研究院发布人脸光比检测算法面部识别系统

(4)网易:2012年5月,网易人脸光比识别系统全国公测用于邮箱登陆

(5)百度:2012年12月 百度推出人脸光比识别,基于图像的铨网人脸光比搜索

(6)阿里:2015年11月在推出支付宝刷脸认证付款

(7)腾讯:2012年下半年,成立优图项目组

05 人脸光比识别(FR)的产品落地

1. FR技术產品的优势

人脸光比图像的采集不同于指纹、掌纹需要接触指掌纹专用采集设备指掌纹的采集除了对设备有一定的磨损外,也不卫生嫆易引起被采集者的反感,而人脸光比图像采集的设备是摄像头无须接触。

人脸光比照片的采集可使用摄像头自动拍照无须工作人员幹预,也无须被采集者配合只需以正常状态经过摄像头前即可。

人脸光比是一个人出生之后暴露在外的生物特征因此它的隐私性并不潒指掌纹、虹膜那样强,因此人脸光比的采集并不像指掌纹采集那样难以让人接受

我们判断一个人是谁,通过看这个人的脸就是最直观嘚方式不像指掌纹、虹膜等需要相关领域专家才可以判别。

从摄像头监控区域进行人脸光比的采集是非常快速的因为它的非干预性和非接触性,让人脸光比采集的时间大大缩短

人脸光比采集前端设备——摄像头随处可见,它不是专用设备因此简单易操作。

它的采集端完全可以采用现有视频监控系统的摄像设备后端应用的扩展性决定了人脸光比识别可以应用在出入控制、黑名单监控、人脸光比照片搜索等多领域。

2. FR三大识别场景

  1. 简介:将某人面像与指定人员面像进行一对一的比对根据其相似程度来判断二者是否是同一人,相似程度┅般以能否超过某一量化阀值为依据简单的说就是A/B两张照片比对,产生的计算数值是否达到要求
  2. 产品应用:快速的人脸光比识别比对,移动支付认证、安全性身份核对、作为身份确认的一种新方式比如考生身份确认、公司考勤确认、各种证件照和本人确认。
  3. 实际问题:产品在系统设计的逻辑上需要先考虑调取已储存对象信息的先验条件。通过界面/语音的提示使得待认证者预先知道自己正处于被核對的过程中,且已预先了解拟核对对象的身份
  4. 比对来源的三种主要方式:
  1. 用户自传照片,比如支付宝的人脸光比比对用户自传的照片朂大的问题是照片质量的合格率太低,拍照的光线、角度等因素会导致采集源的质量下降不利于后期的大批量人脸光比特征码管理。
  2. 使鼡身份证读卡器读取身份证上的照片,遗憾的是这张照片2K的大小不过也是目前用最多的源照片提取方式,比较适合签到场合
  3. 使用公咹部旗下NCIIC的人脸光比比对接口(注意,不是网纹照片接口这个接口已经不对外),使用的是直接的人脸光比比对接口

将某人面像与数據库中的多人的人脸光比进行比对,并根据比对结果来鉴定此人身份或找到其中最相似的人脸光比,并按相似程度的大小输出检索结果

人脸光比开门、人脸光比检索,排查犯罪嫌疑人、失踪人口的全库搜寻、一人多证的重复排查等

  • 走失儿童的项目中去:这一类系统的蔀署需要两个条件:A. BCD基本库(比如1000万人)B.强大的算法硬件
  • 零售店中的刷脸支付长江,需要用户预先输入全手机号确定用户身份再进行人臉光比识别,将原本为1:N的问题转化为了1:1的问题

a. 1:N中的N能够支持多大

  • 场景多样化:从一个班级百号人刷脸签到,到一个公司千号人的刷脸打鉲再到一个学校的几万人,一个四线城市几十万人一个一线城市的几千万人,难度是呈指数上升的
  • 公司实际情况:目前各家公司的荿熟人脸光比识别应用能够支持几万到几百万人不等的应用场景,而且还有一个错误率的概念比如,公司宣称千万分之一的错误率的情況下(1/)人脸光比通过率其实只有93%,这是因为很难做到一定不发生错误而且每个人都能识别通过。(假如一家公司说自己能做到亿分の一的错误率通过率能做到98%以上,多半是虚假宣传在实际使用中是很难达到的)
  • 在配合场景下:比如ATM机刷脸取款,用户会自主配合將人脸光比以一个理想的角度通过识别。
  • 而在非配合应用场景下比如监控视频下的人脸光比识别,追踪违法犯罪分子的身份信息情况僦要困难得多。这种情况下用户脸部会发生角度偏大,遮挡光线不可控等问题。

c. 跨人种跨年龄识别问题

  • 研究发现,在一个数据集上訓练好的模型想到迁移到另外一个人种上,效果会出现较大程度的下降另外,人脸光比随着年龄的变化带来的改变也给人脸光比识别帶来不小的挑战
  • 要改善这样的问题,一个必要条件是需要建立一个足够完备的跨人种跨年龄的人脸光比数据库;在国内的话,是以汉族人为主同时跨年龄的人脸光比数据库也比较难收集,需要不短的时间跨度
  • 近来备受关注的刷脸支付,很多时候都会要求用户输入全掱机号或手机号后四位,以缩小用户搜索库大小实际上这是比较影响体验的。
  • 西安一高校晨读刷脸签到由于系统实际响应匹配时间過长,导致学生排百米长队

1:N同时作业就是N:N了,同时相应多张照片检索需求

  • 在视频级N:N的校验中,如果要提高通过率很多时候是采取降低准确率的方式,降低算法队列数量;同样在一些比赛中为了降低误识率大大提高了准确率,所以算法在校验的过程中必须遵循至少┅个固定标准追求的是速度效率还是最高准确率。
  • 视频流的帧处理所用对服务器的计算环境要求严苛,目前的算法系统所支撑的输出率非常有限

海量的人脸光比照片解析需要大量运算(目前很少看到在采集端直接解析的,都是照片剪裁)海量的人脸光比照片传输需要夶量的带宽(常见的720布控摄像头抓取最小的人脸光比照片为20K)海量的人脸光比照片在后台检索需要耗费大量的运算(国内主流主机为例朂多到24路摄像头)。

3. 产品实战中的物理问题

光照问题是机器视觉重的老问题在人脸光比识别中的表现尤为明显。由于人脸光比的3D结构咣照投射出的阴影,会加强或减弱原有的人脸光比特征

A、对其进行包括光照强度和方向、人脸光比反射属性的量化,面部阴影和照度分析等尝试建立数学模型,以利用这些光照模型在人脸光比图像预处理或者归一化阶段尽可能的补偿乃至消除其对识别性能的影响,将凅有的人脸光比属性(反射率属性、3D表面形状属性)和光源、遮挡及高光等非人脸光比固有属性分离开来

B、基于光照子空间模型的任意咣照图像生成算法,用于生成多个不同光照条件的训练样本然后利用具有良好的学习能力的人脸光比识别算法,如子空间法SVM等方法进荇识别。

与光照问题类似姿态问题也是目前人脸光比识别研究中需要解决的一个技术难点。姿态问题涉及头部在三维垂直坐标系中绕三個轴的旋转造成的面部变化其中垂直于图像平面的两个方向的深度旋转会造成面部信息的部分缺失。针对姿态的研究相对比较的少目湔多数的人脸光比识别算法主要针列正面、准正而人脸光比图像,当发生俯仰或者左右侧而比较厉害的情况下人脸光比识别算法的识别率也将会急剧下降。面部幅度较大的哭、笑、愤怒等表情变化同样影像着面部识别的准确率

  • 第一种思路:是学习并记忆多种姿态特征,這对于多姿态人脸光比数据可以容易获取的情况比较实用其优点是算法与正面人脸光比识别统一,不需要额外的技术支持其缺点是存儲需求大,姿态泛化能力不能确定不能用于基于单张照片的人脸光比识别算法中等。
  • 第二种思路:是基于单张视图生成多角度视图可鉯在只能获取用户单张照片的情况下合成该用户的多个学习样本,可以解决训练样本较少的情况下的多姿态人脸光比识别问题从而改善識别性能。
  • 第三种思路:是基于姿态不变特征的方法即寻求那些不随姿态的变化而变化的特征。中科院计算所的思路是采用基于统计的視觉模型将输入姿态图像校正为正面图像,从而可以在统一的姿态空间内作特征的提取和匹配

对于非配合情况下的人脸光比图像采集,遮挡问题是一个非常严重的问题特别是在监控环境下,往往彼监控对象都会带着眼镜帽子等饰物,使得被采集出来的人脸光比图像囿可能不完整从而影响了后面的特征提取与识别,甚至会导致人脸光比检测算法的失效

随着年龄的变化,面部外观也在变化特别是對于青少年,这种变化更加的明显对于不同的年龄段,人脸光比识别算法的识别率也不同一个人从少年变成青年,变成老年他的容貌可能会发生比较大的变化,从而导致识别率的下降对于不同的年龄段,人脸光比识别算法的识别率也不同

不同个体之间的区别不大,所有的人脸光比的结构都相似甚至人脸光比器官的结构外形都很相似。这样的特点对于利用人脸光比进行定位是有利的但是对于利鼡人脸光比区分人类个体是不利的。

人脸光比图像的来源可能多种多样由于采集设备的不同,得到的人脸光比图像质量也不一样特别昰对于那些低分辨率、噪声大、质量差的人脸光比图像(如手机摄像头拍摄的人脸光比图片、远程监控拍摄的图片等)如何进行有效地人脸光仳识别是个需要关注的问题。同样的对于高分辨图像对人脸光比识别算法的影响也需要进一步的研究。

基于统计学习的人脸光比识别算法是目前人脸光比识别领域中的主流算法但是统计学习方法需要大量的训练。由于人脸光比图像在高维空间中的分布是一个不规则的流形分布能得到的样本只是对人脸光比图像空间中的一个极小部分的采样,如何解决小样本下的统计学习问题有待进一步的研究

传统人臉光比识别方法如PCA、LDA等在小规模数据中可以很容易进行训练学习。但是对于海量数据这些方法其训练过程难以进行,甚至有可能崩溃

3.9 夶规模人脸光比识别

随着人脸光比数据库规模的增长,人脸光比算法的性能将呈现下降

非配合性人脸光比识别的情况下,运动导致面部圖像模糊或摄像头对焦不正确都会严重影响面部识别的成功率在地铁、高速公路卡口、车站卡口、超市反扒、边检等安保和监控识别的使用中,这种困难明显突出

伪造人脸光比图像进行识别的主流欺骗手段是建立一个三维模型,或者是一些表情的嫁接随着人脸光比防偽技术的完善、3D面部识别技术、摄像头等智能计算视觉技术的引入,伪造面部图像进行识别的成功率会大大降低

3.12 丢帧和丢脸问题

需要的網络识别和系统的计算机识别可能会造成视频的丢帧和丢脸现象,特别是监控人流量大的区域由于网络传输的带宽问题和计算能力问题,常常引起丢帧和丢脸问题

3.13 摄像机的头像问题

摄像机很多技术参数影响视频图像的质量,这些因素有感光器(CCD、CMOS)、感光器的大小、DSP的處理速度、内置图像处理芯片和镜头等同时摄像机内置的一些设置参数也将影响质量,如曝光时间、光圈、动态白平衡等参数

4. 实战中嘚数据标注

(1)一般来说,数据标注部分可以有三个角色

  1. 标注员:标注员负责标记数据
  2. 审核员:审核员负责审核被标记数据的质量。
  3. 管悝员:管理人员、发放任务、统计工资

只有在数据被审核员审核通过后,这批数据才能够被算法同事利用

  1. 任务分配:假设标注员每次標记的数据为一次任务,则每次任务可由管理员分批发放记录也可将整个流程做成“抢单式”的,由后台直接分发
  2. 标记程序设计:需偠考虑到如何提升效率,比如快捷键的设置、边标记及边存等等功能都有利于提高标记效率
  3. 进度跟踪:程序对标注员、审核员的工作分別进行跟踪,可利用“规定截止日期”的方式淘汰怠惰的人
  4. 质量跟踪:通过计算标注人员的标注正确率和被审核通过率,对人员标注质量进行跟踪可利用“末位淘汰”制提高标注人员质量。

数据标记完成后交由算法同学进行模型的训练,期间发现的问题可与产品一起商讨训练过程中,最好能可视化一些中间结果一来可以检测代码实现是否有Bug,二来也可以通过这些中间结果来帮助自己更好的理解這个算法的过程。

测试同事(一般来说算法同事也会直接负责模型测试)将未被训练过的数据在新的模型下做测试

如果没有后台设计,測试结果只能由人工抽样计算抽样计算繁琐且效率较低。模型的效果需要在精确率(识别为正确的样本数/识别出来的样本数)和召回率(识别为正确的样本数/所有样本中正确的数)中达到某一个平衡。

测试同事需要关注特定领域内每个类别的指标比如针对识别人脸光仳的表情,里面有喜怒哀乐等分类每一个分类对应的指标都是不一样的。测试同事需要将测试的结果完善地反馈给算法同事算法同事財能找准模型效果欠缺的原因。同时测试同事将本次模型的指标结果反馈给产品,由产品评估是否满足上线需求

(2)测试集和测试需求说明

比如“图片包含人脸光比大小应超过96*96像素,测试结果达到XX程度满足需求

  • 经典人脸光比身份识别测试集LFW,共包含13233 张图片 5749 种不同身份;世界记录99.7%
  • CK+ (一个人脸光比表情数据集),包含固定表情和自发表情包含123个人的593个表情序列。每个序列的目标表情被FACS编码同时添加叻已验证的情感标签(生气、厌恶、害怕、快乐、悲伤、惊讶)。

(3)需要说明“有效距离左右角度,上下角度速度”等参数值(范圍)

注:这和“部署的灵活性”相关——由于不同客户不同场景的需求不同,所以技术方的人脸光比检测模块一般可以通过调整参数得箌N种亚型,以适应不同应用场景(光照、角度、有效距离、速度) 下对运算量和有效检测距离的需求

(4)测试结果——欠拟合

  • 定义:模型没囿很好地捕捉到数据特征,不能够很好地拟合数据

左图表示size与prize关系的数据中间的图就是出现欠拟合的模型,不能够很好地拟合数据如果在中间的图的模型后面再加一个二次项,就可以很好地拟合图中的数据了如右面的图所示。

  1. 添加其他特征项有时候我们模型出现欠擬合的时候是因为特征项不够导致的,可以添加其他特征项来很好地解决例如,“组合”、“泛化”、“相关性”三类特征是特征添加嘚重要手段无论在什么场景,都可以照葫芦画瓢总会得到意想不到的效果。
  2. 添加多项式特征这个在机器学习算法里面用的很普遍,唎如将线性模型通过添加二次项或者三次项使模型泛化能力更强例如上面的图片的例子。
  3. 减少正则化参数正则化的目的是用来防止过擬合的,但是现在模型出现了欠拟合则需要减少正则化参数。
  4. 尝试非线性模型比如核SVM 、决策树、DNN等模型。

(5)测试结果——过拟合

  • 定義:模型把数据学习的太彻底以至于把噪声数据的特征也学习到了,这样就会导致在后期测试的时候不能够很好地识别数据即不能正確的分类,模型泛化能力太差例如下面的例子。

上面左图表示size和prize的关系我们学习到的模型曲线如右图所示,虽然在训练的时候模型可鉯很好地匹配数据但是很显然过度扭曲了曲线,不是真实的size与prize曲线

  1. 重新清洗数据,导致过拟合的一个原因也有可能是数据不纯导致的噪音太多影响到模型效果,如果出现了过拟合就需要我们重新清洗数据
  2. 增大数据的训练量,还有一个原因就是我们用于训练的数据量呔小导致的训练数据占总数据的比例过小。
  1. 交叉检验通过交叉检验得到较优的模型参数;
  2. 特征选择,减少特征数或使用较少的特征组合对于按区间离散化的特征,增大划分的区间;
  3. 正则化常用的有 L1、L2 正则。而且 L1正则还可以自动进行特征选择;
  4. 如果有正则项则可以考虑增大囸则项参数 lambda;
  5. 增加训练数据可以有限的避免过拟合;
  6. Bagging ,将多个弱学习器Bagging 一下效果会好很多比如随机森林等.

4.5 标注流程中遇到的问题

(1)项目过程Φ的不确定性

一般情况下,只要数据标注的规范清晰对规则的界定从一而终,标注工作的流程还是比较简单的

数据标注规范可能会在測试后根据结果情况进行调整,那么规则修改前后“数据标注的一致性”就出现了问题,会导致多次返工在时间和人工成本上颇有影響。

  1. 1)如是分类性质的解析工作建议标注规则先从非常肯定的非黑即白开始;规则设定由简到繁,带有疑虑数据再另外作记号随着规則一步步深入,可能会出现交叉影响此时就需要放弃一些低频问题的规则,余下的未标注的数据就根据新的规则标注
  2. 2)如是多类规则哃时进行的标注工作,需要把每类规则定得足够细致
  • 如询问机器人会干什么的语料中出现,“你说你会干什么”可以理解为询问,也鈳能是嫌弃这两类应对的策略不同,有歧义所以不能把它归纳如询问类,需要把它从训练集里剔除
  • 如人脸光比情绪识别中,一个人茬流眼泪有时可以理解为伤心落泪,有时可以理解为喜极而泣还有时可以理解为激动落泪,甚至是感动落泪等所以在看到此类照片時,不能简单的凭借惯性化思维将其归纳到悲伤一类中当人眼都很难判别清楚时,需要把它从训练集里剔除

5.1 某领域的人脸光比识别监測与身份确认

光照影响:过暗或过亮等非正常光照环境,会对模型的效果产生很大干扰

  1. 在用户可以更换环境的前提下(比如银行刷脸取錢等),可语音/界面提示用户目前环境不理想(头歪、头发、眼镜等)建议进行正确的正脸取照。
  2. 在用户不能控制更换环境的情况下(仳如人脸光比识别、车辆识别等摄像头固定的场景)只能通过调试硬件设施弥补这个问题。
  3. 晚上:由于摄像头在晚上会自动切换到黑夜場景(从图片上看就是从彩色切换为黑白)因此在晚上强光下(例如路灯照射)人脸光比就会过曝,这时我们可以通过强制设置摄像頭环境为白天(图像为彩色)来避免。而过暗的情况从节省成本角度看,可以在摄像头旁边增加一个光线发散、功率不高的灯来弥补當然这两个问题也可以通过购买高质量的摄像头解决,但这样做也意味着更高的成本
  4. 白天:白天也会出现光线过亮的情况,这种情况可鉯考虑用滤光片等等

用算法将图片进行处理,可以将图片恢复得让人眼看清的程度

5.2 某款人脸光比年龄识别产品

一款识别人脸光比年龄嘚产品对女性某个年龄阶段(25—35)的判断,误差较大经过发现,是因为该年龄阶段有以下特点:

  • 女性在这个年龄阶段面貌变化不是很大有时人眼给出的判断误差都很离谱。
  • 在这个年龄层次的女性注重打扮化妆品很大程度上掩盖了其真实年龄,有时30多的跟20岁没多大差别;C. 精装打扮的和素颜的差别不是很大
  • 补充数据:针对该年龄层次的人脸光比图片数据做补充。不仅补充正例(“XXX”应为多少岁)还应補充负例(“XXX”不应为多少岁)。
  • 优化数据:修改大批以往的错误标注
  • 数据总结:对化妆和不化妆的人脸光比图片进行分析,以便调整算法参数
  • 自拍:如女性群体一般都希望自拍时,年龄的判别在心里预期中能越小越好当在和一群人自拍中可以适当的将主人公的年龄判别结果调低至达到用户心理满足感。此时可适当降低算法的参照度
  • 婚恋交友:在婚恋网站交友过程中,双方都希望知道彼此的真实年齡信息此时运用人脸光比年龄识别可以分析双方的年龄、皮肤等物理信息为彼此提供参考。此时的信息就不能以达到心理满足感为主了应当追求准确度。

在背景出现多人或宠物时相机有时并未能精确定位出目标用户,而定位到背景图片中的人、宠物、身旁的其他人;囿时屏幕一片漆黑;有时显示未检测出人脸光比

  • 从产品角度:界面提醒用户远离复杂背景,或美颜时最好屏幕中只出现一人或给出方框图让用户自己手动选择主要定位区域进行AR美颜;屏幕一片漆黑时可提醒用户是否是光线太暗,或是摄像头被障碍物遮挡等;
  • 从算法角度:可对人脸光比关键点进行定位计算目标用户与摄像头的距离或计算人脸光比在频幕的区域占比来确定目标用户(一般几何距离近的、頻幕区域占比较大的为美颜目标),结合活体检测来排除背景图片人物的干扰等

光线太暗、运动、对焦等造成模糊(摄像头距离因素,慥成图像低频存在高频流失等)

  • 从产品角度:可提醒用户在光线较温和的区域进行美颜操作;或是擦除前置摄像头的障碍物;或文字提礻动作太快;或是更换高清前置摄像头;或提示对焦失败,给与对焦框图让用户手动对焦等
  • 从算法角度:在美颜前可在后台中调取手机煷度调节功能,用算法调节光线的亮暗程度以适应美颜所需的物理条件;用算法设法补齐高频部分从而减少对照片的干扰。

(3)人脸光仳关键动作抓捕太慢

在进行AR美颜搞怪时(如张嘴动作屏幕出现音符、唾沫星子等)对动作抓捕太慢(半天才抓捕到张嘴动作)。

  • 从产品角度:文字提示不支持快速移动或提示缓慢移动(如亲!您的动作太快了,奴家还未反应过来等)
  • 从算法角度:人脸光比姿态估计、关鍵点定位来捕捉人脸光比动作

(4)关键位置添加虚拟物品失败(如在嘴上叼烟、耳朵吊耳环、眼镜戴墨镜、脸显红晕)

  • 从产品角度:文芓/图片提醒用户摆正人脸光比位置。
  • 从算法角度:可利用算法对人脸光比关键区域进行分割并定位来达到人脸光比精准定位添加虚拟物品

5.4 人脸光比开门和人脸光比检索

(1)人脸光比开门等跨网方案需要关注的因素

  • 远程算法更新:远程算法更新必然会造成本地局域网功能暂時性无法使用。因此远程算法更新的频率、时间、更新效果都需要产品在更新前精确评估
  • 增删改人脸光比数据与本地数据的同步:本地局域网和互联网是无法直接交互的,因此用户在互联网一旦对人脸光比数据库进行增删改的操作下发程序的稳定性和及时性都需要重点關注。
  • 硬件环境:本地存储空间的大小和GPU直接影响到本地识别的速度服务器的稳定性影响到功能地正常使用。
  • 守护程序:断电等外置情況意外情况发生又被处理完善后程序能自动恢复正常。

(2)人脸光比检索等某一局域网方案需要关注的因素

  • 速度:除了算法识别需要消耗一定时间外该局域网下的网速会影响到识别结果输出的速度。
  • 数据库架构:通过检索结果关联结构化数据
  • 阈值的可配置性:在界面設置阈值功能,从产品层面输入阈值后改变相对应的结果输出。
  • 输出结果排序:根据相似度排序或结构化数据排序内容地抉择

5.5 旷视科技官网产品体验(多图预警)

(1)年龄略有差距自我估计+-5,性别基本无误头部状态略有误差,人种误差在30-40%(样本量10白种人和黄种人误差明显),情绪基本无误眼镜种类识别有误差(商品识别的范畴),强光状态下表现不佳

(2)逻辑错误:左眼(睁眼、普通眼镜)、祐眼(墨镜);相似度大(下图为张一山和夏雨)的较难区分(双胞胎估计很难区分)

(3)远距离检测较难:左图检测出一张,右图检测絀两张(估计10米开外检测不到)

(4)能够识别蜡像、海报等非真人场景因此在一些场合可欺骗摄像头,如在金融领域里的身份识别海關检查等关键性应用中,将会有风险

(5)佩戴的口罩无法检测出人脸光比

(6)公司体验对比结果

6. 项目虚拟实战(以AR美颜APP为例,过程为理論经验推理所得自己并未实习)

人脸光比检测系统下,有很多FR相关的应用比如人脸光比属性识别(年龄、表情、性别、种族等)、人臉光比美颜/美妆、人脸光比聚类等等。我们从AR美颜/美妆这一个例子着手探索项目的具体流程。

场景及痛点:现在大多数美颜相机拍照后都只有添加各种滤镜、加几个字、变白一点,早已经不能满足广大女性群体对于美颜的需求;加上如今年轻女性和男性的审美标准和猎渏心理都在发生改变社交方式的趣味性也变得不同,比如原来大家可能在空间、朋友圈、直播上看到美女帅哥都会觉得很吸睛点赞粉絲直奔而来,但随着快手和抖音的出现可以发现不仅仅是俊男靓女的照片和视频能引起围观,同样的各种普通群众的搞怪合成视频或合荿照片(虚拟的AR特效带来的各种浮夸造型)同样能吸引无数粉丝的追捧让普通人也能享受被人膜拜的满足感,而这些都需要用到人脸光仳识别的相关技术

(2)目标用户画像分析

  • 了解目标用户的主流群体:学生(大学生、高中生、初中生)群体对月美颜美妆的心理需求、時尚人士的美妆需求、长相普通的人和长相突出的人对于美颜的心理需求等。
  • 了解用户的年龄组成、地域分布对应美妆的特点
  • 不同收入群体(白领、金领、蓝领等)的美颜美妆需求关注点。

美颜美妆的市场规模产业链,潜在的边际效应利益等

详细的分析目前的用户需求,针对不同群体设计不同的产品解决方案,包括市场的需求文档

前期的人脸光比图片收集、分发、标注总结文档(确定什么样的图爿能要,什么样的不能要)各种脸型(长的、宽的、圆的、前额凸出的、眼睛深陷的等等)的分类,多少人完成眼睛美颜图片的分类等

  • 场景落地文档:如听歌时头上戴虚拟耳机,叹气时嘴上叼烟说话时唾沫星子等针对不同的人脸光比姿态场景研究可能的落地产品形式。
  • 产品的设计文档:如美颜APP的页面交互设计、导航设计、视觉呈现设计等;直播APP中的弹幕呈现设计、点赞分享按钮设计等
  • 产品开发流程攵档:如PM先提交需求、可行性分析、立项、设计流程、开发流程,算法搭建、模型训练、测试训练等一系列流程的步骤及跟进
  • 模型训练忣测试文档:数据标注好后,喂给算法搭建人脸光比识别美颜的模型框架,如前期用成千上万的照片训练机器的人脸光比关键点定位讓机器找准鼻子、眼睛、耳朵、嘴等位置等。

在文档的指引下从公开网站上爬取收集符合模型训练的人脸光比图片、或是运用公司的数據图片等

在标注规范文档的指引下,将图片分发给标注团队进行数据的标注对一些模棱两可的图片,如图片中的人脸光比较模糊此时該照片是要还是不要,期间应与算法同事保持沟通有时暗的图片在算法的优化中能准确识别,这样增加实际情况的容错率(实际中较暗嘚人脸光比图像也能定位出关键部位)那么这张图片则视为有效数据;有时较暗的图片经过算法之后并不能达到要求(及无法定位出人臉光比关键点),此时这照片则视为无效数据直接剔除;但是标注团队并不知道这张图片是有效还是无效,所以标注过程中算法同事吔需间接参与进来。

在部分图片标注过程后交于算法同事训练模型调节参数,期间将测试后的数据(精确率和召回率的计算来反映数據的标注结果)反馈给还在标注的人员,有时可能造成过拟合有时可能造成欠拟合等方便对数据进行重新操作

(1)产品立项后,每天的任务管理流程进度跟踪,产出时间管理开会反馈工作成果等。

(2)软硬件端:在开发流程文档的指引下按照常规的软硬件跟踪开发。

(3)算法流程:人脸光比采集、人脸光比检测、图像的预处理(模糊的则用算法去模糊等)、人脸光比特征提取、图像的匹配识别、AR虚擬等

  1. 模型识别时间、准确率、召回率测试
  2. 其他平台、硬件产品常规测试

经过各种测试之后,针对反馈回来的数据进行产品的优化

如一張嘴就给你来根烟,结果烟插到鼻子上了这就明显是没有定位到人脸光比关键点,是数据的原因还是算法的原因这些都要经过优化处悝;经过种子用户测试后,反馈得知这个点赞按钮操作起来有点别扭应该怎样怎样,这时可能要与设计的同学讨论一下该怎样优化产品的设计和体验。

产品按照流程功能进行验收后上线

下面附上总结这篇系列文章的思路导图:

我要回帖

更多关于 人脸光比 的文章

 

随机推荐