我国人脸识别的准确率非常之高,已经达到了百分之九十五以上,牛脸识别的准确率是多少呢?能不能进行商业化推广?笔者从事多年面部识别,经常有朋友问到这个问题,这里就做个科普性介绍。
十年前,随着人脸识别的兴起,国内互联网大厂蜂拥介入牛脸猪脸等畜脸识别,因为准确率难以提高导致的难以商业推广,现在已经基本停止。
牛脸识别的准确率,与学习样本数、基准身份证的精确采集、特征点的选择及数量、动物的成长时间差、比对动物的数量等各种因素密切相关。一般类似实验室条件下,以上因素做到极致,并且比对动物的数量在百头以下,可能达到百分之九十左右。如果是实际场景,一般就在百分之七八十甚至更低。下面就各种影响因素与人脸识别进行逐一对比讨论:
首先,动物基准身份证的难以建立。脸部识别要有一个基准身份证。人有身份证,动物也要建立这个基准身份证以选择特征点。
人的身份证照片拍摄,相信大家都有体会:具备资质的照相馆、布置后的白色背景、有经验的摄影师,灯光的调整,身体及头部的调整,拍摄好上传公安系统审核是否合格。
这一切基于人是理性听话的,动物怎么办?而且动物脸部识别要左中右三面,只能是围绕动物脸部拍摄一小段视频,后台尽可能抓取合适的照片来作为基准。但动物对人的恐惧,怎么能听话的任你拍摄?何况背景及光线怎么处理?拍摄者是否专业?拍摄的设备是否一致?所以动物基准身份证的准确建立是个无比繁琐的问题。基准身份证不准,下一步的比对怎么能准?
其次,动物的成长性困扰。成长就会发生变化,人一般也要根据成长,从青少年开始,十年或二十年更换身份证。而动物的成长更快,几年甚至几个月就要长大出栏或淘汰,几个月或半年就做一次基准身份证吗?
第三,种群的区别以及大规模样本数的模型学习带来的问题。人类也分黄白黑等人种,每个人种都要建立学习模型,要大规模的样本数提供给模型学习。我国对白种人及黑种人的识别率就远远低于黄种人的识别率。而同一种动物,比如牛的种群类要远远多于人类,肉牛、奶牛、肉奶两用牛、牦牛等等,这些牛按产地不同又有很大不同,比如肉牛中的黄牛,相邻省份就可能不同。再加上引进的国外各种牛,比如西门塔尔牛、安格斯牛等等,还有国内各地对这些牛互相之间的杂交牛及二次三次杂交牛,种类如此繁杂,就要分别建立模型,进行大规模的样本数进行学习。
我国对黄种人的人脸识别经过了千万级别样本数的学习。牛脸识别,某一种牛,样本数几千几万的采集都不容易。种类如此之多,每一类都要建立模型收集样本数来学习,这如何能做到?
第四,动物比对的近亲属相似性带来的不准。动物一般是近亲繁殖,比如猪的养殖,一个养殖场的某一代猪,基本就那几个父亲,一个栏里的一二十头基本是同一个母亲。而人类双胞胎的人脸识别还没有解决,猪虽然不是同卵,但也是极其相似,更何况其快速的成长性。
所以,现在谁来谈猪脸识别,谁就是骗子无疑了。 牛比猪的情况要好一些,一般是单胎。但种公牛也是那么几头,而种母牛又是高度近亲。这高度的相似性,必然导致识别准确率的极大降低。
第五,死活比对带来的严重偏差。 以上四点是活活比对之难,而死活比对更是难上加难。比如牛脸识别在个别保险公司的试用:承保时对动物建立基准身份证,动物死了进行理赔。这就要进行死活比对了。
动物死了,面部每时每刻都在发生变化,一个小时的变化已经非常大了,何况保险理赔到达现场的时间很难按小时计,这识别率怎么能高?
最要命的是每头死牛由于环境季节,每时每刻的变化不同,怎么抓取样本来学习?这已经是无解问题了。
综上,我们已经明白了牛脸识别的准确率非常低。
而如此低的识别率,有些使用者,比如对准确率要求近乎百分之百的保险行业,理赔时面对的还是死活比对,但试用的个别公司却感觉很准。为什么?
技术提供方调整了相似度阈值! 为了看似高的准确率,将相似度阈值从100调整到了50。这样能不准吗?
但是,承保时候的牛叫张三,现在死的牛,可能是张三也可能是李四、王五、赵六等等。如果李四王五赵六等牛之前并不在承保范围内呢?保险公司一样要赔付。
目前,除了个别的商业性试用,规模的商业性推广基本没有。除了准确率低,还有一个重大问题即法律合规性问题。人脸识别尚且不能作为法律依据,牛脸识别远远低于人脸识别的准确率,如何能作为依据?比如保险公司承保的牛死了,养殖户不认可牛脸识别的结果,发生了法律纠纷,保险公司必定败诉,所以很少有公司敢进行商业化推广。