根據美國政府測試發現的結果,即使是表現最佳的人臉識別系統,黑人的錯誤識別率比白人高5至10倍。那么到底是什么原因導致不同人種之間人臉識別效果差距如此之大呢?又該如何應對呢?
法國有一家名叫Idemia的公司,它的人臉識別軟件已經在為美國、澳大利亞和法國的警方提供服務。
例如,這個軟件會根據海關或者邊境保護局的記錄,檢查一些在美國著陸乘客的面部特征。
2017年,FBI一名高級官員向國會報告稱:“面部識別系統使用Idemia技術掃描3000萬張照片,有助于‘保護美國公民’。”
但即便如此,Idemia的算法并不能對所有面孔都做到精準識別。
美國國家標準與技術研究所(National Institute of Standards and Technology,NIST) 7月份的測試結果顯示,比起白人和黑人男性,系統更容易混淆黑人女性。
NIST用兩張相同的面部照片去測試算法,結果表明,Idemia的算法錯誤匹配白人女性面孔的概率約為萬分之一,而錯誤匹配黑人女性面孔的概率卻為千分之一,概率增長了10倍之多。
而在人臉識別系統中,錯誤識別概率超過萬分之一是一個評判標準。
Idemia美國公共安全部門主管Donnie Scott表示:
“NIST測試的算法尚未在商業上發布,該公司在產品開發過程中會檢查人口統計學差異。人與人之間存在身體差異,算法將以不同的速度對不同的人進行改進。”
最先進的人臉識別算法依舊無法應對深色皮膚面孔
目前,計算機視覺算法在人臉識別任務中可以說是達到了巔峰。
NIST去年表示,在2010年到2018年期間,算法在大型數據庫精準識別人臉的能力提升了25倍,只有0.2%的概率會出現無法匹配人臉的情況。這將有助于推動在政府、商業或者手機等電子產品中的廣泛使用。
但NIST的測試以及其它研究反復發現,算法在識別深色皮膚人臉方面的能力是較差的。該機構7月份的報告涵蓋了50多家公司的代碼測試。
自2017年初以來,NIST已經公布了人臉識別算法的人口統計學測試結果。研究還一致發現,識別女性的結果比識別男性的結果差一些,造成這種差距的一部分原因是由化妝造成的。
報告指出,白人男性的錯誤匹配率通常比較低,而黑人女性的錯誤匹配率通常會比較高。NIST計劃在今年秋季詳細報告該技術如何在不同的人口群體中發揮作用。
NIST的研究被認為是評估人臉識別算法的黃金標準。那些在人臉識別做的較好的公司將其成果在市場上進行營銷。
許多人臉識別算法更容易混淆黑人面孔。每個圖表都代表了NIST測試的不同算法。
國土安全部還發現,深色皮膚對商業化的人臉識別任務也具有挑戰。今年2月,國土安全部的工作人員公布了11個商用系統的測試結果。結果表明,接受測試的系統需要更長的時間來處理膚色較深的人,而且準確率也相應較低。
政府報告也稱:亞馬遜、微軟和IBM的算法在深色皮膚上的識別并不太準確。
人臉識別技術引發隱私、種族歧視等輿論
這些發現引發了一場關于正確和不正確使用面部識別的全國性辯論。
一些公民自由倡導者、立法者和政策專家希望政府限制或禁止使用該技術,就像最近在舊金山和其他兩個城市所做的那樣。
他們擔心的問題包括隱私風險、公民與州之間的權力平衡以及結果中的種族差異。一些批評人士說,即使人臉識別對所有面孔都同樣有效,仍然有理由限制這項技術。
盡管爭論日益激烈,但人臉識別已經深入到許多聯邦、州和地方政府機構中,并且正在傳播。美國政府在邊境檢查和尋找非法移民等任務中使用人臉識別技術。
今年早些時候,洛杉磯警察局對一起入室盜竊案做出回應,這起案件后來升級為致命的槍擊事件。一名嫌疑犯被逮捕,但另一名逃跑了。警方通過一張在線照片在人臉識別系統中搜索到了逃犯。
這起案件顯示了人臉識別系統的價值,該系統被50多個縣級機構使用,并在一個包含1200多萬張面部照片的數據庫中進行搜索。警長辦公室的中尉Derek Sabatini說:“如果沒有面部識別,警察們可能不會那么快找到嫌疑人。”
LA County系統是根據Cognitec公司的人臉匹配算法建立起來的。Cognitec是一家德國公司,和Idemia一樣,為世界各國政府提供人臉識別服務。
NIST同樣也對Cognitec算法做了測試,結果表明,對于女性和有色人種,這些算法的準確率可能會更低。在敏感閾值下,NIST測試的兩種Cognitec算法誤判黑人女性的概率大約是前者的五倍。
Cognitec算法開發總監Thorsten Thies承認兩者存在差異,但表示很難解釋。他說,其中一個因素可能是,“與白人相比,給深色皮膚的人拍一張好照片更困難。”
Sabatini對這種擔憂進行了反駁,即不管潛在的原因是什么,有偏差的算法都可能導致警務工作中的種族差異。并且表示警方在采取行動前會仔細檢查建議的匹配項,并尋找確鑿的證據。他說:“我們從2009年開始就在這里使用它,沒有任何問題:沒有訴訟,沒有案例,沒有投訴。”
其實,對于人臉識別和種族相關的新聞并不新鮮。
2012年,美國聯邦調查局(FBI)首席面部識別專家合著了一篇研究論文,發現商業面部識別系統對黑人和女性的準確率較低。喬治敦大學的研究人員在2016年一份有影響力的報告中警告了這個問題,報告稱FBI可以搜索大約一半美國人的臉。
隨著人臉識別變得越來越普遍,政策專家和決策者對技術的局限性越發感興趣,這個問題獲得了新的關注。MIT研究員、活動家Joy Buolamwini的工作尤其具有影響力。
2018年初,Buolamwini和他的人工智能研究員Timnit Gebru指出,微軟和IBM試圖檢測照片中人臉性別的服務,對于膚色白皙的男性來說近乎完美,但對于膚色黝黑的女性來說,失敗的幾率超過20%。
隨后的一項研究發現亞馬遜服務也有類似的模式。這些研究沒有測試試圖識別人類的算法(亞馬遜在一篇激進的博客文章中稱其為“誤導”)。
今年5月,在眾議院監督和改革委員會(House Oversight and Reform Committee)舉行的聽證會上,Buolamwini是一位明星證人。馬里蘭州民主黨主席Elijah Cummings表示,測試結果中的種族差異加劇了他對警察在2015年巴爾的摩抗議黑人男子Freddie Gray在警察拘留期間死亡時使用面部識別技術的擔憂。
后來,Jim Jordan(俄亥俄州共和黨人)宣布,國會需要對政府使用這項技術“做點什么”。他說:
“如果一個面部識別系統犯了錯誤,而這些錯誤對非洲裔美國人和有色人種的影響更大,那么在我看來,這就直接違反了美國憲法第一修正案和第四修正案賦予的自由。”
為什么面部識別系統對深色皮膚的識別效果不同?
Buolamwini告訴國會,許多公司用于測試或訓練面部分析系統的數據集并不具有代表性。最容易收集大量面孔的地方是網絡,那里的內容偏向白人、男性和西方人。
根據IBM的一份評論,在學術研究中引用最多的三種面部圖像收集中,81%或更多的人膚色較淺。
領導NIST測試的Patrick Grother是人臉識別領域廣受尊敬的人物,他表示,可能還有其他原因導致有色皮膚的識別效果較差。
一個是照片質量。從彩色膠片開始到數字時代,攝影技術和技術已經針對較淺顏色的皮膚進行了優化。
在11月的一次會議上,他還提出了一個更具挑釁性的假設:從統計數據上看,黑人的臉比白人的臉更相似。他說:“你可能會猜測,這與人性有關。不同的人口群體可能在我們基因的表型表達上存在差異。”
佛羅里達理工學院(Florida Institute of Technology)副教授Michael King則不那么肯定。King此前曾為美國情報機構管理包括人臉識別在內的研究項目。“這是我目前不準備討論的問題。我們的研究還遠遠不夠,”他說。
King與FIT和圣母大學的同事們的最新研究結果表明,解釋人臉識別算法中人口統計學上的不一致性,以及如何解決這一問題,是一項挑戰。
他們的研究測試了4種面部識別算法(兩種商業的和兩種開源的),共計53000張臉部照片。
在黑人面孔中,錯誤地匹配兩個人的情況更為常見,而在白人面孔中,沒有發現匹配面孔的情況更為常見。黑人的大頭照中有很大一部分不符合身份證照片的標準,但僅憑這一點無法解釋這種扭曲的表現。
研究人員確實發現,他們可以讓算法對黑人和白人“一視同仁”,但前提是對兩組人使用不同的敏感度設置。
這在實驗室之外是不太可能實現的,因為要求偵探或邊境特工為不同的人群選擇不同的環境會帶來歧視風險,并可能引發指控種族定性的訴訟。
當King和其他人在實驗室里仔細研究算法時,圍繞人臉識別的政治斗爭正在迅速展開。兩黨國會議員都承諾采取行動控制這項技術,理由是擔心少數族裔的準確性。周二,奧克蘭成為繼馬薩諸塞州薩默維爾和舊金山之后,自5月以來第三個禁止其機構使用該技術的美國城市。
King表示:
“讓這些系統對不同的人口統計數據同樣有效,甚至理解這是否可能實現,或為什么可能實現,這確實是一個長期目標。”
-
AI
+關注
關注
87文章
31490瀏覽量
269916 -
人臉識別
+關注
關注
76文章
4015瀏覽量
82176
原文標題:AI也臉盲 |黑人遭人臉識別技術“誤判”概率竟高出白人5至10倍!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論