是否有一個程序可以通過讀取潛在的***的面部表情和行為來發(fā)現(xiàn)他們?
這是美國交通安全管理局(TSA)于2003年提出的一個假設,當時它開始測試一個新的監(jiān)控程序,稱為“通過觀察技術(shù)篩查乘客”,簡稱SPOT。
在制定該計劃時,他們咨詢了舊金山加利福尼亞大學心理學榮譽教授Paul Ekman。幾十年前,Ekman開發(fā)了一種識別微小面部表情并將其映射到相應情緒的方法。這種方法被用來訓練“行為檢測人員”,以掃描面部是否有欺騙跡象。
但是當該計劃于2007年推出時,卻遇到了問題。官員們或多或少地隨意運用該技術(shù)對人進行審訊,而且少數(shù)逮捕行動是與恐怖主義無關(guān)。更令人擔憂的是,該計劃據(jù)稱被用來證明種族相貌的合理性。
Ekman試圖將自己與Spot保持距離,聲稱他的方法被誤用了。但其他人認為,該計劃的失敗是由于過時的科學理論支撐了Ekman的方法。
近年來,科技公司已經(jīng)開始使用Ekman的方法來訓練從面部表情中檢測情緒的算法。一些開發(fā)人員聲稱,自動情緒檢測系統(tǒng)不僅比人類更好地通過分析面部表情來發(fā)現(xiàn)真實的情緒,而且這些算法將適應我們內(nèi)心的感受,極大地改善了與設備的交互。
但是,許多研究情緒科學的專家擔心這些算法根據(jù)錯誤的科學理論會做出高風險的決定,也將可能再次失敗。
識別你的臉:一個200億美元的行業(yè)
情緒檢測需要兩種技術(shù):
計算機視覺,精確識別面部表情;
機器學習算法,分析和解釋這些面部特征的情緒內(nèi)容。
通常,第二步采用一種稱為監(jiān)督學習的技術(shù),通過這種技術(shù),一個算法被訓練來識別它以前見過的東西。基本的想法是,如果你在看到一張新的快樂臉譜圖時,用標簽“快樂”來顯示成千上萬張快樂臉譜圖的算法,它會再次將其識別為“快樂”。
研究生Rana el Kaliouby是第一批開始嘗試這種方法的人之一。2001年,在從埃及搬到劍橋大學攻讀計算機科學博士學位后,她發(fā)現(xiàn)自己花在計算機上的時間比其他人更多。她認為,如果她能教電腦識別情緒并對她的情緒狀態(tài)做出反應,那么她遠離家人和朋友的時間就不會那么孤獨。
Kaliouby致力于這項研究,并最終開發(fā)出一種輔助阿斯伯格綜合癥兒童閱讀和回應面部表情的設備。她稱之為“情緒助聽器”。
2006年,Kaliouby加入麻省理工學院的情緒計算實驗室,與實驗室主任Rosalind Picard一起繼續(xù)改進和完善該技術(shù)。然后,在2009年,他們共同創(chuàng)辦了一家名為Affectiva的創(chuàng)業(yè)公司,這是第一家營銷“人工情緒智能”的公司。
起初,Affectiva將他們的情緒檢測技術(shù)作為市場研究產(chǎn)品出售,為廣告和產(chǎn)品提供實時的情緒反應。他們找到了客戶,如Mars、凱洛格和哥倫比亞廣播公司等客戶。Picard于2013年離開了Affectiva,并加入了一家不同的生物識別創(chuàng)業(yè)公司,業(yè)務繼續(xù)增長,圍繞它的行業(yè)也是如此。
亞馬遜、微軟和IBM一直將“情緒分析”作為他們面部識別產(chǎn)品的主要功能進行宣傳,并且許多小公司,如Kairos和Eyeris已經(jīng)出現(xiàn),為Affectiva提供類似的服務。
除了市場研究,情緒檢測技術(shù)現(xiàn)在被用于監(jiān)測和檢測駕駛員損傷,測試視頻游戲的用戶體驗以及幫助醫(yī)療專業(yè)人員評估患者的健康狀況。
Kaliouby看到情緒檢測從一個研究項目發(fā)展成為一個價值200億美元的行業(yè),她對這種增長的持續(xù)性充滿信心。她預測,在不久的將來,當這項技術(shù)無處不在并融入我們所有的設備中時,能夠“利用我們的內(nèi)心、潛意識做出瞬間的反應”。
來自87個國家的750萬個面孔數(shù)據(jù)
與大多數(shù)機器學習應用程序一樣,情緒檢測的進展取決于訪問更高質(zhì)量的數(shù)據(jù)。
根據(jù)Affectiva的網(wǎng)站,他們擁有世界上最大的情緒數(shù)據(jù)存儲庫,來自87個國家的面孔,數(shù)量超過750萬,其中大部分是從人們收看電視或開車每天上下班的選擇性錄像中收集的。
這些視頻由位于開羅的Affectiva辦公室的35名貼標人進行分類,他們觀看鏡頭并將面部表情轉(zhuǎn)化為相應的情緒。例如,如果他們看到低垂的眉毛、緊繃的嘴唇和凸出的眼睛,他們會附上標簽“憤怒”。這個被標記的人類情緒數(shù)據(jù)集然后將用于訓練Affectiva的算法,該算法學習如何將憤怒的臉、笑臉與幸福等聯(lián)系在一起。
這種標記方法,被情緒檢測行業(yè)的許多人認為是測量情緒的黃金標準,它由Paul Ekman和Wallace V Friesen在20世紀80年代開發(fā)的一種叫“情緒面部動作編碼系統(tǒng)(Emfacs)”衍生而來。
這個系統(tǒng)的科學根源可以追溯到20世紀60年代,當時Ekman和兩位同事假設有六種普遍的情緒——憤怒、厭惡、恐懼、快樂、悲傷和驚訝——這些情緒與我們有著緊密的聯(lián)系,并且可以通過分析面部肌肉的運動在所有文化中被發(fā)現(xiàn)。
為了驗證這一假設,他們向全世界不同的人群展示了面部照片,要求他們辨別他們所看到的情緒。他們發(fā)現(xiàn),盡管存在巨大的文化差異,人類還是會將相同的面部表情與相同的情緒相匹配。一張眉毛低垂、嘴唇緊閉、眼睛凸出的臉對美國的銀行家和巴布亞新幾內(nèi)亞的半游牧獵人來說都意味著“憤怒”。
在接下來的二十年里,Ekman利用他的發(fā)現(xiàn)開發(fā)了一種識別面部特征并將其映射到情緒的方法。潛在的前提是,如果一個人的普遍情緒被觸發(fā),那么一個相關(guān)的面部動作就會自動出現(xiàn)在臉上。即使那個人試圖掩飾他們的情緒,真實的本能的感覺也會“泄露”。
整個20世紀后半葉,這一理論被稱為“經(jīng)典情緒理論”,開始主導著情緒科學。Ekman將他的情緒檢測方法作為專利,并開始將其作為培訓項目出售給CIA、FBI、海關(guān)和邊境保護局以及TSA。真實情緒在臉上可讀的觀念甚至滲透到大眾文化中,形成了“Lie to me”節(jié)目的基礎。
然而,許多研究情緒本質(zhì)的科學家和心理學家質(zhì)疑經(jīng)典理論和Ekman的相關(guān)情緒檢測方法。
情緒檢測理論備受質(zhì)疑
近年來,心理學教授Barret提出了一個特別強烈而持久的批評。
Barret作為研究生首先遇到了古典理論。她需要一種客觀地測量情緒的方法,并且遇到了Ekman的方法。在回顧文獻時,她開始擔心潛在的研究方法有缺陷——特別是,她認為通過為人們提供與照片匹配的預選情緒標簽,Ekman無意中“準備”了他們給出的某些答案。
她和一組同事通過重演Ekman的測試來檢驗這個假設,而不提供標簽,讓受試者可以自由地描述他們所看到的圖像中的情緒。具體的面部表情和具體的情緒之間的關(guān)系直線下降。
從那時起,Barret發(fā)展了她自己的情緒理論,這在她的書《情緒是如何產(chǎn)生的:大腦的秘密生活》中有所闡述。她認為,大腦中沒有由外部刺激觸發(fā)的普遍情緒。相反,每一次情緒體驗都是由更基本的部分構(gòu)成的。
她寫道:
“它們是你身體物理特性的結(jié)合,是一個靈活的大腦,它將自己連接到它所處的任何環(huán)境中,以及你的文化和成長環(huán)境中。”
“情緒是真實的,但在客觀意義上不是分子或神經(jīng)元是真實的。它們的真實性與金錢的真實性是相同的,也就是說,這不是幻覺,而是人類一致同意的產(chǎn)物。”
Barret解釋說,把面部表情直接映射到所有文化和環(huán)境中的情緒是沒有意義的。當一個人生氣時可能會皺眉,而另一個人可能會在策劃敵人倒臺時禮貌地微笑。因此,評估情緒最好理解為一種動態(tài)實踐,包括自動認知過程、人與人的互動、具體經(jīng)驗和文化能力。她說:“這聽起來像是很多工作,但確實如此。”
“情緒是復雜的。”
Kaliouby也同意情緒是復雜的,這就是為什么她和她在Affectiva的團隊一直在努力提高他們數(shù)據(jù)的豐富性和復雜性的原因。除了使用視頻而不是靜止圖像來訓練算法外,他們還嘗試著捕捉更多的上下文數(shù)據(jù),比如聲音、步態(tài)以及人類感知之外的面部細微變化。她相信更好的數(shù)據(jù)將意味著更準確的結(jié)果。一些研究甚至聲稱機器在情緒檢測方面已經(jīng)優(yōu)于人類。
但據(jù)Barret說,這不僅與數(shù)據(jù)有關(guān),而且與數(shù)據(jù)如何被標記有關(guān)。情緒檢測公司和其他情緒檢測公司用來訓練算法的標記過程,只能識別Barret所說的“情緒刻板印象”,就像表情符號一樣,這些符號符合我們文化中熟悉的情緒主題。
紐約大學人工智能研究所的聯(lián)合主任Whittaker認為,基于Ekman過時的科學構(gòu)建機器學習應用程序不僅僅是一種糟糕的實踐,它還轉(zhuǎn)化為真正的社會危害。
“你已經(jīng)看到招聘公司使用這些技術(shù)來衡量應聘者是否是一個好員工。”
她說:“在學校環(huán)境中,你也可以看到一些實驗性的技術(shù)被提出,以觀察學生在課堂上是積極的、無聊的還是憤怒的。”“這些信息可以用來阻止人們獲得工作或改變他們在學校的待遇和評估方式,如果分析不十分準確,那將是一種具體的物質(zhì)傷害。”
Kaliouby說,她意識到情緒檢測可能被濫用的方式,并將認真對待她的工作道德。“與公眾就這一切的運作方式——在哪里應用以及在哪里不應用進行對話至關(guān)重要。”
Kaliouby過去戴過頭巾,她也敏銳地意識到建立不同數(shù)據(jù)集的重要性。她說:“我們確保當我們訓練這些算法時,訓練數(shù)據(jù)是多樣的。”“我們需要代表白種人、亞洲人、膚色較深的人,甚至是戴頭巾的人。”
這就是為什么Affectiva從87個國家收集數(shù)據(jù)的原因。通過這個過程,他們注意到在不同的國家,情緒表達似乎呈現(xiàn)出不同的強度和細微差別。例如,巴西人用寬而長的微笑來表達幸福,而在日本,微笑并不表示幸福,而是表示禮貌。
Affectiva通過在系統(tǒng)中添加另一層分析來解釋這種文化差異。匯編了Kaliouby所說的“基于種族的基準”,或編纂了關(guān)于不同種族文化中如何表達情緒的假設。
但正是這種基于種族等標記的算法判斷,讓Whittaker最擔心情緒檢測技術(shù)暗示了自動化“相面”的未來。事實上,已經(jīng)有公司對某人成為***或戀童癖者的可能性進行了預測,同時也有研究人員聲稱,他們擁有的算法能夠單獨從臉上檢測到性行為。
最近幾項研究還表明,面部識別技術(shù)會產(chǎn)生更可能傷害少數(shù)族裔群體的偏見。去年12月發(fā)表的一篇文章顯示,與白人相比,情緒檢測技術(shù)給黑人臉上的負面情緒更多。
Kaliouby表示,情緒系統(tǒng)確實有一個“種族分類器”,但是他們現(xiàn)在沒有使用它。相反,他們使用地理位置作為確定某人來自哪里的基準。這意味著他們將巴西的微笑與巴西的微笑進行比較,而日本的微笑與日本的微笑進行比較。
“如果巴西有一個日本人呢?難道系統(tǒng)能識別出禮貌微笑和幸福微笑的細微差別嗎?“
Kaliouby承認,在這個階段,這項技術(shù)并不是百分之百的萬無一失。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7134瀏覽量
89406 -
機器
+關(guān)注
關(guān)注
0文章
784瀏覽量
40778 -
情緒識別
+關(guān)注
關(guān)注
0文章
3瀏覽量
1654
原文標題:87個國家、750萬個面孔數(shù)據(jù),『情緒識別機器』催生200億美元“財富夢”
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論