在過去的幾年中,隨著AI解決方案在我們的日常生活中越來越根深蒂固,人工智能(AI)的偏見已成為熱門話題。 作為轉(zhuǎn)向數(shù)據(jù)科學(xué)的心理學(xué)家,這個(gè)話題非常貼切。
為了避免使AI模型產(chǎn)生偏差,首先必須意識(shí)到存在各種各樣的偏差。
為了檢測(cè)偏見,必須意識(shí)到它的存在。
為此,本文將指導(dǎo)您解決在開發(fā)AI的不同階段中可能遇到的許多常見和不常見的偏見。 這些階段包括:
· 數(shù)據(jù)采集
· 數(shù)據(jù)預(yù)處理
· 數(shù)據(jù)分析
· 建模
希望,了解您可能遇到的偏見將有助于您開發(fā)偏見較少的AI解決方案。
1.什么是偏見?
偏見被認(rèn)為是對(duì)一個(gè)想法或事物的偏愛或偏見。 偏見通常是在人類的背景下想到的,但它可以存在于許多不同的領(lǐng)域:
· 統(tǒng)計(jì)信息-例如,統(tǒng)計(jì)信息的系統(tǒng)失真
· 研究-例如,偏向于發(fā)表某些實(shí)驗(yàn)性重大成果
· 社會(huì)科學(xué)-例如,對(duì)某些人群的偏見
在本文中,我們將結(jié)合幾個(gè)領(lǐng)域,在這些領(lǐng)域中可能會(huì)出現(xiàn)(認(rèn)知)偏差,以了解偏差如何進(jìn)入人工智能。
在下文中,我將經(jīng)歷AI開發(fā)的常見階段,并確定步驟以檢測(cè)可能在哪里發(fā)現(xiàn)偏差。
2.數(shù)據(jù)收集
數(shù)據(jù)收集是您會(huì)發(fā)現(xiàn)偏見的第一個(gè)也是最常見的地方之一。 造成這種情況的最大原因是,數(shù)據(jù)通常是由人收集或創(chuàng)建的,從而允許錯(cuò)誤,離群值和偏差易于滲入數(shù)據(jù)中。
數(shù)據(jù)收集過程中常見的偏見:
· 選擇偏差-選擇數(shù)據(jù)時(shí)樣本不能代表總體的數(shù)據(jù)選擇
例如,在許多社會(huì)研究中,研究人員一直在使用學(xué)生作為參與者,以檢驗(yàn)其假設(shè)。 學(xué)生顯然不能代表一般人群,并且可能會(huì)偏向所發(fā)現(xiàn)的結(jié)果。
Selection Bias
· 框架效應(yīng)-調(diào)查以特定傾向構(gòu)建的問題。
如下圖所示,如果這個(gè)問題的答案是肯定的,那么人們更有可能挽救200條生命,而挽救所有人的幾率是33%。
當(dāng)出現(xiàn)正構(gòu)架提示(“挽救200條生命”)時(shí),有72%的參與者選擇了治療A,而當(dāng)出現(xiàn)負(fù)構(gòu)架提示(“ 400人將死亡”)時(shí),則下降為22%。
· 系統(tǒng)性偏差-這是一個(gè)一致且可重復(fù)的錯(cuò)誤。
這通常是設(shè)備故障的結(jié)果。 由于此錯(cuò)誤很難檢測(cè),因此更正此錯(cuò)誤很重要。 必須對(duì)機(jī)械或過程有充分的了解。
Systematic Error
· 回應(yīng)偏見—一系列偏見,參與者對(duì)問題的回答不正確或錯(cuò)誤。
答復(fù)偏見經(jīng)常出現(xiàn)在問卷中。 由于這些都是參與者填寫的,因此人為偏見很容易在數(shù)據(jù)中找到。 例如,《社會(huì)可取性偏見》指出人們很可能否認(rèn)其反應(yīng)中的不良特征。 這可以通過強(qiáng)調(diào)良好行為或低估不良行為來實(shí)現(xiàn)。 類似地,"問題順序偏向"指出人們可能會(huì)根據(jù)問題的順序不同地回答問題。
重要的是要了解,您如何設(shè)計(jì)收集過程會(huì)嚴(yán)重影響將要收集的數(shù)據(jù)類型。 如果不小心,您的數(shù)據(jù)將嚴(yán)重偏向某些群體。 任何結(jié)果分析都可能有缺陷!
3.數(shù)據(jù)預(yù)處理
處理數(shù)據(jù)時(shí),可以采取許多步驟來準(zhǔn)備進(jìn)行分析:
· 離群值檢測(cè)
您通常希望刪除異常值,因?yàn)樗鼈兛赡軐?duì)某些分析產(chǎn)生不成比例的影響。 在所有人都在20到30歲之間的數(shù)據(jù)集中,一個(gè)110歲的人可能不太能代表數(shù)據(jù)。
· 缺失值
您如何處理某些變量的缺失值會(huì)引入偏差。 如果要用均值填充所有缺失值,那么您有意將數(shù)據(jù)推向均值。 這可能會(huì)使您偏向表現(xiàn)更接近均值的某些群體。
· 篩選資料
我已經(jīng)多次看到這種情況,對(duì)數(shù)據(jù)進(jìn)行了如此多的過濾,以致于它幾乎不再代表目標(biāo)人群。 這以某種方式將選擇偏差引入數(shù)據(jù)。
4.數(shù)據(jù)分析
在開發(fā)AI解決方案時(shí),最終產(chǎn)品可能是模型或算法。 但是,在數(shù)據(jù)分析中也很容易發(fā)現(xiàn)偏差。 通常,我們會(huì)在數(shù)據(jù)分析中看到以下偏見:
· 誤導(dǎo)圖-扭曲的圖,它歪曲了數(shù)據(jù),因此可能從中得出不正確的結(jié)論。
例如,當(dāng)報(bào)告分析結(jié)果時(shí),數(shù)據(jù)科學(xué)家可以選擇將其圖的y軸從0開始。盡管這不會(huì)在數(shù)據(jù)本身中引入偏差,但由于差異似乎是 更明顯(見下圖)。
如果Y軸從0%開始,則農(nóng)作物產(chǎn)量的差異似乎很小。但是,簡單地將其更改為從70%開始會(huì)產(chǎn)生看似不同的觀點(diǎn),而結(jié)果實(shí)際上是相同的。
如果您想進(jìn)一步了解誤導(dǎo)圖的影響,強(qiáng)烈建議您閱讀"如何利用統(tǒng)計(jì)數(shù)據(jù)撒謊"一書!
· 確認(rèn)偏見—傾向于專注于確認(rèn)先入之見的信息的傾向。
假設(shè)您認(rèn)為癌癥和喝酒之間有很強(qiáng)的關(guān)系。 在執(zhí)行分析時(shí),您僅通過不考慮任何混淆變量來搜索以確認(rèn)該假設(shè)。
The confirmation Bias
這似乎是一個(gè)極端的例子,您將永遠(yuǎn)做不到。 但是現(xiàn)實(shí)是,人類天生就有偏見,這很難撼動(dòng)。 發(fā)生在我身上的次數(shù)比我想承認(rèn)的要多!
5.建模
當(dāng)談?wù)揂I的偏見時(shí),人們通常指的是某種程度上有利于特定人群的AI系統(tǒng)。 一個(gè)很好的例子就是亞馬遜創(chuàng)建的招聘算法,該算法在決策中顯示了性別偏見。 他們用于此算法的數(shù)據(jù)主要由擔(dān)任技術(shù)職務(wù)的男性組成,這使其傾向于使用男性作為高潛力候選人。
這是垃圾填充現(xiàn)象的經(jīng)典示例,其中您的AI解決方案僅與您使用的數(shù)據(jù)一樣好。 這就是為什么在開始對(duì)數(shù)據(jù)進(jìn)行建模之前檢測(cè)數(shù)據(jù)中的偏差如此重要的原因。
讓我們研究一下在創(chuàng)建預(yù)測(cè)模型時(shí)經(jīng)常會(huì)看到的幾種類型的偏差:
· 偏差/方差折衷-偏差(模型的基本假設(shè))和方差(如果使用不同的數(shù)據(jù),則預(yù)測(cè)的變化)之間的折衷。
具有高方差的模型將過多地關(guān)注火車數(shù)據(jù),并且不能很好地推廣。 另一方面,高偏差假定數(shù)據(jù)始終以相同的方式運(yùn)行,這很少是正確的。 當(dāng)增加偏見時(shí),通常會(huì)降低方差,反之亦然。 因此,我們經(jīng)常尋求平衡偏見和差異。
Demonstrating the effect of the trade-off between bias and variance.
· 概念漂移–一種現(xiàn)象,目標(biāo)變量的統(tǒng)計(jì)屬性會(huì)隨時(shí)間發(fā)生意外變化。
假設(shè)您創(chuàng)建了一個(gè)模型,可以預(yù)測(cè)在線商店中客戶的行為。 該模型起初很棒,但一年后性能下降。 發(fā)生的事情是客戶的行為在過去一年中發(fā)生了變化。 客戶行為的概念已經(jīng)改變,并對(duì)模型的質(zhì)量產(chǎn)生負(fù)面影響。
解決方案可能只是簡單地使用新數(shù)據(jù)重新訓(xùn)練您的模型,以便及時(shí)掌握新行為。 但是,可能需要一個(gè)全新的模型。
The original data (left) versus concept drift (right) after time has passed and new data was added.
· 分類不平衡-(目標(biāo))分類頻率的極端不平衡。
假設(shè)您要對(duì)圖片包含貓還是狗進(jìn)行分類。 如果您有1000張狗的照片而只有10張貓的照片,則存在類不平衡。
階級(jí)失衡的結(jié)果是該模型可能偏向多數(shù)階級(jí)。 由于數(shù)據(jù)中的大多數(shù)圖片都是狗,因此該模型只需要始終猜測(cè)"狗"即可達(dá)到99%的準(zhǔn)確率。 實(shí)際上,該模型尚未了解到貓和狗的圖片之間的差異。 可以通過選擇正確的驗(yàn)證措施(例如,平衡準(zhǔn)確度或F1得分而不是準(zhǔn)確度)來補(bǔ)救。
6.接下來是什么?
在了解了AI解決方案中的所有這些潛在偏見之后,您可能會(huì)認(rèn)為:
"但是我該如何消除解決方案中的偏見?"
我認(rèn)為,要解決偏見,您需要了解其根源。 知道是成功的一半。 之后,由您自己確定消除或處理該特定偏差的方法。 例如,如果您發(fā)現(xiàn)問題是由于數(shù)據(jù)中的選擇偏差引起的,那么最好添加其他數(shù)據(jù)。 如果類別不平衡使您的模型更偏向多數(shù)群體,那么您可以研究重采樣策略(例如SMOTE)。
注意:有關(guān)常見認(rèn)知偏差的交互式概述,請(qǐng)參見此驚人的可視化。
-
AI
+關(guān)注
關(guān)注
87文章
31490瀏覽量
269974 -
人工智能
+關(guān)注
關(guān)注
1795文章
47642瀏覽量
239750
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論