近期,加州大學(xué)洛杉磯分校的研究人員利用深度卷積網(wǎng)絡(luò)(DCNN)在對(duì)象分類(lèi)方面取得了較大的突破,但他們還發(fā)現(xiàn),AI與人類(lèi)識(shí)物的方式是完全不同的:人類(lèi)更傾向于根據(jù)物體的全局信息進(jìn)行分類(lèi),而機(jī)器卻對(duì)物體的局部信息敏感。
識(shí)別,是人類(lèi)智能的重要組成部分。如果機(jī)器能夠比人類(lèi)更快速的做到識(shí)別,其意義將是非常深遠(yuǎn)的。
然而,人類(lèi)和機(jī)器識(shí)別事物的方式截然不同。
拿上圖舉例,對(duì)于圖(a)來(lái)說(shuō),人類(lèi)能夠很快分辨出是一只熊,在速度和準(zhǔn)確性方面都遠(yuǎn)超于機(jī)器;但是對(duì)于圖(b),機(jī)器算法能夠?qū)⑵錃w類(lèi)為熊,而人類(lèi)可能看上半天都無(wú)法識(shí)別是什么。
雖然目前在通過(guò)機(jī)器算法識(shí)別事物方面已經(jīng)有了一些突破性進(jìn)展,但即便是最先進(jìn)的算法、技術(shù),也可能認(rèn)錯(cuò)事物:例如將電視機(jī)中的靜態(tài)畫(huà)面或者抽象的圖畫(huà),誤認(rèn)為是真實(shí)世界中的事物。
這些困難很大程度上是難以消除的,因?yàn)槲覀儗?duì)這些神經(jīng)網(wǎng)絡(luò)如何“看”和“識(shí)別”事物沒(méi)有很好的理解。
最近,加州大學(xué)洛杉磯分校的研究人員在PLOS computing Biology上發(fā)表了一篇文章,這項(xiàng)研究正在測(cè)試神經(jīng)網(wǎng)絡(luò),以了解它們的視覺(jué)極限以及計(jì)算機(jī)視覺(jué)和人類(lèi)視覺(jué)之間的差異。
論文地址:
https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1006613#sec001
他們提出了一種名為VGG-19的深度卷積神經(jīng)網(wǎng)絡(luò)。這是最先進(jìn)的技術(shù),在ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)等標(biāo)準(zhǔn)化測(cè)試中已經(jīng)超越了人類(lèi)。
并且還發(fā)現(xiàn):人類(lèi)更傾向于根據(jù)物體的全局信息進(jìn)行分類(lèi),而機(jī)器卻對(duì)物體的局部信息敏感。
這一結(jié)果將有助于解釋為什么神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中會(huì)犯人類(lèi)從未犯過(guò)的錯(cuò)誤。
識(shí)別方式不同,使得AI擅于紋理識(shí)物,弱于輪廓
在第一個(gè)實(shí)驗(yàn)中,訓(xùn)練神經(jīng)網(wǎng)絡(luò)將圖像整理分類(lèi),歸入1000個(gè)不同的類(lèi)別。
然后呈現(xiàn)出只有輪廓的圖像:所有的局部信息都丟失了,只留下物體的輪廓。
如果你能選對(duì)其中一個(gè),你就比最先進(jìn)的圖像識(shí)別軟件強(qiáng)多了。
通常情況下,經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)能夠識(shí)別這些對(duì)象,分類(lèi)正確率達(dá)到90%以上。
而在研究輪廓的時(shí)候,這個(gè)數(shù)字降低到了10%。雖然人類(lèi)觀察者幾乎總能產(chǎn)生正確的形狀標(biāo)簽,但神經(jīng)網(wǎng)絡(luò)似乎對(duì)圖像的整體形狀幾乎不敏感。
當(dāng)研究人員試圖讓神經(jīng)網(wǎng)絡(luò)對(duì)他們已經(jīng)識(shí)別出的玻璃雕像進(jìn)行分類(lèi)時(shí),出現(xiàn)了一個(gè)特別有趣的例子:當(dāng)我們很容易識(shí)別水獺或北極熊的玻璃模型時(shí),神經(jīng)網(wǎng)絡(luò)將它們分別歸類(lèi)為“氧氣面罩”和“開(kāi)罐器”。
神經(jīng)網(wǎng)絡(luò)依賴(lài)于分類(lèi)對(duì)象的紋理信息,而在這個(gè)例子中這些信息是丟失的,神經(jīng)網(wǎng)絡(luò)無(wú)法僅通過(guò)形狀來(lái)識(shí)別對(duì)象。
研究人員發(fā)現(xiàn),當(dāng)神經(jīng)網(wǎng)絡(luò)明確地被訓(xùn)練用來(lái)識(shí)別物體輪廓的時(shí)候,圖像輪廓的輕微扭曲就足以再次欺騙AI,而不會(huì)對(duì)人類(lèi)的判定造成影響。
神經(jīng)網(wǎng)絡(luò)似乎對(duì)物體的整體形狀不敏感,而是依賴(lài)于局部分布點(diǎn)之間的統(tǒng)計(jì)相似性,在此基礎(chǔ)上便有了進(jìn)一步的實(shí)驗(yàn)。
如果將圖像打亂,使整體形狀消失,但保留了局部特征,會(huì)有怎樣的結(jié)果呢?
事實(shí)證明,神經(jīng)網(wǎng)絡(luò)在識(shí)別“亂序版本”物體方面要比只有輪廓的物體要好得多,也快得多,即使在人類(lèi)“基本無(wú)法識(shí)別”的時(shí)候也是如此。學(xué)生們只能對(duì)37%的被打亂的物體進(jìn)行分類(lèi),而神經(jīng)網(wǎng)絡(luò)成功的概率為83%。
更明智地使用神經(jīng)網(wǎng)絡(luò),需先了解其運(yùn)作方式
作者Kellman說(shuō):“這項(xiàng)研究表明,這些系統(tǒng)在不考慮形狀的情況下,就能從訓(xùn)練過(guò)的圖像中得到正確的答案。對(duì)人類(lèi)來(lái)說(shuō),整體形狀是物體識(shí)別的首要條件,而通過(guò)整體形狀識(shí)別圖像似乎根本不在這些深度學(xué)習(xí)系統(tǒng)考慮范疇當(dāng)中。”
人們可能天真地認(rèn)為,由于神經(jīng)網(wǎng)絡(luò)的許多層都是基于大腦神經(jīng)元之間的連接建立的模型,而且與視覺(jué)皮層的結(jié)構(gòu)非常相似,因此計(jì)算機(jī)視覺(jué)的運(yùn)作方式必然與人類(lèi)視覺(jué)相似。
但是這種研究表明,雖然基本架構(gòu)可能類(lèi)似于人類(lèi)大腦,但由此產(chǎn)生的“思維”運(yùn)作方式卻截然不同。
研究人員目前可以漸漸地了解到神經(jīng)網(wǎng)絡(luò)中的“神經(jīng)元”在受到刺激時(shí)是如何運(yùn)作的,并將其與生物系統(tǒng)對(duì)相同刺激的反應(yīng)進(jìn)行比較。也許有一天,我們可以利用這些對(duì)比來(lái)了解神經(jīng)網(wǎng)絡(luò)是如何“思考”的,以及這些反應(yīng)與人類(lèi)的不同之處。
但是,到目前為止,還需要更多的實(shí)驗(yàn)心理學(xué)來(lái)探索神經(jīng)網(wǎng)絡(luò)和人工智能算法是如何感知世界的。
針對(duì)神經(jīng)網(wǎng)絡(luò)的測(cè)試更接近于科學(xué)家如何嘗試?yán)斫鈩?dòng)物的感官或幼兒發(fā)育中的大腦,而不僅僅是開(kāi)發(fā)一款軟件。通過(guò)將這種實(shí)驗(yàn)心理學(xué)與新的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)技術(shù)相結(jié)合,可能會(huì)使它們更加可靠。
然而,這項(xiàng)研究表明,對(duì)于我們正在創(chuàng)造和使用的算法,仍有很多不解之處:
它們是如何運(yùn)作的;
它們是如何做出決策的;
它們與我們有何不同。
隨著神經(jīng)網(wǎng)絡(luò)在社會(huì)、科技發(fā)展中扮演著越來(lái)越重要的角色,如果我們想要明智而有效地使用它們,深入理解神經(jīng)網(wǎng)絡(luò)將是至關(guān)重要的——而不是只見(jiàn)樹(shù)木不見(jiàn)森林。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4779瀏覽量
101054 -
算法
+關(guān)注
關(guān)注
23文章
4629瀏覽量
93200 -
機(jī)器識(shí)別
+關(guān)注
關(guān)注
1文章
13瀏覽量
2571
原文標(biāo)題:UCLA:最先進(jìn)DCNN已超越人類(lèi),識(shí)物方式與人腦不同
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論