人類識別物體的能力非常卓越。假如你在特殊光線下看一個杯子,或者從一個意想不到的方向去看杯子,你的大腦仍然很有可能認出這是一個杯子。這種精確的物體識別能力對人工智能開發者來說是一個難以實現的夢想,例如那些改進自動駕駛汽車導航的開發者。
雖然在視覺皮層中建立靈長類動物物體識別模型已經徹底改變了人工視覺識別系統,但是目前的深度學習系統相比生物系統已經被簡化,并且還是難以識別一些物體,。
近日,麻省理工學院麥戈文研究所的研究員 James DiCarlo 和他的同事在 Nature Neuroscience 上發表的研究成果中提到,有證據表明,反饋可以提高靈長類動物大腦識別難識別物體的能力,添加反饋回路可以改進視覺應用中所用到的人工神經網絡系統的性能。
圖丨人工智能和深度學習視覺識別系統的藝術渲染圖(來源:Christine Daniloff)
深度卷積神經網絡(DCNN)是目前在快速時間尺度(小于 100 毫秒)上精確識別物體最成功的模型。它具有大體上與靈長類動物腹側視覺流、皮質區域類似的結構,這一結構用來逐步建立所觀察的物體的精確圖像。然而,跟靈長類動物的腹側神經系統相比,大多數的 DCNN 都很簡單。
“在很長一段時間里,我們都沒有獲得一個基于模型的理解。因此,這一領域是通過將視覺識別建模作為前饋過程而開始的,”麻省理工學院大腦和認知科學系的系主任DiCarlo 解釋道,“但是,我們知道,在跟物體識別相關的大腦區域中,存在著重復性解剖學連接。”
試想一下,前饋 DCNN 和視覺系統中首次嘗試捕捉物體信息的部分,就像一條穿過一系列車站的地鐵線,而反復出現的大腦網絡就像街道,相互連接,但又不是單向的。大腦精確識別物體只需 200 毫秒,所以這些反復出現的聯結是否在物體識別的關鍵步驟上起作用,目前仍不清楚。也許這些反復出現的聯結只是為了長時間保持視覺系統協調。例如,街道上的排水溝緩慢地排出水和垃圾,但是并不需要很快地將人從小鎮的一邊轉到另一邊。
DiCarlo 和本研究的主要作者、CBMM 的博士后 Kohitij Kar 一起,開始驗證快速識別物體過程中這些多次出現的結構的微妙作用是否被忽略了。
首先,作者需要確認靈長類動物大腦能詳細解碼的物體。識別物體這一過程對人工系統來說,充滿了挑戰,結果證明這很關鍵。
Kar 進一步解釋道,“我們意識到,人工智能模型實際上并不是對處理每一幅或被遮擋、或處于混亂狀態的圖像都有問題?!?/p>
作者分別讓深度學習系統,還有猴子和人類識別一些“有挑戰性的”圖片,結果靈長類動物可以很輕易地識別物體,但是前饋 DCNN 就不行。但是,當他們將合適的循環處理加入到這些 DCNN 中后,上述物體的識別突然變得輕而易舉了。
Kar 采用了空間和時間精度極高的神經記錄方法,來確定這些圖片的處理對靈長類動物來說,是否真的如此瑣碎。值得注意的是,他們發現,雖然對人類大腦來說,高難度圖片的識別似乎很簡單,但是它們實際上涉及到了額外的神經處理時間(大概是 30 毫秒),這表明循環在我們的大腦中也存在。
“計算機視覺界最近在人工神經網絡上成功堆疊了越來越多的層次,并且具有循環連接的大腦結構也已經出現?!盞ar 說。
心理學教授、貝克曼研究所智能系統主題的聯合主席、非本研究作者 Diane Beck 進一步解釋道:“由于完全前饋的深度卷積神經系統現在非常擅長預測靈長類動物的大腦活動,這引起了人們對于反饋連接在靈長類大腦中所起到的作用的疑問。這項研究表明,反饋連接很可能在物體識別中發揮作用。”
“這對自動駕駛汽車意味著什么呢?研究表明,假如深度學習想要類比靈長類大腦,那么深度學習中物體識別所涉及的結構就需要循環組件,并且研究指出如何在下一代智能機器中使用這一程序?!?/p>
“隨著時間的變化,循環模型提供了對神經活動和行為的預測,”Kar 說?!拔覀儸F在可以模擬更復雜的任務。也許有一天,這個系統不僅可以識別物體,比如人,還可以執行人類大腦能夠輕松進行的認知任務,比如體會他人的情緒?!?/p>
-
AI
+關注
關注
87文章
31475瀏覽量
269869 -
MIT
+關注
關注
3文章
253瀏覽量
23440
原文標題:MIT最新研究:加上“反饋”,AI算法可以看得更清楚
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論