人類和部分動物都具有一種數量感知能力,不需要刻意數數,就能憑借視覺對數量多少得出一個基本判斷,甚至直接抽象出具體數量。比如一張圖片中有 4 個蘋果和 4 只狗,人類在觀察圖片并識別蘋果和狗的過程中,大腦自然而然就能形成 “兩類物體都有 4 個” 這樣的抽象概念。
雖然這種數感能力的準確率會隨著數量級的上升而下降——我們很難憑感覺判斷圖片中有 100 只狗,還是 98 只——但是在一張有 98 只狗和 50 個蘋果的圖片中,我們依然可以對誰多誰少有一個大致準確的概念。
更重要的是,這種能力似乎源自于大腦中的視覺感知區域,其中的神經元在受到視覺刺激的情況下,也可以同時激活一部分數感機制。
那么問題來了,我們發明的人工智能(AI),尤其是所謂的模擬大腦工作機制的神經網絡,是否也具備這種能力呢?換言之,一個受到視覺訓練的神經網絡,是否可以形成類似的數感機制?
近日,來自德國和美國的科學家就這一問題展開了研究,得出的結論是肯定的。他們在訓練圖像分類 AI 系統時發現,一些神經元的激活模式與猴腦神經元處理數量信息時的激活模式非常相似,而且它們甚至還發展出了對特定數字的偏好,足以說明神經網絡可以從圖像中抽象出數量信息。
也就是說,在沒有進行專門數數訓練的情況下,神經網絡僅憑視覺信息,就在一定程度上 “發展出” 了如何從中獲得數量信息,產生了類似于人類和動物的數量感知能力。
證實數感能力的存在,或許可以證明我們對生物智能的復制在某些方面是富有成效的。該研究成果發表于期刊 Science Advances 上。
人與計算機的不同“腦回路”
剛剛提到,現有神經網絡結構是嘗試模擬人腦運作機制的產物,但計算機和人類的 “腦回路” 截然不同。
我們都知道,相比買菜找零都要算上幾秒鐘的人類,計算機的計算能力可以說是碾壓般的存在,每秒鐘可以完成上億次的運算,還能保證相當高的精確度。當然,這也是我們發明它的目的。
不過,人類的強大之處在于,可以通過直覺感知場景中物體的數量,還具有很強的抗干擾和類比能力,計算機卻必須收到確切的計算指令,比如給出圖片中狗的數量,才能開始執行任務。
這種對于數量的感知能力也被稱為“數量感”,指的是快速理解、估計和產生數量,并對數量進行表征以及理解數量間關系的能力。
研究顯示,人類和動物的大腦中存在特殊神經元,能夠對數量和數值產生反應。因此通過視覺刺激,我們可以對物體特征進行抽象并表征其數量信息,甚至不受物體大小、顏色和形狀的影響。
遵循這一思路,德國和美國的研究人員將目光轉換到神經網絡上,看看是否可以從中挖掘出類似的神經元觸發機制。
無師自通的分類模型
他們選擇了受生物特性啟發而成的分層卷積神經網絡(HCNN)作為實驗對象。該模型廣泛使用于計算機視覺應用中,由多個前饋層和視網膜拓撲結構層組成,層中的每個網絡單元都可以模擬不同類型的視覺神經元。
整個模型包含兩套網絡:一個是特征提取網絡,可以將自然圖像轉化成(特征的)高級表示;另一個是圖像分類網絡,負責歸納和總結特征,將圖像按可能性分成不同類別。這兩個網絡包含了卷積層和池化層。
圖 | 訓練識別物體的 HCNN 模型
模型構建完成后,研究人員使用了知名的 ImageNet 數據集進行圖像分類訓練,其中約有 120 萬張圖像。訓練過程與數量感知毫無關系,HCNN 只是學習普通的圖像分類任務,其分類準確率約為 49.9%。
隨后,為了搞清楚神經元的激活方式,并且判斷是否存在數感機制,他們移除了圖像分類網絡,僅保留了特征提取網絡,而且模型的輸入圖片也從 ImageNet 變成了特制圖片。
研究團隊開發了三組用來刺激神經元的圖像集,每一組都包含 30 張黑色圖片,上面分別有 1-30 個白點。第一組的每張圖片由大小不一的圓點組成。第二組每張圖片上所有圓點的總面積相同,因此隨著白點數量的增加,每個點的大小都會縮小。而第三組則包含了多種形狀,比如圓形,方形和三角形等。
圖 | 三組不同的刺激神經元的圖像集
之所以選擇這些圖片,是因為它們幾乎沒有類別可言,不適合進行圖像分類。可是如果將它們放入到 HCNN 分類模型中,得到反饋結果,研究人員就可以更好地查看神經元的激活方式是否與數感機制相關。
通過雙向方差分析(ANOVA),他們可以篩選出那些對數量敏感的網絡單元,同時避免對神經元的刺激和交互過程造成較大影響。
最終,在超過 3.7 萬個神經元中,有 3601 個神經元(約 9.6%)出現了數字選擇性,即出現了對某個數字的偏好,對相應的視覺刺激(圖片)產生了反應。
具體來說,一個神經元只會對一個數字的刺激展現出最大的 “反應(response)”,就好像是它“最喜歡的數字” 一樣。它的 “反應” 還會隨著數字的不斷變化而逐漸衰退,兩個數字相差越大,“反應”的衰減就越明顯。
圖 | 不同神經元有自己 “喜歡” 和“不感興趣”的數字
舉個例子,一個 “最喜歡” 數字 4 的神經元,就會對一張包含 4 個白點的圖像展現出最激烈的“反應”。如果給它看包含 12 個白點的圖片,它就會展現出不那么激烈的“反應”。如果再增加到 30 個白點,它甚至都不會有什么“反應”。
將所有數據以曲線的形式表達出來后,研究人員發現,神經網絡中神經元的激活模式與猴腦神經元的激活模式高度相似,就連兩種神經元的喜好分布規律都非常相近:更多的神經元偏好小數字,其次是最大的數字,最后才是中間的數字,其中對 0-5 之間數字產生 “反應” 的神經元甚至超過六成。
圖 | B 組圖表:神經網絡中神經元的激活(響應)規律;C 組圖表:猴子大腦中神經元的激活規律;D 組柱狀圖:神經網絡中神經元的偏好分布;E 組柱狀圖:猴子大腦中神經元的偏好分布
這意味著,一套經過視覺訓練的圖像分類神經網絡,在沒有接受任何計數訓練和計算指令的情況下無師自通,其中的神經元對不同數字發展出了不同的敏感度,運作機制跟人類和動物大腦的數感機制十分相似。
該實驗結果證明,數感能力天然存在于視覺系統的運作機制當中,伴隨著獲取視覺信息和視覺刺激,數量感就會以副產品的形式自然而然地出現。這或許也可以解釋為什么在未經訓練的情況下,嬰幼兒和野生動物都會展現出數感。不過雖然數感能力可能是天生的,但它也是可以通過后天訓練不斷加強的,兩者并不沖突。
另一方面,這項研究也證明了我們對神經網絡的運作機制并非完全了解,仍然有尚未發現的特征提取模式,比如提取不存在于圖像分類訓練中的高級數字特征,卻與人腦的數感機制類似,說明我們創造的神經網絡可能比我們想象的更像人腦。
下一步,研究團隊打算嘗試更多類似的研究,試圖挖掘出更多未知的神經網絡運作機制,比如它會如何對待按數量多少順序排列的物體,能否建立起與人腦類似的時間感知機制。這也是人類在計數過程中所使用的能力:理解 “每個數字都是前面數字 + 1” 這樣的抽象概念,而不是單純地將每個數字視為獨立個體。
-
神經網絡
+關注
關注
42文章
4779瀏覽量
101059 -
人工智能
+關注
關注
1795文章
47642瀏覽量
239763
原文標題:最新研究顯示:AI自發激活了數量感,并會挑選“最喜歡”的數字
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論