今天,DeepMind在Nature上發表的一篇論文引起AI領域和神經科學領域的極大震撼:AI展現出與人腦“網格細胞”高度一致的空間導航能力。這項發現有助于AI的可解釋性和把神經科學作為新算法的靈感來源的重要意義。
大多數動物,包括人類,都能夠靈活地駕馭他們生活的世界——在新的地方探索,迅速返回到記憶中的地方,同時能夠“抄近路”。這些能力如此簡單和自然,以至于很少人在意其底層流程究竟有多復雜。相比之下,雖然AI在圍棋等許多任務超過了人類,空間導航能力對于人工智能體來說仍然是一個巨大的挑戰。
2005年,一項驚人的研究發現揭示了空間行為中神經回路一個關鍵部分:當動物在探索它們所處的環境時,神經元的激發呈現出一種非常規則的六邊形網格。
這些網格被認為有利于空間導航,類似于地圖上的網格線。
除了作為動物的內部坐標系之外,這些神經元——被稱為網格細胞(grid cell)——最近也被假設為支持基于矢量的導航。即:讓大腦計算出到達目的地的距離和方向,“像烏鴉飛行一樣”,即使以前沒有走過確切的路線,動物也可以在不同地點之間直接旅行。
首次發現網格細胞的研究團隊共同獲得2014年的諾貝爾生理學或醫學獎,他們的研究揭示了空間的認知表征工作的方式。但從網格細胞被發現以來,經過10多年的理論論證,網格細胞的計算功能,以及它們是否支持基于矢量的導航,在很大程度上仍然是一個謎。
DeepMind今天發表在Nature上的論文“Vector-based navigation using grid-like representations in artificial agents”中,研究人員開發了一種人工智能體(artificial agent)來測試“網格細胞支持基于矢量的導航”這一理論。
研究人員首先訓練了一個循環網絡來執行在虛擬環境中定位自身的任務,主要使用與運動相關的速度信號。哺乳動物處于不熟悉的地方或不容易發現地表的地方(如在黑暗中行走)時,這種能力會自然地激發。
研究人員發現,類似網格般的表示(grid-like representation,以下稱“網格單元”)自發地出現在網絡中,這與在哺乳動物中觀察到的神經活動模式驚人的一致,也與網格單元為空間提供高效代碼的觀點一致。
圖:用agent進行的實驗產生了類似網格的表示(“網格單元”),它們與哺乳動物中的生物網格細胞非常相似。
接下來,研究人員試圖通過創建一個artificial agent來作為實驗小白鼠,要測試的理論是:網格細胞支持基于矢量的導航。
這是通過將最初的“網格網絡”與一個更大的網絡架構相結合,形成了一個agent,可以使用深度強化學習在具有挑戰性的虛擬現實游戲環境中導航進行訓練。
這個agent的表現超過了專業游戲玩家的能力,展現出動物一般的靈活導航方式,當游戲環境中可以有捷徑時,agent會“抄近路”。
通過一系列實驗操作,研究人員發現網格單元對于基于矢量的導航至關重要。例如,當網絡中的網格單元被掐斷時,agent的導航能力就會受損,而且對目標的距離和方向的判斷等關鍵指標的表示變得不那么準確。
圖:具有網格單元的基于矢量的導航的圖示。底部的圓圈表示3個不同尺度的網格單元類群,有顏色的細胞是活躍的。當agent移動時,網格單元(表示“當前的網格代碼”)會發生變化,以反映agent進入了不同的觸發區域。網格單元用于計算目標的最短路徑。
DeepMind認為,這一研究是理解大腦中網格細胞的基本計算目的的重要一步,同時也突出了它們對人工智能agent的好處。這些證據為“網格細胞提供歐幾里德空間框架,支持基于矢量的導航”的理論提供了有利的支持。
此前研究人員對網格細胞進行的廣泛的神經科學研究提供了在試圖理解其內部表示的線索,有助于agent的可解釋性——這本身就是人工智能研究中的一個主要話題。
這項工作還展示了在虛擬現實環境中使用人工agent積極參與復雜行為,以測試大腦工作原理的潛力。
更進一步,類似的方法可以用來測試那些對感知聲音或控制肢體有重要意義的大腦區域的理論。未來,這樣的網絡很可能為科學家們提供一種新的方法來進行“實驗”,提出新的理論,甚至對目前在動物身上進行的研究提供補充。
DeepMind的聯合創始人兼CEO、該研究的聯合作者Demis Hassabis說:“要證明我們現在致力于構建的通用智能是可行的,人類的大腦是我們現有的唯一證據,因此,把神經科學作為新算法的靈感來源是有意義的。”
針對DeepMind這項研究,國內外眾多專家給與評價
杜克大學陳怡然教授:
春鵬同學評論道:論文中提到的兩個細節值得注意。第一,如果神經網絡的損失函數中不包括正則項,那么神經網絡無法表現出網格細胞功能。這一發現給了我們一個全新的角度去思考正則項的作用。第二,論文指出深度神經網絡的“黑盒”特點阻礙了進一步分析網格細胞活動特性對路徑整合的作用。這一點再次印證了當前研究神經網絡可解釋性的必要。
中科院自動化所何暉光:
在這項工作中,研究人員首先訓練循環神經網絡基于運動速度信息在虛擬環境中定位。這與哺乳動物在不熟悉環境中運動定位所用到的信息非常類似。令人震驚的是,類似網格細胞的模式,研究人員稱之為網格單元,在神經網絡中自然出現,如上圖所示!人工智能的定位方案,與大自然億萬年進化所得到的答案,高度一致。
中科院計算所研究員、中科視拓創始人、董事長兼 CTO 山世光:
基于數據進行學習后得到的人工神經網絡中的規律和模式與長期進化而來的生物神經系統有相似之處——出現這樣的可能性是偶然還是必然,這確實是很有趣,很值得探索的方向。
新加坡南洋理工大學黃廣斌教授:
這也再次說明AI發展突飛猛進,國內和國外在AI算法上的差距越來越大。國內許多AI公司還處在重復使用開源算法階段。除了講故事、描繪理想,專家們也需要帶頭低調踏實做研究。
-
Agent
+關注
關注
0文章
105瀏覽量
26773 -
神經元
+關注
關注
1文章
363瀏覽量
18486
原文標題:Nature再發DeepMind研究:AI復現大腦網格細胞模擬導航!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論