“拋棄馮諾依曼架構(gòu)”,“模仿人類大腦計算”,近年來,這些噱頭為類腦芯片吸引了不少人的注意。他們相中了這類“非傳統(tǒng)”芯片在AI上的潛力,畢竟將AI計算做到大規(guī)模和低功耗還是一件不小壯舉。因此類腦芯片被諸多低功耗邊緣應用看好,而傳統(tǒng)的密集型云端計算的重任仍然擔在傳統(tǒng)的AI芯片的肩上。
無論是Fabless,還是IDM,不少大廠其實都在關(guān)注邊緣AI的市場,比如英特爾的Movidius和英偉達的Jetson等等。但市面上也有一些廠家在發(fā)力類腦芯片的開發(fā),同時探索新架構(gòu)的芯片上將用到怎樣的軟件開發(fā)生態(tài)。因為這些類腦芯片往往用到的是脈沖神經(jīng)網(wǎng)絡(SNN),直接拿常用的卷積神經(jīng)網(wǎng)絡(CNN)或人工神經(jīng)網(wǎng)絡(ANN)硬套的話,是萬萬行不通的。也正是因為軟硬件上的雙重挑戰(zhàn),限制了類腦芯片的商用。
鉆研5載的英特爾
英特爾的類腦芯片已經(jīng)研究了近5年之久了,早在2017年英特爾就發(fā)布了基于14nm制程的Loihi芯片,該芯片具備13萬個神經(jīng)元,1.3億個神經(jīng)突觸。2021年英特爾又公布了Loihi的繼任者Loihi 2,該芯片基于更名后的Intel 4制程,將芯片大小從60mm2縮小至31mm2,卻依然集成了百萬個神經(jīng)元和1.2億神經(jīng)突觸。
Loihi 2類腦芯片 / 英特爾
雖然這些Loihi芯片都具備可觀的規(guī)模,但類腦芯片并沒有走向HPC的高性能之路,而是繼續(xù)堅持低功耗的優(yōu)勢,這一點從英特爾在評估Loihi時進行的應用展示也可以看出。英特爾稱在三年多的研究中,他們嘗試的應用有自適應機器臂控制、學習與識別新的氣味與手勢、比視覺輸入延遲更低的無人機電機控制,以及解決鐵路調(diào)度等優(yōu)化問題。在這些應用中,與傳統(tǒng)CPU加GPU方案動輒幾百瓦的功耗相比,Loihi的功耗甚至不到1W,可以做到mW級的功耗和ms級響應時間。
當然了,單靠類腦芯片的硬件是遠遠不夠的,類腦芯片商業(yè)化進展緩慢的一大原因就是缺乏清晰高效的編程模型,為此英特爾開發(fā)了一個開源類腦計算框架Lava。Lava不僅支持離線訓練,還可以集成TensorFlow、PyTorch和ROS這樣的第三方框架,開發(fā)者可以自行對其進行擴展。
Oheo Gulch板卡 / 英特爾
不過英特爾的Intel 4制程還未正式面世,目前只準備了兩種Loihi 2硬件供研究人員遠程線上測試,一個是用于早期評估的單片系統(tǒng)Oheo Gulch,另一個則是尚未面世的8芯片系統(tǒng)Kapoho Point。
率先商用的Brainchip
英特爾的類腦芯片尚處于發(fā)展初期階段,即便是第二代Loihi目前也僅僅只是研究芯片,并沒有一個定下來的商用路線。反觀其他的大廠,IBM的TrueNorth芯片已經(jīng)多年沒有動靜,而三星的類腦芯片雖然已經(jīng)宣布可量產(chǎn),但還沒有任何成品或設計面世。反倒是一家名不見經(jīng)傳的公司,BrainChip,最先開啟了類腦芯片的商業(yè)化道路。
Akida類腦處理器 / BrainChip
去年10月BrainChip發(fā)布了兩款開發(fā)套件,分別是用于x86的Shuttle PC套件和用于Arm樹莓派的套件,兩個套件均采用了BrainChip的類腦芯片 AKD1000。AKD1000類腦芯片基于BrainChip 的Akida IP和臺積電28nm制程,卻做到了120萬個神經(jīng)元和100億的神經(jīng)突觸的規(guī)模,功耗范圍在微瓦級到毫瓦級。BrainChip也為Akida處理器準備了MetaTF這一開發(fā)環(huán)境,支持利用Python編程語言和Jupyter notebooks、Numpy這樣的開發(fā)工具和庫,輕易將CNN轉(zhuǎn)換成SNN。
除了PCIe和Mini-PCIe的開發(fā)套件外,Akida也開始在汽車市場露面了。在今年CES梅賽德斯奔馳展示的Vision EQXX概念車中,其語音控制系統(tǒng)就用到了BrainChip的Akida類腦芯片。根據(jù)梅賽德斯奔馳的聲明,Akida類腦芯片為其語音控制系統(tǒng)中的關(guān)鍵詞檢測提供了更低的功耗,與傳統(tǒng)的語音控制方案相比效率提升了5到10倍。從BrainChip的急速商業(yè)化來看,類腦芯片并不一定要像英特爾的Loihi一樣用上先進制程,也能做到優(yōu)秀的性能。
浙大的達爾文芯片
不少高校同樣開展了類腦芯片的研究,其中之一就是浙江大學。2015年和2019年,浙江大學分別推出了第一代和第二代達爾文類腦計算芯片,其聯(lián)合之江實驗室也在2020年成功研制出當時神經(jīng)元規(guī)模最大的類腦計算機Darwin Mouse。該計算機內(nèi)部包含792顆達爾文2代類腦芯片,共1.2億神經(jīng)元,近千億神經(jīng)突觸,功耗范圍在350W到500W范圍內(nèi),由此計算達爾文2代類腦芯片的單片規(guī)模為15萬神經(jīng)元和1.2億神經(jīng)突觸左右。
這792顆芯片采用了每四顆芯片組成一塊板子,再由多塊板子組成模塊打造類腦計算機,由此可見的達爾文2代類腦計算芯片的擴展性。為了完成神經(jīng)元的高效互聯(lián)和調(diào)用,其科研人員還開發(fā)了面向該計算機的類腦操作系統(tǒng)DarwinOS,并基于該計算機和操作系統(tǒng)完成了多種智能任務,比如多個抗洪搶險機器人的協(xié)同、基于腦電信號的“意念打字”和音樂詩詞的時序記憶等。
不過這樣的類腦計算機體積依然是一個問題,在792顆芯片的拼裝下,這臺計算機占據(jù)了3個1.6米高的機柜,如何進一步減小芯片體積都是實現(xiàn)邊緣AI計算最急迫的問題。而且達爾文芯片的規(guī)模還有提升的空間,Darwin Mouse類腦計算機的神經(jīng)元和突觸規(guī)模看似很大,與生物大腦相比也就只有小鼠大腦的規(guī)模,離人類的大腦規(guī)模還有很大的差距。雖然可以犧牲體積,但這與邊緣AI的愿景就有些背道而馳了。
結(jié)語
從目前的應用市場來看,類腦芯片尚處于一個研究發(fā)展階段,還存在軟硬件開發(fā)不成熟的問題。雖然已經(jīng)有了大廠入局,但目前連量產(chǎn)都不成熟,應用方向上也在探索傳統(tǒng)AI芯片走過的老路。固然類腦芯片的前景值得期待,至于大規(guī)模商用,仍是一個比較遙遠的夢。
-
英特爾
+關(guān)注
關(guān)注
61文章
10002瀏覽量
172124 -
AI
+關(guān)注
關(guān)注
87文章
31429瀏覽量
269821 -
類腦芯片
+關(guān)注
關(guān)注
2文章
14瀏覽量
4919 -
BrainChip
+關(guān)注
關(guān)注
0文章
1瀏覽量
1504
發(fā)布評論請先 登錄
相關(guān)推薦
評論