這些團隊開發了第一個內存計算芯片,以比其他平臺更低的能量和更高的精度來處理一系列 AI 應用程序。
邊緣 AI 計算的圣杯是同時提供高效率、高性能和多功能性的芯片。獲得所有這三個一直以來對設計人員構成了重大挑戰,因此,許多人已經開始完全考慮新的計算架構。
其中一種新架構是內存計算,旨在消除數據移動瓶頸,以實現比傳統數字處理單元更高的效率和更好的性能。本周,一組國際研究人員發表了一篇論文,描述了一種基于電阻隨機存取存儲器(RRAM) 的新型內存計算芯片。
NeuRRAM 神經形態芯片。圖片由UCSD提供
在本文中,我們將討論用于內存計算 (CIM) 的 RRAM、這些解決方案的歷史缺陷以及該小組的新“NeuRRAM”神經形態芯片。
用于內存計算的電阻式 RAM
在過去的 30 年中,設計人員一直在研究內存計算的想法,最近,基于電阻 RAM 的內存計算。
RRAM CIM 消除了馮諾依曼瓶頸,這是單獨的內存和計算的結果,而是將它們合并在一起。在此架構中,電阻式 RAM 元件用于存儲器存儲,其中二進制數字基于每個單元中 RRAM 材料的電阻狀態存儲。在這里,施加電壓可能會導致 RRAM 成為高電阻材料,代表數字 1,反之亦然。讀取存儲器中的位是通過向 RRAM 單元施加電壓并讀取產生的電流來實現的,該電流將根據 RRAM 的狀態而變化。
使用 RRAM CIM 單元的乘法示例。圖片由SemiWiki提供
RRAM 是一種非常節能、小型且非易失性的存儲器。這種架構也非常適合人工智能計算的環境,因為機器學習計算嚴重依賴于可以用 RRAM 輕松實現的乘法和累加函數。由于感測電流能夠讀取 RRAM 結果,因此可以通過對一個或一系列結中的電流求和來輕松地將 RRAM 值相加和相乘。
RRAM CIM的缺點
盡管 RRAM CIM 有諸多好處,但這項技術的研發仍然充滿了障礙。
一方面,早期的研究大多集中在 RRAM 芯片上執行 AI 計算,但仍然依賴片外資源來執行其他基本功能,例如模數轉換和神經元激活。這不僅限制了系統性能,而且還影響了基準測試。從歷史上看,結果是基于設備特性的軟件仿真,這幾乎總是樂觀的。
除此之外,RRAM CIM 設備中的能源效率、多功能性和準確性之間存在固有的權衡。根據加州大學圣地亞哥分校 (UCSD)、斯坦福大學、清華大學和圣母大學的一組研究人員的說法,以前的研究從未嘗試同時針對所有三個標準進行優化。
NeuRRAM 達到效率、準確性、靈活性
本周,來自加州大學圣地亞哥分校、斯坦福大學、清華大學和圣母大學的研究人員在 Nature 上發表了一份報告,描述了他們稱之為NeuRRAM的 RRAM CIM 芯片。
據說 NeuRRAM 神經形態芯片由于采用了輸出傳感方法,實現了效率、準確性和靈活性的結合。與讀取輸出電流的傳統技術相比,NeuRRAM 使用神經元電路來感應電壓并在芯片上執行高效的模數轉換。
CIM 內核和 NeuRRAM 架構的框圖。圖片由Nature 和 Wan 等人提供
該架構包括與 RRAM 位單元共存的 CMOS 神經元電路。NeuRRAM 是一種神經形態的 AI 芯片,由 48 個神經突觸核心、256 個 CMOS 神經元和 65,536 個 RRAM 單元組成,它們執行并行處理,可以支持數據和模型并行性。這允許將不同的模型層映射到不同的內核以實現最大的多功能性。
國際研究人員團隊聲稱,該芯片可以實現比傳統數字處理器低 2.3 倍的能量延遲積 (EDP),同時還提供高達 13 倍的計算密度。據說 NeuRRAM 的手寫數字識別準確率達到 99%,圖像分類準確率達到 85.7%,語音識別準確率達到 84.7%。
總而言之,該研究表明,該芯片與傳統數字芯片的精度相匹配,但能量消耗顯著減少,密度更高。設計該芯片時考慮到邊緣計算的研究人員聲稱,NeuRRAM 的低功耗和高性能可能會啟用目前無法使用現有技術的新型設備。
審核編輯 黃昊宇
-
芯片
+關注
關注
456文章
51156瀏覽量
426461 -
內存芯片
+關注
關注
0文章
126瀏覽量
21897 -
AI
+關注
關注
87文章
31491瀏覽量
270000 -
RRAM
+關注
關注
0文章
28瀏覽量
21365
發布評論請先 登錄
相關推薦
評論