1 傳統馮諾依曼瓶頸
隨著人工智能、物聯網、智能傳感等應用的快速興起,數據以爆發式的速度增長。海量數據的高效存儲、遷移與處理成為當前信息領域的重大挑戰。受限于經典的馮諾依曼計算架構存儲與處理分離的特性,在面向大數據分析等應用場景中,數據總線的帶寬嚴重制約了處理器的性能與能量效率,并且數據的頻繁遷移帶來嚴重的傳輸功耗問題。
存內計算架構在此基礎上應運而生。如圖-1b所示,通過賦予存儲器計算功能,以數據為中心,避免不必要的數據頻繁搬運,降低系統的功耗和延時。
圖1 (a)經典馮諾依曼架構圖;(b)主處理器+存內計算的架構示意圖;(c)基于不同存儲介質的存內計算技術百花齊放。
近年來,基于不同存儲介質的存內計算技術不斷涌現,并受到學術界和工業界的廣泛關注。從2017年至今,存內計算主題開始頻繁出現在電路和芯片領域的頂級會議/期刊上(ISSCC、VLSI、IEDM、JSSC、TCAS-I),且占比快速增加。
2 產業界相繼發布存內計算芯片
工業界方面,臺積電、三星、英特爾、IBM、Global Foundries、IMEC等國際半導體巨頭相繼于2021-2023年期間發布了各自的存內計算原型芯片或初期商用芯片,但仍沒有十分完善的產品出現。存內計算技術采用非馮諾依曼架構,在大數據時代,為人工智能、物聯網、智能傳感器等領域提供高效的硬件解決方案,有重要的應用價值。
三星在頂級學術期刊Nature上發表了全球首個基于MRAM(磁性隨機存儲器)的存內計算研究,緊接著臺積電在近日的ISSCC上合作發表了六篇關于存內計算存儲器IP的論文,大力推進基于ReRAM的存內計算方案。
2.1 三星發布基于MRAM的存內計算
2022年,三星半導體宣布,通過結構創新,實現了基于MRAM(磁阻隨機存取存儲器)的內存內計算(In-Memory Computing),進一步拓展了三星的下一代低功耗人工智能芯片技術的前沿領域。
MRAM磁阻內存很難用于內存內計算,因為它在標準的內存內計算架構中無法發揮低功耗優勢。
三星研究團隊設計了一種名為“電阻總和”(resistance sum)的新型內存內計算架構,取代標準的“電流總和”(current-sum)架構,成功開發了一種能演示內存內計算架構的MRAM陣列芯片,命名為“用于內存內計算的磁阻內存交叉陣列”(crossbar array of magnetoresistive memory devices for in-memory computing)。
成功解決了單個MRAM器件的小電阻問題,從而降低功耗,實現了基于MRAM的內存內計算。按照三星的說法,在執行AI計算時,MRAM內存內計算可以做到98%的筆跡識別成功率、93%的人臉識別準確率。
2.2 臺積電發布獨立式STT-MRAM
2024年2月20日,中國臺灣“國研院半導體研究中心”宣布,與臺積電合作開發的“選擇器元件與自旋轉移力矩式磁性存儲整合”(Selector and STT-MRAM Integration)技術,于2023年12月全球頂尖電子元件會議IEDM(International Electron Devices Meeting)中發表,并獲選為Highlight Paper,成為全世界極少數成功開發出高密度、高容量的獨立式STT-MRAM制作技術的團隊。
由于STT-MRAM具備高速度、高可靠度、小體積、省電等優點,十分適合應用于云端計算與物聯網上進行大量的數據儲存。
據悉,臺積電三十幾年來一直致力科技創新及研發,重視技術自主,近年研發經費投入平均是營收的8%,2020年研發經費首度超過1000億元新臺幣,未來隨著業務不斷成長,研發經費會越來越多。
3MRAM存內計算的發展
存內計算對存儲介質適配性的評價主要從以下幾個方面出發:非易失性、能否形成交叉陣列、不同狀態比率、單元計算時輸出量、存儲密度、功耗、響應速度、工藝成熟度、制造成本、器件一致性等。當前,如圖-1c所示,基于多種存儲介質的存內計算研究和應用百花齊放,如靜態隨機存儲器(SRAM)、動態隨機存儲器(DRAM)、閃存(Flash)、憶阻器(ReRAM)、鐵電晶體管(FeFET)、相變存儲器(PCM)、磁隨機存儲器(MRAM)等。然而,基于上述評價標準,由于物理特性限制,各類存儲介質在存內計算應用的不同場景上各有優劣,尚未出現統一的解決方案。MRAM是非易失器件,具有高耐久性、高速度、低功耗、微縮性好、器件一致性好等優點,當前第一代(Toggle-MRAM)、第二代(STT-MRAM)都已在國外實現量產,基于MRAM的存內計算技術關注度快速提升。
圖2 MRAM存內計算技術分布圖
筆者按照技術特點對主要的MRAM存內計算進行了大致的分類,如圖2所示。
3.1 數字存內計算技術
早期MRAM存內計算技術以數字存內計算技術為主,包含廣義上的MRAM近存計算(主要利用其高密度、高速度、非易失的特性,離實際應用較為接近,方便落地)及利用讀寫外圍電路輔助實現布爾邏輯運算的高校研究類工作為主,私以為兩者實際非常接近,本質都為近存計算,只是“近的”程度不同(圖3)。
圖3 中國臺灣清華MRAM近存計算方案及北航MRAM布爾邏輯存內計算方案
3.2電阻式的模擬存內計算方案
第二類為電阻式的模擬存內計算方案。模擬存內計算一直是近年來的熱門,以NOR flash、ReRAM、SRAM等為代表的模擬存內計算方案層出不窮。MRAM由于其出色的一致性、微縮能力、非易失、高密度、工藝成熟度等特性本應十分適合模擬存內計算方案。然而,現有第一、二代MRAM阻值(<10KΩ)及高低阻值比率較低(<300%),只能存儲單比特數據,在存內計算底層電路性能上帶來諸多不利影響。如何突破MRAM器件物理特性限制,研究高性能的MRAM存內計算電路結構有著重要意義。IMEC采用高阻值的自旋軌道矩(SOT)器件(MΩ級別),解決器件電阻問題,且其高一致性在一定程度上降低了高低阻值比率較小的影響(圖4)。三星電子則采用另一條路徑,采用電阻加和的形式,提升整體的計算阻值,解決電阻問題,但該方案同樣面臨面積效率低、計算精度、速度等問題(圖5)。
圖4 IMEC高阻值SOTMRAM存內計算
圖5 三星電子電阻加和式存內計算方案
3.3 概率計算及隨機計算
第三類為概率計算及隨機計算等方向,其通常利用MRAM本身隨機翻轉的本征物理特性進行特定問題的計算或概率流的計算。第三類主要由高校在進行研究,應用前景較為受限,此處不再詳細展開。
雖然MRAM在模擬存內計算方面受到上述挑戰,但目前已有一些有效的解決方案。憑借MRAM密度、非易失等其他優異特性,其在模擬存內計算及數字存內計算方向仍然受到較高的關注。
4 國內存內計算產業的發展
我國的存內計算產業也開始迅猛發展,知存科技、九天睿芯、智芯科、后摩智能、蘋芯科技等國內專注存內計算賽道的新興公司紛紛獲得融資,加速在該領域的早期市場布局及商業落地。
以知存科技推出的量產SoC芯片WTM2101,WTM2101基于40 nm工藝進行流片,單個NOR Flash 器件能夠存儲8 bit權重,因此可以進行8 bit精度的矩陣乘加運算。WTM2101具有4大優勢特點:
(1)基于存內計算架構,可高效地實現神經網絡語音激活檢測和上百條語音命令詞識別。
(2)以超低功耗實現神經網絡環境降噪算法、健康監測與分析算法。
(3)典型應用場景下,工作功耗均在微瓦級別。
(4)采用極小封裝尺寸。
基于以上優勢特點, WTM2101可應用于智能可穿戴設備、智能家居、安防監控、玩具機器人等;適應多種應用,如語音識別、語音降噪/增強、輕量級視覺識別、健康監測和聲紋識別等。
參考文獻
[01]https://tech.sina.com.cn/n/k/2022-01-13/doc-ikyamrmz4934582.shtml
[02]https://www.laoyaoba.com/n/891415
[03]https://36kr.com/p/1665309247756289
[04]https://blog.csdn.net/younger_china/article/details/136058833
[05]郭昕婕等,存內計算芯片研究進展及應用
審核編輯 黃宇
-
存儲器
+關注
關注
38文章
7493瀏覽量
163868 -
芯片架構
+關注
關注
1文章
30瀏覽量
14562 -
MRAM
+關注
關注
1文章
236瀏覽量
31731 -
存內計算
+關注
關注
0文章
30瀏覽量
1381
發布評論請先 登錄
相關推薦
評論