2023年,算力正被ChatGPT推上數(shù)字時(shí)代的寶座。
在今年第十七屆中國IDC產(chǎn)業(yè)年度大典上,各路大佬們都在圍繞“算力”,展開自己的暢想:
中國信通院云計(jì)算與大數(shù)據(jù)研究所所長何寶宏表示,數(shù)字世界消耗最核心的能源是算力,算力是今天的“三次能源”。
稱算力是“三次能源”,一是因?yàn)樗懔κ峭ㄟ^各種芯片、軟件等數(shù)字技術(shù),從二次能源電力加工轉(zhuǎn)換而來;二是因?yàn)?,算力與電力一樣有著舉足輕重的地位:電力網(wǎng)絡(luò)是一個(gè)國家工業(yè)化的基礎(chǔ),算力網(wǎng)絡(luò)是一個(gè)國家數(shù)字化的基礎(chǔ)。
各路大佬除了對(duì)算力提出暢想,也給出了實(shí)際規(guī)劃路線:在大會(huì)上,商湯科技、鵬博士大數(shù)據(jù)、浩云長盛、超聚變、竹間智能等業(yè)內(nèi)專業(yè)人士表示,未來數(shù)據(jù)中心將分化成兩種類型:追求極致算力的數(shù)據(jù)中心與產(chǎn)業(yè)賦能型的數(shù)據(jù)中心。
據(jù)介紹,追求極致算力的數(shù)據(jù)中心旨在提供最大的計(jì)算能力,以滿足越來越龐大的AI模型的訓(xùn)練需求。這類數(shù)據(jù)中心主要關(guān)注計(jì)算能力和效率,目標(biāo)是實(shí)現(xiàn)極高的性能和運(yùn)算速度,通常會(huì)采用最先進(jìn)的硬件設(shè)備,如高性能處理器、GPU和高速內(nèi)存。
“極致”二字,全然顯示著,算力正成為“緊俏貨”,需要快馬加鞭去布局。這,也是目前的現(xiàn)狀:除了“東數(shù)西算”工程的啟動(dòng),國家以及科技企業(yè)正加緊對(duì)液冷、水下數(shù)據(jù)中心、量子計(jì)算的實(shí)踐與探索,企圖補(bǔ)上算力的“窟窿”。
而當(dāng)前,最熱門的解決方案,莫過于“存算一體”。
存算一體(Computing in Memory),就是在存儲(chǔ)器中嵌入計(jì)算能力,以新的運(yùn)算架構(gòu)進(jìn)行二維和三維矩陣乘法/加法運(yùn)算。與以往的馮諾依曼架構(gòu)相比,其打破了由于計(jì)算單元與存儲(chǔ)單元過于獨(dú)立而導(dǎo)致的“存儲(chǔ)墻”,能夠達(dá)到用更低功耗實(shí)現(xiàn)更高算力的效果。
自2022年開始,芯片領(lǐng)域“天降紫微星”,存算一體實(shí)打?qū)嵉鼗鹆耍?/p>
學(xué)界,ISSCC上存算/近存算相關(guān)的文章數(shù)量迅速增加:從20年的6篇上漲到23年的19篇;其中數(shù)字存內(nèi)計(jì)算,從21年被首次提出后,22年迅速增加到4篇。
產(chǎn)界,巨頭紛紛布局存算一體,國內(nèi)陸陸續(xù)續(xù)也有近十幾家初創(chuàng)公司押注該架構(gòu):
在特斯拉2023 Investor Day預(yù)告片末尾,特斯拉的do-jo超算中心和存算一體芯片相繼亮相;
在更早之前,三星、阿里達(dá)摩院包括AMD也早早布局并推出相關(guān)產(chǎn)品,且“用過的都說好”:
阿里達(dá)摩院表示,相比傳統(tǒng)CPU計(jì)算系統(tǒng),存算一體芯片的性能提升10倍以上,能效提升超過300倍;
三星表示,與僅配備HBM的GPU加速器相比,配備HBM-PIM的GPU加速器一年的能耗降低了約2100GWh。
目前,國內(nèi)的億鑄科技、知存科技、蘋芯科技、九天睿芯等十余家初創(chuàng)公司采用存算一體架構(gòu)投注于AI算力,其中億鑄科技專注AI大算力。
同時(shí),我們可以看到,各個(gè)初創(chuàng)公司選擇了不同的存儲(chǔ)介質(zhì):RRAM、SRAM、閃存等,且各家公司芯片適用的場景也有所區(qū)別。
本文,偲睿洞察將梳理國內(nèi)外已經(jīng)入場的科技企業(yè),試圖描繪一幅存算一體全景圖。
01.?存算一體的“兄弟姐妹”
一時(shí)間,學(xué)術(shù)界、產(chǎn)業(yè)界紛紛向存算一體拋去橄欖枝,而大家所青睞的存算一體,大不相同。
學(xué)術(shù)界和產(chǎn)業(yè)界對(duì)存算一體的技術(shù)路徑尚未形成統(tǒng)一的分類,目前主流的劃分方法是依照計(jì)算單元與存儲(chǔ)單元的距離,將其大致分為近存計(jì)算(PNM)、存內(nèi)處理(PIM)、存內(nèi)計(jì)算(CIM)。
近存計(jì)算(PNM)
近存計(jì)算,本質(zhì)上仍是存算分離架構(gòu),計(jì)算操作仍由位于存儲(chǔ)外部、獨(dú)立的計(jì)算單元完成。只不過,該構(gòu)架能夠通過存儲(chǔ)上移或計(jì)算的方式,讓數(shù)據(jù)靠近計(jì)算單元,從而縮小數(shù)據(jù)移動(dòng)的延遲和功耗。 特斯拉、阿里達(dá)摩院、三星等大廠所選擇的,便是近存計(jì)算。 據(jù)Dojo項(xiàng)目負(fù)責(zé)人Ganesh Venkataramanan介紹,特斯拉Dojo(AI訓(xùn)練計(jì)算機(jī))所用的D1芯片相比于業(yè)內(nèi)其他芯片,同成本下性能提升4倍,同能耗下性能提高1.3倍,占用空間節(jié)省5倍。 具體來說,在D1訓(xùn)練模塊方面,每個(gè)D1訓(xùn)練模塊由5x5的D1芯片陣列排布而成,以二維Mesh結(jié)構(gòu)互連。片上跨內(nèi)核SRAM達(dá)到驚人的11GB,由于用上近存計(jì)算架構(gòu),能效比為0.6TFLOPS/W@BF16/CFP8。業(yè)內(nèi)人士表示,對(duì)于CPU架構(gòu)來說,這一能效比非常不錯(cuò)。 阿里達(dá)摩院在2021年發(fā)布采用混合鍵合(Hybrid Bonding)的3D堆疊技術(shù)——將計(jì)算芯片和存儲(chǔ)芯片face-to-face地用特定金屬材質(zhì)和工藝進(jìn)行互聯(lián)。在實(shí)際推薦系統(tǒng)應(yīng)用中,相比傳統(tǒng)CPU計(jì)算系統(tǒng),存算一體芯片的性能提升10倍以上,能效提升超過300倍。 三星基于存內(nèi)處理架構(gòu),發(fā)布存儲(chǔ)器產(chǎn)品HBM-PIM(嚴(yán)格意義上是PNM)。三星表示該架構(gòu)實(shí)現(xiàn)了更高性能與更低能耗:與其他沒有HBM-PIM芯片的GPU加速器相比,HBM-PIM芯片將AMD GPU加速卡的性能提高了一倍,能耗平均降低了約50%。與僅配備HBM的GPU加速器相比,配備HBM-PIM的GPU加速器一年的能耗降低了約2100GWh。
存內(nèi)處理(PIM)
存內(nèi)處理,本質(zhì)上同樣是存算分離,不過相較于近存計(jì)算,“存”與“算”距離更近:獨(dú)立的計(jì)算單元內(nèi)嵌于存儲(chǔ)芯片,同樣也是各干各的。 國內(nèi)知存科技選擇的便是存內(nèi)處理:2022年3月,知存科技量產(chǎn)的基于PIM的SoC芯片WTM2101正式投入市場。距今未滿1年,WTM2101已成功在端側(cè)實(shí)現(xiàn)商用,提供語音、視頻等AI處理方案并幫助產(chǎn)品實(shí)現(xiàn)10倍以上的能效提升。
存內(nèi)計(jì)算(CIM)
存內(nèi)計(jì)算,才是真正的、狹義的存算一體。在該框架下,存儲(chǔ)單元和計(jì)算單元完全融合,沒有獨(dú)立的計(jì)算單元:直接在存儲(chǔ)器顆粒上嵌入算法,由存儲(chǔ)器芯片內(nèi)部的存儲(chǔ)單元完成計(jì)算操作。 這,也就是國內(nèi)大部分初創(chuàng)公司所說的存算一體:
億鑄科技,基于CIM框架、RRAM存儲(chǔ)介質(zhì)的研發(fā)“全數(shù)字存算一體”大算力芯片,通過減少數(shù)據(jù)搬運(yùn)提高運(yùn)算能效比,同時(shí)利用數(shù)字存算一體方法保證運(yùn)算精度,適用于云端AI推理和邊緣計(jì)算。
智芯科微,于2022年底推出業(yè)界首款基于SRAM CIM的邊緣側(cè)AI增強(qiáng)圖像處理器。
并且存內(nèi)計(jì)算,正一步步提高聲量:在ISSCC 2023的34個(gè)session中,有3個(gè)session的標(biāo)題都直接用到存內(nèi)計(jì)算。 可以看到,大公司與初創(chuàng)公司“自覺”分為兩個(gè)陣營:特斯拉、三星、阿里巴巴等擁有豐富生態(tài)的大廠以及英特爾,IBM等傳統(tǒng)的芯片大廠,幾乎都在布局PNM;而知存科技、億鑄科技、智芯科等初創(chuàng)公司,在押注PIM、CIM等“存”與“算”更親密的存算一體技術(shù)路線。 綜合生態(tài)大廠思量的是,如何快速攻破算力和功耗的瓶頸,讓自己豐富的應(yīng)用場景快速落地;芯片大廠們針對(duì)客戶所提出的高效算力和低功耗需求,開發(fā)出符合客戶需求的技術(shù)。 也就是說,大廠對(duì)存算一體架構(gòu)提出的需求是“實(shí)用、落地快”,而近存計(jì)算作為最接近工程落地的技術(shù),成為大廠們的首選。 而中國初創(chuàng)公司們,由于成立時(shí)間較短、技術(shù)儲(chǔ)備薄弱:缺乏先進(jìn)2.5D和3D封裝產(chǎn)能和技術(shù),為打破美國的科技?jí)艛啵袊鮿?chuàng)企業(yè)聚焦的是無需考慮先進(jìn)制程技術(shù)的CIM。 02.?“新老”器件,硝煙四起
從目前發(fā)展路徑來看,存算一體芯片正處于多種存儲(chǔ)介質(zhì)百花齊放的格局,存算一體架構(gòu)正承載著多種存儲(chǔ)介質(zhì):
傳統(tǒng)存儲(chǔ)器陣營,易失性存儲(chǔ)器包括SRAM、DRAM、非易失性存儲(chǔ)器包括NAND、NOR等,新型存儲(chǔ)器包括RRAM、MRAM等。同時(shí),不同介質(zhì)使用的應(yīng)用場景也大不相同。 目前,在傳統(tǒng)存儲(chǔ)器陣營中,SRAM、DRAM、NOR Flash出現(xiàn)的頻次更高。
SRAM
一種靜態(tài)隨機(jī)存儲(chǔ)器,原理是利用晶體管是否接通來代表一個(gè)bit是1還是0,有著以下特性:
基于速度快、成熟度高、密度難以突破的特性,SRAM一直廣受歡迎: 在學(xué)術(shù)領(lǐng)域,SRAM憑借其高成熟度和高存取速度成為存算一體領(lǐng)域里的熱門研究對(duì)象; 在市場應(yīng)用方面,SRAM作為傳統(tǒng)存儲(chǔ)介質(zhì)適合IP化,SRAM存算一體在中小算力、端側(cè)、對(duì)待機(jī)功耗無要求的場景,例如可穿戴設(shè)備、無人車等市場具有一定的應(yīng)用價(jià)值: 九天睿芯,基于神經(jīng)擬態(tài)感存算一體架構(gòu)的芯片已實(shí)現(xiàn)量產(chǎn),應(yīng)用于智能語音和視覺識(shí)別領(lǐng)域。 蘋芯科技,開發(fā)實(shí)現(xiàn)多款基于SRAM的存內(nèi)計(jì)算加速單元并實(shí)現(xiàn)流片,目前處于外部測試和demo階段,產(chǎn)品應(yīng)用于圖像識(shí)別、無人機(jī)等領(lǐng)域。
DRAM
一種動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器,原理是利用電容內(nèi)存儲(chǔ)電荷的多寡來代表一個(gè)bit是1還是0。該存儲(chǔ)器有著以下特性:
基于容量大、成本低、功耗大等特性,DRAM常用于更注重容量的主存儲(chǔ)器,如計(jì)算機(jī)、智能手機(jī)、服務(wù)器內(nèi)存等。
NOR Flash
一種非易失閃存技術(shù),利用存儲(chǔ)單元的多值特性,通過器件本征的物理電氣行為(例如基爾霍夫定律與歐姆定律)來實(shí)現(xiàn)多值MAC 運(yùn)算。該存儲(chǔ)器有著以下特性:
基于低功耗、容量小等特性,NOR FLASH更適用于車載攝像頭、激光雷達(dá)等應(yīng)用場景:
(Flash 在汽車電子中的應(yīng)用容量與領(lǐng)域 圖源:財(cái)信證券) 而在新型存儲(chǔ)器中,RRAM、MRAM、PCM活躍度更高。
RRAM(ReRAM)
一種以非導(dǎo)性材料的電阻在外加電場作用下,在高阻態(tài)和低阻態(tài)之間實(shí)現(xiàn)可逆轉(zhuǎn)換為基礎(chǔ)的非易失性存儲(chǔ)器。該存儲(chǔ)器有著以下特性:
目前,RRAM工藝正一步步成熟:在2021年,晶圓代工廠臺(tái)積電現(xiàn)身,為RRAM站臺(tái):宣布40nmRRAM進(jìn)入量產(chǎn),28nm和22nmRRAM準(zhǔn)備量產(chǎn)。 國內(nèi)同樣傳來利好消息:2022年2月,昕原半導(dǎo)體主導(dǎo)建設(shè)的RRAM 12寸中試生產(chǎn)線順利完成了自主研發(fā)裝備的裝機(jī)驗(yàn)收工作,實(shí)現(xiàn)中試線工藝流程的通線,并成功流片(試生產(chǎn))。 在工藝漸趨成熟背景下,基于兼容性高、微縮性好等特性,RRAM更適用于以下場景:
云端AI推理和邊緣計(jì)算。億鑄科技基于RRAM研發(fā)的“全數(shù)字存算一體”大算力芯片,通過減少數(shù)據(jù)搬運(yùn)提高運(yùn)算能效比,同時(shí)利用數(shù)字存算一體方法保證運(yùn)算精度,適用于云端AI推理和邊緣計(jì)算。
智能汽車。據(jù)云岫資本表示,RRAM不僅滿足高讀寫速度和存儲(chǔ)密度的要求,同時(shí)延遲可降低1000倍,可滿足未來智能駕駛高實(shí)時(shí)數(shù)據(jù)吞吐量。安全性方面,RRAM具備寬溫和可靠性。未來有望出現(xiàn)高性能、高集成度、高穩(wěn)定性和低功耗的車規(guī)RRAM存儲(chǔ)器。
AI數(shù)據(jù)中心。RRAM相較NAND可提升100倍的讀寫性能,同時(shí)保持更低的功耗和高存儲(chǔ)密度,有望解決未來數(shù)據(jù)中心高能效比,低延遲的需求,實(shí)現(xiàn)更高性能的AI數(shù)據(jù)中心。
GPT-4等大模型。RRAM基于高密度存儲(chǔ),工藝兼容帶來的性能優(yōu)勢(shì),能夠?qū)崿F(xiàn)更低功耗、更高性能,緩解目前的算力壓力。
MRAM
是一種基于隧穿磁阻效應(yīng)的技術(shù)。該技術(shù)的工作原理是使用隧道層的“巨磁阻效應(yīng)”來讀取位單元,當(dāng)該層兩側(cè)的磁性方向一致時(shí)為低電阻,當(dāng)磁性方向相反時(shí),電阻會(huì)變得很高。該存儲(chǔ)器有以下特性:
基于耐久性高、低功耗等特性,MRAM有以下合適的應(yīng)用領(lǐng)域:
適用于消耗大量計(jì)算資源的神經(jīng)網(wǎng)絡(luò)計(jì)算。
智能電表等長時(shí)間、龐大數(shù)據(jù)量的應(yīng)用場景,它能滿足對(duì)高耐久性和快速寫入速度的需求。
PCM
PCM的原理是通過改變溫度,讓相變材料在低電阻結(jié)晶(導(dǎo)電)狀態(tài)與高電阻非結(jié)晶(非導(dǎo)電)狀態(tài)間轉(zhuǎn)換。該存儲(chǔ)器有以下特性:
基于抗輻射性好但成本、良率低等特性,根據(jù)我國擁有PCM相變存儲(chǔ)器生產(chǎn)能力的集成電路IDM企業(yè)時(shí)代全芯官網(wǎng)顯示,PCM有以下應(yīng)用領(lǐng)域:
人工智能運(yùn)算;PCM為基礎(chǔ)的TCAM具有占地面積小,功耗低的優(yōu)點(diǎn)。
AIOT;將智能存儲(chǔ)器應(yīng)用與IoT的傳感器上,可以有效的分擔(dān)傳感器對(duì)網(wǎng)絡(luò)和云計(jì)算的負(fù)荷,從而進(jìn)一步拓展物聯(lián)網(wǎng)的功能。
綜合來講,存儲(chǔ)介質(zhì)各有各的優(yōu)點(diǎn),也各有各的“舒適圈”:
“新老”器件全面開花,皆有自己擅長的領(lǐng)域,但對(duì)于玩家來說,選擇受限:傳統(tǒng)存儲(chǔ)市場已被壟斷。 內(nèi)存行業(yè),美光、三星和SK Hynix在高性能存儲(chǔ)領(lǐng)域市占率達(dá)100%;高性能計(jì)算領(lǐng)域,英特爾、AMD和英偉達(dá)的市場占有率也接近100%。高性能芯片代工領(lǐng)域,則被臺(tái)積電和三星聯(lián)合壟斷。 例如DRAM,因極高的技術(shù)和資金壁壘,DRAM領(lǐng)域市場處于高度集中甚至壟斷態(tài)勢(shì)。目前,DRAM芯片市場是由三星、SK海力士和美光統(tǒng)治:2018至2020年,三大巨頭市場占有率合計(jì)在95%左右。
基于此,初創(chuàng)企業(yè)正另辟蹊徑:要么基于傳統(tǒng)存儲(chǔ)介質(zhì)的存算一體制定特定場景的芯片;要么在存算一體架構(gòu)下,用新型存儲(chǔ)器,打破壟斷。
?
由上面兩張圖可以看到,僅有選擇新型存儲(chǔ)器RRAM的公司,能夠?qū)崿F(xiàn)大算力,而其余基于傳統(tǒng)存儲(chǔ)器的基本僅能cover住AIOT、車載模塊等低算力場景。 例如億鑄科技,基于RRAM研發(fā)“全數(shù)字存算一體”大算力芯片,通過減少數(shù)據(jù)搬運(yùn)提高能效比,同時(shí)利用數(shù)字存算一體保證運(yùn)算精度,能夠應(yīng)用于云端AI推理、邊緣計(jì)算、數(shù)據(jù)中心、自動(dòng)駕駛等大算力場景。 03.?從2MB的AIOT到512MB的自動(dòng)駕駛 ? 從上文公司產(chǎn)品應(yīng)用場景可以看出,存算一體應(yīng)用廣泛,既能裝在一塊小小的智能門鎖,也能應(yīng)用于1000+TOPS的數(shù)據(jù)中心。那么,存算一體到底能cover住多少場景? 綜合市面上已有的報(bào)告以及專家觀點(diǎn),偲睿洞察將應(yīng)用場景按照算力大小進(jìn)行劃分: 一是端側(cè)小算力場景,例如智能可穿戴設(shè)備、智能安防、移動(dòng)終端、ARVR等。
二是大算力場景,例如云計(jì)算數(shù)據(jù)中心、自動(dòng)駕駛、GPT-4等大模型等。 目前,業(yè)內(nèi)對(duì)于大算力的“大”界定是模糊的,而根據(jù)下游市場的實(shí)際需求,大算力起碼是1000TOPS及以上: 以2020年發(fā)布的GPT3預(yù)訓(xùn)練語言模型為例,采用的是2020年最先進(jìn)的英偉達(dá)A100 GPU,算力是624 TOPS。2023年,隨著模型預(yù)訓(xùn)練階段模型迭代,又新增訪問階段井噴的需求,未來模型對(duì)于芯片算力的需求起碼要破千。 再例如自動(dòng)駕駛領(lǐng)域,根據(jù)財(cái)通證券研究所表明,自動(dòng)駕駛所需單個(gè)芯片的算力未來起碼1000+TOPS。目前巨頭已開始卷上1000+TOPS的SoC,主要用于自動(dòng)駕駛領(lǐng)域:在2021年4月,英偉達(dá)就已經(jīng)發(fā)布了算力為1000TOPS的DRIVE Atlan芯片。到了今年,英偉達(dá)直接推出芯片Thor達(dá)到2000TOPS。 目前來看,在存算一體架構(gòu)下,能夠真正實(shí)現(xiàn)大算力的,僅有億鑄科技一家:
而在這兩大類場景之中,存算一體并非都有著絕對(duì)性的優(yōu)勢(shì)。針對(duì)端側(cè)的可穿戴等小設(shè)備,由于AI加速能力占比過小,存算一體的優(yōu)勢(shì)并不大:ARM占30%,降噪或ISP占40%,AI加速能力僅占30%。 但云和邊緣大算力場景,是存算一體芯片的優(yōu)勢(shì)領(lǐng)域。這是因?yàn)?,大算力場景下,?duì)設(shè)備提出了高要求:實(shí)現(xiàn)高性能、高計(jì)算密度、高算力的同時(shí)還需實(shí)現(xiàn)低功耗。而這,就大部分仰仗于AI能力。據(jù)業(yè)內(nèi)人士表示,存算一體在云和邊緣的大算力領(lǐng)域的競爭力影響約占90%。
04.?未來的路:“第三極”、融合、突破天花板
存算一體正博得學(xué)界、產(chǎn)界等各路人馬的青睞,基于現(xiàn)有的技術(shù)、發(fā)展路徑以及應(yīng)用場景并結(jié)合業(yè)內(nèi)人士觀點(diǎn),偲睿洞察認(rèn)為,存算一體將有著以下發(fā)展趨勢(shì):
1、隨著AI技術(shù)的加速落地,ChatGPT等大模型對(duì)算力的大量需求,將為存算一體技術(shù)帶來核級(jí)推動(dòng)力。存算一體將成為繼CPU、GPU架構(gòu)之后的算力架構(gòu)“第三極”。
2、在布局存算一體的玩家之中,有創(chuàng)新精神、強(qiáng)勁研發(fā)、工程實(shí)力的團(tuán)隊(duì)及公司將脫穎而出。 這是因?yàn)?,存算一體芯片在設(shè)計(jì)層面有較高難度,且沒有成熟的方法可供參考:存算一體是計(jì)算系統(tǒng)和存儲(chǔ)系統(tǒng)的整合設(shè)計(jì),比標(biāo)準(zhǔn)模擬IP和存儲(chǔ)器IP更復(fù)雜,依賴于多次存儲(chǔ)器流片而積累的經(jīng)驗(yàn),這就需要?jiǎng)?chuàng)始團(tuán)隊(duì)有充分的存儲(chǔ)器量產(chǎn)經(jīng)驗(yàn)和技術(shù)路線認(rèn)知。
根據(jù)量子位針對(duì)存算一體公司多位高管的多次采訪,綜合來看,團(tuán)隊(duì)需具備以下能力: 1)領(lǐng)導(dǎo)層要有清晰的目標(biāo):在存儲(chǔ)器和計(jì)算模式、架構(gòu)的選擇上要有清晰的思路,并且能夠準(zhǔn)確、快速地帶領(lǐng)團(tuán)隊(duì)往前走。 2)團(tuán)隊(duì)需具有深厚技術(shù)背景的人員,對(duì)技術(shù)方向有精準(zhǔn)把握,尤其是在新型存儲(chǔ)器技術(shù)上的探索。 3)在核心研發(fā)、工程團(tuán)隊(duì)中,需要在技術(shù)的各個(gè)層級(jí)中配備經(jīng)驗(yàn)豐富的人才。
3、與多種先進(jìn)技術(shù)融合,實(shí)現(xiàn)系統(tǒng)級(jí)創(chuàng)新,從而突破算力天花板。
在ISSCC 2023,蘇媽提出系統(tǒng)級(jí)創(chuàng)新概念,即從整體設(shè)計(jì)的上下游多個(gè)環(huán)節(jié)協(xié)同設(shè)計(jì)來完成芯片性能的提升,并給出使用該概念實(shí)現(xiàn)數(shù)量級(jí)的效率提升案例。 也就是說,若是將存算一體、Chiplet(芯粒)、3D封裝等技術(shù)同步使用,很有可能帶來數(shù)量級(jí)的效率提升,從而突破性能瓶頸。 目前,國內(nèi)已有團(tuán)隊(duì)進(jìn)行“系統(tǒng)級(jí)創(chuàng)新”實(shí)踐:作為首發(fā)存算一體超異構(gòu)概念的億鑄科技,提出了自己的技術(shù)暢想: 若能把新型憶阻器技術(shù)(RRAM)、存算一體架構(gòu)、芯粒技術(shù)(Chiplet)、3D封裝等技術(shù)結(jié)合,將會(huì)實(shí)現(xiàn)更大的有效算力、放置更多的參數(shù)、實(shí)現(xiàn)更高的能效比、更好的軟件兼容性、從而抬高AI大算力芯片的發(fā)展天花板。
編輯:黃飛
?
評(píng)論
查看更多