電子發燒友網報道(文/周凱揚)隨著摩爾定律失效,高性能計算芯片的規模進一步擴大,數據中心集群龐大的功耗已經成為我們不得不面臨的問題。早在2015年SIA的預測中,到2040年全球計算資源的能源供給就不再具有可持續性,而如今隨著人工智能的爆發,計算資源的需求更是猛漲。
以用于訓練AI大模型的計算資源為例,每六個月翻倍的速度已經遠超高性能計算集群的組建速度。無需等到2040年,到了2030年訓練單個大模型所需的資源就將超過TOP500所有超算的算力總和,而所需要的電力供應也將達到國家級。解決能源可持續的問題已經避無可避了,但除非我們放緩發展速度,或是顛覆計算方式,是很難實現這一目標的。
對于應用層還沒進入商業模式成熟和完全盈利的人工智能來說,放緩發展速度自然是不可取的。那么也就只剩下顛覆計算方式一途,而大幅降低能耗的超導計算,也就理所當然地成了多數研究的重點方向。
顯著降低功耗,最大開銷成為冷卻
2020年,日本國立橫濱大學的一個研究小組就展示了一個超導CPU,并成功實現了流片。該處理器主要采用約瑟夫森結架構打造,這是一種經典的超導三層器件架構,也是超導邏輯單元中取代晶體管的基礎元件。因為其獨特的物理特性,該器件工作時的開關功耗只有10-21J左右,這樣一來動態功耗相比傳統CMOS器件極大降低,加之超導體無電阻的特性,靜態功耗無限趨近于零。
超導體的出現為降低功耗提供了最大的可能性,因為其在通過電流時并不會消耗能量。最大的能耗開支莫過于需要在低溫下工作的冷卻方案供電,比如超導芯片的處理單元,往往需要低至4K的冷卻溫度。但即便如此,幾乎零電阻的互聯、基于超短脈沖構建的數字邏輯,都為現代計算資源大規模擴展提供了足夠的優勢。
而且隨著計算資源規模的擴大,冷卻方案開銷的邊際成本也會越小,據imec研究表明,一旦達到數十petaflops,超導計算機相比傳統的計算機就要節能了,而這樣的算力要求,TOP500中排名前30的超算已經可以做到了。
而Imec近期發布了他們采用標準CMOS工藝制造的超導計算單元,基于該技術打造的處理器能效將是當下最高效芯片的100倍,甚至可以將一個數據中心級別的計算資源塞進鞋盒大小的系統中。
將超導帶出實驗室的方法——兼容現有的CMOS制造技術
盡管超導可以降低功耗提高計算密度,但對于目前的大部分研究來說,都只停留在實驗室階段,要想真正實現大規模量產無異于癡人說夢。比如上文提到的橫濱國立大學超導CPU,就是基于超導鈮實現的,這種材料在可預測的實驗室環境中表現良好,但要想用于制造工藝中就存在不少難題了。
鈮對傳統半導體加工溫度及其周圍材料都很敏感,一加熱就會失去超導能力,因此與標準CMOS工藝流程不兼容。為此,imec改用了氮化鈮鈦作為基礎超導材料。氮化鈮鈦可以承受CMOS制造工藝所用的溫度,而且與周圍層的反應較少。
同時imec還為約瑟夫森結的勢壘層選擇了一個新材料,無定形硅。傳統的約瑟夫森結勢壘層材料,比如氧化鋁等,可以在可控的條件下生長,但為了達到遠高于CMOS工藝芯片的密度,就必須進一步壓縮其厚度,可這么薄的氧化物已經到了無法制造的程度。無定形硅的出現,則允許使用更厚的勢壘層,實現210nm這樣的臨界尺寸。
在電路層面,同樣需要對邏輯和存儲結構重新設計。Imec設計出了一種全新的邏輯架構,名為脈沖守恒邏輯,輸入和輸出的數量保持一致,且SFQ(單通量量子)的總數保持守恒。通過不同約瑟夫森結和電容的組合將SFQ引導至不同輸出,從而產生我們常見的邏輯OR和AND。在Imec的設計中,SRAM也是基于約瑟夫森結重新設計的,不過DRAM還是采用傳統的硅工藝,但也需要從室溫降低至77K的低溫環境,用于提高效率。
鞋盒大小的數據中心,也需要3D堆疊實現
在基于CMOS工藝打造的數字芯片上,隨著縮小晶體管變得越來越困難,我們已經開始廣泛利用3D堆疊技術提高性能。但由于芯片內部的超大功率和熱量,堆疊方案已經逐漸面臨更大的挑戰,如何做好散熱成了多數3D堆疊方案必須解決的首要問題。
對于基于超導體的芯片設計而言,同樣可以借助3D堆疊來實現更高的密度。結合硅中介層和玻璃基板這樣的先進封裝技術,將超導處理單元與嵌入式超導SRAM和DRAM堆疊在一起。芯片的大部分都將浸沒在液氮中,冷卻至4K。
在imec的模擬中,他們將100塊超導體芯片板打造堆疊在一起,中間只留出極小的空間,整個系統的體積大小只有20x20x12厘米,與一個鞋盒大小近似。但正是這樣一個鞋盒大小的系統,總功耗只有500kW,卻可以提供將近20exaflops(BF16)的算力。
而這僅僅是Imec路線圖中第一套方案,在后續的產品中,會進一步縮小約瑟夫森結和互聯的尺寸。未來通過進一步提高邏輯芯片的密度,芯片板的數量也會隨之減少,這樣提高性能的同時,也會降低工藝復雜性和成本。
寫在最后
盡管超導計算讓我們看到了可行的技術路線,但即便是imec也不認為超導數據技術會取代傳統的CMOS計算,而只是作為部分特定應用補充。這一技術的主要應用場景還是在大型的數據中心,為人工智能和機器學習處理提供基于云端的訓練推理等,因為只有這樣的環境內才能有條件實現超導所需的冷卻技術。在消費電子領域,傳統的CMOS硅工藝依然不可取代。
值得一提的是,這一技術與Imec基于CMOS制造工藝的超導量子比特技術同樣可以做到無縫集成,可以說是電子計算與量子計算的完美結合。但即便搞定了基礎材料工程設計,以及架構的設計,還有電路開發設計這一環目前沒有打通,需要EDA廠商為其開發特定的流程工具。
-
處理器
+關注
關注
68文章
19395瀏覽量
230686 -
CMOS
+關注
關注
58文章
5733瀏覽量
235862 -
算力
+關注
關注
1文章
1009瀏覽量
14899
發布評論請先 登錄
相關推薦
評論