自從2.5D/3D封裝、Chiplet、異構集成等技術出現以來,CPU、GPU和內存之間的界限就已經變得逐漸模糊。單個SoC究竟集成了哪些邏輯單元和存儲單元,全憑借廠商自己的設計路線。這樣的設計其實為單芯片的能效比帶來了一輪新的攀升,但也極大地增加了開發難度。即便如此,還是有不少廠商在不遺余力地朝這個方向發展,最典型的莫過于AMD。
AMD的存儲堆疊之路
要說玩堆疊存儲,AMD確實是走得最靠前的一位,例如AMD如今在消費級和數據中心級別CPU上逐漸使用的3D V-Cache技術,就是直接將SRAM緩存堆疊至CPU上。將在今年正式落地的第四代EPYC服務器處理器,就采用了13個5nm/6nm Chiplet混用的方案,最高將L3緩存堆疊至了可怕的384MB。
在消費端,AMD的Ryzen 7 5800X3D同樣也以驚人的姿態出世,以超大緩存帶來了極大的游戲性能提升。即將正式發售的Ryzen 9 7950X3D也打出了128MB三級緩存的夸張參數,這些產品的出現可謂打破了過去CPU廠商拼時鐘頻率、拼核心數的僵局,讓消費者真切地感受到了額外的體驗提升。
MI300 APU / AMD
GPU也不例外,雖然AMD如今的消費級GPU基本已經放棄了HBM堆疊方案,但是在AMD的數據中心GPU,例如Instinct MI250X,卻依然靠著堆疊做到了128GB的HBM2e顯存,做到了3276.8GB/s的峰值內存帶寬。而下一代MI300,AMD則選擇了轉向APU方案,將CPU、GPU和HBM全部整合在一起,以新的架構沖擊Exascale級的AI世代。
其實這也是AMD收購Xilinx最大的收獲之一,早在十多年前Xilinx的3DIC技術也已經為多Die堆疊打下了基礎。在收購Xilinx之際,AMD也提到這次交易會擴張AMD在die堆疊、封裝、Chiplet和互聯技術上的開發能力。在完成Xilinx的收購后,也可以看出AMD在架構上的創新有了很大的飛躍。
在近期的ISSCC 2023上,AMD CEO蘇姿豐透露了他們的下一步野心,那就是直接將DRAM堆疊至CPU上。這里的堆疊并非硅中介層互聯、存儲單元垂直堆疊在一起的2.5D封裝方案,也就是如今常見的HBM統一內存方案,AMD提出的是直接將計算單元與存儲單元垂直堆疊在一起的3D混合鍵封裝方案。
CPU與DRAM垂直堆疊
主流服務器性能的提升速度,已經快要趕上過去的摩爾定律了。根據AMD統計的CPU供應商數據,每過2.4年主流服務器性能就會翻一倍。可限制其繼續發展的不再只是放緩的摩爾定律,還有內存上帶來的限制。內存墻這樣的性能瓶頸,不僅在限制CPU的性能發揮,同樣限制了GPU的性能發揮。
考慮到明面上解決這個問題的主力軍是存儲廠商,所以提出的大部分創新方案,例如存內計算等等,也都是創造算力更高的存儲器產品。蘇姿豐博士也指出,從她這個處理器從業者的角度來說,這一路線有些反常理,但從系統層面來說,她也可以理解該需求存在的意義。而AMD這次提出的方案,則是從計算芯片出發,將存儲器堆疊整合進去。
CPU與DRAM垂直堆疊 / AMD
從AMD給出的能量效率分析來看,DIMM這樣的片外內存訪問能量效率在12pj/bit左右,2.5D的HBM方案在3.5pj/bit左右,而3D垂直堆疊的鍵合方案卻可以做到0.2pj/bit,從而利用更低的功耗來做到大帶寬。況且由于計算單元和存儲單元的集成度更高了,傳輸的延遲必然也會有顯著的降低。
這套方案的出現意味著至少堆疊的內存容量足夠大,服務器CPU甚至可以省去DIMM內存插槽,進一步減小空間占用。但這套方案具體能做堆疊多少內存,AMD并沒有給出具體的數字,如果可堆疊的內存數量與如今的L3緩存一樣僅有數百兆的話,那帶來的性能提升很可能不值一提。
另外就是散熱問題,從AMD給出的示意圖來看,他們選擇了內存單元在上,計算單元在下的方案,這種3D架構很可能會對散熱產生一定負面作用,但性能損失會相對較少一些。比如MI300方案中,AMD就換成了CPU和GPU單元在上,緩存和互聯在下的方案。
捆綁銷售嫌疑?
在消費級領域,其實CPU與內存捆綁銷售已經不是什么新鮮事了,就拿蘋果的M系列芯片為例。自打蘋果轉向Arm陣營,推出M系列芯片后,Mac生態的定制空間就基本只存在于購買前了,雖然華強北的大神們依然能夠找到一些方式來擴展固態硬盤閃存,但內存基本就與SoC徹底綁定了,用戶只能忍受高昂的容量定價,才不會在高負載工作時出現內存不夠用的窘境。
可在服務器市場,已經有了相當成熟的DIMM內存生態,甚至未來還有CXL內存虎視眈眈,AMD這套“捆綁銷售”的方案究竟能否收獲良好的市場反響我們無從得知,很明顯這對內存模組廠商是存在一定威脅的。但話又說回來,AMD這套方案并沒有徹底斷絕擴展內存的可能性,在需要超大容量的內存池時,依然可以選擇傳統的擴展方案,而不是死磕堆疊內存的方案。
AMD的方案更像是給到了一個片上高速方案,從當下的工藝來看,應該還難以實現大容量的堆疊。所以在CPU上垂直堆疊DRAM,更像是AMD的另一套負載加速方案。畢竟根據蘇姿豐博士的說法,AMD也很清楚現有的3D V-Cache SRAM堆疊方案只能提高特定負載的性能,DRAM堆疊方案的性能加速覆蓋面無疑要更廣一些。
寫在最后
其實ChatGPT這樣的應用出現,不僅帶動了一波GPU訂單量的狂飆,也讓HBM、DDR5這些大帶寬的內存有了用武之地,讓人們終于看到了打破內存墻的應用價值,而不只是將其視為一個徒增成本的性能瓶頸。
而AMD雖然提出了將內存堆疊至CPU上的技術路線,也并沒有放棄對其他方案的考量,比如他們也在和三星展開HBM2上的存算一體研究。如果AMD選擇將CPU堆疊內存與存算一體結合在一起的話,或許會給其數據中心產品帶來更大的優勢。
審核編輯 :李倩
-
amd
+關注
關注
25文章
5490瀏覽量
134615 -
DRAM
+關注
關注
40文章
2325瀏覽量
183852 -
cpu
+關注
關注
68文章
10901瀏覽量
212961
原文標題:AMD要在CPU上堆疊DRAM內存,新一代捆綁銷售誕生?
文章出處:【微信號:elecfans,微信公眾號:電子發燒友網】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論