電子發燒友網報道(文/周凱揚)AMD在不久前發布了Instinct MI300,一個結合了CDNA3和Zen4架構的產品系列,比如率先公布的產品為128GB的MI300A。然而在這之后,AMD針對大語言模型市場,專門推出了純CDNA 3 GPU架構打造的MI300X,集成192GB的HBM3。
下一代數據中心與超算的選擇,Instinct MI300
隨著英偉達的A100、H100等GPU產品在今年經歷大熱、缺貨和漲價,越來越多的廠商開始做兩手準備,開始尋找替代品。在AI與HPC領域,市面上缺乏能與英偉達旗艦產品競爭的高性能成熟方案。
雖然相較其他廠商而言,谷歌已經憑借其TPU和OCS在同類負載中實現了不錯的性能/TCO表現,但總的來說依然限制在了單個公司的單個云服務上,也很難給到廠商去提前評估的空間,所以并不算一個完善的第三方解決方案。
為此,AMD推出了MI300X,一個純粹的生成式AI加速器方案,內存帶寬達到了可怕的5.2TB/s。與英偉達的H100 SXM 80GB相比,MI300X帶寬提升了72%,容量根據版本差異有了60%或140%的提升。
基于MI300X,AMD打造了一個名為無限架構的平臺,將8塊Instinct MI300X互聯在一起,實現1.5TB的HBM3內存。這與英偉達的8路HGX板和英特爾的8路Ponte Vecchio一樣,看來未來高端服務器都會采用這套8路處理器的配置。
目前MI300A早已送樣,而MI300X也已經在Q3送樣,相信明年起,我們就能在HPC和AI服務器上看到兩塊芯片的身影了。但這也注定了MI300系列更像是一次略顯倉促的反擊,AMD真正的王牌,可能還是未來的Instinct MI400。
集3D/2.5D混合計算大成的Instinct MI400
在今年AMD的Q2財報會議上,AMD CEO蘇姿豐提到:“從這些工作負載和我們投資的技術來看,不只是現有產品,還有下一代MI400系列等,我們打造了一個極具競爭力且性能滿足需求的硬件路線圖。坦白說,大家討論到AMD往往都會提到軟件路線圖,我們也都看到了軟件側的一些改變。”
近期舉辦的DARPA ERI峰會上,AMD CTO Mark Papermaster也對MI400進行了一個小小的預告,它表示Instinct MI400將成為3D/2.5D混合計算集大成之作。從收購Xilinx以來,AMD已經對其整體產品的封裝和互聯方案進行了大刀闊斧的改革,充分結合兩家廠商在這方面的深入研究。
AMD Chiplet與封裝進化路線圖 / AMD
AMD將其稱為一個全面化的設計,從芯片堆疊、封裝、計算、內存、加速器、互聯、軟件棧和應用等方面進行系統級的優化,采用特定域的異構架構,深度集成處理器、封裝與互聯技術,且在所有層面都充分利用AI。
但上文也都反復提及了軟件,這是AMD不得不去解決的一個問題。雖然AMD提供了一個簡易的CUDA移植路徑,但正如聯想HPC與AI部門總經理Scott Tease所說的那樣,還達不到一站式解決方案的程度。
寫在最后
AMD作為與英偉達在消費圖形領域競爭多年的對手,如今同樣發力服務器與AI領域,勢必也會帶來新的市場格局。只要MI400在性能表現上達到預期,且發布時和發布后AMD能做好軟件生態的構建,都可能會對英偉達的主導地位造成一定威脅。不過考慮到發布時間,屆時AMD的MI400面對的可能是首次用上MCM封裝的Blackwell GB100 GPU。
-
amd
+關注
關注
25文章
5490瀏覽量
134474 -
英偉達
+關注
關注
22文章
3839瀏覽量
91669
發布評論請先 登錄
相關推薦
評論