電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))近日 AMD 舉辦了Advancing AI大會(huì),除了發(fā)布全新的銳龍 8040系列 AI PC 芯片以外,也終于宣布了 MI300X GPU以及 MI300A APU這兩大 AI 計(jì)算重磅新品的出貨。
頂級(jí) AI 計(jì)算 GPU MI300X
作為全新 CDNA3架構(gòu)打造的 AI 加速器,MI300X 的配置可謂豪華,8 組 XCD 共 304 個(gè) CDNA 單元,加上帶寬高達(dá) 5.3TB/s 的 192GB顯存。相對(duì)上一代 MI250X 而言,計(jì)算單元多了接近 40%,內(nèi)存容量增至 1.5 倍,理論帶寬更是提升至 1.7 倍,同時(shí)引入了對(duì) FP8和稀疏計(jì)算的支持。
AMD 也在實(shí)際用例上與英偉達(dá)的 H100 進(jìn)行了對(duì)比,在運(yùn)行 1760億參數(shù)的 BLOOM 大語(yǔ)言模型推理時(shí),其吞吐量可達(dá)后者的 1.6 倍。且單塊 MI300X就能運(yùn)行像 Llama2 這樣 700 億參數(shù)的大模型,簡(jiǎn)化了企業(yè)級(jí) LLM 部署的同時(shí),提供了極致的 TCO 性價(jià)比。
首個(gè)數(shù)據(jù)中心 APU 出爐
隨著英偉達(dá)開始針對(duì)數(shù)據(jù)中心推出 Grace Hopper Superchip 這樣的 CPU+GPU 打包方案,AMD 這個(gè)早在消費(fèi)級(jí)產(chǎn)品上這么干的公司自然也察覺到了個(gè)中機(jī)遇。于是在本次大會(huì)上,AMD 終于宣布首個(gè)數(shù)據(jù)中心 APU,MI300A開始出貨。
在 3D 封裝技術(shù)和 AMD Infinity 架構(gòu)的支持下,MI300A將 CDNA 3架構(gòu)的 GPU 核心、Zen 4 架構(gòu)的 CPU 核心以及 128GB 的 HBM3 內(nèi)存集成在一起。同樣是與 MI250X相比,其在HPC和 AI 負(fù)載的 FP32計(jì)算上,能耗比近乎翻倍。
得益于統(tǒng)一的內(nèi)存和緩存,CPU、GPU 與 HBM 之間的數(shù)據(jù)傳輸延遲大大降低,且均可享受超大的帶寬,無(wú)論是在極限性能還是在功耗分配上,都能提供好于獨(dú)立方案的表現(xiàn)。
軟件同樣迎來大幅升級(jí)
而此次 Advancing AI大會(huì)上,AMD不僅對(duì)硬件進(jìn)行了更新,也對(duì)其軟件進(jìn)行了更新,RoCm 這一并行計(jì)算框架迎來了第六版,這一版本主要對(duì) AMD 的 Instinct 系列 GPU在生成式 AI 的大語(yǔ)言模型上進(jìn)行了優(yōu)化。
作為 AMD 對(duì)英偉達(dá)的 CUDA 做出的對(duì)策方案,ROCm這幾年來已經(jīng)逐步完善,甚至可以說在開發(fā)支持程度上毫不遜色于 CUDA。此次更新不僅增加對(duì)新數(shù)據(jù)類型的支持,還引入了高級(jí)圖形和內(nèi)核優(yōu)化、庫(kù)優(yōu)化以及最先進(jìn)的注意力機(jī)制算法。以文本生成這一任務(wù)為例,與在 MI250 上運(yùn)行的 ROCm 5 相比,性能提升顯著,總體延遲改善了 8 倍左右。
更重要的是,這次 OpenAI 也來?yè)搅艘荒_,OpenAI 宣布他們會(huì)在 Triton 3.0 上加入對(duì) AMD Instinct 的支持。Triton是一個(gè)類Python 的開源編程語(yǔ)言,允許開發(fā)者在沒有 CUDA 開發(fā)經(jīng)驗(yàn)的情況下也能寫出高效的 GPU 代碼,可以視為 CUDA 的精簡(jiǎn)版。而在最新的Triton 3.0,可以說 AMD 的Instinct硬件平臺(tái)獲得了開箱即用的支持。
其實(shí)這次合作早有預(yù)示,幾個(gè)月前Triton就開始合并 ROCm 的代碼,此前也宣布過增加AMD Instinct以及英特爾XPU 的支持。不過目前 Instinct平臺(tái)的ROCm 還是以 Linux 開發(fā)為重點(diǎn),Radeon 平臺(tái)的ROCm 則主要集中在對(duì) Windows 的支持上。
寫在最后
這次Advancing AI大會(huì)象征了 AMD 對(duì) 明年 AI 市場(chǎng)的野心,也難怪 AMD 會(huì)將今年數(shù)據(jù)中心 AI 芯片的市場(chǎng)規(guī)模從 6 月份的 300 億美元提高至 450 億美元。未來的MI300X很有可能成為英偉達(dá) H100 最強(qiáng)勁的對(duì)手,也有可能成為云服務(wù)廠商競(jìng)相追逐的新計(jì)算卡。
-
amd
+關(guān)注
關(guān)注
25文章
5490瀏覽量
134496 -
AI
+關(guān)注
關(guān)注
87文章
31490瀏覽量
269907
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論