電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))在今年的ISC2024上,新一期的TOP500全球超算榜單發(fā)布。除了瑞典超級(jí)計(jì)算機(jī)Alps空降第六之外,此次TOP500的前十名在排名上并沒有太大變化,但我們還是從新的成績(jī)中找到了一些別的亮點(diǎn)。
AMD實(shí)現(xiàn)TOP500近三成覆蓋率
首先是衛(wèi)冕成功的Frontier,這個(gè)由HPE打造的大規(guī)模超算系統(tǒng)部署在美國橡樹嶺國家實(shí)驗(yàn)室,此次拿下了1.206 Exaflop/s的HPL算力成績(jī),在開發(fā)人員的優(yōu)化下,相較上次提交的1.194 Exflop/s成績(jī)還有所提升。Frontier集成了9472塊AMD Epyc 7713 64核2GHz CPU和37888塊AMD Instinct MI250X GPU。
Frontier超算 / 美國橡樹嶺國家實(shí)驗(yàn)室
憑借AMD頂級(jí)Epyc CPU和Instinct GPU的搭配,F(xiàn)rontier可以說是當(dāng)下已公開系統(tǒng)中,兼顧HPC和AI的最強(qiáng)超算。不僅如此,其能效表現(xiàn)同樣不俗,52.93Gflops/W的成績(jī)居于GREEN500能效榜單的第13位。
如果我們觀察余下的TOP500超算,就會(huì)看到搭載了MI300A系列GPU的超算系統(tǒng)開始逐漸顯現(xiàn),比如美國勞倫斯利弗莫爾國家實(shí)驗(yàn)室的三臺(tái)新系統(tǒng),分別拿下了46、47和48的排名。而這三臺(tái)均為El Capitan超算的子系統(tǒng),今年部署完成后預(yù)計(jì)HPL算力可突破2 Exaflop/s。
根據(jù)AMD的說法,在新發(fā)布的TOP500超算系統(tǒng)中,由AMD硬件驅(qū)動(dòng)的超算系統(tǒng)增加了29%,達(dá)到了156臺(tái)。在能效榜單GREEN500上,由AMD硬件驅(qū)動(dòng)的超算系統(tǒng)也達(dá)到了157臺(tái)。雖然這與英特爾60%以上的份額還有不小差距,但其增長(zhǎng)速度要遠(yuǎn)超英特爾。
英特爾首臺(tái)E級(jí)超算出爐,性能還沒到頂
去年拿下第二的Aurora超算在今年的TOP500上再進(jìn)一步,獲得了1.012 Exaflop/s的HPL算力成績(jī),成為TOP500歷史上第二臺(tái)E級(jí)超算,也是基于英特爾硬件的首臺(tái)E級(jí)超算。由于去年Aurora尚未完成全面部署,所以只是勉強(qiáng)超過第三名的Eagle超算,HPL算力為585.34 PFlop/s。
Aurora超算 / 美國阿貢國家實(shí)驗(yàn)室
如今的Aurora離硬件全面到位還差一點(diǎn),所以此次提交成績(jī)只用到了80%到90%左右的節(jié)點(diǎn),要在下一次TOP500榜單公布才能完成全面部署。但即便如此,Aurora的成績(jī)依然成功突破了E級(jí)大關(guān)。如果按照這一規(guī)模來估算,加上阿貢實(shí)驗(yàn)室開發(fā)人員的優(yōu)化,Aurora未來也有可能完成逆襲,超過Frontier,不過屆時(shí)第一名很有可能會(huì)是同樣完成部署的El Capitan。
另外值得一提的是,無論是Aurora還是Frontier,在測(cè)試混合精度算力的HPL-MxP上,兩者都獲得了超過10 Exaflop/s的成績(jī)。其中Aurora憑借89%的系統(tǒng)拿下了10.6Exaflop/s的成績(jī),位列第一。但這一測(cè)試并不能代表絕對(duì)的AI性能,尤其是用于新一代的AI負(fù)載,因此在這一屆ISC2024上,行業(yè)也在呼吁推出新的AI測(cè)試榜單。
由于Aurora部署進(jìn)度經(jīng)歷了一再推遲,其能效相比其他超算系統(tǒng)略有遜色,只有26.15GFlops/w,這也是為何其系統(tǒng)功耗從去年的24.687MW提升至今年的38.698MW。相較之下算力還要高于Aurora的Frontier系統(tǒng)功耗只有22.786MW。
從目前前十名的榜單來看,基于英特爾Xeon處理器的系統(tǒng)依舊占據(jù)了一半席位,這足以說明英特爾在HPC上的持續(xù)統(tǒng)治地位。這還是在其HPC產(chǎn)品發(fā)布推遲的前提下,未來隨著工藝的推進(jìn)和發(fā)布計(jì)劃重回正軌,英特爾依然有機(jī)會(huì)找回被奪去的份額。
英偉達(dá)開始發(fā)力,Arm CPU+GPU性能與能效雙管齊下
此次TOP500最令人意想不到的應(yīng)該是英偉達(dá)的全面發(fā)力,此前英偉達(dá)出現(xiàn)在TOP500榜單上主要是因?yàn)槠銰PU,在TOP500榜單中,半數(shù)帶有加速器的系統(tǒng)都用到了英偉達(dá)的GPU。而此次TOP500上,則一共有8臺(tái)系統(tǒng)基于英偉達(dá)的Grace Hopper處理器。
Alps超算 / 瑞士超算中心
這次空降的第六名是來自瑞士超算中心的Alps超算系統(tǒng),該系統(tǒng)集成了英偉達(dá)的GH200超級(jí)芯片,算力成績(jī)達(dá)到了270 PFlop/s。該系統(tǒng)從2021年開始計(jì)劃部署,用于氣候、物理和生命科學(xué)研究等HPC應(yīng)用的同時(shí),提供強(qiáng)大的AI算力。
我們?nèi)绻^察同期發(fā)布的GREEN500能效榜單就會(huì)發(fā)現(xiàn),基于英偉達(dá)Grace Hopper打造的超算系統(tǒng)包攬了前三的位置。這三臺(tái)系統(tǒng)分別是德國超算JEDI、英國超算Isambard-AI和波蘭超算Helios GPU,能效分別為72.733Gflops/W、68.835Gflops/W和66.948Gflops/W。即便是TOP500排名第六的Alps,其能效比也有51.98Gflops/W,在GREEN500上排名第14.
結(jié)合TOP500上也有不少x86超算使用英偉達(dá)的GPU,側(cè)面反映了Arm架構(gòu)在HPC系統(tǒng)上的能效優(yōu)勢(shì)。結(jié)合未來對(duì)于超算能效更加嚴(yán)格的要求,英偉達(dá)的CPU+GPU超級(jí)芯片方案的吸引力會(huì)越來越大。
超算的市場(chǎng)格局迎來新一輪劇變
可以看出,超算行業(yè)已經(jīng)不再是過去英特爾一家獨(dú)大的場(chǎng)面了,無論是AMD、英偉達(dá)等都在迎頭趕上,甚至是以更快的速度奪取市場(chǎng)份額。在x86系統(tǒng)上,AMD的CPU與GPU組合已經(jīng)成為不少超算中心和商業(yè)公司的首選,而且由于供貨較為穩(wěn)定,其部署速度也要快于其他超算系統(tǒng)。
在Arm系統(tǒng)上,英偉達(dá)已經(jīng)開始發(fā)力,依仗Grace Hopper提供的性能和能效雙重優(yōu)勢(shì),與HPC方案商合作貢獻(xiàn)了多臺(tái)TOP500系統(tǒng)。未來隨著GB200投入市場(chǎng),憑借Blackwell架構(gòu)在FP64精度上比Hopper架構(gòu)高出30%的性能表現(xiàn),相信會(huì)有更多的超算系統(tǒng)選擇英偉達(dá)的硬件方案。
至于IBM的Power架構(gòu),目前前十名中只有老牌榜首Summit采用IBM的Power9 CPU,除此之外就只剩采用自研Arm核心和處理器的富岳超算系統(tǒng)這一特例了。鑒于目前具備自研HPC處理器的廠商并不多,未來各種眾核處理器的HPC系統(tǒng)數(shù)量預(yù)計(jì)還是維持在個(gè)位數(shù),但其性能往往都不容小覷。
與此同時(shí),中國超算系統(tǒng)今年出現(xiàn)了銷聲匿跡的局面,今年的TOP500超算榜單上,沒有一個(gè)來自中國的新超算系統(tǒng),位列TOP500的中國超算系統(tǒng),也從104臺(tái)減少至80臺(tái)。但實(shí)際上國內(nèi)也有三臺(tái)值得關(guān)注的新超算,分別是620 Pflop/s的天河星逸,以及神威海洋之光和天河三號(hào),后兩者的預(yù)估性能分別為2.05 Exaflop/s和1.5 Exaflop/s。但很有可能出于地緣政治的原因,國內(nèi)超算紛紛選擇了停止提交HPL成績(jī)。
來自美國的超算系統(tǒng)從171臺(tái)減少至160臺(tái),從這幾年的趨勢(shì)來看,美國更加致力于打造頂級(jí)超算。反倒是來自歐洲的超算系統(tǒng)從143臺(tái)提升至160臺(tái),正式超過亞洲成為第二名,僅次于北美地區(qū),足見歐盟對(duì)于HPC系統(tǒng)的投入。
在系統(tǒng)制造商上,HPE和聯(lián)想依然是最大的兩家制造商,尤其是聯(lián)想,占據(jù)了32.4%的份額。但在總系統(tǒng)算力上,HPE打造的系統(tǒng)占據(jù)了36.1%的份額。這也說明了得益于HPE提供的HPE Cray OS操作系統(tǒng)以及Singshot-11互聯(lián)方案,其在高端系統(tǒng)上更受歡迎。
隨著摩爾定律的放緩或者說終止,在速度的提升上,我們已經(jīng)看到了減緩的跡象,曾經(jīng)在2030年實(shí)現(xiàn)10 Exascale的目標(biāo)已經(jīng)不太可能實(shí)現(xiàn)了,如今的能效指標(biāo)也不允許我們一味地?cái)U(kuò)大超算規(guī)模。
-
amd
+關(guān)注
關(guān)注
25文章
5476瀏覽量
134297 -
英特爾
+關(guān)注
關(guān)注
61文章
9984瀏覽量
171956 -
摩爾定律
+關(guān)注
關(guān)注
4文章
636瀏覽量
79099 -
HPC
+關(guān)注
關(guān)注
0文章
317瀏覽量
23812 -
超算
+關(guān)注
關(guān)注
1文章
115瀏覽量
9097
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論