電子發燒友網報道(文/周凱揚)相信對超算市場有過一定了解的朋友,都對曾經的第一名富岳超算不陌生。這臺2021年正式啟用的超算,是全球首臺登頂TOP500的Arm架構超算。富岳采用了富士通設計A64FX SoC,整個超算集群的峰值性能可以達到537.21PFlop/s。如此強大的性能,甚至于日本東京工業大學、日本東北大學等都宣布將借助富岳來開發日語生成式AI。
然而在最新的TOP500排行榜上,隨著更新的英特爾Xeon和AMD EPYC處理器紛紛到位,如今的富岳已經降至第四名的位置。為此,富士通也在開發A64FX的繼任者,并計劃用于下一代超算的開發中去。
Monaka,A64FX的繼任者
作為一直在超算領域發力的頭部廠商之一,富士通此前一直選擇SPARC作為其計算處理器的架構,直到A64FX的出現。A64FX面世之時一度被稱為最強Arm處理器,也讓不少人對Arm在數據中心和HPC的前景有了新的改觀。
然而這種眾核處理器,除非經過特殊的架構優化,否則并不適合用于通用服務器,國產的申威26010服務器也是類似的設計思路。但不可否認在HPC應用下,眾核處理器可以發揮出媲美甚至超越傳統x86旗艦處理器的實力。
近日,富士通宣布了他們在研的下一代眾核Arm處理器Monaka,該處理器除了改用Armv9架構,引入了SVE2之外,還采用了云原生的3D眾核設計,專為數據中心做了能效優化。Monaka采用了3D Chiplet的設計方案,其中處理器核心die基于2nm工藝打造,而SRAM和IO die基于5nm工藝打造,通過TSV與核心die相連。
然而在最新的TOP500排行榜上,隨著更新的英特爾Xeon和AMD EPYC處理器紛紛到位,如今的富岳已經降至第四名的位置。為此,富士通也在開發A64FX的繼任者,并計劃用于下一代超算的開發中去。
Monaka,A64FX的繼任者
作為一直在超算領域發力的頭部廠商之一,富士通此前一直選擇SPARC作為其計算處理器的架構,直到A64FX的出現。A64FX面世之時一度被稱為最強Arm處理器,也讓不少人對Arm在數據中心和HPC的前景有了新的改觀。
然而這種眾核處理器,除非經過特殊的架構優化,否則并不適合用于通用服務器,國產的申威26010服務器也是類似的設計思路。但不可否認在HPC應用下,眾核處理器可以發揮出媲美甚至超越傳統x86旗艦處理器的實力。
近日,富士通宣布了他們在研的下一代眾核Arm處理器Monaka,該處理器除了改用Armv9架構,引入了SVE2之外,還采用了云原生的3D眾核設計,專為數據中心做了能效優化。Monaka采用了3D Chiplet的設計方案,其中處理器核心die基于2nm工藝打造,而SRAM和IO die基于5nm工藝打造,通過TSV與核心die相連。
Monaka 3D眾核架構 / 富士通
據富士通透露,2nm的核心die區域僅僅占了整個芯片面積的不到30%,從而帶來極高的能效表現,只需用到風冷。同時3D眾核架構使其可以塞入雙插槽144個核心,實現極低的延遲和更高的帶寬。
至于在軟件支持上,富士通除了持續開發Linux OS中行業標準軟件的支持外,也會參與發展與Arm相關的開源軟件生態,加強在Python、Java、LLVM等標準工具上的性能表現。Monaka預計將于2027年正式亮相,考慮到其流片時間,富士通既有可能選擇臺積電、英特爾等現有的先進晶圓代工廠,也可能考慮正在建設2nm工廠的Rapidus。
HPC轉向AI主導?
作為目前最有利可圖的市場,AI正在驅動GPGPU聚焦在低精度計算的算力升級上。在CUDA平臺的助力下,HPC生態的門檻也在持續降低。從這幾年發布的新品來看,無論是FP16、FP8的算力都在成倍增長,然而在FP64這種傳統HPC應用需要用到的高精度數據格式上,性能提升卻相當有限。
更重要的是,要想通過堆量來提高HPC集群的FP64性能也不再現實了,因為GPU的TDP提升幅度甚至更高。為此,富士通的看法是,將更多的FP64單元放在CPU端,而將更多的HBM和低精度矩陣單元放在GPU端,這樣構建HPC系統的客戶就不再需要為GPU的巨額成本和巨量功耗買單,卻可以利用其在深度學習上的卓越性能。同時,開發更多HPL-MxP應用,利用混合精度計算來提高效率。當然了,也可以施壓GPU廠商進一步改善其FP64性能,只不過在生成式AI依舊火熱的當下,讓GPU廠商放棄這個搖錢樹并不現實。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
ARM
+關注
關注
134文章
9107瀏覽量
368000 -
超算
+關注
關注
1文章
115瀏覽量
9097 -
富士通
+關注
關注
2文章
195瀏覽量
54583
發布評論請先 登錄
相關推薦
《富士通綜合報告(Fujitsu Integrated Report 2024)》帶你全面了解富士通
利益相關者分享富士通的現狀和未來愿景。 我們的企業目標是什么?我們如何行動?我們希望實現怎樣的未來?我們從《富士通綜合報告》中摘錄了一些重點信息,希望能幫助您更全面、更立體地了解富士通
MicroBlaze V軟核處理器的功能特性
本指南提供了有關 AMD Vivado Design Suite 中包含的 32 位和 64 位 MicroBlaze V 軟核處理器的信息。該文檔旨在用作為處理器硬件架構的指南,隨附《RISC-V 指令集手冊》
ARM處理器的尋址方式
ARM處理器的尋址方式是處理器在執行指令時,根據指令中給出的地址信息來尋找物理地址的方法。ARM處理器支持多種尋址方式,以滿足不同的編程需求
ARM處理器和CISC處理器的區別
ARM處理器和CISC(復雜指令集計算機)處理器在多個方面存在顯著的區別。這些區別主要體現在架構原理、性能與功耗、設計目標、應用領域以及市場生態等方面。
ARM處理器的結構和特點
ARM處理器,全稱Advanced RISC Machines,是一種基于精簡指令集(RISC)架構的微處理器。其結構和特點在嵌入式系統、移動設備、物聯網等多個領域具有顯著優勢。以下將
ARM處理器概述和發展歷程
ARM處理器是一種基于RISC(精簡指令集計算機)架構的高性能微處理器,由英國公司ARM(Advanced RISC Machines)開發
富士通發布2024財年第一季度財報
富士通于昨日發布了2024財年第一季度財報。根據財報顯示,2024財年第一季度整體營收為8,300億日元,較上一年度同期增長3.8%。
實測分享,瑞芯微RK3588八核國產處理器性能測評!確實“遙遙領先”!
ARM Cortex-A76@2.4GHz + 四核ARM Cortex-A55@1.8GHz大小核架構,有國產“至強嵌入式處理器”之稱,可
發表于 07-17 10:49
采用144核,能效提升66%!英特爾至強6處理器震撼上市,加速數據中心升級
6能效核處理器基于Intel 3制程工藝,憑借高核心密度及出色的每瓦性能,可在提供高效算力的同時顯著降低能源成本。英特爾至強6700E采用144核
富士通發布《富士通技術與服務愿景2024》
富士通近日發布了《富士通技術與服務愿景2024(Fujitsu Technology and Service Vision 2024,簡稱FT&SV 2024)》,闡述了對未來商業和社會的愿景。
富士通使用富岳超級計算機訓練LLM
盡管富士通的富岳超級計算機不再是超級計算機500強名單中最快的機器,但它仍然是一個非常強大的系統,A64FX處理器的多功能性允許將其用于各種工作負載,例如AI。
實測分享,瑞芯微RK3588八核國產處理器性能測評!確實“遙遙領先”
RK3588處理器優勢 RK3588是瑞芯微最新一代旗艦工業處理器,它具有如下卓越優勢: ? 超強運算能力: 四核ARM Cortex-A7
評論