隨著人工智能和云計算等技術的不斷發展,處理器需要處理的數據量越來越大,對性能和效率的要求也越來越高。另一方面,摩爾定律逼近極限,在過去十幾年中,單個處理器中晶體管數目的增加速度逐漸放緩,芯片工藝制程接近1nm時,開始接觸到量子效應的極限。
當制造工藝很難再發展的時候,人們更多是希望在處理器架構設計多下功夫,以提高計算效率,NUMA架構應運而生。本篇文章,跟大家介紹一下,什么是NUMA架構?
早期的時候,每臺服務器都是單CPU,隨著技術的發展,出現了多CPU共同工作的需求。NUMA(Non-Uniform Memory Access,非一致性內存訪問)和SMP(Symmetric Multi-Processor,對稱多處理器系統)是兩種不同的解決多CPU共同工作的硬件體系架構。
SMP架構是比較常見的多CPU構建方式。其主要特征是共享,所有的CPU共享使用全部資源,例如內存、總線和I/O,多個CPU對稱工作,彼此之間沒有主次之分,平等地訪問共享的資源。但是缺點也顯而易見,這樣勢必引入資源的競爭問題,隨著核數增多,內存控制器讀取內存的性能瓶頸越來越明顯,從而導致它的擴展內力非常有限。
為了解決這個問題,硬件設計師們將內存控制器平分到每個 die上,從而形成了NUMA 架構。
NUMA架構通過將CPU劃分成不同的組(Node),每個Node由一個或多個(物理)CPU組成,并且有獨立的本地內存、I/O等資源。在NUMA架構中,每個節點都有自己的內存和計算資源,這使得處理器可以更靈活地分配資源,提高了整體性能和效率。此外,NUMA架構還可以通過增加節點數量來擴展處理器的計算和存儲能力,這使得它成為一種非常適合大規模并行處理的架構。
目前業界都認為摩爾定律接近極限,NUMA技術是CPU發展的一種必然趨勢。
摩爾定律是由英特爾(Intel)創始人之一戈登·摩爾(Gordon Moore)提出來的。其內容為:當價格不變時,集成電路上可容納的晶體管數目,約每隔18-24個月便會增加一倍,性能也將提升一倍。換言之,處理器的性能大約每兩年翻一倍,同時價格下降為之前的一半。
然而,在過去十幾年中,單個處理器中晶體管數目的增加速度逐漸放緩,促使許多廠商推出雙核及多核計算機。在這樣的背景下,NUMA架構處理器可帶來更高的性能、核心密度和能效,也會適用于更廣泛的計算環境。
說了這么多,NUMA架構處理器表現如何?國內外都哪些品牌采用了多NUMA架構的方式去設計處理器?
(1)AMD
AMD 的“Zen”架構帶來全新的處理器設計,較原來的 AMD “推土機”架構實現了大幅的性能提升。“Zen”有三大目標 — 卓越的性能、非凡的可擴展性以及出色的能效。
為實現出色的可擴展性,AMD 在處理器中大膽采用全新理念:小芯片。AMD 沒有構建更大、更昂貴的單片芯片,而是采取了稱為小芯片的處理器構建塊。每個小芯片都包含許多基于“Zen”的核心,而且封裝的小芯片越多,處理器性能就越強。目前,“Zen”處理器的核心數少則兩個,多則 128 個。這種創新為消費者帶來可擴展性和靈活性。
AMD Zen架構誕生于2017年,迄今已經先后有了14nm Zen、12nm Zen+、7nm Zen 2、7nm Zen 3,以及現有的已應用于AMD 4代服務器的5nm Zen 4Genoa處理器產品。比如,早期的zen1如下圖所示4個numa的結構
AMD官網上展示的zen4的多numa架構
從AMD的產品路線圖上可以發現,采用多NUMA的架構設計,能擴展更多的物理Core,提供更強的性能,例如:從zen1的32物理核,到zen2/3的64物理核,雖然zen2采用7nm制程,但是多NUMA方式讓zen2集成更多的核心,性能也是提升2+倍不止。
型號 | 核心數 | 線程數 |
基頻 (GHz) |
最高加速頻率 (Ghz) |
CPU2017 Integer Rates |
Zen1 7551 | 32 | 64 | 2.0 | 3.0 | 136 |
Zen2 7662 | 64 | 128 | 2.0 | 3.3 | 335 |
目前最新發布的zen4多達96核,多NUMA架構的方式讓處理器可帶來更高的性能、更高的核心密度和更低的能效。從AMD的產品路線圖上,AMD一直在多NUMA上設計,產品性能也是遙遙領先。
(2)Intel
英特爾今年創新推出的Sapphire Rapids,也為下一代數據中心處理器樹立了標準參考。
據英特爾Linux工程師Andi Kleen提交的內核補丁可知,Sapphire Rapids將采用Golden Cove架構核心,而不是目前Tiger Lake使用的Willow Cove架構核心,這意味著Sapphire Rapids將于即將到來的Alder Lake擁有同款架構核心。Sapphire Rapids芯片采用了與AMD霄龍服務器處理器類似的“膠水”設計,4個MCM小芯片有望提供多達80個CPU核心,單顆處理器則由4個NUMA組成。
英特爾在2023年推出了至強鉑金 8490H 是一款 60 核服務器/工作站處理器,四個DIE(NUMA)的實現方式。通過lscpu可以看到9490H單顆處理器4個NUMA結構。
(3)海光
在海光官網上直觀的看到海光也是4NUMA的設計,同時,在現有的服務器驗證結果來看,海光確實是4NUMA結構,并且在高頻計算方面表現在同行業中表現出眾,海光在國內市場也已經擠進主流處理器的行列中。
在NUMA架構技術加持下,海光在諸多場景下都能發揮出性能優勢。
如在數據庫管理系統領域,在大量讀寫的數據庫操作中,NUMA架構可以顯著提高數據庫的性能,許多數據庫管理系統,如Oracle、MySQL等,支持NUMA架構,可以利用NUMA特性進行優化;在科學計算領域,常常需要處理大量的數據,使用NUMA架構可以提高處理器的內存訪問速度,從而提高整體性能;在服務器應用領域,NUMA架構可以幫助平衡負載,提高服務器的整體性能;在云計算領域,NUMA架構可以用于平衡虛擬機的資源分配,從而提高整個云環境的性能。
據說,海光四號將采用Chiplet技術,在原有的NUMA架構上,進一步優化互聯技術、提升計算能力。海光不斷的技術創新,以持續自研迭代,帶來好用、易用的國產處理器。
綜上所述,NUMA架構是處理器發展的一個重要趨勢,產品表現相對而言是不錯的。當然,技術發展都是任重道遠的,未來處理器架構的發展,還需要不斷的創新優化,以克服未知的挑戰。
審核編輯:劉清
-
處理器
+關注
關注
68文章
19349瀏覽量
230319 -
云計算
+關注
關注
39文章
7840瀏覽量
137565 -
人工智能
+關注
關注
1792文章
47445瀏覽量
239041 -
numa
+關注
關注
0文章
7瀏覽量
3844
原文標題:NUMA架構或將成為未來處理器發展趨勢
文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論