在邊緣計算、chiplet、人工智能與機器學習、CaaS(計算即服務)以及可持續性需求等其他趨勢的推動下,HPC(高性能計算)正在變得日益重要。
無論是在嚴格定義方面,還是在更為重要的應用領域和使用方法方面,HPC概念在過去幾年中均得到了發展。如今,HPC不再局限于大型數據中心、研究實驗室和超級計算機,而是被廣泛應用在各種行業中,如產品設計、財務建模、天氣預報等。它為我們所依賴并樂享的居家、辦公和汽車體驗帶來了更加強大的計算能力,讓各種應用更加貼近我們的日常生活。
HPC得以發展壯大的根本原因可以歸結為一個詞:數據,更具體的來說是因為人們需要比以往更快地處理、分析和傳輸各種數據。不管是我們居家時刷短視頻的習慣,還是日益互聯的汽車,亦或是我們在完成工作、監測健康狀況或管理財務時所需的大量信息,這些過程中都會不斷有數據產生、提供和消費,而HPC便是為這種無盡的數據循環問題而生。
隨著人們對HPC需求的不斷增加,對更快、更強、更高效的半導體芯片的需求也在同步增長。事實上,盡管芯片業務總體上有起有伏,但在HPC領域卻表現出一貫的持續增長。
作為HPC背后關鍵半導體技術的推動者,新思科技對HPC不斷變化的需求和新的用途有著全面的了解。那么,2023年HPC的前景如何呢?
01
邊緣(分布式)計算不斷發展
毫無疑問,邊緣計算是從總體上改變計算環境的一個關鍵趨勢,但它似乎與傳統HPC恰恰相反。HPC往往與大型集中式計算和存儲資源相關聯,而這些資源實際上是遠程云計算的主干。相比之下,邊緣計算則專注于在網絡邊緣或附近處理數據,而不是將數據發送回中心位置。這樣一來,它便可以提供較低的延遲,并且在許多情況下具有更安全的操作特性。
但是,這兩個領域正在走向融合:邊緣計算常常也是HPC,只是可能位于傳統數據中心之外的其他地方。導致出現這種情況的原因是數據的大爆炸。在萬物智能需求的推動下,邊緣產生的數據量在數量和復雜性方面呈指數級增長(這其中還包括大量的物聯網(IoT)設備)。邊緣計算的重要性主要體現在延遲和內容交付上,因為不斷往返于云端/集中化數據中心無法滿足所需的響應時間。在某些情況下,文件可能太大,無法發送到云端進行處理甚至存儲。這其中可能包括城市交通管理和相關的自動駕駛系統、精準醫療、欺詐檢測、商業智能、智慧城市開發等。
我們認為,邊緣計算將對HPC系統供應商、云服務提供商、網絡供應商和存儲供應商產生重大影響,因為這些組織希望將遠程HPC功能與本地生成和處理的數據策略結合在一起。在此過程中,我們預計還會看到HPC的物理足跡從集中式交付模型擴展到更加分散的分布式模型,其中包含的一些位置靠近那些會生成大量數據的邊緣位置。
從芯片設計的角度來看,盡管邊緣計算仍要求具有出色的功耗、性能和面積(PPA),但它還要兼顧另一個關鍵優先事項:減少這些設備在處理和傳輸數據時的延遲。設計策略必須優先考慮這類芯片中的數據傳輸速度和效率,例如下面小芯片架構中討論的那些芯片。當然,芯片設計解決方案必須考慮PPA權衡方案的各個方面,并提供一些高級功能來針對任何給定的應用需求設計和分析優化的芯片。這其中包括強大的仿真和驗證工具、功耗和熱分析功能、設計布局的智能實施,以及一系列關鍵功能和接口的認證IP模塊。未來,從數據中心到由電池供電的物聯網設備,市場對能夠降低功耗的設計解決方案的需求會不斷增加。
02
Chiplets走向成熟
HPC的最新趨勢之一是Multi-Die系統的使用。由于器件的物理特性和制造傳統單體架構芯片所面臨的經濟挑戰,摩爾定律的加倍效應已經開始放緩。為了應對這一情況,Multi-Die系統得到了高性能計算領域的青睞。簡單來說,傳統的單個片上系統(SoC)變得太大,生產成本太高,無法進行先進設計,而且收益風險也會隨著設計尺寸而增加。作為擴展摩爾定律PPA優勢的一種可行方式,Multi-Die方案非常具有吸引力。該方案可以提供更強大的處理能力,而又無需增加芯片面積或功耗。它還支持異質混合和匹配方法,可最大限度實現目標應用優化的工藝技術。將SoC組件分解,分別制造,然后將這些不同的功能匯集到單個封裝中,不僅可以減少浪費,同時還提供一種方法來快速打造具有優化系統功耗和性能的新產品型號。
雖然Multi-Die系統已經成為HPC發展的基本推動力,但設計方法必須不斷發展以應對新的挑戰。例如,支持高帶寬、低延遲、低功耗和無差錯工作的die-to-die接口對于快速、可靠的數據傳輸至關重要。而要處理這種Multi-Die方案中的異構集成、互連和封裝問題,就需要增強的工具、方法和IP。另外,為了推動創新和設計效率達到新水平,還必須具備先進封裝和硅光子學等領域的專業知識和技術。
03
人工智能與機器學習方興未艾
另一個貫穿HPC各個方面的重要趨勢是人工智能(AI)和機器學習(ML)的興起。該領域與HPC存在著共生關系。
一方面,高性能計算機需要處理AI工作負載。在當今這個自動化數據密集的世界中,AI工作負載可謂無處不在。對于HPC供應商來說,這是一個快速增長的領域,幾乎每個有計算需求的地方都存在新的機遇。但是,為了支持AI工作負載,計算平臺要求底層硬件不斷提高性能,這就給芯片開發者帶來了持續創新的壓力。在這里,人工智能本身也發揮著作用。現在,借助AI設計工具,開發者可以優化繁瑣或過于詳盡的任務(經過訓練的AI算法可以很好地接手這些任務),據此處理前沿芯片設計中的復雜性和規模性問題。這不僅提高了整體開發效率,還讓開發者可以專注于更加注重創新的工作。
另一方面,HPC依賴人工智能本身來高效、安全地運行數據中心。無論是監控存儲、服務器和網絡設備的健康狀況與安全性,確保配置正確,預測設備故障,還是篩查數據來排查惡意軟件,人工智能為HPC用戶提供了新的洞察力,并將預測性維護提升到新水平。人工智能還可用于通過優化供暖和冷卻系統來降低用電量和提高效率,這些是數據中心運營商最關心的關鍵可持續性問題(下文會做更深入的介紹)。
04
HPCaaS得以推進
隨著業務各個方面所需的計算能力大幅增長,各家公司都在積極探索“即服務”模式的價值,以滿足其周期性計算需求。“HPC即服務”(HPCaaS)便應運而生。除了峰值工作負載效率外,此類模式還為那些內部不具備相關知識、資源或基礎設施來通過云技術使用HPC的公司提供相關服務和支持。HPCaaS使得HPC易于部署和擴展,并且從成本的角度更加可預測。
芯片設計領域對該模式表現出了極大的興趣,希望能夠通過它來獲取執行數據密集型芯片設計任務所需的計算資源。由多核架構組成的復雜HPC芯片設計便是一個主要例證。這類設計在設計和開發期間要求具備更高的計算、存儲和處理能力,并且通常需要并行處理大量數據,以便實現設計與驗證的融合。這種托管模式正在為大型半導體公司和開發高性能的HPC芯片的初創公司所使用。這是一種有趣的共生關系:HPC的推動者也依賴于HPC能力。
與其他HPCaaS企業用例一樣,基于云的EDA在芯片開發過程中提供了可擴展性、靈活性、效率和安全性。各家公司可以根據具體的使用需求、高峰設計時間和分布式工作結構來調整HPC的使用,而無需員工具備專門的資源管理專業知識。所有這些優勢都是建立在性能吞吐量優勢的基礎之上,而這正是EDA工具的一個關鍵需求。
05
可持續發展成為焦點
隨著HPC的快速發展,我們在生活中諸多方面受益匪淺,但與此同時我們也為之付出了一些代價,即這些高能耗系統造成的環境影響。一些專家預測,到2030年,僅數據中心的用電量就將占到全球總用電量的3%至7%。在地方層面上,由于用水和用電量問題,許多數據中心都遭到人們強烈抵制,甚至出現難以獲得新施工許可的情況。這些大型計算平臺的供電和冷卻問題已經成為可持續發展的討論熱點,電源使用效率(PUE)和碳排放等指標已經成了大家首要考慮的問題。
通過可再生能源(水力、太陽能、風能)為數據中心供電的根本性轉變正逐漸成為大家的共識。一些新的方法同樣具有巨大的潛力,例如沉浸冷卻或液冷技術(包括水下數據中心),將數據中心消耗的能源和水重新分配并回收用于其他用途(如樓宇供暖),以及在供應鏈生態系統中使用更環保的組件、材料和制造方法。前文所述的HPCaaS模式本質上也是一種更高效地利用資源的方法。
對于新思科技而言,我們能做的是在芯片級別提高能耗和散熱效率。例如,通過使用先進的低功耗設計方法和功率優化的IP核,可以更好地對HPC芯片設計進行功耗優化,從而降低芯片和整個系統的總體能耗。
小芯片趨勢為降低功耗提供了另一個重要的潛在途徑。對功耗更為敏感的數據傳輸方法(例如高帶寬內存(HBM))也可以讓芯片及其支持的系統更加節能。CXL、UCIe和OCP等標準和開源工作也在助力這些目標的實現。
總之,HPC行業正在不斷發展壯大,每天都在為我們的生活帶來新的氣象。但是,這種發展是一把雙刃劍,因為它在為數據創建和消費方面帶來持續、高效增長的同時,也可能對環境造成有害的影響。應對這些挑戰的解決方案還在不斷改進中,新思科技期待發揮自己的作用,讓HPC保持可持續、可擴展的發展道路。
? ? ?
? ?
原文標題:2023:五大趨勢引領HPC可持續發展
文章出處:【微信公眾號:新思科技】歡迎添加關注!文章轉載請注明出處。
-
新思科技
+關注
關注
5文章
805瀏覽量
50387
原文標題:2023:五大趨勢引領HPC可持續發展
文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論