準確的天氣模型對于企業正確預測可再生能源的生產和制定自然災害預案至關重要。僅 2022 年,無效和無法預測的天氣就造成了約 7140 億 美元的損失。為了避免這種情況,企業需要更快、更便宜、更精準的天氣模型。
在 GTC23上,微軟和 TempoQuest 詳細介紹了他們如何與 NVIDIA 合作一起解決這個能源和氣候問題。NVIDIA 初創加速計劃成員 TempoQuest 實現了超本地、低延遲的天氣和環境預測。該多學科合作團隊涵蓋大氣科學、氣象學、高性能計算(HPC)AI、機器學習(ML)、工程等領域,是將 GPU 引入環境領域的先鋒,包括:
本文中將介紹 TempoQuest 如何利用微軟 Azure 上的 NVIDIA 加速計算,將傳統的天氣研究和預報(WRF)軟件移植到 GPU 上、提供高于 1 公里的分辨率以及 1 分鐘至 1 小時的時間分辨率并加快對可再生風能和太陽能資源發電的預測。
公用事業單位在整合可再生能源過程中所面臨的挑戰
公用事業單位在他們的電網中使用可再生能源(主要是風能和太陽能)是具有挑戰性的。這些能源因環境因素而異,比如云層覆蓋和風速等。如果可再生能源的發電量不足以滿足需求,公用事業單位必須使用“旋轉備用”,即由發電機生產的碳基電力來彌補缺口。為了更好地預測可再生能源發電,需要快速、準確、經濟的天氣預報。
圖 1 標準電網基礎設施示意圖,包括發電、輸電和配電
能源行業需要實現三個關鍵功能:發電、輸電和配電。發電目前主要使用碳基燃料,但正在向包括風能和太陽能在內的可再生能源過渡,以實現凈零排放。輸電指的是產生的電力通過升壓變壓器后經高壓線傳輸。在遙遠的電網邊緣,電力經變壓器和變電站“降壓”后,輸送給家庭和企業的用電者(240 V / 120 V)。
如果要在電網中增加更多可再生能源,公用事業單位不僅要整合新的發電站,還要建造更多高壓輸電線路和塔架。這就給電網維護帶來了更高的復雜性和成本,包括投資和運營費用。高分辨率的 GPU 加速 WRF 可以通過減少對碳基電力的依賴和優化可再生能源的使用幫助實現這一目標。
使用 GPU 加速 WRF
AceCAST 代表“加速預測”,通過運行一個名為“天氣研究和預報”(WRF)的區域模型可實現加速預測。目前,已有 160 個國家的 5 萬名用戶使用該模型。通過將 WRF 移植到使用專有的 OpenACC 和 CUDA 帶有 NVIDIA GPU 的 x86 系統上運行,并在多 GPU 和多節點系統上進行擴展。AceCAST 支持所有主要的 WRF 動力學、物理學方案和名詞表選項,可直接取代現有的 WRF 配置。
AceCAST 的眾多優點包括更快的求解時間、更高的分辨率和精度、對局部天氣現象更加深入的認識以及更低的計算成本。
測試表明,在天氣預報和可再生能源預測方面,GPU 比 CPU 速度更快、分辨率更高且更具成本效益。這一加速解決方案對于減少碳排放、提升電網可靠性和管理以及降低用電者的用電成本十分重要。
AceCAST 驗證和性能成本分析
為了驗證基準測試結果,首先要保證 CPU WRF 與 GPU WRF 的差異在可接受的范圍內。團隊在幾個時間和空間預測范圍內測試了模型性能,最終驗證了數千個測試案例,以確保 AceCAST 產生與 CPU WRF 相同的結果。在微軟 Azure 上運行性能測試時,團隊發現兩者在性能和成本上都有很大的差異。
基于 CPU 的 WRF – Standard HB120rs_v3 VMs(HBv3):
-
120 顆 AMD EPYC7V73X 系列(Milan-X)CPU 核
-
450 GB 內存( 350 GB/s 內存帶寬)
-
200 Gb/s HDR InfiniBand
-
2 個1 TB NVMe 固態硬盤
-
NCAR WRF 4.2.2
-
使用 Parallel net-CDF
-
使用英特爾編譯器和 MPI 進行編譯
GPU 加速 WRF - Standard_ND96amsr_A100_v4(NDmv4):
-
8 個 NVIDIA A100 Tensor Core GPUs (80GB)
-
NVLink 3.0(200 Gb/s HDR InfiniBand)
-
96 顆 AMD EPYC7V12 系列(Rome)CPU 核
-
8 個 1 TB NVMe 固態硬盤
-
AceCAST 2.1
-
使用 OpenACC 和 CUDA 的專有實現
-
使用 MPI 在多節點和多 GPU 上進行擴展
Azure 代管式 Lustre 文件系統
-
40 TiB 存儲Azure 代管容量
-
10000 MB/s 最大吞吐量
圖 2 基于 CPU 的 WRF 與 TempoQuest AceCAST 的性能價格比較分析
結果顯示,與一個節點上基于 CPU 的 WRF 相比,一個節點上的 GPU 加速 WRF(AceCAST)的速度加快了約 9 倍,而要實現與一個 GPU 節點類似的性能,需要 18 個 CPU 節點。這些結果至關重要,因為更快、更低成本的天氣預報使公用事業單位能夠更加準確地預測可再生能源發電、提供穩定可靠的電力并避免過長時間的停電。
AceCAST 3.0.1 上的進一步測試顯示其可繼續提升性能。團隊使用了一個嵌套域,外域由 500 萬個網格點(430x331x38v)和 15 公里的網格間距組成,內域由 8000 萬個網格點(1551x1361x38v)和 3 公里的網格間距組成。
圖 3 TempoQuest AceCAST 以最佳配置運行一項作業的性能成本圖
結果顯示,AceCAST 在 1xNDmA100V4(8 個 GPU)上的內域計算和通信時間比 1xHBv3(64 個CPU)快 16.8 倍。單個作業的最佳配置是在 16 個 HBv3(CPU)虛擬機上運行 WRF,在 1 個包含 8 個 GPU 的 NDmA100(GPU)虛擬機上運行 AceCAST。在這種情況下,AceCAST 比基于 CPU 的 WRF 運行速度快 7%,成本低 75%。
可再生發電功率預測
最后一步是將 AceCAST 應用于可再生能源預測。美國的公用事業單位掌握著所有 7 萬多臺風力發電機的規格以及每個風能和太陽能節點的位置。通過使用專有的天氣-電力算法,AceCAST 可提供更高的預測分辨率,每天對特定可再生能源發電站點作出小時級的精確功率預測(MW)。
電網脫碳化
隨著發電資產從集中化的碳基技術過渡到清潔的分布式能源資源,電網面臨著實時管理供需的挑戰。通過預測可再生資產的性能,電力公司能夠提高電網的可靠性和彈性。NVIDIA、微軟和 TempoQuest 正在聯手幫助解決這一重大的社會及全球挑戰。
憑借 AceCAST 這一 GPU 加速 WRF,TempoQuest 正在以更低的成本加速風能和太陽能可再生資源的發電功率預測。這有助于優化負載和發電的平衡、減少公用事業單位的運營成本、管理可再生能源輸出的波動并產生更加可靠的預測,進而減少對碳基電力儲備的依賴。
點擊“閱讀原文”深入了解加速計算,訪問 GPU 加速庫論壇。
掃描下方海報二維碼,觀看 NVIDIA 創始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領域的最新進展!
原文標題:微軟和 TempoQuest 利用 AceCast 加速風能預測
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3842瀏覽量
91727
原文標題:微軟和 TempoQuest 利用 AceCast 加速風能預測
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論