NVIDIA A100 80G PCIe、NVIDIA NDR 400G InfiniBand和NVIDIA Magnum IO三箭齊發!超強HGX助力廣大HPC系統和云服務
NVIDIA宣布在NVIDIA HGX AI超級計算平臺中加入融合了AI與高性能計算的新技術,使越來越多的行業能夠更加充分地利用超級計算的力量。
為了加快產業AI和HPC新時代的到來,NVIDIA在HGX平臺中加入了三項關鍵技術:NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand網絡和NVIDIA Magnum IO GPUDirect Storage軟件。三者結合,提供了卓越的性能,以實現產業 HPC 的創新。
目前,已有數十家合作伙伴將NVIDIA HGX平臺用于新一代系統和解決方案,其中包括源訊(Atos)、戴爾科技(Dell Technologies,)、慧與(Hewlett Packard Enterprise )、聯想(Lenovo)、Microsoft Azure以及NetApp等。
NVIDIA創始人兼首席執行官黃仁勛先生表示:“HPC 革命始于學術界,并迅速擴展到各行各業。產業各項關鍵趨勢正在推動超指數、超摩爾定律的發展速度,使HPC變成各行業都能使用的工具。NVIDIA 的 HGX 平臺為研究人員提供了卓越的高性能計算加速能力,以解決行業面臨的那些最棘手的問題?!?/p>
行業領導者使用 HGX 平臺推動創新突破
高科技產業先驅者通用電氣正在使用HGX 平臺,將 HPC 創新應用于計算流體動力學模擬,以指導大型燃氣輪機和噴氣發動機的設計創新。HGX平臺在通用電氣的 GENESIS 代碼中實現了突破性CFD 方法的數量級加速,該代碼采用大渦模擬來研究渦輪機內部湍流的影響。渦輪機由數百個單獨的葉片組成,需要獨特的復雜幾何形狀。
除了推動產業 HPC 轉型外,HGX平臺還在加速世界各地的科學 HPC 系統,包括同樣在今日宣布的位于愛丁堡大學的新一代超級計算機。
NVIDIA A100 80GB PCIe GPU提升AI和HPC性能
NVIDIA A100 TensorCore GPU提供了前所未有的HPC加速能力,解決了與產業HPC相關的復雜AI、數據分析、模型訓練和計算模擬等挑戰。與A100 40GB相比,A100 80GB PCIe GPU的內存帶寬增加了25%,達到2TB/s,并且提供80GB的HBM2e高帶寬內存。
A100 80GB PCIe的巨大內存容量與高內存帶寬,可以保存更多的數據和更大的神經網絡,從而最大限度地減少節點間通信和能耗。憑借其更快的內存帶寬,研究人員能夠獲得更高的吞吐量和更快得到結果,實現IT投資價值的最大化。
A100 80GB PCIe GPU基于NVIDIA Ampere架構。該架構內置Multi-Instance GPU(MIG)功能,可為AI推理等小型工作負載提供加速。MIG允許HPC系統縮小計算和內存規模的同時并保證服務質量。除了PCIe之外,還有四卡和八卡的NVIDIA HGX A100配置。
NVIDIA合作伙伴為A100 80GB PCIe GPU提供了廣泛的支持,包括源訊(Atos)、思科(Cisco)、戴爾科技(Dell Technologies)、富士通(Fujitsu)、新華三(H3C)、慧與(Hewlett Packard Enterprise )、浪潮(Inspur)、聯想(Lenovo)、PenguinComputing、云達科技(QCT)以及超微(Supermicro)。通過NVLink 互連的基于 A100 GPU 的HGX 平臺也可通過來自 AWS (Amazon Web Services)、Microsoft Azure 和Oracle Cloud Infrastructure 的云服務獲得。
新一代NDR 400Gb/s InfiniBand交換機系統
NVIDIA InfiniBand是全球唯一具有完全卸載功能的網絡計算的互連系統,為那些需要超大數據通道的HPC系統提供超強支持。通過NDR InfiniBand網絡可以輕松擴展性能,以應對產業HPC和科學HPC系統面臨的大量挑戰?;贜VIDIA Quantum-2單芯片的交換機系統可提供64個NDR 400Gb/s InfiniBand端口(或128個NDR200端口),其端口密度比HDR InfiniBand高出3倍。
NVIDIA Quantum-2模塊化交換機提供了可擴展的端口配置選項,最高可提供2048個NDR400Gb/s InfiniBand端口(或4096個NDR200端口),雙向總吞吐量達到1.64Pb/s,是上一代HDR InfiniBand模塊化交換機系列的5倍。相比上一代,這款2048端口交換機的擴展能力增加了6.5倍,采用DragonFly+網絡拓撲,只需三個網絡Hop就能連接超過一百萬個節點。第三代 NVIDIA SHARP 網絡計算數據歸約技術,比上一代的AI 加速能力提高了 32 倍,可大幅提升高性能產業和科學應用的性能。
此外,NVIDIA UFM Cyber-AI平臺還提供了先進的管理功能,如網絡自修復功能等,以及NVIDIA網絡計算加速引擎,進一步將數據中心的停機時間降至最低。
基于行業標準的NVIDIA Quantum-2 交換機(預計在年底前可出樣品)具有向后和向前的兼容性,可以輕松遷移和擴展現有系統和軟件。
包括源訊(Atos)、DDN、戴爾科技(DellTechnologies)、Excelero 、技嘉科技(GIGABYTE)、慧與(HPE)、聯想(Lenovo)、PenguinComputing、云達科技(QCT)、超微(Supermicro)、VAST以及 WekaIO 在內的業內領先基礎設施制造商等,均計劃將Quantum-2 NDR 400Gb/s InfiniBand交換機集成到其企業級產品和HPC產品中。另外,包括Azure在內的云服務供應商們也正在使用InfiniBand技術。
Magnum IO GPUDirect Storage介紹
Magnum IO GPUDirect Storage提供GPU內存和存儲之間的直接內存訪問,實現了優異的復雜工作負載處理性能。這條直接的通路讓應用程序從低I/O延遲中受益,并能夠充分利用到網卡的全部帶寬,同時減少CPU在通信中的負載,并可以管理逐漸增加的數據消耗所產生的影響。
支持 Magnum IO GPUDirect Storage(現已上市)的行業領導者包括 DDN、戴爾科技(Dell Technologies)、Excelero、慧與(HPE)、IBM Storage、Micron、NetApp、Pavilion、ScaleFlux、VAST 和 WekaIO。
想要了解 NVIDIA 的 Marc Hamilton 的最新消息和參與 NVIDIA HPC 專家的現場問答,請在北京時間6月29日中午12點30分收聽 NVIDIA ISC2021 特別演講。
編輯:jq
-
AI
+關注
關注
87文章
30946瀏覽量
269189 -
超級計算
+關注
關注
1文章
39瀏覽量
11291 -
HPC
+關注
關注
0文章
316瀏覽量
23788 -
數據分析
+關注
關注
2文章
1451瀏覽量
34061
原文標題:ISC2021 | NVIDIA與全球合作伙伴聯合發布全新HGX A100系統,為產業AI和HPC提速
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論