怡红院在线观看精品,亚洲成人伦理,一二三四国语在线观看视频

大語言模型（LLM）和人工智能應用程序（如 ChatGPT 和 DALL-E）最近出現了快速增長。由于 GPU、CPU、DPU、高速存儲和針對人工智能優化的軟件創新，人工智能現在得到了廣泛使用。您甚至可以在云端或內部部署人工智能。

然而，人工智能應用程序可能會對網絡造成很大負擔，這種增長給 CPU 和 GPU 服務器以及將這些系統連接到一起的現有底層網絡基礎設施帶來了負擔。

傳統以太網雖然足以處理主流和企業應用程序，如 Web、視頻或音頻流，但并未針對支持新一代人工智能工作負載進行優化。在松耦合應用、低帶寬數據流和高抖動的情況下，傳統以太網是理想的選擇。它可能足以滿足異構流量（如 Web、視頻或音頻流、文件傳輸和游戲），但在發生超額訂閱時并不理想。

NVIDIA Spectrum-X 網絡平臺是一種端到端解決方案，專為滿足人工智能應用程序的性能需求而全新設計，并針對高速網絡性能、低延遲和規模進行了優化。

NVIDIA Spectrum-X

NVIDIA Spectrum-X 網絡平臺是為了解決傳統以太網網絡的局限性而開發的。它是一種網絡架構，旨在滿足要求苛刻的人工智能應用程序的需求，用于實現緊耦合的過程。

這種經過 NVIDIA 認證和測試的端到端解決方案結合了一流的人工智能優化網絡硬件和軟件，可提供人工智能工作負載所需的可預測的、一致的和毫不妥協的性能水平。

圖 1：NVIDIA Spectrum-X 網絡平臺將 NVIDIA Spectrum-4 以太網交換機與 NVIDIA BlueField-3 DPU 相結合，為 AI 工作負載提供最佳性能

NVIDIA Spectrum-X 是一種高度通用的技術，可用于各種人工智能應用程序。具體而言，它可以在以下用例中顯著提高 AI 集群的性能和效率：

GPT 和 BERT 大型語言模型
分布式訓練和并行處理
自然語言處理（NLP）
計算機視覺
高性能模擬（NVIDIA Omniverse 和 NVIDIA OVX）
高性能數據分析（Spark）
推理應用程序

NVIDIA Spectrum-X 平臺的兩個關鍵元素是NVIDIA Spectrum-4 以太網交換機和 NVIDIA BlueField-3 DPU。

NVIDIA Spectrum-4 以太網交換機

NVIDIA Spectrum-4 以太網交換機為基于標準的以太網構建的 AI 集群提供了前所未有的應用程序性能。要充分發揮 NVIDIA Spectrum-4 的潛力，需要端到端的、專門構建的網絡架構。只有 NVIDIA Spectrum-X 平臺才能提供支持超大規模人工智能所需的硬件加速器和卸載。

NVIDIA Spectrum-4 以太網交換機基于 51.2Tbps 的 Spectrum-4 ASIC 而構建，帶寬是上一代產品的 4 倍。它是全球首款以太網人工智能交換平臺。它專為人工智能工作負載而設計，將專用的高性能架構與標準以太網連接相結合。

NVIDIA Spectrum-4 提供：

RoCE 擴展：具有獨特增強功能的 RoCE

RoCE 自適應路由
RoCE 性能隔離
簡化、自動化的自適應路由和 RoCE 配置
同步集合
用于 HPC 增強的其他 RoCE 功能

大規模以太網上的最高有效帶寬
低延遲、低抖動和短尾
確定性性能和性能隔離
全棧和端到端優化
NVIDIA Cumulus Linux 或 SONiC

圖 2 : NVIDIA Spectrum-4 將專用的高性能架構與標準以太網連接相結合

NVIDIA Spectrum-X 與 NVIDIA Spectrum-4 的主要優勢包括：

將 RoCE 擴展用于 AI 和自適應路由（AR），以實現 NVIDIA 集合通信庫（NCCL）的最大性能。
利用性能隔離來確保在多租戶和多作業環境中，一個作業不會影響另一個作業。
確保在出現網絡組件故障時，網絡架構能夠繼續提供最高性能。
與 BlueField-3 DPU 同步，實現最佳 NCCL 和 AI 性能。
在各種人工智能工作負載下保持一致和穩定的性能，這對實現 SLA 至關重要。

端到端最佳網絡性能

要構建有效的人工智能計算網絡架構，需要優化人工智能網絡的每一個部分，從 DPU 到交換機再到網絡軟件。使用 RoCE 自適應路由和高級擁塞控制機制等技術，在負載和規模需求下實現最高有效帶寬。結合在 NVIDIA BlueField-3 DPU 和 Spectrum-4 交換機上同步工作的功能對于實現 AI 網絡架構的最高性能和可靠性至關重要。

RoCE 自適應路由

人工智能工作負載和應用程序的特點是少量大象流負責 GPU 之間的大量數據移動，其中尾部延遲嚴重影響整個應用程序的性能。使用傳統的網絡路由機制來迎合這種流量模式可能會導致 AI 工作負載的 GPU 性能不一致且未得到充分利用。

RoCE 自適應路由是一種細粒度的負載均衡技術。它動態地重新路由 RDMA 數據以避免擁塞，并提供最佳負載均衡以實現最高的有效數據帶寬。

它是一種端到端功能，包括 Spectrum-4 交換機和 BlueField-3 DPU 。Spectrum-4 交換機負責為每個數據包選擇最不擁塞的端口進行數據傳輸。由于同一流的不同數據包通過網絡的不同路徑來傳輸，它們可能會無序到達目的地。BlueField-3 在 RoCE 傳輸層轉換任何無序數據，透明地將有序數據傳遞給應用程序。

Spectrum-4 根據出口隊列負載評估擁塞，確保所有端口都很好地均衡。對于每個網絡數據包，交換機都會在其出口隊列中選擇負載最小的端口。Spectrum-4 還接收來自相鄰交換機的狀態通知，這會影響路由決策。所評估的隊列與服務質量級別相匹配。

因此，NVIDIA Spectrum-X 能夠在超大規模系統的負載和規模下實現高達 95% 的有效帶寬。

圖 3 ：NVIDIA Spectrum-4 典型數據中心部署結構

RoCE 擁塞控制

由于網絡層面的擁塞，在超大規模云系統上并發運行的應用程序可能會出現性能下降和可重復運行時間縮短的問題。這可能是由應用程序本身的網絡流量或來自其他應用程序的后臺網絡流量引起的。這種擁塞的主要原因被稱為多對一擁塞，即存在多個數據發送方和單一數據接收方。

這種擁塞不能使用自適應路由來解決，并且實際上需要對每個端點的數據流進行計量。擁塞控制是一種端到端的技術，Spectrum-4 交換機提供代表實時擁塞數據的網絡遙測信息。這些遙測信息由 BlueField DPU 處理，后者管理和控制數據發送方的數據注入速率，從而實現網絡共享的最大效率。

如果沒有擁塞控制，多對一的場景將導致網絡背壓和擁塞擴散，甚至出現丟包，從而極大地降低網絡和應用程序的性能。

在擁塞控制過程中，BlueField-3 DPU 執行擁塞控制算法。它們以微秒的反應延遲每秒處理數百萬個擁塞控制事件，并應用細粒度的速率決策。

Spectrum-4 交換機帶內遙測既包含用于準確擁塞估計的排隊信息，也包含用于快速恢復的端口利用率指示。NVIDIA RoCE 擁塞控制通過使遙測數據繞過擁塞流排隊延遲，同時仍然提供準確和并發的遙測，從而顯著改善了擁塞發現和反應時間。

RoCE 性能隔離

人工智能超大規模和云基礎設施需要支持越來越多的用戶（租戶）和并行應用程序或工作流。這些用戶和應用程序無意中競爭基礎設施的共享資源（如網絡），因此可能會影響性能。

NVIDIA Spectrum-X 平臺包括一些機制，當它們結合在一起時，可以提供性能隔離。它確保一個工作負載不會影響另一個工作負荷的性能。這些機制確保任何工作負載都不會造成網絡擁塞，從而影響另一個工作負載的數據移動。性能隔離機制包括服務質量隔離、用于數據路徑擴展的 RoCE 自適應路由和 RoCE 擁塞控制。

NVIDIA Spectrum-X 平臺具有軟件和硬件的緊密集成功能，能夠更深入地了解人工智能工作負載和流量模式。這樣的基礎設施提供了使用專用以太網 AI 集群進行大型工作負載測試的能力。通過利用來自 Spectrum 以太網交換機和 BlueField-3 DPU 的遙測技術，NVIDIA NetQ 可以主動檢測網絡問題并更快地解決網絡問題，以優化網絡容量的使用。

NVIDIA NetQ 網絡驗證和 ASIC 監控工具集提供了對網絡健康狀況和行為的可見性。NetQ 流遙測分析顯示了數據流在穿越網絡時所采用的路徑，從而提供網絡延遲和性能洞察。

提高能效

由于對計算資源的需求不斷增長以及控制能源成本的需要，功率封頂已成為數據中心的一種常見做法。Spectrum-4 ASIC 和光學創新可簡化網絡設計，提高了每瓦的性能，實現了更高效率，并提供了更快的人工智能洞察，而不會超過網絡功率預算。

總結

NVIDIA Spectrum-X 網絡平臺專為要求苛刻的人工智能應用而設計。與傳統以太網相比，NVIDIA Spectrum-X 具有更高的性能、更低的功耗、更低的 TCO、全棧軟硬件集成和大規模，它是運行現有和未來人工智能工作負載的理想平臺。

觀看下方視頻

了解更多關于 NVIDIA Spectrum-X 的信息！

掃描下方二維碼，查看更多有關 NVIDIA Spectrum-X 的信息。

更多精彩內容 COMPUTEX2023 | NVIDIA 推出面向超大規模生成式 AI 的加速以太網平臺

原文標題：使用 NVIDIA Spectrum-X 網絡平臺加速生成式 AI 工作負載

文章出處：【微信公眾號：NVIDIA英偉達】歡迎添加關注！文章轉載請注明出處。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

英偉達

英偉達

+關注

關注
22

文章
3842

瀏覽量
91749

原文標題：使用 NVIDIA Spectrum-X 網絡平臺加速生成式 AI 工作負載

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達】歡迎添加關注！文章轉載請注明出處。

NVIDIA向開放計算項目捐贈Blackwell平臺設計

近日，在美國加利福尼亞州舉行的 OCP 全球峰會上，NVIDIA 宣布已把 NVIDIA Blackwell 加速計算平臺的一些基礎元素捐贈給開放計算項目（OCP），并擴大

發表于 11-19 15:30 ?254次閱讀

NVIDIA SuperNIC推進現代AI基礎設施發展

在生成式 AI 時代，加速網絡對于為大規模分布式 AI

發表于 11-06 13:59 ?289次閱讀

NVIDIA 以太網加速 xAI 構建的全球最大 AI 超級計算機

市的 Colossus 超級計算機集群達到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規模。該集群使用了 NVIDIA Spectrum-X? 以太網網絡

發表于 10-30 09:33 ?174次閱讀

NVIDIA新增生成式AI就緒系統認證類別

借助全新的 NVIDIA Spectrum-X Ready 和 NVIDIA IGX 認證，領先的制造業合作伙伴將提供高性能系統，幫助客戶輕松部署 AI。

發表于 10-10 09:44 ?421次閱讀

簡單認識NVIDIA網絡平臺

NVIDIA Spectrum-X800 平臺是業界第一代 800Gb/s 的以太網網絡平臺，包括了 N

發表于 09-09 09:22 ?485次閱讀

NVIDIA在加速計算和生成式AI領域的創新

在最新發布的公司 2024 財年可持續發展報告開篇的一封信中，NVIDIA 創始人兼首席執行官黃仁勛介紹了 NVIDIA 在加速計算和生成式

發表于 09-09 09:18 ?627次閱讀

應用NVIDIA Spectrum-X網絡構建新型主權AI云

法國云服務提供商 Scaleway 正在基于 NVIDIA 的 Hopper GPU和 Spectrum-X 以太網網絡平臺構建區域性 GPU 集群，為用戶提供

發表于 07-26 18:58 ?1229次閱讀

HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 變革

by HPE 包含了可持續的加速計算產品組合以及全生命周期服務，將簡化 AI 創造價值的過程，加速生成式

發表于 06-21 14:39 ?412次閱讀

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

關系進一步深化。助力生成式 AI 的企業級應用與發展加速駛入快車道。 HPE Private Cloud AI 是該解決方案的關鍵，開創性地

發表于 06-20 17:36 ?766次閱讀

NVIDIA Spectrum-X 以太網網絡平臺已被業界廣泛使用

平臺已被業界廣泛使用，并且將進一步加快新品發布計劃。 Spectrum-X 是全球首款專為 AI 打造的以太網網絡平臺，可將

發表于 06-03 18:20 ?1020次閱讀

NVIDIA AI Enterprise榮獲金獎

NVIDIA AI Enterprise、GH200 Grace Hopper 超級芯片和 Spectrum-X 在 COMPUTEX 2024 獲得認可。

發表于 05-29 09:27 ?487次閱讀

NVIDIA數字人技術加速部署生成式AI驅動的游戲角色

NVIDIA 在 GDC 2024 大會上宣布，Inworld AI 等領先的 AI 應用程序開發者，正在使用 NVIDIA 數字人技術加速

發表于 04-09 10:08 ?711次閱讀

NVIDIA Isaac將生成式AI應用于制造業和物流業

NVIDIA Isaac 機器人平臺利用最新的生成式 AI 和先進的仿真技術，加速

發表于 03-22 10:06 ?585次閱讀

NVIDIA發布專為大規模AI量身訂制的全新網絡交換機-X800系列

NVIDIA Quantum-X800 InfiniBand 網絡和 NVIDIA Spectrum?-

發表于 03-20 09:54 ?562次閱讀

NVIDIA 發布全新交換機，全面優化萬億參數級 GPU 計算和 AI 基礎設施

NVIDIA Quantum-X800 InfiniBand 網絡，打造性能最強大的 AI 專用基礎設施 NVIDIA

發表于 03-19 10:05 ?400次閱讀