NVIDIA DOCA SDK 和加速框架為開發者提供了豐富的庫、驅動程序和 API,以便為 NVIDIA BlueField DPU 和 ConnectX 智能網卡創建高性能應用程序和服務。它推動了數據中心的創新,實現了應用程序的快速部署。
憑借全面的功能,NVIDIA DOCA 可為基于 BlueField DPU 進行開發的開發人員提供大規模加速數據中心工作負載和人工智能應用程序的一站式服務。
NVIDIA DOCA 現已普遍可用,已使超過 10,000 名開發者從中受益,并使更廣泛的開發者社區利用 BlueField DPU 平臺實現創新的人工智能和云服務。
NVIDIA DOCA 2.2 的新增和增強功能
NVIDIA DOCA 2.2 引入了新增功能和增強功能,用于卸載、加速和隔離數據中心內的網絡、存儲、安全和基礎設施管理。
視頻 1:觀看 NVIDIA DOCA 軟件框架簡介
可編程性
NVIDIA BlueField-3 DPU 與其板載專用數據路徑加速器(DPA)和 DOCA SDK 框架相結合,提供了一個無與倫比的平臺。現在,開發者可以創建需要高吞吐量和低延遲的高性能且可擴展的網絡應用程序。
數據路徑加速器
為利用 BlueField-3 DPA 編程子系統,NVIDIA DOCA 2.2 提供了幾項增強功能。DOCA DPA 是 DOCA SDK 開發包的一個新計算子系統部分,它提供了一個編程模型,用于卸載在 DPA 處理器上運行的以通信為中心的用戶代碼。DOCA DPA 有助于卸載 CPU 流量,并通過 DPU 加速提高性能。
圖 1:NVIDIA BlueField-3 DPU 流入和流出流量
DOCA DPA 還提供了顯著的開發優勢,包括在創建自定義模擬和擁塞控制時具有更高的靈活性。定制的擁塞控制對于人工智能工作流至關重要,可以實現性能隔離、提高公平性,并防止在有損網絡上的丟包。
DOCA 2.2 版本引入了以下 SDK:
-
DOCA-FlexIO:這是一個用于 DPA 編程的低級別 SDK。具體來說,DOCA FlexIO 驅動程序提供了用于通過 DPA 管理和運行代碼的 API。
-
DOCA-PCC:這是一個用于擁塞控制開發的 SDK,它使 CSP 和企業客戶能夠創建自己的擁塞控制算法,從而通過更高的帶寬和更低的延遲來提高網絡運營的穩定性和效率。
NVIDIA 還提供必要的工具鏈、示例和輔助資料,以加快和支持開發工作。請注意,NVIDIA DOCA DPA 可在 DPU 模式和 NIC 模式下使用。
圖 2:DOCA-PCC 提供更高的帶寬和更低的延遲
網絡
NVIDIA DOCA 和 BlueField-3 DPU 通過一個全面、開放的開發平臺,共同開發出具有突破性網絡性能的應用程序。NVIDIA DOCA 包括一系列驅動程序、庫、工具和示例應用程序,并在不斷發展。此版本提供了以下其他功能,以支持網絡應用程序的開發。
NVIDIA DOCA Flow
借助 NVIDIA DOCA Flow,用戶可以定義和控制網絡流量,實現網絡策略,并以編程方式管理網絡資源。它提供網絡虛擬化、遙測、負載平衡、安全強制和流量監控等功能。這些功能有助于以低延遲處理高數據包工作負載,節省 CPU 資源并降低功耗。
此版本包括以下新功能,可為云部署帶來即時優勢:
-
支持隧道卸載 - GENEVE 和 GRE:提供增強的安全性、可見性、可擴展性、靈活性和可擴展性,是站點通信、網絡隔離和多租戶的構建塊。具體而言,GRE 隧道用于連接單獨的網絡并建立安全的 VPN 通信,支持 Overlay 網絡,提供協議靈活性,并實現流量工程。
-
支持具有 bps / pps 選項的每個流計量:在云環境中,監控 / 分析流量(即測量帶寬或數據包速率)、管理 QoS(即執行限制)或增強安全性(即阻止拒絕服務攻擊)都至關重要。
-
增強的鏡像功能(FDB / 交換機域):這項新增功能不僅用于監控、故障排除、安全分析和性能優化,還能為鏡像工作負載提供更高的 CPU 利用率。
OVS-DOCA (Beta 版)
OVS-DOCA 是適用于 NVIDIA 網絡服務的高度優化虛擬交換機。其極其高效的設計通過 NVIDIA 網卡或 DPU 提升了下一代性能和規模。現在,OVS-DOCA 可以在 DOCA 中用于 DPU,也可以在 DOCA 中用于主機(二進制文件和源代碼)。
圖 3:OVS- DOCA 針對 NVIDIA 網絡服務進行了優化
基于 Open vSwitch,OVS-DOCA 提供了相同的北向 API、OpenFlow、CLI 和數據接口,為 OVS 提供了一種替代方案。使用 OVS-DOCA 可以更快地實現未來 NVIDIA 創新的網絡功能。
BlueField-3(增強的)NIC 模式(Beta 版)
此版本受益于增強的 BlueField-3 NIC 模式,目前處于 Beta 版。與卸載、加速和隔離都可用的 BlueField-3 DPU 模式不同,BlueField-3 NIC 模式僅提供加速功能。
圖 4:BlueField-3(增強的)NIC 模式
在繼續利用 BlueField 低功耗和低計算密集型 SKU 的同時,增強的 BlueField-3 NIC 模式比當前的 ConnectX BlueField-2 NIC 模式具有許多優勢,包括:
-
使用本地 DPU 內存大規模實現更高的性能和更低的延遲
-
采用可編程擁塞控制(PCC)的高性能 RDMA
-
利用 DPA 和其他 BlueField 加速器實現可編程性
-
通過設備認證和卡載 BMC 實現強大平臺安全性
請注意,BlueField-3 NIC 模式將作為一種軟件模式進行產品化,而非單獨的 SKU,以實現未來使用 DPU 模式。因此,BlueField-3 NIC 模式是所有 BlueField-3 SKU 上都可以使用的且完全支持的軟件功能。對于在 NIC 模式下運行的任何 BlueField-3 DPU,DPA 可編程性要求在主機上安裝 DOCA 和活躍的基于主機服務。
服務
NVIDIA DOCA 服務是一種基于容器化 DOCA 程序,為特定用例提供端到端解決方案。這些服務可以通過 NVIDIA NGC 獲得,從而可以輕松地將它們直接部署到 DPU。DOCA 2.2 提供了更好的控制能力,現在可以離線安裝 DOCA 服務。
NGC 離線服務安裝
從 NGC 安裝 DOCA 服務需要互聯網連接。然而,許多客戶在沒有互聯網接入的安全生產環境中運營。因此,我們提供了“非連接”部署選項,可以在完全安全的生產環境中安裝服務,從而簡化流程,并避免了每臺服務器都需要連接才能完成安裝過程的情況。
例如,考慮在生產環境中安裝 DOCA 遙測服務(DTS)以支持計量收集。整個安裝過程只需兩個步驟即可完成:
-
步驟 1:在已連接的服務器上下載 NGC
-
步驟 2:使用內部安全交付進行離線安裝
總結
NVIDIA DOCA 2.2 在推動數據中心創新以及為人工智能應用而改造云和企業數據中心網絡方面發揮著關鍵和不可或缺的作用。通過為 BlueField DPU 提供全面的 SDK 和加速框架,DOCA 為開發者提供了強大的庫、驅動程序和 API,從而能夠創建高性能的應用程序和服務。
DOCA 2.2 有了一些新增功能和增強功能,可以立即獲得許多優勢。除了通過 DPU 加速實現的性能提升外,DOCA-FlexIO 和 DOCA-PCC SDK 的加入為開發者提供了以人工智能為中心的加速計算優勢。這些 SDK 能夠創建自定義模擬和算法,縮短上市時間,并顯著改善整體開發體驗。
此外,NVIDIA DOCA FLOW 和 OVS-DOCA 的網絡特定更新為軟件定義的網絡和安全解決方案提供了簡化的交付途徑。這些功能提高了效率,增強了可見性、可擴展性和靈活性,對于構建復雜而安全的基礎架構至關重要。
DOCA 為數據中心創新、人工智能應用加速和強大的網絡基礎設施做出了廣泛貢獻,是 NVIDIA 人工智能云服務的重要組成部分。隨著行業朝著更復雜、更苛刻的計算需求發展,DOCA 的不斷發展以及與尖端技術的集成將進一步鞏固其作為開創性平臺的地位,為數據中心和人工智能驅動的解決方案的未來賦能。
掃描下方二維碼,立即訪問 DOCA。
?
更多精彩內容 利用 NVIDIA DOCA Flow 實現 DPU 加速數據包轉向邏輯
使用 NVIDIA DOCA GPUNetIO 實現實時網絡處理功能
利用 NVIDIA DOCA 2.0 改變 IPsec 的部署
-
英偉達
+關注
關注
22文章
3799瀏覽量
91337
原文標題:使用 NVIDIA DOCA 2.2 加速數據中心工作負載和 AI 應用程序
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論