NVIDIA Dynamo 提高了推理性能,同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理優化將 DeepSeek-R1 上的吞吐量提高了 30 倍
NVIDIA 發布了開源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴展 AI 工廠中的 AI 推理模型。
作為 NVIDIA Triton 推理服務器的后續產品,NVIDIA Dynamo 是一款全新的 AI 推理服務軟件,旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協調并加速數千個 GPU 之間的推理通信,并使用分離服務將大語言模型 (LLM) 的處理階段和生成階段在不同 GPU 上分離開來。這使得每個階段的特定需求可以進行單獨優化,并確保更大程度地利用 GPU 資源。
NVIDIA Dynamo 完全開源并支持 PyTorch、SGLang、NVIDIA TensorRT-LLM 和 vLLM,使企業、初創公司和研究人員能夠開發和優化在分離推理時部署 AI 模型的方法。
“全世界各行業都在訓練 AI 模型以不同的方式進行思考和學習,從而使模型復雜度持續升級。” NVIDIA 創始人兼首席執行官黃仁勛表示,“為了實現自定義推理 AI 的未來,NVIDIA Dynamo 可以在這些模型上進行規模化部署,從而為 AI 工廠實現降本增效”。
-
NVIDIA
+關注
關注
14文章
5149瀏覽量
104767 -
AI
+關注
關注
87文章
32772瀏覽量
272191
原文標題:GTC25 | NVIDIA Dynamo 開源庫加速并擴展 AI 推理模型
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
英偉達GTC2025亮點:NVIDIA認證計劃擴展至企業存儲領域,加速AI工廠部署
英偉達GTC2025亮點:NVIDIA、Alphabet 和谷歌攜手開啟代理式與物理AI的未來

英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業加速代理式AI推理

英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數據工具的重大更新
英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

NVIDIA 推出開放推理 AI 模型系列,助力開發者和企業構建代理式 AI 平臺

評論