色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

NVIDIA Triton助力騰訊構建高性能推理服務

藉由 NVIDIAT4 GPU，通過 Ronda 平臺調用 NVIDIA Triton 以及 TensorRT ，整體提升開發和推理效能，幫助騰訊 PCG 的多個服務整體效能提升 2 倍，吞吐量最大提升 6 倍，同時降低了 40% 的延時。

騰訊平臺與內容事業群（簡稱騰訊 PCG）負責公司互聯網平臺和內容文化生態融合發展，整合 QQ、QQ 空間等社交平臺，和應用寶、瀏覽器等流量平臺，以及新聞資訊、視頻、體育、直播、動漫、影業等內容業務，推動 IP 跨平臺、多形態發展，為更多用戶創造海量的優質數字內容體驗。

騰訊 PCG 機器學習平臺部旨在構建和持續優化符合 PCG 技術中臺戰略的機器學習平臺和系統，提升 PCG 機器學習技術應用效率和價值。建設業務領先的模型訓練系統和算法框架；提供涵蓋數據標注、模型訓練、評測、上線的全流程平臺服務，實現高效率迭代；在內容理解和處理領域，輸出業界領先的元能力和智能策略庫。機器學習平臺部正服務于 PCG 所有業務產品。

而過往在項目執行時，團隊所面挑戰包含：

1. 業務繁多，場景復雜

業務開發語言包括C++/Python

模型格式繁多，包括ONNX、Pytorch、TensorFlow、TensorRT等

模型預處理涉及圖片下載等網絡IO

多模型融合流程比教復雜，涉及循環調用

支持異構推理

2. 模型推理結果異常時，難以方便地調試定位問題

3. 需要與公司內現有協議/框架/平臺進行融合

基于以上挑戰，騰訊 PCG 選擇了采用 NVIDIA Triton 推理服務器，以解決新場景下模型推理引擎面臨的挑戰，在提升用戶研效的同時，大幅降低了服務成本。

NVIDIA Triton 是一款開源軟件，對于所有推理模式都可以簡化模型在任一框架中以及任何 GPU 或 CPU 上的運行方式，從而在生產環境中使用 AI。Triton 支持多模型 ensemble，以及 TensorFlow、PyTorch、ONNX 等多種深度學習模型框架，可以很好的支持多模型聯合推理的場景，構建起視頻、圖片、語音、文本整個推理服務過程，大大降低多個模型服務的開發和維護成本。

基于 C++ 的基礎架構、Dynamic-batch、以及對 TensorRT 的支持，同時配合 T4 的 GPU，將整體推理服務的吞吐能力最大提升 6 倍，延遲最大降低 40%，既滿足了業務的低延時需求，成本也降低了 20%-66%。

通過將 Triton 編譯為動態鏈接庫，可以方便地鏈入公司內部框架，對接公司的平臺治理體系。符合 C 語言規范的 API 也極大降低了用戶的接入成本。

借助 Python Backend 和 Custom Backend，用戶可以自由選擇使用 C++/Python 語言進行二次開發。

Triton 的 Tracing 能力可以方便地捕捉執行過程中的數據流狀態。結合 Metrics 和 Perf Analysis 等組件，可以快速定位開發調試，甚至是線上問題，對于開發和定位問題的效率有很大提升。

NVIDIA DALI 是 GPU 加速的數據增強和圖像加載庫。DALI Backend 可以用于替換掉原來的圖片解碼、resize 等操作。FIL Backend 也可以替代 Python XGBoost 模型推理，進一步提升服務端推理性能。

借助 NVIDIA Triton 推理框架，配合 DALI/FIL/Python 等 Backend，以及 TensorRT，整體推理服務的吞吐能力最大提升 6 倍，延遲最大降低 40%。幫助騰訊 PCG 各業務場景中，以更低的成本構建了高性能的推理服務，同時更低的延遲降低了整條系統鏈路的響應時間，優化了用戶體驗。

審核編輯：彭菁

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

數據

數據

+關注

關注
8

文章
7134

瀏覽量
89402
NVIDIA

NVIDIA

+關注

關注
14

文章
5075

瀏覽量
103539
騰訊

騰訊

+關注

關注
7

文章
1666

瀏覽量
49547

NVIDIA 發布保障代理式 AI 應用安全的 NIM 微服務

NVIDIA NeMo Guardrails 包含全新 NVIDIA NIM 微服務，能夠為各行業構建 AI 的企業提高 AI 的準確性、安全性和可控性。 ? AI 智能體有望成為能夠

發表于 01-17 16:29 ?62次閱讀

NVIDIA技術助力Pantheon Lab數字人實時交互解決方案

、NVIDIA Triton，Pantheon Lab 訓練速度提高 10 倍、推理延遲降低 50%，以及用戶參與度提升 30%。這些進步使對話式 AI 能夠提供實時且真實的互動，使 Pantheon Lab 在數字人技術不斷革

發表于 01-14 11:19 ?240次閱讀

鴻蒙原生頁面高性能解決方案上線OpenHarmony社區助力打造高性能原生應用

隨著HarmonyOS NEXT的正式推出，鴻蒙原生應用開發熱度高漲，數量激增。但在三方應用鴻蒙化進程中，性能問題頻出。為此，HarmonyOS NEXT推出了一整套原生頁面高性能解決方案，包括

發表于 01-02 18:00

Triton編譯器在高性能計算中的應用

高性能計算（High-Performance Computing，HPC）是現代科學研究和工程計算中不可或缺的一部分。隨著計算需求的不斷增長，對計算資源的要求也越來越高。Triton編譯器作為一種

發表于 12-25 09:11 ?316次閱讀

Triton編譯器在機器學習中的應用

1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務平臺的一部分

發表于 12-24 18:13 ?485次閱讀

Wolfspeed碳化硅助力實現高性能功率系統

Wolfspeed碳化硅助力實現高性能功率系統

發表于 10-24 10:51 ?0次下載

澎峰科技高性能大模型推理引擎PerfXLM解析

自ChatGPT問世以來，大模型遍地開花，承載大模型應用的高性能推理框架也不斷推出，大有百家爭鳴之勢。在這種情況下，澎峰科技作為全球領先的智能計算服務提供商，在2023年11月25日發布了針對大語言

發表于 09-29 10:14 ?547次閱讀

澎峰科技<b class='flag-5'>高性能</b>大模型<b class='flag-5'>推理</b>引擎PerfXLM解析

NVIDIA助力提供多樣、靈活的模型選擇

在本案例中，Dify 以模型中立以及開源生態的優勢，為廣大 AI 創新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務器

發表于 09-09 09:19 ?516次閱讀

NVIDIA攜手Meta推出AI服務，為企業提供生成式AI服務

NVIDIA近日宣布了一項重大舉措，正式推出NVIDIA AI Foundry服務與NVIDIA NIM（NVIDIA Inference

發表于 07-25 16:57 ?584次閱讀

英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務

發表于 07-25 09:48 ?763次閱讀

英偉達推出AI模型推理服務NVIDIA NIM

英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程，為全球的2800萬英偉達開發者提供前所未有的便利。

發表于 06-04 09:15 ?714次閱讀

英特爾助力京東云用CPU加速AI推理，以大模型構建數智化供應鏈

英特爾助力京東云用CPU加速AI推理，以大模型構建數智化供應鏈

發表于 05-27 11:50 ?572次閱讀

利用NVIDIA組件提升GPU推理的吞吐

本實踐中，唯品會 AI 平臺與 NVIDIA 團隊合作，結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）將推理的稠密網絡和熱

發表于 04-20 09:39 ?798次閱讀

使用NVIDIA Triton推理服務器來加速AI預測

這家云計算巨頭的計算機視覺和數據科學服務使用 NVIDIA Triton 推理服務器來加速 AI 預測。

發表于 02-29 14:04 ?619次閱讀

基于NVIDIA DOCA 2.6實現高性能和安全的AI云設計

網絡平臺上快速創建應用程序和服務，并啟用 NVIDIA BlueField DPU 和 NVIDIA BlueField SuperNIC 的強大功能，提供突破性的網絡、安全和存儲性能

發表于 02-23 10:02 ?513次閱讀

科技綠洲
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot javascript的成熟分類
Hot java和javaweb和javascript的區別

New 電阻器的制造材料與工藝
New 常見電阻器故障及解決方法

精選推薦
更多

文章

資料

帖子

Llama 7B大語言模型本地部署全攻略！一步步教你輕松上手

英碼科技
1天前

330 閱讀

先進電動汽車的電壓轉換策略在48V電動汽車供電網絡中部署區域架構

Vicor
1天前

491 閱讀

解析汽車拋負載Load Dump：load dump產生原因與TVS并聯保護方案

力特奧維斯Littelfuse
1天前

432 閱讀

泰克示波器在直流充電樁電流紋波測試中的應用

泰克科技
1天前

448 閱讀

互補場效應晶體管的結構和作用

中科院半導體所
1天前

380 閱讀

圖表細說電子元件

jcyang05
38912

免費

0下載

zigbee無線傳感網絡物理層學習資料下載

h1654155275.5741
525 KB

10積分

469下載

通信系統中接收鏈差分濾波器設計

Duke
630KB

免費

28下載

nginx-proxy Docker容器的自動化nginx代理

席毖庸
0.13 MB

2積分

1下載

ConvenientImagePicker iOS簡潔優雅的imagepicker

蕭藹晨
24.35 MB

免費

0下載

【瑞薩RA2L1入門學習】開箱+Keil環境搭建+點燈+點亮OLED

gtbestom
18小時前

59 閱讀

【瑞薩RA2L1入門學習】01、PWM呼吸燈

jf_83922529
18小時前

60 閱讀

【ELF 2學習板試用】命令行功能測試-shell腳本進行IO控制-燈閃

lustao
18小時前

59 閱讀

【「鴻蒙操作系統設計原理與架構」閱讀體驗】01-

申小林一號
18小時前

54 閱讀

【瑞薩RA2L1入門學習】00、開發板開箱及串口輸出實現

jf_83922529
1天前

101 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

NVIDIA Triton助力騰訊構建高性能推理服務

評論

NVIDIA 發布保障代理式 AI 應用安全的 NIM 微服務

NVIDIA技術助力Pantheon Lab數字人實時交互解決方案

鴻蒙原生頁面高性能解決方案上線OpenHarmony社區助力打造高性能原生應用

Triton編譯器在高性能計算中的應用

Triton編譯器在機器學習中的應用

Wolfspeed碳化硅助力實現高性能功率系統

澎峰科技高性能大模型推理引擎PerfXLM解析

NVIDIA助力提供多樣、靈活的模型選擇

NVIDIA攜手Meta推出AI服務，為企業提供生成式AI服務

英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

英偉達推出AI模型推理服務NVIDIA NIM

英特爾助力京東云用CPU加速AI推理，以大模型構建數智化供應鏈

利用NVIDIA組件提升GPU推理的吞吐

使用NVIDIA Triton推理服務器來加速AI預測

基于NVIDIA DOCA 2.6實現高性能和安全的AI云設計