色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA Triton助力騰訊構建高性能推理服務

科技綠洲 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-04-10 10:08 ? 次閱讀

藉由 NVIDIAT4 GPU,通過 Ronda 平臺調用 NVIDIA Triton 以及 TensorRT ,整體提升開發和推理效能,幫助騰訊 PCG 的多個服務整體效能提升 2 倍,吞吐量最大提升 6 倍,同時降低了 40% 的延時。

騰訊平臺與內容事業群(簡稱 騰訊 PCG)負責公司互聯網平臺和內容文化生態融合發展,整合 QQ、QQ 空間等社交平臺,和應用寶、瀏覽器等流量平臺,以及新聞資訊、視頻、體育、直播、動漫、影業等內容業務,推動 IP 跨平臺、多形態發展,為更多用戶創造海量的優質數字內容體驗。

騰訊 PCG 機器學習平臺部旨在構建和持續優化符合 PCG 技術中臺戰略的機器學習平臺和系統,提升 PCG 機器學習技術應用效率和價值。建設業務領先的模型訓練系統和算法框架;提供涵蓋數據標注、模型訓練、評測、上線的全流程平臺服務,實現高效率迭代;在內容理解和處理領域,輸出業界領先的元能力和智能策略庫。機器學習平臺部正服務于 PCG 所有業務產品

而過往在項目執行時,團隊所面挑戰包含:

1. 業務繁多,場景復雜

業務開發語言包括C++/Python

模型格式繁多,包括ONNX、Pytorch、TensorFlow、TensorRT等

模型預處理涉及圖片下載網絡IO

多模型融合流程比教復雜,涉及循環調用

支持異構推理

2. 模型推理結果異常時,難以方便地調試定位問題

3. 需要與公司內現有協議/框架/平臺進行融合

基于以上挑戰,騰訊 PCG 選擇了采用 NVIDIA Triton 推理服務器,以解決新場景下模型推理引擎面臨的挑戰,在提升用戶研效的同時,大幅降低了服務成本。

NVIDIA Triton 是一款開源軟件,對于所有推理模式都可以簡化模型在任一框架中以及任何 GPU 或 CPU 上的運行方式,從而在生產環境中使用 AI。Triton 支持多模型 ensemble,以及 TensorFlow、PyTorch、ONNX 等多種深度學習模型框架,可以很好的支持多模型聯合推理的場景,構建起視頻、圖片、語音、文本整個推理服務過程,大大降低多個模型服務的開發和維護成本。

基于 C++ 的基礎架構、Dynamic-batch、以及對 TensorRT 的支持,同時配合 T4 的 GPU,將整體推理服務的吞吐能力最大提升 6 倍,延遲最大降低 40%,既滿足了業務的低延時需求,成本也降低了 20%-66%。

通過將 Triton 編譯為動態鏈接庫,可以方便地鏈入公司內部框架,對接公司的平臺治理體系。符合 C 語言規范的 API 也極大降低了用戶的接入成本。

借助 Python Backend 和 Custom Backend,用戶可以自由選擇使用 C++/Python 語言進行二次開發。

Triton 的 Tracing 能力可以方便地捕捉執行過程中的數據流狀態。結合 Metrics 和 Perf Analysis 等組件,可以快速定位開發調試,甚至是線上問題,對于開發和定位問題的效率有很大提升。

NVIDIA DALI 是 GPU 加速的數據增強和圖像加載庫。DALI Backend 可以用于替換掉原來的圖片解碼、resize 等操作。FIL Backend 也可以替代 Python XGBoost 模型推理,進一步提升服務端推理性能。

借助 NVIDIA Triton 推理框架,配合 DALI/FIL/Python 等 Backend,以及 TensorRT,整體推理服務的吞吐能力最大提升 6 倍,延遲最大降低 40%。幫助騰訊 PCG 各業務場景中,以更低的成本構建了高性能的推理服務,同時更低的延遲降低了整條系統鏈路的響應時間,優化了用戶體驗。

審核編輯:彭菁
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7134

    瀏覽量

    89402
  • NVIDIA
    +關注

    關注

    14

    文章

    5075

    瀏覽量

    103539
  • 騰訊
    +關注

    關注

    7

    文章

    1666

    瀏覽量

    49547
收藏 人收藏

    評論

    相關推薦

    NVIDIA 發布保障代理式 AI 應用安全的 NIM 微服務

    NVIDIA NeMo Guardrails 包含全新 NVIDIA NIM 微服務,能夠為各行業構建 AI 的企業提高 AI 的準確性、安全性和可控性。 ? AI 智能體有望成為能夠
    發表于 01-17 16:29 ?62次閱讀

    NVIDIA技術助力Pantheon Lab數字人實時交互解決方案

    NVIDIA Triton,Pantheon Lab 訓練速度提高 10 倍、推理延遲降低 50%,以及用戶參與度提升 30%。這些進步使對話式 AI 能夠提供實時且真實的互動,使 Pantheon Lab 在數字人技術不斷革
    的頭像 發表于 01-14 11:19 ?240次閱讀

    鴻蒙原生頁面高性能解決方案上線OpenHarmony社區 助力打造高性能原生應用

    隨著HarmonyOS NEXT的正式推出,鴻蒙原生應用開發熱度高漲,數量激增。但在三方應用鴻蒙化進程中,性能問題頻出。為此,HarmonyOS NEXT推出了一整套原生頁面高性能解決方案,包括
    發表于 01-02 18:00

    Triton編譯器在高性能計算中的應用

    高性能計算(High-Performance Computing,HPC)是現代科學研究和工程計算中不可或缺的一部分。隨著計算需求的不斷增長,對計算資源的要求也越來越高。Triton編譯器作為一種
    的頭像 發表于 12-25 09:11 ?316次閱讀

    Triton編譯器在機器學習中的應用

    1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務平臺的一部分
    的頭像 發表于 12-24 18:13 ?485次閱讀

    Wolfspeed碳化硅助力實現高性能功率系統

    Wolfspeed碳化硅助力實現高性能功率系統
    發表于 10-24 10:51 ?0次下載

    澎峰科技高性能大模型推理引擎PerfXLM解析

    自ChatGPT問世以來,大模型遍地開花,承載大模型應用的高性能推理框架也不斷推出,大有百家爭鳴之勢。在這種情況下,澎峰科技作為全球領先的智能計算服務提供商,在2023年11月25日發布了針對大語言
    的頭像 發表于 09-29 10:14 ?547次閱讀
    澎峰科技<b class='flag-5'>高性能</b>大模型<b class='flag-5'>推理</b>引擎PerfXLM解析

    NVIDIA助力提供多樣、靈活的模型選擇

    在本案例中,Dify 以模型中立以及開源生態的優勢,為廣大 AI 創新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務
    的頭像 發表于 09-09 09:19 ?516次閱讀

    NVIDIA攜手Meta推出AI服務,為企業提供生成式AI服務

    NVIDIA近日宣布了一項重大舉措,正式推出NVIDIA AI Foundry服務NVIDIA NIM(NVIDIA Inference
    的頭像 發表于 07-25 16:57 ?584次閱讀

    英偉達推出全新NVIDIA AI Foundry服務NVIDIA NIM推理服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務NVIDIA NIM 推理服務
    的頭像 發表于 07-25 09:48 ?763次閱讀

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程,為全球的2800萬英偉達開發者提供前所未有的便利。
    的頭像 發表于 06-04 09:15 ?714次閱讀

    英特爾助力京東云用CPU加速AI推理,以大模型構建數智化供應鏈

    英特爾助力京東云用CPU加速AI推理,以大模型構建數智化供應鏈
    的頭像 發表于 05-27 11:50 ?572次閱讀
    英特爾<b class='flag-5'>助力</b>京東云用CPU加速AI<b class='flag-5'>推理</b>,以大模型<b class='flag-5'>構建</b>數智化供應鏈

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網絡和熱
    的頭像 發表于 04-20 09:39 ?798次閱讀

    使用NVIDIA Triton推理服務器來加速AI預測

    這家云計算巨頭的計算機視覺和數據科學服務使用 NVIDIA Triton 推理服務器來加速 AI 預測。
    的頭像 發表于 02-29 14:04 ?619次閱讀

    基于NVIDIA DOCA 2.6實現高性能和安全的AI云設計

    網絡平臺上快速創建應用程序和服務,并啟用 NVIDIA BlueField DPU 和 NVIDIA BlueField SuperNIC 的強大功能,提供突破性的網絡、安全和存儲性能
    的頭像 發表于 02-23 10:02 ?513次閱讀
    主站蜘蛛池模板: 午夜在线观看免费完整直播网页 | 中文字幕在线免费观看视频 | 成人毛片免费观看视频大全 | 光溜溜的美女直播软件 | 国产精品v欧美精品v日韩 | 久久99这里只有精品 | 国产91无毒不卡在线观看 | 蜜桃人妻无码AV天堂三区 | 永久免费看mv网站入口 | 亚洲国产综合另类视频 | 海角社区在线视频播放观看 | 99久久无码热高清精品 | 国产高潮久久精品AV无码 | 亚洲 自拍 欧洲 视频二区 | 天天夜夜草草久久亚洲香蕉 | 2019天天射干网站 | 成人国产精品免费网站 | 亚洲七七久久桃花综合 | 亚洲欧美一区二区三区久久 | A国产一区二区免费入口 | 九九免费精品视频 | 亚洲精品乱码电影在线观看 | 欧美精品亚洲精品日韩专区一 | 免费果冻传媒在线完整观看 | 我的美女奴隶 | 久久高清免费视频 | 欧美精品一区二区蜜臀亚洲 | 美女扒开腿让男生桶爽免费APP | 欧美日韩中文国产一区发布 | 国产乱妇乱子在线播视频播放网站 | 国产精品久久久久久久久LI无码 | 99热久久视频只有精品6 | 国产精品爽爽久久久久久竹菊 | 秋霞影音先锋一区二区 | 日韩中文欧美在线视频 | 国产中文字幕乱码一区 | 久久精品男人影院 | 激情床戏视频片段有叫声 | av视频在线免播放观看 | 女人和男人插曲视频大全 | 男人天堂999 |