色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA TensorRT加速打造實時數字化運動場景

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-05-20 15:11 ? 次閱讀

案例簡介

GALA Sports 的 Arena4D 方案使用多個高清攝像機,將數據傳輸到一個本地 HPC 中,經過一系列的神經網絡流水線,實時計算出每個運動員的位置與姿態,從而將整個比賽場景數字化。

Arena4D 的中央處理 HPC 需要以 30FPS 的速度處理 4-12 個 4K 相機的數據,流水線包括圖像前處理、運動員追蹤與識別、球的追蹤識別、骨骼關鍵點識別,多幀時間軸降噪等多個算法模塊,為了達到實時計算,Arena4D 使用了 NVIDIA A100 GPU 加速神經網絡計算,并使用 Tensor RT、CUDA 進行深度優化,經過優化部署的算法計算速度相對于早期算法原型有 10 倍以上的性能提升。

本案例主要應用到 NVIDIA A100 GPU、TensorRT和CUDA。

客戶簡介及應用背景

望塵科技(GALA Sports)于 2013 年在深圳成立,是一家以技術為驅動的互聯網公司,多年來一直專注于體育游戲和賽場數字化,致力于為用戶提供高品質的體育在線娛樂體驗,目前團隊成員 300 余人,分別于深圳、成都設有辦公地點。

憑借歷年來在體育游戲市場的深耕與穩定的高質量產品研發,望塵科技推出了《足球大師》、《NBA 籃球大師》、《最佳 11 人》等多款體育類手游,與 FIFPro、NBA、中超、拜仁、巴薩、曼聯、皇馬、國米等體育聯盟及豪門俱樂部保持著長期的合作關系。目前,擁有全球超過 2000 萬的下載用戶,全球日活躍用戶量超 50 萬人次;在賽場三維重構、人體運動模擬、球類競技 AI、表情與肌肉物理模擬、超寫實數字人、大場景渲染等幾個領域處于國內外領先地位。

客戶挑戰

多臺高清攝像頭每幀圖像需上傳到顯卡進行實時轉碼、降噪等前處理工作,數據吞吐量較大。

基于神經網絡的計算流水線,需要實時進行多個視角、多個運動員的追蹤、識別、姿態估計與降噪計算。

在多個 AI 模型級聯計算流水線中,每個 AI 模型之間的數據處理與拷貝占用了大量的時間。

應用方案

基于以上挑戰,GALA Sports 選擇了 NVIDIA 提供的 AI 加速解決方案——TensorRT。

針對多相機從內存到顯存大量數據拷貝 IO bound 問題,我們使用 CUDA 多流技術實現了內存拷貝與數據處理并行化,降低了 overhead,4 路 4k 相機數據的拷貝與轉碼從約 50ms 減少到 30ms。

針對神經網絡流水線的計算延遲問題,首先我們根據體育比賽的使用場景與相機視角對模型結構進行了優化,根據不同體育類型的相機機位和球場尺度,設計了專門針對特定比賽的識別網絡,大大降低了網絡的復雜度;然后使用量化工具對網絡進行 fp16 量化加速,最后使用 TensorRT 針對 A100 編譯,在 A100 上能達到最優性能的模型。

針對計算流水線模型之間數據處理耗時的問題,首先我們通過合并部分神經網絡模型重新訓練,然后對于必須保留的數據處理代碼,我們用 CUDA C++ 重寫了大部分數據處理的 kernel,并針對 A100 的硬件結構對并行參數進行調優,最終將數據處理 30ms 的計算時間降低到 5ms。

最終,以足球場場景為例,追蹤目標為 1 個足球 + 22 名球員 + 3 名教練的位置與骨骼,在 1 張 A100 設備上我們實現了平均 50ms/幀的速度,在 2 張 A100 設備上能達到平均 30ms/幀的速度,整個流水線比原型提升了 18 倍。

方案效果及影響

將整個推理端算法流水線經過上述方法優化后,相較于未用 TensorRT 與 CUDA 優化的算法原型,我們實現了 18 倍的性能提升,使超大規模體育場景的姿態捕捉與重建的實時計算成為可能,在體育比賽過程中的實時計算產生了許多新的用途,我們的客戶能夠將這些數字化內容用于直播解說、實時戰術分析、自由視角回放、比賽結果預測等新場景,提升了系統方案的價值。

我們的硬件方案也從 4 臺 HPC 縮減到 1 臺 HPC 搭載 2 張 A100 GPU,不僅顯著地降低了成本,也顯著降低了系統維護和使用的復雜度,提升了系統可靠度。

后續,我們計劃:

通過將流水線中部分網絡使用 Int8 量化以進一步提升性能;

將整體流水線遷移到 CUDA C++ 代碼中進一步提升性能;

把性能提升空余的計算資源用于提升網絡模型的復雜度以提升精度;

將 CenterNet 與 Dense Sematic 網絡特征提取部分替換成 Vision Transformer 以提升精度;

使用 Nsight 在 A100 真實環境中進一步 profile,減少 overhead。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5187

    瀏覽量

    105384
  • 攝像機
    +關注

    關注

    3

    文章

    1671

    瀏覽量

    60874
  • CUDA
    +關注

    關注

    0

    文章

    122

    瀏覽量

    13994
收藏 0人收藏

    評論

    相關推薦

    智慧工廠第6期 實時監控系統—打造智能數字化車間

    在工業4.0和智能制造浪潮的推動下,傳統生產模式正加速數字化、網絡、智能方向演進。實時監控系統作為智慧工廠的核心支柱,正在重塑制造企業
    的頭像 發表于 04-22 09:50 ?100次閱讀
    智慧工廠第6期 <b class='flag-5'>實時</b>監控系統—<b class='flag-5'>打造</b>智能<b class='flag-5'>數字化</b>車間

    華宇電子加速先進封裝測試數字化轉型

    近日,安徽省工業和信息廳聯合安徽省廣播電視臺打造數字化轉型·安徽時刻”專欄,聚焦華宇電子數字化轉型典型案例,展示數字化轉型中最有代表性和
    的頭像 發表于 04-11 13:43 ?170次閱讀

    Altair One? 云端門戶與 NVIDIA Omniverse 實時數字孿生藍圖完成全面整合

    正式宣布其?Altair One?云端門戶與?NVIDIA Omniverse 實時數字孿生藍圖實現技術融合。通過整合?GPU 加速NVIDIA NIM 微服務與?Omniverse
    的頭像 發表于 04-02 14:01 ?136次閱讀

    工信部|制造業企業數字化轉型典型場景

    聚焦產業鏈上下游企業研發設計、生產制造、運維服務、經營管理、供應鏈管理等場景,以場景為切入點梳理數字化轉型痛點需求,繪制重點行業、重點產業鏈數字化轉型
    的頭像 發表于 02-06 10:38 ?318次閱讀
    工信部|制造業企業<b class='flag-5'>數字化</b>轉型典型<b class='flag-5'>場景</b>

    NVIDIA技術助力Pantheon Lab數字實時交互解決方案

    本案例中,Pantheon Lab(萬想科技)專注于數字人技術解決方案,通過 NVIDIA 技術實現數字實時對話與客戶互動交流。借助 NVIDIA
    的頭像 發表于 01-14 11:19 ?512次閱讀

    智能工廠的數字化應用場景

    本文探討了智能工廠中的數字化場景,包括設備互聯與數據采集、生產計劃與排程優化、自動立體倉庫和智能物流系統。通過這些數字化技術,智能工廠實現了生產效率的提升、資源消耗的降低、決策能力的
    的頭像 發表于 12-30 09:32 ?686次閱讀
    智能工廠的<b class='flag-5'>數字化</b>應用<b class='flag-5'>場景</b>

    LITESTAR 4D應用:運動場照明設計流程

    當設計一個專業的足球運動場時,可以使用LITESTAR 4D中SportPlus進行設計 1.插入燈具并設置高度數量 2.設置桅桿及燈具瞄準點 3.計算結果 4.最后查看結果,打印報表。
    發表于 12-10 13:33

    NVIDIA TensorRT-LLM Roadmap現已在GitHub上公開發布

    感謝眾多用戶及合作伙伴一直以來對NVIDIA TensorRT-LLM的支持。TensorRT-LLM 的 Roadmap 現已在 GitHub 上公開發布!
    的頭像 發表于 11-28 10:43 ?538次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT</b>-LLM Roadmap現已在GitHub上公開發布

    NVIDIA Omniverse加速零售數字化轉型

    大模型、生成式 AI、數字孿生技術等前沿科技啟發了各行各業的新業務模態,在這一時代背景下 NVIDIA 作為 AI 技術的耕耘者、加速計算方面的領導者,看到了數字化浪潮中前所未有的變革
    的頭像 發表于 11-09 13:52 ?632次閱讀

    阿爾特汽車借助NVIDIA Omniverse打造全方位數字化平臺

    隨著 AI 和工業數字化的飛速發展,汽車行業正經歷著翻天覆地的變化。AI 模型、實時仿真和數字孿生等技術的應用,正在重塑汽車設計和研發的流程,推動著產業向更高效、更智能的方向發展。
    的頭像 發表于 10-31 14:40 ?752次閱讀
    阿爾特汽車借助<b class='flag-5'>NVIDIA</b> Omniverse<b class='flag-5'>打造</b>全方位<b class='flag-5'>數字化</b>平臺

    實時數據與數字孿生的關系

    實時數據與數字孿生是當今工業4.0和智能制造領域中兩個緊密相連的概念。它們共同推動了生產效率的提升、運營成本的降低以及產品質量的改善。 1. 實時數據的定義與作用 實時數據是指在事件發
    的頭像 發表于 10-25 14:42 ?729次閱讀

    數字化技術如何加速精益生產策略的實施與成效?

    的蓬勃發展,精益生產策略正迎來前所未有的加速期,兩者深度融合,正引領著全球制造業邁向智能、高效的新高度。具體如天行健企業管理咨詢公司下文所述: 1. 實時數據洞察,精準決策支持
    的頭像 發表于 10-25 11:43 ?331次閱讀

    高速數字化儀的技術原理和應用場景

    高速數字化儀是一種用于采集高速模擬信號,并將其轉換為數字信號進行處理和儲存的設備。以下是對其技術原理和應用場景的詳細介紹:一、技術原理 采樣:高速數字化儀的采樣率是指每秒鐘采樣多少次,
    發表于 10-21 14:34

    HT for Web并力ARMxy工業計算機實現數字化轉型可視化解決方案

    ,用戶可以輕松設計出直觀的監控場景,實現對工業過程的實時數據展示和交互控制。而ARMxy系列產品以其強大的數據處理能力和靈活的IO配置,精準響應生產需求,驅動自動流程,助力企業實現數字化
    的頭像 發表于 08-28 16:17 ?638次閱讀
    HT for Web并力ARMxy工業計算機實現<b class='flag-5'>數字化</b>轉型可視化解決方案

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM
    的頭像 發表于 04-28 10:36 ?814次閱讀
    主站蜘蛛池模板: 亚洲男人天堂2018av | 女人张开腿让男人桶爽免 | 久久亚洲精品中文字幕 | 国产精品一区二区AV交换 | 性女传奇快播 | 久拍国产在线观看 | 性色AV一区二区三区V视界影院 | 久久精品视频15人人爱在线直播 | 午夜影院老司机 | 亚洲AV色香蕉一区二区三区 | 国内视频在线精品一区 | 性满足久久久久久久久 | 日本久久久免费高清 | 久青草影院 | 小蝌蚪视频在线观看免费观看WWW | 一区不卡二区卡 | 99re在线播放| 国语对白刺激真实精品 | 亚洲精品国产在线观看 | 亚洲精品九色在线网站 | 野花韩国免费高清电影 | 小莹的性荡生活40章 | 中文字幕在线观看国产 | 草莓视频在线观看完整高清免费 | 性夜a爽黄爽 | 麻豆成人啪啪色婷婷久久 | 国产啪精品视频网免费 | 小泽玛丽av无码观看 | www.青青草| 久久久精品久久久久特色影视 | 亚洲人成网站在线观看90影院 | 一本大道手机在线看 | 国产在线伊人 | 国产精品伦一区二区三级视频 | 99久酒店在线精品2019 | 国产色无码精品视频国产 | 国产色无码精品视频国产 | 东北老妇人70OLDMAN | np高h肉辣一女多男 no视频在线观看 | 国产免费午夜 | 亚洲VA欧美VA天堂V国产综合 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品