3 月 22 日下午 1 點開始,本屆 GTC 專門面向中國 AI 從業者的特別活動 China AI Day 將在線上舉行,11 位來自阿里巴巴、百度、快手、騰訊、網易,字節跳動,以及 NVIDIA GPU 計算專家團隊的技術專家將進行專題報告,圍繞互聯網搜索、推薦、廣告業務、數字孿生、短視頻應用、元宇宙和數字人等熱門應用場景分享專業見解。
推薦業內關注數據、算法、架構和運維的工程師、開發人員以及 AI 從業者預約觀看!
以下為 11 個演講的詳細介紹:
加速計算助力云上業務場景
會議代碼:[SE52359]
演講時間:3 月 22 日 1:00 PM - 1:30 PM
演講嘉賓:

李曦鵬
NVIDIA 開發與技術部門亞太區總經理
主要內容:
加速計算是未來必經之路,極致化性能,并提高能效。NVIDIA AI 平臺涵蓋了從基礎設施、調度、加速庫以及加速框架、部署工具和最上層的應用框架。NVIDIA 也提供了從數據預處理、大規模訓練、推理優化到大規模部署的端對端軟件。加速計算需要應用導向來進行整個環節的優化,是軟硬件協同,需要業務、算法、工程師和加速工程師密切合作。
本演講將以推薦系統的演變為例,來闡述加速計算的旅程。加速計算也正是 China AI Day 的主旨所在。非常歡迎并誠摯感謝 China AI Day 的演講者,分享在數字孿生、元宇宙、短視頻、以及搜索、廣告、推薦等領域,借助 NVIDIA GPU 和全棧 AI 解決方案,最新鮮的優化加速的精彩成果。
李星瀾:一個基于實時智能交互系統打造的
“真實” 數字生命
會議代碼:[SE51461]
演講時間:3 月 22 日 1:30 PM -2:00 PM
演講嘉賓:

四道
朝夕光年江南工作室 AI 技術負責人
主要內容:
智能 NPC 和數字人已經在娛樂行業和社交媒體平臺被廣泛應用,包括人工智能驅動的主持人、評論員和網紅等。但開發具有高視覺保真度的逼真智能 AI 通常需要大量時間,而且成本很高,很難擴大規模。
朝夕光年江南工作室提出了一個 GPU 驅動的系統,包括文本到語音模塊、音頻到全身動畫模塊、視頻分析模塊、渲染模塊和聊天機器人模塊,基于這些模塊可以構建一個逼真的實時交互數字人。在 NVIDIA Omniverse 的支持下,可以實時高效地渲染李星瀾,而且其中的動畫模塊將根據后端聊天機器人的輸出自動驅動角色模型的運動。動畫模塊和后臺聊天機器人都是基于自定義開發的深度神經網絡。使用 NVIDIA Omniverse ACE,能夠在兩天內完全訓練 audio2motion 和 text2speech 模型,并在 5 天內訓練超大參數的 Chatbot 神經網絡模型,使用了超過 10tb 的訓練數據。
本演講將介紹如何利用 NVIDIA Omniverse 和 NVIDIA GPU,以及如何借助計算機圖形學和人工智能功能來構建 Lydia 數字人項目。
飛槳深度學習平臺高效支持
大規模生產及應用
會議代碼:[S52366]
演講時間:3 月 22 日即可在線觀看
(自選點播)
演講嘉賓:

馬艷軍
百度 AI 技術生態總經理
主要內容:
源于百度業務對人工智能技術的廣泛應用,飛槳深度學習平臺結合應用持續創新,研發了業界領先的大規模分布式訓練技術。飛槳先后發布了 4D 混合并行訓練、端到端自適應分布式訓練、超大規模圖訓練引擎等核心技術,并基于這些技術支持文心大模型的訓練和部署。目前,文心大模型已經覆蓋基礎大模型、任務大模型、行業大模型的三級體系,飛槳+文心大模型賦能千行百業的智能化升級。本演講將分享飛槳深度學習平臺如何高效支持大規模生產及應用。
機器學習模型中訪存密集型計算 STITCH
融合優化技術
會議代碼:[SE51289]
演講時間:3 月 22 日 2:00 PM – 2:30 PM
演講嘉賓:

鄭禎
阿里巴巴高級技術專家
主要內容:
近年來,訪存密集型計算日益成為影響機器學習模型性能的重要因素。由于機器學習模型計算圖日趨復雜,傳統的機器學習編譯器面對復雜的數據依賴關系時很難執行高效的計算融合優化。同時,動態張量形狀(dynamic tensor shape)的模型優化需求開始興起,缺失的張量形狀使得訪存密集型計算子圖的性能優化變得更加困難。
本演講將講述阿里巴巴針對機器學習任務中訪存密集型計算性能優化的關鍵技術:STITCH 融合技術。該技術支持將任意類型及任何數量的機器學習訪存密集型算子進行融合,最終將大粒度的訪存密集型計算子圖轉化為單個的 GPU 核函數,以減少片外訪存、框架調度及 GPU 核函數調用開銷。
GPU 加速大規模向量索引構建
會議代碼:[SE51475]
演講時間:3 月 22 日 2:30 PM – 3:00 PM
演講嘉賓:

李晨
騰訊高級工程師
主要內容:
大規模向量檢索引擎在騰訊諸多業務中有所應用,在百億級召回場景中提供低延遲、高召回率的在線服務。但隨著索引規模的增加,向量索引的構建已經成為日常索引的更新瓶頸。離線向量 IVF 索引構建,在引入 GPU 優化之前,索引構建工作依托 Hadoop 平臺進行,引入 NVIDIA GPU 改造后索引構建成本降低 60%。索引構建的優化工作主要由兩部分組成:1. IVF KMeans 聚類;2. 百億向量在海量聚類中心上的 FIT 過程。本次演講將介紹如何基于 GPU 構建大規模向量索引及其優化過程。
多模態超大模型在短視頻場景落地應用
會議代碼:[SE52361]
演講時間:3 月 22 日 3:00 PM – 3:30 PM
演講嘉賓:

張勝卓,快手算法引擎專家
韓青長,快手算法引擎工程師
李杰,快手算法引擎工程師
門春雷,快手算法引擎專家
主要內容:
以 ChatGPT 為代表的大模型面世,帶來了 AI 大模型技術熱潮,研究表明,知識密集任務中越大的模型學習效率越高(相同訓練數據量下,模型越大任務效果越好),主流大模型的參數大都超過了千億 (100B) 規模,同時也給模型的高效訓練和推理部署帶來嚴峻挑戰。快手圍繞提高模型計算效率和可部署開展技術攻關,沉淀了一套通用的混合并行訓練、壓縮、推理整體解決方案,并聯合業務實現百億參數 Dense 模型和千億參數 MOE 大模型落地,取得顯著業務收益。本演講將分享多模態超大模型在短視頻場景的落地應用。
PGLBox:百度基于 GPU 的
超大規模圖模型訓練框架
會議代碼:[SE51302]
演講時間:3 月 22 日 3:30 PM – 4:00 PM
演講嘉賓:

焦學武
百度主任架構師
百度 MEG 商業模型中臺技術負責人
主要內容:
PGLBox 是百度研發的基于 GPU 的大規模圖模型訓練框架,支持數百億節點和邊的圖模型全 GPU 訓練,已在百度廣泛部署。相比業界主流的分布式 CPU 解決方案,PGLBox 具有以下幾大優勢:1. 超高性能:業界首個分布式 GPU 圖學習訓練框架,相比分布式 CPU 方案,訓練速度提升 27 倍;2. 超大規模:業界首個多級存儲圖引擎,單機可支持數百億節點數百億邊的超大圖規模;3. 算法豐富:預置豐富的圖表示學習算法,支持跨場景異構圖建模和復雜圖屬性建模;4. 靈活易用:用戶僅需簡單配置,即可一鍵啟動大規模圖表示學習訓練任務;5. 落地廣泛:百度內部多業務體系廣泛落地,為業務帶來了顯著業務收益。
視頻場景中的音頻理解推理加速解決方案
會議代碼:[SE51166]
演講時間:3 月 22 日 4:00 PM – 4:30 PM
演講嘉賓:

陳炳州
字節跳動音頻理解視頻方向引擎負責人
主要內容:
音頻理解是指通過語音識別、事件檢測、語種識別、聲紋識別等技術從音頻數據中解析出多維度信息。在視頻場景上,比較經典的落地技術,比如視頻字幕生成、視頻字幕打軸等等。這些技術應用極大地提高了人效,也帶來生活的便利。伴隨短視頻和音頻類應用的興起,用戶請求量、音頻數據正呈幾何級別增長,這些都為大規模數據處理,以及高并發低延遲的推理帶來諸多挑戰。比如機器有限的情況下如何處理更多的音頻,多語種的場景中單卡處理單語種模型存在利用率較低的問題。本演講將基于 NVIDIA 提供的推理 GPU(T4, A10, A30),介紹音頻理解如何做推理加速,以及如何廣泛應用于抖音等大流量場景。
CUTLASS 極致性能優化探索
及在阿里巴巴推薦系統中的應用
會議代碼:[SE51305]
演講時間:3 月 22 日 4:30 PM – 5:00 PM
演講嘉賓:

董紀瑩
阿里巴巴高級工程師
主要內容:
在大規模推薦系統中,點擊率(Click-Through Rate, CTR)和 轉化率(ConVersion Rate, CVR)預測任務的深度神經網絡模型通過由 Embedding 層,Attention 層和 MLP 層組成。然而,在 TensorFlow 上執行時,Attention 層和 MLP 層中數量眾多的算子和大量耗時的計算成為了性能瓶頸。
通過 NVIDIA 開源的高性能矩陣乘(general matrix multiplication, GEMM)應用框架 CUTLASS,能夠實現將與 GEMM 相連的算子融合進 GEMM,并且將級聯的 GEMM 進一步融合成一個算子。通過這種方式,在理想情況下,可以將整個Attention 模塊融合成一個算子。在計算 MLP 時,將縱向相連的 GEMM 融合成 back-to-back GEMM,然后繼續將橫向相連的 GEMM 融合成 Batch GEMM,從而實現性能提升。這些優化已經在阿里巴巴預測引擎平臺上線,很好地提升了預測性能,更好地發揮了硬件算力。
NVIDIA CUDA 技術助力網易瑤臺
神經隱式曲面建模 20 倍加速
會議代碼:[SE52360]
演講時間:3 月 22 日 5:00 PM – 5:30 PM
演講嘉賓:

李林橙
網易伏羲視覺計算負責人
主要內容:
網易瑤臺提供大型的沉浸式會展服務。在與客戶的溝通中,我們了解到,客戶期望將線下物體生成 3D 模型,導入瑤臺,從而降低定制化制作的成本。2020 年以來神經渲染 3D 建模技術快速發展,重建精度有了顯著的提升,但耗時卻限制了實際的應用。網易瑤臺充分利用了 NVIDIA 的 tiny-cuda-nn 與 CUDA 渲染技術,對神經隱式曲面建模進行了 20 多倍加速,實現了高效、高質量的 3D mesh 重建。本演講將分享項目過程中的實踐經驗與心得。
在 GPU 上使用 Video Codec SDK,CV-CUDA和 TensorRT 加速現代云上視頻應用
會議代碼:[SE51229]
演講時間:3 月 22 日5:30 PM – 6:00 PM
演講嘉賓:

王倬遙
NVIDIA 開發與技術部工程師
主要內容:
人工智能技術廣泛應用于云和 on-prem 數據中心的短視頻和直播應用當中,覆蓋了超分辨率、直播視頻特效、舊視頻修復、自動像素化、視頻內容理解等。然而,當部署這些應用程序時,傳統視頻處理管線混合了 CPU 和 GPU 負載,其性能將受到以下因素的限制:1) h2d 和 d2h 內存拷貝;2) CPU 上的前處理和后處理;3) CPU 上的視頻編解碼;4) 未充分優化的 AI 推理框架。
針對以上限制, NVIDIA 提供了豐富的視頻處理相關的 SDK。如何在實踐中高效地在云上使用這些工具是搭建基于人工智能的新式視頻處理管線的關鍵。本演講將介紹如何使用這些 SDK 來解決應用中的低效部分,并構建一個全 GPU 的視頻處理管線。
馬上注冊,預約觀看China AI Day
想要預約以上精彩內容?掃描海報二維碼或點擊“閱讀原文”,打開 China AI Day 專題頁面,按照會議代碼或標題,找到對應演講。通過點擊“Add to Schedule”或右上角“五角星”,將該演講內容添加至您的日程,大會開始后登錄即可在線觀看。
進入 GTC 2023特別活動:China AI Day 專題頁面

按照 會議代碼 或者 演講標題,找到感興趣的內容。點擊“Add to Schedule”,添加至您的日程。

如無“Add to Schedule”按鈕,說明該演講為點播,從 3 月 22 日開始即可在線觀看。點擊右上方的五角星,將該演講添加至您的日程。

如點擊“Add to Schedule”或五角星時,出現如下界面。

如果您已注冊,請點擊“Login”登錄,激活賬戶,繼續操作;如果您尚未注冊,請點擊“Create Account”,詳情參看 GTC23 注冊教程。
掃描下方海報二維碼,鎖定 NVIDIA 創始人兼首席執行官黃仁勛的 GTC 主題演講!北京時間 3 月 21 日 23:00 全球首播,3 月 22 日 10:00 中國重播。深度解讀 NVIDIA 加速計算平臺如何推動人工智能、元宇宙、云技術和可持續計算的下一波浪潮。加入 GTC23,切勿錯過 AI 的決定性時刻!
原文標題:GTC23 | 3 月 22 日預告 — 點擊解鎖 GTC 特別活動 China AI Day
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3862瀏覽量
92255
原文標題:GTC23 | 3 月 22 日預告 — 點擊解鎖 GTC 特別活動 China AI Day
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
NVIDIA GTC 2025大會預告
寧暢服務器亮相GTC 2024,開啟AI新紀元
與NVIDIA深度參與GTC,向量數據庫大廠Zilliz與全球頂尖開發者共迎AI變革時刻
亮相英偉達GTC大會!德賽西威高算力智駕域控海外展出
奧比中光3D相機及方案亮相,攜手NVIDIA探索機器人應用革新
AI高光時刻:汽車技術全方位亮相GTC 2024大會
SK海力士展示業界最高標準適于AI應用的存儲器產品
英偉達GTC大會丨宇樹通用人形機器人H1與全球共同擁抱AI
英偉達2024年GTC人工智能大會看點,黃仁勛發布最炸裂的B200 GPU,講述人工智能奇跡

評論