色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

清華&西電提出HumanMAC:人體動作預測新范式

CVer ? 來源:CVer ? 2023-07-17 16:56 ? 次閱讀

我們一篇關于人體動作預測的研究工作被計算機視覺國際頂級會議ICCV 2023錄用,代碼[1]開源,demo講解[2]、項目主頁[3]、中文文檔[4]開放。

7d90cb98-23f2-11ee-962d-dac502259ad0.png

HumanMAC: Masked Motion Completion for Human Motion Prediction 主頁:https://lhchen.top/Human-MAC 論文:https://arxiv.org/abs/2302.03665 代碼:https://github.com/LinghaoChan/HumanMAC

人體動作預測是計算機視覺和圖形學中的一個經典問題,旨在提升預測結果的多樣性、準確性,并在自動駕駛、動畫制作等多領域有非常多具體的應用。本研究梳理了今年來大家對于該問題的建模方式,認為以往的大多數工作對于動作預測任務都是使用一種encoding-decoding的范式。這類范式大多是將觀測幀編碼進隱空間,然后從隱空間解碼出預測幀。我們認為這種方式存在三個缺點:

大多數SOTA的方法需要多個loss作為目標約束,需要精細化地調節多個loss之間的權重,需要極其繁重的調參工程。

大多數SOTA的方法需要多階段訓練,特別是需要預訓練encoder和decoder,這使得預測結果非常依賴于預訓練的質量。

對于這些方法來說,很難實現不同類別運動的切換,例如從“WalkDog”到“Sitting”的切換,這對于結果多樣性至關重要。出現這個現象的原因是這些方法所使用的訓練數據包括很少這樣的切換。

為克服上述問題,我們提出了一種建模動作預測問題的全新范式:掩碼動作補全。如圖1(b)所示,我們認為預測問題就是一種特殊的補全問題,可以借助diffusion model的補全能力解決上述挑戰。如果使用這種范式,我們是需要一個loss、訓練一個階段就可以實現預測,可以說是“大道至簡”。并且由于我們建模了全局的動作,模型很容易學習到平滑性,就能自動實現動作的切換。

7d99eed0-23f2-11ee-962d-dac502259ad0.jpg

encoding-decoding方式與掩碼運動補全的比較。(a)encoding-decoding的方法將觀測幀顯式地編碼到隱空間,然后將隱空間變量解碼為預測結果。(b)HumanMAC在訓練階段由噪聲生成運動。在推理階段完成補全動作的任務。

為了解決動作抖動等問題,我們借鑒了以往工作在頻域建模的思路[5][6],通過DCT變換,對數據在頻域進行訓練。也就是說,我們的diffusion model是動作頻譜的生成模型,在輸出結果的時候只需要做iDCT變換即可復原動作。為此,我們設計了一個補全算法:DCT-Completion。算法流程和示意圖如下。

7da1dfaa-23f2-11ee-962d-dac502259ad0.jpg

7da8a66e-23f2-11ee-962d-dac502259ad0.jpg

由于動作預測的問題只是一個特殊的掩碼補全問題,我們可以靈活地使用mask實現各種“花式”可控動作補全:

動作切換

7dae2de6-23f2-11ee-962d-dac502259ad0.jpg

動作切換

特定軀體可控動作編輯

7db359d8-23f2-11ee-962d-dac502259ad0.jpg

特定軀體可控動作編輯

在量化指標上我們僅僅通過一個loss、一階段訓練就可以和以往的工作不相上下了(我們還比較了最新的arxiv算法)。多樣性的指標遜色于baseline方法的原因,主要來自于baseline方法生成的“多樣”結果存在大量的failure cases,詳情可以見論文和demo中的可視化結果比較。

7dbabf84-23f2-11ee-962d-dac502259ad0.jpg

主實驗結果

在正文中,我們對網絡結構、DCT設計、頻譜頻段選擇、網絡結構、采樣步數、噪聲建模等進行了精細的消融驗證。同時,由于以往研究的codebase計算效率太低,我們重新優化了評估代碼并開源(加速上千倍),為后續研究者提供便利。

為了探究模型的泛化性能,我們還做了在H3.6M數據訓練,在AMASS上做zero-shot預測實驗的研究,效果也特別好。

7dc01e52-23f2-11ee-962d-dac502259ad0.jpg

AMASS上的zero-shot預測實驗

這是我們基于對動作生成任務全新理解,在動作預測問題上的一個探索性工作。我們的大量實驗表明這種框架的擴展性非常好,還有很大的擴展空間,歡迎大家關注我們的后續工作。

該研究是我和原來本科的同學多次交流獲得的靈感,在此也感謝一下母校。衷心感謝所有合作者,特別是Xiaobo全方位的指導,讓我獲益匪淺(^_^)。P.S.: 該工作做完剛剛掛出arxiv的時候就有很多工業界的同行發郵件來交流,甚至希望部署到他們的產品線中,給予了我們極大的鼓舞,在此也向他們表示感謝。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3298

    瀏覽量

    49074
  • DCT
    DCT
    +關注

    關注

    1

    文章

    56

    瀏覽量

    19898
  • 計算機視覺
    +關注

    關注

    8

    文章

    1700

    瀏覽量

    46076

原文標題:ICCV 2023 | 清華&西電提出HumanMAC:人體動作預測新范式

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    范式間區別

    第二范式(2NF),其余范式以次類推。一般說來,數據庫只需滿足第三范式(3NF)就行了。下面我們舉例介紹第一范式(1NF)、第二范式(2NF
    發表于 10-22 11:40

    調原理圖和amp和PCB圖

    調原理圖和amp和PCB圖,PDF格式資料,比較清晰。
    發表于 09-26 16:31 ?76次下載

    synopsys&Mentor設計流程

    synopsys & Mentor 設計流程免費下載。
    發表于 07-08 11:37 ?72次下載

    R&S FSL6臺式信號分析儀的功能特點及應用范圍

    R&S?FSL 是一款多功能而且經濟實用的信號分析儀。R&S?FSL全系列標配28MHz的信號解調帶寬,遠高于其他同類產品。無論是頻譜、噪聲系數、ACL
    發表于 12-09 09:46 ?1300次閱讀

    歐拉 Summit 2021 安全&可靠性&運維專場:主流備份技術探討

    在openEuler Summit 2021 安全&可靠性&運維專場上,高沖對為數據安全而生,統信軟件備份還原工具分享。
    的頭像 發表于 11-10 17:42 ?1836次閱讀
    歐拉 Summit 2021 安全&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;可靠性&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;運維專場:主流備份技術探討

    存儲類&amp;作用域&amp;生命周期&amp;鏈接屬性

    目錄前言一、存儲類&amp;amp;作用域&amp;amp;生命周期&amp;amp;鏈接屬性的
    發表于 12-09 15:51 ?5次下載
    存儲類&<b class='flag-5'>amp</b>;作用域&<b class='flag-5'>amp</b>;生命周期&<b class='flag-5'>amp</b>;鏈接屬性

    2021 Kubernetes on AI &amp;amp;amp;amp; Edge Day圓滿舉行 共探邊緣云融合

    2021年12月11日-12日,由Linux基金會、LF AI &amp;DATA、LF Edge、CNCF、LFN等開源社區聯合舉辦,開源科技OSTech和西麗湖人才服務中心協辦的Kubernetes on AI &amp;
    的頭像 發表于 12-16 09:43 ?5327次閱讀
    2021 Kubernetes on AI &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; Edge Day圓滿舉行 共探邊緣云融合

    如何區分Java中的&amp;amp;和&amp;amp;&amp;amp;

    首先給i賦值為0,如果i大于10,并且i++等于1,則輸出“錯誤”和i的值。否則輸出“正確”和i的值。分別用&amp;和&amp;&amp;運行,觀察運行結果的不同。
    的頭像 發表于 02-24 10:46 ?1589次閱讀
    如何區分Java中的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;和&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;

    if(a==1 &amp;amp;&amp;amp; a==2 &amp;amp;&amp;amp; a==3),為true,你敢信?

    接下來咱們來嘗試解決這個問題。假設 if(a==1&amp;&amp;a==12)是等于 true的,那么a肯定不可能是一個“普通的變量”。它勢必要有能力在執行的時候能夠動態改動值。
    的頭像 發表于 05-08 11:01 ?1145次閱讀
    if(a==1 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; a==2 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; a==3),為true,你敢信?

    HarmonyOS &amp;amp;amp;amp;潤和HiSpark 實戰開發,“碼”上評選活動,邀您來賽!!!

    出色的系統 助力優秀的設備 為應用開發者帶來豐富的體驗與想象空間 正如當HarmonyOS遇見潤和HiSpark 這萬物互聯的時代 將由你的&amp;lt; 代碼 &amp;gt;來定義 潤
    的頭像 發表于 04-11 15:33 ?1205次閱讀
    HarmonyOS &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;潤和HiSpark 實戰開發,“碼”上評選活動,邀您來賽!!!

    你使用shell腳本中的2&amp;gt;&amp;amp;1了嗎?

    run_cmax > ./starrc_cmax.logs 2>&amp;1中的 2>&amp;1是啥意思?
    的頭像 發表于 07-30 14:44 ?1983次閱讀

    攝像機&amp;amp;amp;雷達對車輛駕駛的輔助

    攝像機&amp;amp;雷達擔負著可輔助駕駛員安全駕駛的、高級駕駛輔助系統的傳感功能。尼得科正在進一步推進攝像機&amp;amp;雷達的高性能化進程。
    的頭像 發表于 11-26 10:02 ?961次閱讀
    攝像機&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;雷達對車輛駕駛的輔助

    解讀北美運營商,AT&amp;amp;amp;T的認證分類與認證內容分享

    在數字化日益深入的今天,通信技術的穩定與安全對于個人、企業乃至整個國家都至關重要。作為北美通信領域的領軍者,AT&amp;T一直致力于為用戶提供高效、可靠的通信服務。而在這背后,AT&amp;T
    的頭像 發表于 06-05 17:27 ?674次閱讀
    解讀北美運營商,AT&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;T的認證分類與認證內容分享

    FS201資料(pcb &amp;amp; DEMO &amp;amp; 原理圖)

    電子發燒友網站提供《FS201資料(pcb &amp; DEMO &amp; 原理圖).zip》資料免費下載
    發表于 07-16 11:24 ?0次下載

    onsemi LV/MV MOSFET 產品介紹 &amp;amp;amp; 行業應用

    01直播介紹直播時間2024/10/281430直播內容1.onsemiLV/MVMOSFET產品優勢&amp;市場地位。2.onsemiLV/MVMOSFETRoadmap。3.onsemiT10
    的頭像 發表于 10-13 08:06 ?515次閱讀
    onsemi LV/MV MOSFET 產品介紹 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; 行業應用
    主站蜘蛛池模板: 国精产品999一区二区三区有限 | 中文字幕人成乱码熟女APP | 色欲AV人妻精品麻豆AV | 亚洲精品中文字幕无码A片蜜桃 | 嫩草影院在线观看精品视频 | 成人精品视频 | 亚洲精品入口一区二区乱麻豆精品 | 91精品一区二区三区在线观看 | 日韩一区二区三区四区区区 | 美女脱内衣裸身尿口露出来 | 日本zljzljzlj精品 | 国产99久久久国产精品成人 | 一色狗影院 | 热思思| 亚洲无吗视频 | 亚洲精品久久久无码一区二区 | 肉色欧美久久久久久久蜜桃 | 大学生宿舍飞机china free | 亚洲色在线 | 粗好大用力好深快点漫画 | 天天躁日日躁狠狠躁AV麻豆 | 日本xxxx8888 | 精品国产麻豆免费人成网站 | 中文字幕视频在线观看 | 亚洲免费视频观看 | 99热最新网站 | 久久久久99精品成人片三人毛片 | 精品国产自在天天线2019 | 国产一区二区内射最近更新 | 色欲AV精品人妻一二三区 | 真人美女精美小穴 | 欧美亚洲色帝国 | 亚洲AV天堂无码麻豆电影 | 成年免费大片黄在线观看岛国 | 国产高清视频青青青在线 | 18禁裸乳无遮挡免费网站 | 中文字幕久精品视频在线观看 | 色欲人妻AAAAAAA无码 | 黄色三级视频网站 | 亚洲视频欧美视频 | 国产精彩视频在线 |