色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

清華&西電提出HumanMAC:人體動作預測新范式

CVer ? 來源:CVer ? 2023-07-17 16:56 ? 次閱讀

我們一篇關于人體動作預測的研究工作被計算機視覺國際頂級會議ICCV 2023錄用,代碼[1]開源,demo講解[2]、項目主頁[3]、中文文檔[4]開放。

7d90cb98-23f2-11ee-962d-dac502259ad0.png

HumanMAC: Masked Motion Completion for Human Motion Prediction 主頁:https://lhchen.top/Human-MAC 論文:https://arxiv.org/abs/2302.03665 代碼:https://github.com/LinghaoChan/HumanMAC

人體動作預測是計算機視覺和圖形學中的一個經典問題,旨在提升預測結果的多樣性、準確性,并在自動駕駛、動畫制作等多領域有非常多具體的應用。本研究梳理了今年來大家對于該問題的建模方式,認為以往的大多數工作對于動作預測任務都是使用一種encoding-decoding的范式。這類范式大多是將觀測幀編碼進隱空間,然后從隱空間解碼出預測幀。我們認為這種方式存在三個缺點:

大多數SOTA的方法需要多個loss作為目標約束,需要精細化地調節多個loss之間的權重,需要極其繁重的調參工程。

大多數SOTA的方法需要多階段訓練,特別是需要預訓練encoder和decoder,這使得預測結果非常依賴于預訓練的質量。

對于這些方法來說,很難實現不同類別運動的切換,例如從“WalkDog”到“Sitting”的切換,這對于結果多樣性至關重要。出現這個現象的原因是這些方法所使用的訓練數據包括很少這樣的切換。

為克服上述問題,我們提出了一種建模動作預測問題的全新范式:掩碼動作補全。如圖1(b)所示,我們認為預測問題就是一種特殊的補全問題,可以借助diffusion model的補全能力解決上述挑戰。如果使用這種范式,我們是需要一個loss、訓練一個階段就可以實現預測,可以說是“大道至簡”。并且由于我們建模了全局的動作,模型很容易學習到平滑性,就能自動實現動作的切換。

7d99eed0-23f2-11ee-962d-dac502259ad0.jpg

encoding-decoding方式與掩碼運動補全的比較。(a)encoding-decoding的方法將觀測幀顯式地編碼到隱空間,然后將隱空間變量解碼為預測結果。(b)HumanMAC在訓練階段由噪聲生成運動。在推理階段完成補全動作的任務。

為了解決動作抖動等問題,我們借鑒了以往工作在頻域建模的思路[5][6],通過DCT變換,對數據在頻域進行訓練。也就是說,我們的diffusion model是動作頻譜的生成模型,在輸出結果的時候只需要做iDCT變換即可復原動作。為此,我們設計了一個補全算法:DCT-Completion。算法流程和示意圖如下。

7da1dfaa-23f2-11ee-962d-dac502259ad0.jpg

7da8a66e-23f2-11ee-962d-dac502259ad0.jpg

由于動作預測的問題只是一個特殊的掩碼補全問題,我們可以靈活地使用mask實現各種“花式”可控動作補全:

動作切換

7dae2de6-23f2-11ee-962d-dac502259ad0.jpg

動作切換

特定軀體可控動作編輯

7db359d8-23f2-11ee-962d-dac502259ad0.jpg

特定軀體可控動作編輯

在量化指標上我們僅僅通過一個loss、一階段訓練就可以和以往的工作不相上下了(我們還比較了最新的arxiv算法)。多樣性的指標遜色于baseline方法的原因,主要來自于baseline方法生成的“多樣”結果存在大量的failure cases,詳情可以見論文和demo中的可視化結果比較。

7dbabf84-23f2-11ee-962d-dac502259ad0.jpg

主實驗結果

在正文中,我們對網絡結構、DCT設計、頻譜頻段選擇、網絡結構、采樣步數、噪聲建模等進行了精細的消融驗證。同時,由于以往研究的codebase計算效率太低,我們重新優化了評估代碼并開源(加速上千倍),為后續研究者提供便利。

為了探究模型的泛化性能,我們還做了在H3.6M數據訓練,在AMASS上做zero-shot預測實驗的研究,效果也特別好。

7dc01e52-23f2-11ee-962d-dac502259ad0.jpg

AMASS上的zero-shot預測實驗

這是我們基于對動作生成任務全新理解,在動作預測問題上的一個探索性工作。我們的大量實驗表明這種框架的擴展性非常好,還有很大的擴展空間,歡迎大家關注我們的后續工作。

該研究是我和原來本科的同學多次交流獲得的靈感,在此也感謝一下母校。衷心感謝所有合作者,特別是Xiaobo全方位的指導,讓我獲益匪淺(^_^)。P.S.: 該工作做完剛剛掛出arxiv的時候就有很多工業界的同行發郵件來交流,甚至希望部署到他們的產品線中,給予了我們極大的鼓舞,在此也向他們表示感謝。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3461

    瀏覽量

    49775
  • DCT
    DCT
    +關注

    關注

    1

    文章

    56

    瀏覽量

    20086
  • 計算機視覺
    +關注

    關注

    8

    文章

    1705

    瀏覽量

    46452

原文標題:ICCV 2023 | 清華&西電提出HumanMAC:人體動作預測新范式

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    范式間區別

    第二范式(2NF),其余范式以次類推。一般說來,數據庫只需滿足第三范式(3NF)就行了。下面我們舉例介紹第一范式(1NF)、第二范式(2NF
    發表于 10-22 11:40

    調原理圖和amp和PCB圖

    調原理圖和amp和PCB圖,PDF格式資料,比較清晰。
    發表于 09-26 16:31 ?77次下載

    synopsys&Mentor設計流程

    synopsys & Mentor 設計流程免費下載。
    發表于 07-08 11:37 ?72次下載

    R&S FSL6臺式信號分析儀的功能特點及應用范圍

    R&S?FSL 是一款多功能而且經濟實用的信號分析儀。R&S?FSL全系列標配28MHz的信號解調帶寬,遠高于其他同類產品。無論是頻譜、噪聲系數、ACL
    發表于 12-09 09:46 ?1378次閱讀

    歐拉 Summit 2021 安全&可靠性&運維專場:主流備份技術探討

    在openEuler Summit 2021 安全&可靠性&運維專場上,高沖對為數據安全而生,統信軟件備份還原工具分享。
    的頭像 發表于 11-10 17:42 ?1961次閱讀
    歐拉 Summit 2021 安全&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;可靠性&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;運維專場:主流備份技術探討

    485&amp;&amp;Modbus協議

    1.RS4851)485通信 --差分傳輸物理層: 通信引腳 A B使用雙絞線通信。發送器: 邏輯1: A&amp;gt;B AB之間電壓為+2V~+6V 邏輯0: A&amp;lt;B AB之間
    發表于 11-23 17:36 ?3次下載
    485&<b class='flag-5'>amp</b>;&<b class='flag-5'>amp</b>;Modbus協議

    存儲類&amp;作用域&amp;生命周期&amp;鏈接屬性

    目錄前言一、存儲類&amp;amp;作用域&amp;amp;生命周期&amp;amp;鏈接屬性的
    發表于 12-09 15:51 ?5次下載
    存儲類&<b class='flag-5'>amp</b>;作用域&<b class='flag-5'>amp</b>;生命周期&<b class='flag-5'>amp</b>;鏈接屬性

    2021 Kubernetes on AI &amp;amp;amp;amp; Edge Day圓滿舉行 共探邊緣云融合

    2021年12月11日-12日,由Linux基金會、LF AI &amp;DATA、LF Edge、CNCF、LFN等開源社區聯合舉辦,開源科技OSTech和西麗湖人才服務中心協辦的Kubernetes on AI &amp;
    的頭像 發表于 12-16 09:43 ?5447次閱讀
    2021 Kubernetes on AI &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; Edge Day圓滿舉行 共探邊緣云融合

    如何區分Java中的&amp;amp;和&amp;amp;&amp;amp;

    首先給i賦值為0,如果i大于10,并且i++等于1,則輸出“錯誤”和i的值。否則輸出“正確”和i的值。分別用&amp;和&amp;&amp;運行,觀察運行結果的不同。
    的頭像 發表于 02-24 10:46 ?1775次閱讀
    如何區分Java中的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;和&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;

    if(a==1 &amp;amp;&amp;amp; a==2 &amp;amp;&amp;amp; a==3),為true,你敢信?

    接下來咱們來嘗試解決這個問題。假設 if(a==1&amp;&amp;a==12)是等于 true的,那么a肯定不可能是一個“普通的變量”。它勢必要有能力在執行的時候能夠動態改動值。
    的頭像 發表于 05-08 11:01 ?1268次閱讀
    if(a==1 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; a==2 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; a==3),為true,你敢信?

    HarmonyOS &amp;amp;amp;amp;潤和HiSpark 實戰開發,“碼”上評選活動,邀您來賽!!!

    出色的系統 助力優秀的設備 為應用開發者帶來豐富的體驗與想象空間 正如當HarmonyOS遇見潤和HiSpark 這萬物互聯的時代 將由你的&amp;lt; 代碼 &amp;gt;來定義 潤
    的頭像 發表于 04-11 15:33 ?1352次閱讀
    HarmonyOS &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;潤和HiSpark 實戰開發,“碼”上評選活動,邀您來賽!!!

    你使用shell腳本中的2&amp;gt;&amp;amp;1了嗎?

    run_cmax > ./starrc_cmax.logs 2>&amp;1中的 2>&amp;1是啥意思?
    的頭像 發表于 07-30 14:44 ?2181次閱讀

    攝像機&amp;amp;amp;雷達對車輛駕駛的輔助

    攝像機&amp;amp;雷達擔負著可輔助駕駛員安全駕駛的、高級駕駛輔助系統的傳感功能。尼得科正在進一步推進攝像機&amp;amp;雷達的高性能化進程。
    的頭像 發表于 11-26 10:02 ?1162次閱讀
    攝像機&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;雷達對車輛駕駛的輔助

    FS201資料(pcb &amp;amp; DEMO &amp;amp; 原理圖)

    電子發燒友網站提供《FS201資料(pcb &amp; DEMO &amp; 原理圖).zip》資料免費下載
    發表于 07-16 11:24 ?2次下載

    onsemi LV/MV MOSFET 產品介紹 &amp;amp;amp; 行業應用

    01直播介紹直播時間2024/10/281430直播內容1.onsemiLV/MVMOSFET產品優勢&amp;市場地位。2.onsemiLV/MVMOSFETRoadmap。3.onsemiT10
    的頭像 發表于 10-13 08:06 ?745次閱讀
    onsemi LV/MV MOSFET 產品介紹 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; 行業應用

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品
    主站蜘蛛池模板: 国产偷国产偷亚洲高清app | jizz女学| 国产人妻精品午夜福利免费不卡 | 精品久久综合1区2区3区激情 | 成都电影免费中文高清 | 十分钟免费观看大全视频 | 伊人久久丁香色婷婷啪啪 | 亚洲精品久久久久AV无码林星阑 | 樱桃视频影院在线播放 | 调教日本美女 | 欧美2019高清hd巨大 | 一抽一出BGM免费50分动漫 | 欧美 亚洲 日韩 在线综合 | https黄视| 好紧好湿太硬了我太爽了文字 | 泡妞高手在都市完整版视频免费 | 国产精品成人免费观看 | 秋霞特色大片18岁入口 | 亚洲视频中文字幕在线观看 | 蜜桃婷婷狠狠久久综合9色 蜜桃视频一区二区 | 欧美18在线 | 第一会所欧美无码原创 | 久久九九亚洲精品 | 欧美精品成人久久网站 | 色WWW永久免费视频首页 | 特级做A爰片毛片免费69 | 亚洲精品无码不卡在线播HE | 欧美精品做人一级爱免费 | 男人网站在线观看 | 在线不卡日本v二区 | 被滋润的艳妇疯狂呻吟白洁老七 | 欧美亚洲高清国产 | 国产又色又爽又刺激在线播放 | 国精产品一区一区三区有限公司 | 一区二区不卡在线视频 | 九九视频在线观看视频6 | 精子pk美女 | 成人性生交大片免费看4 | 2021国产精品国产精华 | 久久精品电影 | 好男人在线视频 |