在线观看aaa,亚洲精品亚洲九十七页,亚偷熟乱区视频在线观看

本文主要介紹商湯智能感知終端團隊，發表在 ECCV 2022 上的工作。針對3D交互雙手姿態估計問題，作者采用分而治之的策略，把交互的雙手姿態估計問題，解耦成兩個單手姿態估計問題。

作者提出了一種基于去遮擋和移除的3D交互手姿態估計框架，補全目標手被遮擋的部分，并移除另一只有干擾的手。此外，作者還構建了一個大規模數據集Amodal InterHand Dataset (AIH)，用以訓練手勢去遮擋和移除網絡。實驗結果表明，論文提出的框架在InterHand2.6M 和 Tzionas 兩個主流的公開數據集上，都獲得了顯著的性能提升。

? ? ?

Part 1動機和背景

圖1 本文算法（右）與baseline（左）的對比

手，是人和世界交互的主要工具。3D交互手姿態估計，指從單目彩色圖中，恢復出一個人兩只互相交互的手的骨架。它是人機交互、AR/VR、手語理解等諸多現實應用的基礎。與被充分研究的單手姿態估計任務不同，交互手3D姿態估計是近兩年來剛興起的學術方向。

現存的工作會直接同時預測交互手的左右兩手的姿態，而我們則另辟蹊徑，將交互手姿態估計任務，解耦成左右兩手分別的單手姿態估計任務。這樣，我們就可以充分利用當下單手姿態估計技術的最新進展。然而相比通常的單手姿態估計任務來說，交互手姿態估計有以下兩個難點：一是左右手間可能存在的嚴重的遮擋，難以估計被遮擋的手的姿態；二是左右手顏色紋理相近有歧義性，預測一只手的姿態可能會因另一只手的存在而被干擾。

為了解決這兩個困難，我們提出了去遮擋和移除框架，旨在預測一只手的姿態時，補全它被遮擋的部分，并移除有干擾的另一只手的部分。由圖1的示例可見，在用去遮擋和移除框架后，交互手的圖片會恢復右手被遮擋的部分，也會移除有干擾的左手的部分，進而轉換成右手的單手姿態估計任務。

此外，我們還構建了第一個大規模的合成交互手數據集（Amodal InterHand Dataset）。該數據集具有很多應用前景，如交互式雙手姿態估計、Amodal & modal的實例分割、以及手部去遮擋。

Part 2方法

圖2 本文提出的框架示意圖

本文的框架包括三個部分：手部非模態分割模塊（HASM）、手部去遮擋和移除模塊（HDRM）、單手姿態估計模塊（SHPE）。

我們首先用HASM去分割圖像中左右手的模態和非模態掩碼，在得到掩碼后，我們可以分別定位左右兩手的位置并對圖片進行裁剪。

之后，我們利用HDRM恢復手被遮擋的部分并移除另一只有干擾的手。

這樣，一個交互手的圖片會被轉換成左右兩手的單個手的圖片，通過SHPE后可以得到左右手分別的姿態。

2.1 手部非模態分割模塊（HASM）

我們基于mmsegmentation框架，從交互手的圖片中分割出四種掩碼：左手可見區域、左手完整區域、右手可見區域和右手完整區域。

2.2 手部去遮擋和移除模塊（HDRM）

圖3 HDRNet示意圖以右手為例，首先根據2.1預測的掩碼，以右手完整部分掩碼為中心，裁剪得到圖片。

而HDRNet的輸入則有以下四部分拼接而成：（1）圖片右手被遮擋區域被涂黑；（2）右手可見部分掩碼；（3）I圖片左手多余區域被涂黑；（4）除左右兩手外的背景區域的掩碼。

我們借鑒經典的inpainting方法中的網絡結構(UNet + Partial Convolutions)，并在其中加入了一些Transformer結構，來增強圖像特征、擴大感受野，以及讓網絡關注更重要的圖像區域。

網絡HDRNet最終預測出右手被遮擋區域的像素，以及左手多余區域背后背景的像素，這樣最終預測結果即為單個右手的圖片。

2.3 單手姿態估計模塊（SHPE）

由于SHPE不是本文的重點，因此我們使用了一個簡單有效的開源方法MinimalHand作為我們的baseline。

Part3AIH虛擬交互手數據集

圖4 AIH數據集中的樣例為了充分訓練我們提出的HDRM網絡，我們基于InterHand2.6M V1.0數據集，構建了第一個大規模的虛擬合成的Amodal交互手數據集（AIH）。

AIH有大約300萬樣本組成，其中AIH_Syn 有220萬樣本，AIH_Render有70萬樣本。前者是將InterHand2.6M V1.0數據集的單個右手或單個左手的圖片，進行復制粘貼，合成的交互手圖片。

后者是將InterHand2.6M V1.0數據集的雙手mesh裝飾上紋理，經過隨機的旋轉和平移，最終渲染到隨機的數據集背景上得到的圖片。圖4展示了AIH數據集的可視化效果。

Part 4實驗結果

我們在 InterHand2.6M V1.0 和 Tzionas 兩個主流的數據集上做了實驗。如表1和表2所示，定量實驗表明，我們提出的算法，取得了最優的精度。

而且在耗時方面，在Tesla P40機器上單個樣本預測，HDRM（我們的主要貢獻點）只需要0.6ms，占整個框架預測時間47.2ms中很小一部分。更多可視化效果見圖5。

表1InterHand2.6M V1.0 數據集的定量結果對比

表2Tzionas 數據集的定量結果對比

圖5 更多可視化結果

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

人工智能

人工智能

+關注

關注
1801

文章
48303

瀏覽量
243794
智能傳感器

智能傳感器

+關注

關注
16

文章
605

瀏覽量
55618
計算機視覺

計算機視覺

+關注

關注
8

文章
1704

瀏覽量
46377

原文標題：ECCV 2022 | 基于去遮擋和移除的3D交互雙手姿態估計

文章出處：【微信號：3D視覺工坊，微信公眾號：3D視覺工坊】歡迎添加關注！文章轉載請注明出處。

一種以圖像為中心的3D感知模型BIP3D

在具身智能系統中，3D感知算法是一個關鍵組件，它在端側幫助可以幫助智能體理解環境信息，在云端可以用來輔助生成3D場景和3D標簽，具備重要的研究價值。現有主流算法主要依賴于點云作為輸入

發表于 03-17 13:44 ?201次閱讀

<b class='flag-5'>一種</b>以圖像為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>

用于黑暗中視覺自我運動估計的新型主動照明框架

本文提出一種新型主動照明框架，通過動態控制可移動光源主動照亮高紋理區域，顯著提升VO與VSLAM算法在極端光照條件下的性能。在真實機器人平臺上進行的實驗表明，相比傳統固定照明方法，本文方法可將姿態

發表于 02-28 14:29 ?216次閱讀

用于黑暗中視覺自我運動<b class='flag-5'>估計</b>的新型主動照明<b class='flag-5'>框架</b>

SciChart 3D for WPF圖表庫

SciChart 3D for WPF 是一個實時、高性能的 WPF 3D 圖表庫，專為金融、醫療和科學應用程序而設計。非常適合需要極致性能和豐富的交互式

發表于 01-23 13:49 ?356次閱讀

SciChart <b class='flag-5'>3D</b> for WPF圖表庫

騰訊混元3D AI創作引擎正式上線

近日，騰訊公司宣布其自主研發的混元3D AI創作引擎已正式上線。這一創新性的創作工具，標志著騰訊在3D內容生成領域邁出了重要一步。混元3D

發表于 01-22 10:26 ?368次閱讀

一種3D交聯導電粘結劑用于硅負極Angew

硅（Si）負極在高容量鋰離子電池（LIBs）中具有巨大潛力，但其實際應用受到嚴重體積膨脹和機械退化的阻礙。為了解決這些挑戰，我們提出了一種創新的3D交聯導電聚噁二唑（POD）粘結劑，通過甘油（GL

發表于 01-20 13:56 ?311次閱讀

<b class='flag-5'>一種</b><b class='flag-5'>3D</b>交聯導電粘結劑用于硅負極Angew

Google DeepMind發布Genie 2：打造交互式3D虛擬世界

的交互式體驗。據了解，Genie 2是一個自回歸潛在擴散模型，它基于大型視頻數據集進行訓練。通過自動編碼器，視頻中的潛在幀被傳遞到大型Transformer動力學模型中。該模型采用與大語言模型類似的因果掩碼進行訓練，從而實現了對3D

發表于 12-05 14:16 ?859次閱讀

一文理解2.5D和3D封裝技術

隨著半導體行業的快速發展，先進封裝技術成為了提升芯片性能和功能密度的關鍵。近年來，作為2.5D和3D封裝技術之間的一種結合方案，3.5D封裝技術逐漸走向前臺。

發表于 11-11 11:21 ?2811次閱讀

一種全新開源SfM框架MASt3R

運動恢復結構（SfM）是計算機視覺領域一個長期存在的問題，旨在根據每個相機拍攝的圖像來估計場景的3D幾何結構以及觀測該場景的相機的參數。由于它方便地同時為相機和地圖提供信息，因此構成了許多實用計

發表于 10-28 14:13 ?1261次閱讀

物聯網行業中的模具定制方案_3D打印材料選型分享

3D打印材料介紹 3D打印技術是一種快速制造技術，它可以將數字模型轉化為實體物體。3D打印材料是3D打印技術中不可或缺的

發表于 09-25 10:59 ?523次閱讀

裸眼3D筆記本電腦——先進的光場裸眼3D技術

隨著科技的不斷進步，裸眼3D技術已經不再是科幻電影中的幻想。如今，英倫科技裸眼3D筆記本電腦將這一前沿科技帶到了我們的日常生活中。無論你是專業的3D模型設計師，還是希望在視頻播放和模型

發表于 07-16 10:04 ?821次閱讀

3D建模的重要內容和應用

3D建模是一種技術，通過計算機軟件創建虛擬三維模型，模擬現實世界中的物體或場景。這項技術廣泛應用于建筑設計、電影制作、游戲開發、工程仿真等領域。下面古河云科技將介紹一些與3D建模相關的

發表于 06-21 14:48 ?989次閱讀

英倫科技10.1寸裸眼3D平板電腦的五大特點

選擇英倫科技的裸眼3D平板電腦，就是選擇了一種全新的視覺體驗。它的裸眼3D視頻觀看功能、光場裸眼3D技術、卓越的硬件配置、豐富的軟件支持以及人性化的設計理念，都是您不容錯過的選擇?，F在

發表于 06-12 15:15 ?627次閱讀

什么是光場裸眼3D？

光場裸眼3D技術，是一種無需任何輔助設備（如3D眼鏡或頭顯）即可產生真實三維效果的技術。它通過特殊的顯示設備，精確控制光線的方向和強度，使觀察者在不同的角度都能看到清晰、連續的立體圖像。這種技術的核心在于模擬人眼對真實世界的觀察

發表于 05-27 14:21 ?1655次閱讀

3D建模的特點和優勢都有哪些？

3D建模是一種用于創建三維對象的過程，它在許多領域都有著廣泛的應用，包括動畫、游戲開發、建筑設計、工程以及制造業等。下面古河云科技將介紹一些關于3D建模的內容詳情，包括它的特點、優勢以

發表于 05-13 16:41 ?3223次閱讀

機器人3D視覺引導系統框架介紹

通過自主開發的3D掃描儀可獲準確并且快速地獲取場景的點云圖像，通過3D識別算法，可實現在對點云圖中的多種目標物體進行識別和位姿估計。

發表于 04-29 09:31 ?454次閱讀