色婷婷色综合,污到你怀疑人生,亚洲国产成人欧美激情

看到一張圖片，我們很容易就能猜測(cè)出圖中物體的立體模樣，但是機(jī)器能做到嗎？美國加州大學(xué)伯克利分校的研究人員就開發(fā)了一個(gè)框架，讓機(jī)器通過一張圖片就能還原出立體原型，并添加自然的紋理圖案。以下是論智對(duì)原論文的編譯，后附論文地址和實(shí)驗(yàn)結(jié)果展示視頻。

我們開發(fā)了一種學(xué)習(xí)框架，能夠通過一張圖片還原圖中物體的3D形狀、攝像角度及紋理。形狀用可變形的3D網(wǎng)格模型表示。

上圖中有許多小鳥，即使我們是第一次看到這種圖片上二維的鳥類，我們依然能推斷出它大概的3D形狀、了解拍攝的角度、甚至能猜出從另一個(gè)角度看它會(huì)是什么樣。我們能做到這些是因?yàn)橹拔覀円娺^的鳥類能讓我們對(duì)陌生小鳥有個(gè)大致輪廓，這些知識(shí)幫助我們還原這些案例的3D結(jié)構(gòu)。

在這篇文章中，我們展示了一個(gè)能根據(jù)單張圖片推斷3D表示的計(jì)算模型，如上圖所示，學(xué)習(xí)過程只需要一張標(biāo)注過的2D圖像，其中包括目標(biāo)對(duì)象的類別、前景掩碼和語義重點(diǎn)標(biāo)簽。

我們的目標(biāo)是生成一個(gè)預(yù)測(cè)器fθ（參數(shù)化設(shè)置為一個(gè)CNN），它可以從單張照片I中推斷出目標(biāo)物體的3D結(jié)構(gòu)。在這個(gè)項(xiàng)目中我們希望將物體的形狀用3D網(wǎng)格表示，這種表示比其他方法（比如probabilistic volumetric grids）有更多優(yōu)點(diǎn)，例如可對(duì)紋理進(jìn)行模擬、進(jìn)行相應(yīng)的推理、表面水平推理和可解釋性。

我們提出的框架如下圖所示。輸入的圖像通過一個(gè)編碼器后到達(dá)由三個(gè)模塊組成的表征，它可以預(yù)測(cè)相機(jī)位置、物體形狀和花紋的參數(shù)。

用模型推斷目標(biāo)物的3D表示

首先，給定一張圖像I，我們預(yù)測(cè)fθ（I）≡（M, π），網(wǎng)格M和相機(jī)位置π用來捕捉對(duì)象的3D結(jié)構(gòu)。具體的推導(dǎo)過程可查看原論文。除了這些直接預(yù)測(cè)的方面，我們還學(xué)習(xí)了網(wǎng)格和類別水平語義重點(diǎn)之間的關(guān)系。當(dāng)我們?cè)谝?guī)范框架中使用特定類別的網(wǎng)格來表示形狀時(shí)，跨實(shí)例的規(guī)律能幫助我們找到語義一致的定點(diǎn)位置，從而隱含地賦予這些頂點(diǎn)語義。

經(jīng)過這一步，我們就利用一張圖片I推斷出了相應(yīng)的相機(jī)位置π和形狀?V。同時(shí)，我們還通過學(xué)習(xí)實(shí)例獨(dú)立的參數(shù)。推斷出了網(wǎng)格定點(diǎn)的位置V和語義重點(diǎn)A·V。

從圖像集合中學(xué)習(xí)

為了訓(xùn)練fθ，我們提出了一種不依賴于實(shí)際3D形狀和多角度圖像實(shí)例的監(jiān)督的方法，而是從帶有稀疏關(guān)鍵點(diǎn)和分割掩碼的圖像集中進(jìn)行學(xué)習(xí)。這種設(shè)置更加自然，并且容易獲得，特別是對(duì)會(huì)動(dòng)和可變形的物體，例如鳥類或其他動(dòng)物。想要獲取對(duì)象的掃描件甚至同一物體多個(gè)角度的照片是非常困難的，但對(duì)于大多數(shù)物體來說，獲取單張圖像相對(duì)更容易。

有了帶注釋的圖像集，我們通過制定一個(gè)目標(biāo)函數(shù)來訓(xùn)練fθ，該函數(shù)包含和實(shí)例相關(guān)的損失和先驗(yàn)。具體的實(shí)例能量術(shù)語（energy te rms）可以保證預(yù)測(cè)的3D結(jié)構(gòu)與現(xiàn)有的掩碼和關(guān)鍵點(diǎn)一致，并且先驗(yàn)知識(shí)能幫助生成一些特征，例如光滑性。由于我們從許多實(shí)例中得到了通用的預(yù)測(cè)模型fθ，那么各個(gè)種類之間的通用結(jié)構(gòu)也能讓我們從中得到有意義的3D預(yù)測(cè)，即使只有一個(gè)實(shí)例。

插入圖案預(yù)測(cè)

在我們的公式中，所有復(fù)原的形狀都有著共同的3D網(wǎng)格結(jié)構(gòu)——每種形狀都是平均形狀的變形。我們可以利用這一屬性來減少特定實(shí)例中的圖案以預(yù)測(cè)平均圖案的形狀。我們的平均形狀是個(gè)球體，它的表面圖案可以表示成一張名為Iuv的圖像，其值通過固定的UV映射映射到表面上（類似于將地球展開成平面圖）。

于是，我們將預(yù)測(cè)圖案的這個(gè)任務(wù)看作是推斷Iuv的像素值。該圖像可以被認(rèn)為是屬于目標(biāo)物體類別的典型外觀空間。例如，預(yù)測(cè)形狀中的特殊三角形總是會(huì)映射到Iuv中的特定區(qū)域，不管它如何變形。

將圖案參數(shù)化之后，UV圖像中每個(gè)像素的語義含義都一致，從而使預(yù)測(cè)模型更容易利用通用模式，例如鳥背和身體之間的相關(guān)性。

我們通過設(shè)置一個(gè)解碼器，將圖案預(yù)測(cè)模塊添加到框架中，該解碼器可以將潛在表示轉(zhuǎn)換成Iuv的空間向量。雖然直接用回歸計(jì)算Iuv的像素值是一種可行的方法，但這通常會(huì)導(dǎo)致模糊圖像的產(chǎn)生。相反，我們將此任務(wù)看成預(yù)測(cè)外觀流，我們不回歸Iuv像素的值，而是讓模塊輸出從原始輸入圖像復(fù)制來的像素顏色。如圖所示：

實(shí)驗(yàn)過程

模型設(shè)置好后，我們選擇CUB-200-2011數(shù)據(jù)集做實(shí)驗(yàn)，該數(shù)據(jù)集有6000張訓(xùn)練和測(cè)試圖像，包括了200種鳥類。每張圖片都有邊界框進(jìn)行標(biāo)注，另外還有14個(gè)語義關(guān)鍵點(diǎn)標(biāo)注出了位置，同時(shí)還顯示出了前景的掩碼。我們從中挑選了近300張圖像，其中每張圖的關(guān)鍵點(diǎn)少于或等于6個(gè)。另外預(yù)測(cè)網(wǎng)絡(luò)的各個(gè)模塊示意圖如圖2所示，編碼器由一個(gè)在ImageNet上預(yù)訓(xùn)練的ResNet-18組成，緊接著是一個(gè)卷積層。

最終在CUB測(cè)試集上得到的重建結(jié)果如圖所示：

論文附錄和文后視頻中會(huì)有360度全景展示。

另外，我們還對(duì)目標(biāo)物體的圖案進(jìn)行了替換，將一張圖上的紋理替換到預(yù)測(cè)形狀上去。我們發(fā)現(xiàn)，即使兩個(gè)視角可能不同，由于基礎(chǔ)的紋理圖像在空間上是一致的，所轉(zhuǎn)換的紋理在語義上也是一致的。

除此之外，我們還在PASCAL 3D+數(shù)據(jù)集上對(duì)車和飛機(jī)做了同樣的實(shí)驗(yàn)，預(yù)測(cè)的形狀通常都很正常，不過圖案會(huì)出現(xiàn)較多錯(cuò)誤，因?yàn)槠嚿嫌蟹垂獾牡胤交蚴怯?xùn)練數(shù)據(jù)較少：

結(jié)語

我們展示了可以從單一角度預(yù)測(cè)物體3D結(jié)構(gòu)的框架。雖然這項(xiàng)結(jié)果非常令人興奮，但是我們并沒有提出一個(gè)通用的解決方案。最后，雖然我們只能使用實(shí)例的單一視圖進(jìn)行學(xué)習(xí)，但對(duì)于有多個(gè)視圖的場(chǎng)景來說，我們的方法可能同樣適用，并產(chǎn)生更好的結(jié)果。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

編碼器

編碼器

+關(guān)注

關(guān)注
45

文章
3737

瀏覽量
136314
3D

3D

+關(guān)注

關(guān)注
9

文章
2935

瀏覽量
109015

原文標(biāo)題：讓平面變立體——特定類別3D網(wǎng)格重建學(xué)習(xí)

文章出處：【微信號(hào)：jqr_AI，微信公眾號(hào)：論智】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

3D測(cè)量使用的labview框架

這是小弟一個(gè)3D測(cè)量項(xiàng)目上的軟件框架

發(fā)表于 06-04 14:16

3D掃描的結(jié)構(gòu)光

。幾何三角剖分的原理使得計(jì)算被掃描物體表面上每個(gè)點(diǎn)的XYZ坐標(biāo)成為可能（見圖01）。然后，獲得的點(diǎn)云數(shù)據(jù)用于被掃描物體表面詳細(xì)3D模型的計(jì)算構(gòu)造。圖01：使用DLP? 技術(shù)的

發(fā)表于 08-30 14:51

3D打印的優(yōu)勢(shì)

縮短。不需要開模，可直接快速打印原型，成本大大減低。在尺寸精度上也可滿足工業(yè)級(jí)裝配要求，塑料樣件尺寸精度可達(dá)±0.1mm，金屬樣件尺寸精度可達(dá)±20μm;優(yōu)點(diǎn)3：靈活度高3d打印在加工零件的結(jié)

發(fā)表于 11-10 16:15

PYNQ框架下如何快速完成3D數(shù)據(jù)重建

來實(shí)現(xiàn)基于這些約束的三維重建的完整管道?！　≡谶@個(gè)項(xiàng)目中，作者的目標(biāo)是朝著實(shí)時(shí)生成3D視覺數(shù)據(jù)邁進(jìn)一步。首先，在CPU上生成3D點(diǎn)云，然后使用Mesh Lab可視化它。由于Mesh L

發(fā)表于 01-07 17:25

浩辰3D的「3D打印」你會(huì)用嗎？3D打印教程

設(shè)計(jì)。由浩辰CAD公司研發(fā)的浩辰3D作為從產(chǎn)品設(shè)計(jì)到制造全流程的高端3D設(shè)計(jì)軟件，不僅能夠提供完備的2D+3D一體化解決方案，還能一站式集成

發(fā)表于 05-27 19:05

3D打印機(jī)的結(jié)構(gòu)

這是 DIY 系列的第一篇，先從結(jié)構(gòu)說起。細(xì)數(shù) 3D 打印機(jī)的結(jié)構(gòu)不下 10 種了，各有各的優(yōu)缺點(diǎn)。從最古老的龍門結(jié)構(gòu)開始，分別列舉各自的優(yōu)

發(fā)表于 09-01 06:37

使用結(jié)構(gòu)光的3D掃描介紹

控制、醫(yī)療、牙科和原型設(shè)計(jì)。 3D掃描是提取一個(gè)物體的表面和物理測(cè)量，并用數(shù)字的方式將其表示出來。這些數(shù)據(jù)被采集為一個(gè)由X，Y和Z坐標(biāo)（表示物體

發(fā)表于 11-16 07:48

從榮耀角度解讀3D識(shí)別的結(jié)構(gòu)光、TOF及雙目立體成像方案

3D Sensing在人機(jī)交互上，可實(shí)現(xiàn)人臉識(shí)別、設(shè)備解鎖、面部表情等應(yīng)用，借助“點(diǎn)云深度攝像頭”的散斑結(jié)構(gòu)光手機(jī)配件，榮耀V10可實(shí)現(xiàn)3D人臉建模、人臉識(shí)別、3D面部表情控制以及

發(fā)表于 12-12 11:19 ?3.1w次閱讀

淺析3D結(jié)構(gòu)光技術(shù)

HUAWEI Mate 20 Pro采用2400萬前置攝像頭，擁有3D結(jié)構(gòu)光設(shè)計(jì)，3D智能美顏，自拍清晰自然;同時(shí)支持3D人臉解鎖，帶來毫秒級(jí)解鎖體驗(yàn)。

發(fā)表于 10-23 15:55 ?2.1w次閱讀

3D的感知技術(shù)及實(shí)踐

3D濾波、噪聲過濾和表面平滑 3D信號(hào)處理深度圖平滑濾波 3D信號(hào)處理深度圖的雙邊濾波 3D信號(hào)處理表面平滑（三角

發(fā)表于 10-23 09:40 ?3414次閱讀

3D視覺主要技術(shù)路徑 3D結(jié)構(gòu)光技術(shù)原理

3D傳感器作為3D視覺的眼睛，通過多個(gè)攝像頭與深度傳感器的組合能夠獲得物體三維位置及尺寸等數(shù)據(jù)，實(shí)現(xiàn)三維信息采集。目前3D視覺傳感器主要有雙目相機(jī)、

發(fā)表于 11-22 21:21 ?4158次閱讀

大規(guī)模3D重建的Power Bundle Adjustment

BA (BA) 是一個(gè)經(jīng)典的計(jì)算機(jī)視覺問題，它構(gòu)成了許多 3D 重建和運(yùn)動(dòng)結(jié)構(gòu) (SfM) 算法的核心組成部分。它指的是通過最小化非線性重投影誤差來聯(lián)合估計(jì)相機(jī)參數(shù)和

發(fā)表于 12-15 11:20 ?819次閱讀

NeuralLift-360：將野外的2D照片提升為3D物體

從3D點(diǎn)云中生成可渲染的3D網(wǎng)格：使用一個(gè)基于深度學(xué)習(xí)的方法來將點(diǎn)云轉(zhuǎn)換為可渲染的3D

發(fā)表于 04-16 10:02 ?2335次閱讀

基于未知物體進(jìn)行6D追蹤和3D重建的方法

如今，計(jì)算機(jī)視覺社區(qū)已經(jīng)廣泛展開了對(duì)物體姿態(tài)的 6D 追蹤和 3D 重建。本文中英偉達(dá)提出了同時(shí)對(duì)未知物體進(jìn)行 6

發(fā)表于 07-03 11:24 ?742次閱讀

生成高質(zhì)量 3D 網(wǎng)格，從重建到生成式 AI

新一代 AI 工作流已經(jīng)在生成高保真 3D 模型方面取得了巨大成功，從基于給定圖像的場(chǎng)景重建，到能夠?yàn)榻换ナ襟w驗(yàn)制作資產(chǎn)的生成式 AI。這些生成的 3D 模型通常被提取成標(biāo)準(zhǔn)的三

發(fā)表于 08-17 19:15 ?860次閱讀