一级毛片观看,四虎影院精品,思思91精品国产综合在线

讓機器擁有像人類一樣感知 3D 物體和環境的能力，是人工智能領域的一項重要課題。牛津大學計算機科學系博士生 Bo Yang 在其畢業論文中詳細解讀了如何重建和分割 3D 物體，進而賦予機器感知 3D 環境的能力，突破了人工智能和機器理解的界限。

賦予機器像人類一樣感知三維真實世界的能力，這是人工智能領域的一個根本且長期存在的主題。考慮到視覺輸入具有不同類型，如二維或三維傳感器獲取的圖像或點云，該領域研究中一個重要的目標是理解三維環境的幾何結構和語義。

傳統方法通常利用手工構建的特征來估計物體或場景的形狀和語義。但是，這些方法難以泛化至新物體和新場景，也很難克服視覺遮擋的關鍵問題。

今年九月畢業于牛津大學計算機科學系的博士生 Bo Yang 在其畢業論文《Learning to Reconstruct and Segment 3D Objects》中對這一主題展開了研究。與傳統方法不同，作者通過在大規模真實世界的三維數據上訓練的深度神經網絡來學習通用和魯棒表示，進而理解場景以及場景中的物體。

總體而言，本文開發了一系列新型數據驅動算法，以實現機器感知到真實世界三維環境的目的。作者表示：「本文可以說是突破了人工智能和機器理解的界限。」

這篇博士論文有 143 頁，共六章。機器之心對該論文的核心內容進行了簡要介紹，感興趣的讀者可以閱讀論文原文。

論文地址：https://arxiv.org/pdf/2010.09582.pdf

論文概述

作者在第 2 章首先回顧了以往 3D 物體重建和分割方面的研究工作，包括單視圖和多視圖 3D 物體重建、3D 點云分割、對抗生成網絡（GAN）、注意力機制以及集合上的深度學習。此外，本章最后還介紹了在單視圖 / 多視圖 3D 重建和 3D 點云分割方面，該研究相較于 SOTA 方法的新穎之處。

基于單視圖的 3D 物體重建

在第 3 章，作者提出以一種基于 GAN 的深度神經架構來從單一的深度視圖學習物體的密集 3D 形狀。作者將這種簡單但有效的模型稱為 3D-RecGAN++，它將殘差連接（skip-connected）的 3D 編碼器 - 解碼器和對抗學習結合，以生成單一 2.5D 視圖條件下的完整細粒度 3D 結構。該模型網絡架構的訓練和測試流程如下圖所示：

接著，作者利用條件對抗訓練來細化編碼器 - 解碼器估計的 3D 形狀，其中用于 3D 形狀細化的判別器結構示意圖如下：

最后，作者將提出的 3D-RecGAN++ 與 SOTA 方法做了對比，并進行了控制變量研究。在合成和真實數據集上的大量實驗結果表明，該模型性能良好。

基于多視圖的 3D 物體重建

在第 4 章，作者提出以一種新的基于注意力機制的神經模塊來從多視圖中推理出更好的 3D 物體形狀。這種簡單但高效的注意力聚合模塊被稱為 AttSets，其結構如下圖所示。與現有方法相比，這種方法可以學習從不同圖像中聚合有用信息。

此外，研究者還引入了兩階段訓練算法，以確保在給出一定數量輸入圖像的情況下，預估的 3D 形狀具有魯棒性。研究者在多個數據集上進行了實驗，證明該方法能夠精確地恢復物體的 3D 形狀。

從點云中學習分割 3D 物體

在第五章中，研究者提出了一個新的框架來識別大規模 3D 場景中的所有單個 3D 物體。與現有的研究相比，該研究的框架能夠直接并且同時進行檢測、分割和識別所有的目標實例，而無需任何繁瑣的前 / 后處理步驟。研究者在多個大型實際數據集上展現了該方法相對于基線的性能提升。

作者介紹

本文作者 Bo Yang 現為香港理工大學計算機系助理教授。他本科和碩士分別畢業于北京郵電大學和香港大學，然后進入牛津大學計算機科學系攻讀博士學位，其導師為 Niki Trigoni 和 Andrew Markham 教授。

Bo Yang 作為一作以及合著的論文曾被《計算機視覺國際期刊》（IJCV）以及 NeurIPS 和 CVPR 等學術會議接收，谷歌學術主頁上顯示他共著有 22 篇論文，被引用數超過 400。

論文目錄如下：

責任編輯：PSY

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
31165

瀏覽量
269550
機器學習

機器學習

+關注

關注
66

文章
8428

瀏覽量
132820
3D物體識別

3D物體識別

+關注

關注
0

文章
3

瀏覽量
6338

中興通訊攜手中國移動推出AI裸眼3D創新產品

產品憑借Neovision 3D Anytime突破性的2D轉3D技術，以及5G與AI的深度融合，為消費者帶來更加沉浸、更為豐富的裸眼

發表于 10-15 10:05 ?820次閱讀

中興通訊全場景AI終端應用與裸眼3D新品亮相

”的產品戰略與理念，終端業務六大AI主題展示吸引了眾多關注，內容覆蓋全球領先的AI裸眼3D、AI同聲傳譯和方言互譯、AI安全反詐、

發表于 10-15 10:00 ?958次閱讀

紫光展銳助力全球首款AI裸眼3D手機發布

1.4億臺，展示了該技術巨大的市場潛力和增長空間。近日，全球首款AI裸眼3D手機——中興遠航3D重磅上市。憑借微米級3D光柵技術、Neovision

發表于 07-15 16:00 ?705次閱讀

機器學習中的數據分割方法

在機器學習中，數據分割是一項至關重要的任務，它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習中數據

發表于 07-10 16:10 ?1977次閱讀

Meta推出革命性3D Gen AI模型：1分鐘內生成高質量3D內容

在科技日新月異的今天，Meta再次引領創新潮流，宣布了一項令人矚目的技術突破——3D Gen AI模型的誕生。這款先進的模型以其前所未有的高效性與卓越品質，重新定義了3D內容創作的邊界

發表于 07-04 18:12 ?1039次閱讀

中興通訊與中國移動發布全球首創AI裸眼3D新品，引領3D科技新浪潮

在科技飛速發展的今天，裸眼3D技術以其獨特的沉浸式體驗，正逐漸成為科技領域的新寵。近日，全球領先的通訊科技企業中興通訊攜手中國移動，在備受矚目的2024MWC上海展上，發布了兩款全球首創的AI裸眼

發表于 06-28 15:32 ?1030次閱讀

3D建模的重要內容和應用

3D建模是一種技術，通過計算機軟件創建虛擬三維模型，模擬現實世界中的物體或場景。這項技術廣泛應用于建筑設計、電影制作、游戲開發、工程仿真等領域。下面古河云科技將介紹一些與3D建模相關的重要內容

發表于 06-21 14:48 ?675次閱讀

銀牛微電子引領3D空間計算芯片前沿技術

在此次活動上，銀牛微電子有限責任公司的周凡博士指出，2D視覺已無法滿足日益復雜的系統需求，因此我們需要引入更多維度來輔助機器人和智能設備更好地理解并融入真實環境，即從2

發表于 05-18 16:34 ?936次閱讀

重磅| 奧比中光全新雙目系列3D相機，搭載自研芯片，為智能機器人而生

設計的新一代深度引擎芯片MX6800，配備高性能主被動融合雙目成像系統，能夠在戶外、室內、夜晚、白晝等不同光照條件以及復雜多變的動態環境中穩定輸出高質量深度數據，精準還原場景和物體的3D信息，廣泛適用于AMR、巡檢機器人、配送

發表于 04-30 18:00 ?485次閱讀

重磅| 奧比中光全新雙目系列<b class='flag-5'>3D</b>相機，搭載自研芯片，為智能<b class='flag-5'>機器</b>人而生

機器人3D視覺引導系統框架介紹

通過自主開發的3D掃描儀可獲準確并且快速地獲取場景的點云圖像，通過3D識別算法，可實現在對點云圖中的多種目標物體進行識別和位姿估計。

發表于 04-29 09:31 ?349次閱讀

<b class='flag-5'>機器</b>人<b class='flag-5'>3D</b>視覺引導系統框架介紹

三維掃描與3D打印在法醫頭骨重建中的突破性應用

隨著科技的飛速發展，三維掃描和3D打印技術已經逐漸滲透到醫療領域的各個環節，為臨床診斷、治療和醫學研究帶來了前所未有的便利。特別是在法醫學領域，三維掃描和3D打印技術的應用更是為頭骨重建、身份鑒定等

發表于 04-19 10:26 ?528次閱讀

三維掃描與<b class='flag-5'>3D</b>打印在法醫頭骨<b class='flag-5'>重建</b>中的<b class='flag-5'>突破</b>性應用

Stability AI推出全新Stable Video 3D模型

近日，Stability AI 推出了全新的 Stable Video 3D 模型，該模型以其獨特的功能吸引了眾多關注。此模型具備從單張圖像中生成多視圖3D視頻的能力，為視頻制作領域帶來了革命性的

發表于 03-22 10:30 ?880次閱讀

AI新工具DUSt3R走紅GitHub，兩秒完成3D重建驚艷網友

近日，一款名為DUSt3R的AI新工具在微軟旗下的GitHub平臺上引發了廣泛關注。這款神奇的工具僅需兩張圖片和兩秒鐘的時間，便能完成精確的3D重建，且無需額外測量任何數據。上線不久，

發表于 03-08 14:02 ?1212次閱讀

2張圖2秒鐘完成3D建模！3D內容生成工具DUSt3R爆火，國產廠商有哪些機會？

電子發燒友網報道（文/吳子鵬）近日，一款名為DUSt3R的AI新工具在GitHub上爆火。DUSt3R能夠在短短2秒鐘內通過僅有2張圖片完成3D 重

發表于 03-06 00:10 ?4126次閱讀

基于深度學習的方法在處理3D點云進行缺陷分類應用

背景部分介紹了3D點云應用領域中公開可訪問的數據集的重要性，這些數據集對于分析和比較各種模型至關重要。研究人員專門設計了各種數據集，包括用于3D形狀分類、3D物體檢測和

發表于 02-22 16:16 ?1235次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

牛津博士論文學習重建和分割3D物體，突破AI和機器理解的界限

評論