小蝌蚪亚洲精品国产,中国wwwwxxxx,亚洲狠狠婷婷综合久久久久网站

在機(jī)器人和計(jì)算機(jī)視覺領(lǐng)域，光學(xué) 3D 距離傳感器已經(jīng)得到了廣泛應(yīng)用，比如 RGB-D 攝像頭和 LIDAR 傳感器，都在 3D 環(huán)境繪制和無人駕駛等任務(wù)中扮演了重要角色。

盡管它們性能十分強(qiáng)大，兼具高敏感度、高精度和高可靠性等特質(zhì)，但在識(shí)別透明物體上卻不盡如人意。想要破壞這些傳感器的成像效果，或者讓機(jī)械手臂無從下手，只需要在它們面前放上玻璃杯一類的透明物體就可以了，因此難以在不使用其他傳感器的情況下獨(dú)立完成特定任務(wù)。

這是因?yàn)?a href="http://m.1cnz.cn/tags/光學(xué)傳感器/" target="_blank">光學(xué)傳感器的算法假設(shè)所有表面均是理想散射的 (Lambert)，即物體會(huì)在各個(gè)方向和各個(gè)角度均勻地反射光線。在 Lambert 光照模型中，無論觀察者的視角如何，其表面亮度都是相同的。

現(xiàn)實(shí)中的絕大多數(shù)物體符合這一假設(shè)，除了透明物體，因?yàn)樗鼈兊谋砻婕日凵溆址瓷涔饩€。這樣一來，光線傳播的復(fù)雜性大幅提升，表面亮度與視角無關(guān)的假設(shè)被破壞了，基于 Lambert 模型的算法也就失效了，導(dǎo)致傳感器收集的透明物體的大多數(shù)深度數(shù)據(jù)都是噪聲或者無效的。

圖 | 透明物體在傳統(tǒng)算法眼中是噪聲（來源：谷歌 AI）

為了改善這一問題，讓機(jī)器可以更好地感知透明表面，谷歌 AI，Synthesis AI 和哥倫比亞大學(xué)的研究人員合作開發(fā)了一種名為 ClearGrasp 的機(jī)器學(xué)習(xí)算法，能夠從 RGB-D 圖像中估算透明物體的準(zhǔn)確 3D 數(shù)據(jù)。

根據(jù)谷歌 AI 介紹，在設(shè)計(jì)之初，ClearGrasp算法就考慮到了兼容性。它可以與任何標(biāo)準(zhǔn) RGB-D 相機(jī)捕捉的數(shù)據(jù)配合使用，借助神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)來準(zhǔn)確地重建透明物體的景深數(shù)據(jù)。

圖 | ClearGrasp 算法的工作原理（來源：谷歌 AI）

與目前所使用的技術(shù)不同，ClearGrasp 算法不依賴于對(duì)透明物體的先驗(yàn)知識(shí)，比如預(yù)先對(duì)透明物體進(jìn)行 3D 建模，還要補(bǔ)充觀察視角和光線數(shù)據(jù)。在神經(jīng)網(wǎng)絡(luò)的幫助下，它可以很好地泛化到從未見過的全新物體身上。

在測(cè)試過程中，研究人員將新算法集成到了一套現(xiàn)有的拾取機(jī)器人控制系統(tǒng)中，最終發(fā)現(xiàn)它對(duì)透明塑料物體的抓取成功率有了非常顯著的提升，最多可以提升 6 倍。未來有望在拾取機(jī)器人和自動(dòng)駕駛等領(lǐng)域應(yīng)用。

透明對(duì)象的可視數(shù)據(jù)集

無論是什么樣的深度學(xué)習(xí)模型，訓(xùn)練時(shí)都要依賴于大量數(shù)據(jù)，比如訓(xùn)練自然語言模型 BERT 需要維基百科，ClearGrasp 也不例外。然而目前廣泛使用的 3D 數(shù)據(jù)集，包括 Matterport3D 和 ScanNet，都會(huì)忽略透明表面和物體，因?yàn)闃?biāo)記過程過于復(fù)雜和耗時(shí)。

這讓研究人員不得不自己創(chuàng)建訓(xùn)練集和測(cè)試集，專門針對(duì)透明對(duì)象設(shè)計(jì)。

在訓(xùn)練數(shù)據(jù)集中，他們創(chuàng)造了 5 萬多個(gè)符合真實(shí)物理原則的渲染圖，每張圖片最多包含 5 個(gè)透明物體，放置于平面上或者開放式容器中，視角、背景和光線各不相同。每個(gè)物體還有配套的表面法線（曲率）、分割蒙版、邊緣和深度等信息，用于訓(xùn)練各種 2D 和 3D 物體檢測(cè)任務(wù)。

至于測(cè)試集，研究團(tuán)隊(duì)選擇用真實(shí)場(chǎng)景創(chuàng)建圖片和數(shù)據(jù)，方便最大程度上測(cè)試算法的真實(shí)表現(xiàn)。這是一個(gè)十分痛苦的過程，因?yàn)閷?duì)于每個(gè)場(chǎng)景都要在保證視角、光線和場(chǎng)景布置完全一致的情況下照兩遍：第一遍用透明物體，第二遍用一模一樣的非透明物體替換它們（必須保證位置完全一樣）。

最終他們得到了 286 個(gè)真實(shí)場(chǎng)景測(cè)試圖，其中不僅包括透明物體本身，還有各種不同的背景貼圖和隨機(jī)不透明物體。圖片中既包含訓(xùn)練集中存在的已知對(duì)象，也包括從未出現(xiàn)過的新物體。

在數(shù)據(jù)集的問題解決之后，下一步是思考如何收集透明物體的深度數(shù)據(jù)。

雖然在透明物體上，RGB-D 經(jīng)典的深度估算方法無法給出準(zhǔn)確數(shù)據(jù)，但仍然有一些蛛絲馬跡暗示了物體的形狀。最重要的一點(diǎn)是，透明表面會(huì)出現(xiàn)鏡面反射，在光線充足的環(huán)境中會(huì)顯示成亮點(diǎn)，在 RGB 圖像中非常明顯，而且主要受到物體形狀的影響。

因此，卷積神經(jīng)網(wǎng)絡(luò)可以利用這些反射數(shù)據(jù)推斷出準(zhǔn)確的表面法線，然后將其用于深度估算。

另一方面，大多數(shù)機(jī)器學(xué)習(xí)算法都嘗試直接從單眼 RGB 圖像中估計(jì)深度，不過即使對(duì)于人類而言，這也是一個(gè)困難的任務(wù)。尤其在背景表面比較平滑時(shí)，現(xiàn)有算法對(duì)深度的估計(jì)會(huì)出現(xiàn)很大的誤差。這也會(huì)進(jìn)一步加大透明物體深度的估算誤差。

基于此，研究人員認(rèn)為與其直接估算透明物體深度，不如矯正 RGB-D 相機(jī)的初始深度估算數(shù)據(jù)。這樣更容易實(shí)現(xiàn)，還可以通過非透明表面的深度來推算透明表面的深度。

ClearGrasp 算法

ClearGrasp 算法使用了三個(gè)神經(jīng)網(wǎng)絡(luò)：一個(gè)用于估計(jì)表面法線，一個(gè)用于分析受遮擋邊界（深度不連續(xù)），另一個(gè)給透明對(duì)象罩上蒙版。蒙版負(fù)責(zé)刪除透明對(duì)象的所有像素，以便填充上正確的深度數(shù)據(jù)。

研究人員使用了一種全局優(yōu)化模塊，可以預(yù)測(cè)表面法線并利用其來引導(dǎo)形狀的重建，實(shí)現(xiàn)對(duì)已知表面深度的拓展，還可以利用推算出的遮擋邊界來保持不同物體之間的分離狀態(tài)。

由于研究人員創(chuàng)建的數(shù)據(jù)集存在局限性，比如訓(xùn)練圖片只包含放在地平面上的透明物體，因此初期的 ClearGrasp 算法判斷墻壁等其他表面法線的表現(xiàn)很差。為了改善這一問題，他們?cè)诒砻娣ň€估算訓(xùn)練中加入了 Matterport3D 和 ScanNet 數(shù)據(jù)集中的真實(shí)室內(nèi)場(chǎng)景，雖然沒有透明物體，但針對(duì)真實(shí)場(chǎng)景的訓(xùn)練有效提高了算法估算表面法線的準(zhǔn)確率。

圖 | 三套神經(jīng)網(wǎng)絡(luò)各有不同分工（來源：谷歌 AI）

為了系統(tǒng)分析 ClearGrasp 的性能，研究人員分別利用 RGB-D 數(shù)據(jù)和 ClearGrasp 數(shù)據(jù)構(gòu)造了 3D 點(diǎn)云。點(diǎn)云顯示了算法所生成的 3D 表面形狀干凈且連貫，沒有原始單眼深度估算法中常見的鋸齒狀噪聲，而且還可以分辨復(fù)雜圖案背景下的透明物體，以及區(qū)分相互遮擋的透明物體。

最重要的是，ClearGrasp 輸出深度數(shù)據(jù)可以直接控制依賴于 RGB-D 圖像的機(jī)械臂。

研究人員使用了 UR5 工業(yè)機(jī)械臂進(jìn)行測(cè)試，將其原始傳感器數(shù)據(jù)替換成 ClearGrasp 輸出深度數(shù)據(jù)后，它的透明物體抓取成功率得到了顯著改善：平行夾爪的成功率從 12% 大幅提升到 74%，吸爪的成功率從 64% 提升到 86%。

雖然分辨透明物體的準(zhǔn)確率已經(jīng)有了大幅提升，但新算法仍然有很大的進(jìn)步空間。

研究人員認(rèn)為，受到訓(xùn)練數(shù)據(jù)集和傳統(tǒng)路徑跟蹤及渲染算法的局限性影響，ClearGrasp 仍然不能準(zhǔn)確分辨散焦線，經(jīng)常會(huì)把明亮的散焦線和物體陰影混淆為獨(dú)立的透明物體。這將是未來的重要研究方向之一。

研究人員相信，這項(xiàng)研究成果證明了，基于深度學(xué)習(xí)的深度數(shù)據(jù)重建方法足以勝過傳統(tǒng)方法，使機(jī)器能夠更好地感知透明表面，不僅有望提高 LIDAR 無人駕駛等技術(shù)的安全性，而且還可以在多變的應(yīng)用場(chǎng)景中開啟新的交互方式，讓分類機(jī)器人或者室內(nèi)導(dǎo)航等技術(shù)更加高效和可靠。

編輯：hfy

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

機(jī)器人

機(jī)器人

+關(guān)注

關(guān)注
211

文章
28632

瀏覽量
208267
計(jì)算機(jī)視覺

計(jì)算機(jī)視覺

+關(guān)注

關(guān)注
8

文章
1700

瀏覽量
46108
距離傳感器

距離傳感器

+關(guān)注

關(guān)注
3

文章
76

瀏覽量
15158
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5512

瀏覽量
121490

評(píng)論

相關(guān)推薦

深度數(shù)智DC-ROMA RISC-V Laptop II入選IEEE Spectrum“Top Tech 2025”

重磅消息！深度數(shù)智的DC-ROMARISC-VLaptopII榮登IEEESpectrum“TopTech2025”專欄！這一殊榮意味著深度數(shù)智的產(chǎn)品在全球科技圈中得到了高度認(rèn)可和關(guān)注。這不僅肯定了

發(fā)表于 01-09 17:40 ?317次閱讀

<b class='flag-5'>深度數(shù)</b>智DC-ROMA RISC-V Laptop II入選IEEE Spectrum“Top Tech 2025”

NPU在深度學(xué)習(xí)中的應(yīng)用

設(shè)計(jì)的硬件加速器，它在深度學(xué)習(xí)中的應(yīng)用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對(duì)深度學(xué)習(xí)算

發(fā)表于 11-14 15:17 ?835次閱讀

AI大模型與深度學(xué)習(xí)的關(guān)系

人類的學(xué)習(xí)過程，實(shí)現(xiàn)對(duì)復(fù)雜數(shù)據(jù)的學(xué)習(xí)和識(shí)別。AI大模型則是指模型的參數(shù)數(shù)量巨大，需要龐大的計(jì)算資源來進(jìn)行訓(xùn)練和推理。深度學(xué)習(xí)

發(fā)表于 10-23 15:25 ?1192次閱讀

FPGA做深度學(xué)習(xí)能走多遠(yuǎn)？

并行計(jì)算的能力，可以在硬件層面并行處理大量數(shù)據(jù)。這種并行處理能力使得 FPGA 在執(zhí)行深度學(xué)習(xí)算法時(shí)速度遠(yuǎn)超傳統(tǒng)處理器，能夠提供更低的延遲和

發(fā)表于 09-27 20:53

深度識(shí)別算法包括哪些內(nèi)容

深度識(shí)別算法是深度學(xué)習(xí)領(lǐng)域的一個(gè)重要組成部分，它利用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)輸入數(shù)據(jù)進(jìn)行高層次的理解和

發(fā)表于 09-10 15:28 ?461次閱讀

ESP8266-12退出深度睡眠模式時(shí)掛起怎么解決？

我正在使用 adafruits 的 esp8266 HUZZAH 板（ESP8266-12），該板連接到溫度/濕度傳感器 （DHTxx），該傳感器正在向 thingspeak 發(fā)送溫度/濕度數(shù)據(jù)

發(fā)表于 07-22 06:26

深度學(xué)習(xí)算法在嵌入式平臺(tái)上的部署

隨著人工智能技術(shù)的飛速發(fā)展，深度學(xué)習(xí)算法在各個(gè)領(lǐng)域的應(yīng)用日益廣泛。然而，將深度學(xué)習(xí)算法部署到資源

發(fā)表于 07-15 10:03 ?1673次閱讀

深度學(xué)習(xí)算法在集成電路測(cè)試中的應(yīng)用

隨著半導(dǎo)體技術(shù)的快速發(fā)展，集成電路（IC）的復(fù)雜性和集成度不斷提高，對(duì)測(cè)試技術(shù)的要求也日益增加。深度學(xué)習(xí)算法作為一種強(qiáng)大的數(shù)據(jù)處理和模式識(shí)別工具，在集成電路測(cè)試領(lǐng)域展現(xiàn)出了巨大的應(yīng)用潛

發(fā)表于 07-15 09:48 ?1164次閱讀

利用Matlab函數(shù)實(shí)現(xiàn)深度學(xué)習(xí)算法

在Matlab中實(shí)現(xiàn)深度學(xué)習(xí)算法是一個(gè)復(fù)雜但強(qiáng)大的過程，可以應(yīng)用于各種領(lǐng)域，如圖像識(shí)別、自然語言處理、時(shí)間序列預(yù)測(cè)等。這里，我將概述一個(gè)基本的流程，包括環(huán)境設(shè)置、數(shù)據(jù)準(zhǔn)備、模型設(shè)計(jì)、訓(xùn)

發(fā)表于 07-14 14:21 ?2426次閱讀

深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

應(yīng)用中往往難以實(shí)現(xiàn)。因此，無監(jiān)督學(xué)習(xí)在深度學(xué)習(xí)中扮演著越來越重要的角色。本文旨在綜述深度學(xué)習(xí)中的無監(jiān)督學(xué)

發(fā)表于 07-09 10:50 ?917次閱讀

深度學(xué)習(xí)與nlp的區(qū)別在哪

方法，它通過模擬人腦的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，實(shí)現(xiàn)對(duì)數(shù)據(jù)的自動(dòng)特征提取和學(xué)習(xí)。深度學(xué)習(xí)的核心是構(gòu)建多層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，每一層都包含大量的神經(jīng)元，這些神經(jīng)元通過權(quán)重連接，實(shí)現(xiàn)對(duì)輸入

發(fā)表于 07-05 09:47 ?1051次閱讀

深度學(xué)習(xí)的基本原理與核心算法

隨著大數(shù)據(jù)時(shí)代的到來，傳統(tǒng)機(jī)器學(xué)習(xí)方法在處理復(fù)雜模式上的局限性日益凸顯。深度學(xué)習(xí)（Deep Learning）作為一種新興的人工智能技術(shù)，以其強(qiáng)大的非線性表達(dá)能力和自

發(fā)表于 07-04 11:44 ?2434次閱讀

深度學(xué)習(xí)模型訓(xùn)練過程詳解

深度學(xué)習(xí)模型訓(xùn)練是一個(gè)復(fù)雜且關(guān)鍵的過程，它涉及大量的數(shù)據(jù)、計(jì)算資源和精心設(shè)計(jì)的算法。訓(xùn)練一個(gè)深度學(xué)習(xí)

發(fā)表于 07-01 16:13 ?1482次閱讀

深度解析深度學(xué)習(xí)下的語義SLAM

隨著深度學(xué)習(xí)技術(shù)的興起，計(jì)算機(jī)視覺的許多傳統(tǒng)領(lǐng)域都取得了突破性進(jìn)展，例如目標(biāo)的檢測(cè)、識(shí)別和分類等領(lǐng)域。近年來，研究人員開始在視覺SLAM算法中引入深度

發(fā)表于 04-23 17:18 ?1374次閱讀

為什么深度學(xué)習(xí)的效果更好？

，這些原則和進(jìn)步協(xié)同作用使這些模型異常強(qiáng)大。本文探討了深度學(xué)習(xí)成功背后的核心原因，包括其學(xué)習(xí)層次表示的能力、大型數(shù)據(jù)集的影響、計(jì)算能力的進(jìn)步、算法

發(fā)表于 03-09 08:26 ?681次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

基于深度學(xué)習(xí)的收集透明物體深度數(shù)據(jù)的光學(xué)傳感器算法

評(píng)論

深度數(shù)智DC-ROMA RISC-V Laptop II入選IEEE Spectrum“Top Tech 2025”

NPU在深度學(xué)習(xí)中的應(yīng)用

AI大模型與深度學(xué)習(xí)的關(guān)系

FPGA做深度學(xué)習(xí)能走多遠(yuǎn)？

深度識(shí)別算法包括哪些內(nèi)容

ESP8266-12退出深度睡眠模式時(shí)掛起怎么解決？

深度學(xué)習(xí)算法在嵌入式平臺(tái)上的部署

深度學(xué)習(xí)算法在集成電路測(cè)試中的應(yīng)用

利用Matlab函數(shù)實(shí)現(xiàn)深度學(xué)習(xí)算法

深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

深度學(xué)習(xí)與nlp的區(qū)別在哪

深度學(xué)習(xí)的基本原理與核心算法

深度學(xué)習(xí)模型訓(xùn)練過程詳解

深度解析深度學(xué)習(xí)下的語義SLAM

為什么深度學(xué)習(xí)的效果更好？