基于傳感器的掃描技術已經可以很成功的重建室內場景,但在這些掃描方案的應用中,鏡子和玻璃等表面的重建成了顯著的問題,一個鏡子會在其中形成現實世界的鏡像,而對于掃描系統來說,鏡像世界和現實世界實際上很難區分,玻璃也會產生與鏡子很相似的效果,然而這兩者都是在掃描生活場景是不可避免的成分,由于它們造成的困難,最近場景重建方法(如Matterport3D)甚至都需要用戶在掃描時手動選擇窗戶和鏡子。
最近,Facebook的研究人員發表了一篇論文,用于在掃描過程中自動識別鏡子和玻璃等容易產生鏡像的表面,并且對該表面平面實現精確的識別和邊界的檢測。
根據論文,Facebook的研究人員采用的是一種稱為AprilTag的標記方案。這個AprilTag實際上是一種用于機器人視覺等的技術,看起來就像是一個二維碼,在機器人視覺的運用中,AprilTag可以貼于障礙物上,傳感器對這個“二維碼”進行識別,就可以了解前方的障礙,并做出應對。
在論文中,對AprilTag的運用更有趣一些,簡單地說,它沒有選擇將AprilTag貼在鏡子和玻璃表面再由掃描設備識別(可能這樣還不如直接在掃描過程中選擇鏡面方便),而是在掃描裝置的下方的一個畫有AprilTag的薄片上,對于可以形成鏡像的物品,掃描設備即可識別鏡像中的AprilTag,對于不能形成鏡像的物品,就沒有AprilTag的鏡像了。
關于鏡面表面和邊緣的識別,鏡面表面是通過將Slam裝置精確的姿勢估計和觀測AprilTag的鏡面圖像在空間的移動兩者結合起來運算得到的。
而對于的邊緣的識別,則是依靠多個功能通道的識別實現的,其中包括幾何識別、圖像強度識別、AprilTag特征識別等等,通過將這些不同特征的識別計算,即可估計出鏡面邊緣的位置和樣式,這還被用來區分玻璃和鏡面的反射,因為玻璃的反射更模糊,圖像范圍更大,而鏡面反射則更加保真。
當然這里只是簡單的解釋,實際上,為了均勻的鏡面反射和更好地識別,對于照明光線、畫有AprilTag的薄片的組成都有更為嚴謹的要求,而如果去看鏡面表面識別和邊緣估計的論文部分,就會看到大量的公式計算。
那么,這種方法的效果如何呢?Facebook的研究人員在i7-5930K 、NVIDIA TITAN Xp GPU和Ubuntu16.04的環境下實現了重建系統的配備,其中深度圖的分辨率為960×640像素,RGB圖像的分辨率為1224×1024像素。包括深度提取,深度融合,幾何使用雙輪廓提取,紋理生成在內的重建系統可以在在大約37Hz的頻率下運行;在使用12個線程時,系統可以以大約70Hz估算RGB圖像中的AprilTag位置。
另外,對于邊界提取的特征計算在大約38Hz的頻率下運行;邊界分割優化的吞吐量是每秒60k像素,640×480像素的特征通道集需要約5.12秒進行分割,在700幀下重建一面面積大約0.5平方米的鏡子大約需要90秒,而且單個鏡面觀察的幾何誤差基本始終為零。
這種方法當然也有它的局限性,首先它對于無框鏡面或者遮擋鏡面的邊緣識別并不好;再者,由于它對鏡面的識別完全基于AprilTag,如果輸入裝置沒有觀測到或者無法識別圖像質量很差的AprilTag,那對于鏡面的重建就會出現問題。比如雖然這種方法可以在單個的觀察中精確觀測鏡面,但它在門、玻璃、或者是彎曲非常嚴重的表面(凸面鏡、凹面鏡等)的觀測效果很明顯更差,就是由于檢測到的AprilTag的投影位置變化、扭曲了的緣故;另外,如果掃描裝置快速移動,也有可能會造成AprilTag圖像的失真,系統無法檢測到該圖像,導致重建失敗。
-
自動識別
+關注
關注
3文章
222瀏覽量
22857 -
Facebook
+關注
關注
3文章
1429瀏覽量
54874 -
機器人視覺
+關注
關注
0文章
48瀏覽量
10110
原文標題:Facebook新論文說明對鏡面在虛擬場景中的重建
文章出處:【微信號:ARchan_TT,微信公眾號:AR醬】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論