色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

EmerNeRF:全面基于NeRF的自動駕駛仿真框架,無需分割

3D視覺工坊 ? 來源:計算機視覺工坊 ? 2023-11-21 10:23 ? 次閱讀

0. 筆者個人體會

自動駕駛中,感知、表示和重建動態場景對于代理程序理解并與其環境進行交互至關重要。傳統的仿真框架大多強依賴于識別跟蹤等感知模塊的有監督學習,這樣在數據集層面上限制了模型表示各種復雜場景的能力。這幾年中NeRF(神經輻射場)的爆炸式發展也逐漸融入了自動駕駛行業,然而當前端到端的以NeRF為基礎自動駕駛方針框架并不多。

本文將介紹最近英偉達開源的框架EmerNeRF。不同于之前依然需要實例分割標簽的框架,EmerNeRF進一步擺脫了圖像以外訓練標簽的需求。這里也推薦工坊推出的新課程《深度剖析面向自動駕駛領域的車載傳感器空間同步(標定)》。

1. 效果展示

EmerNeRF 可以模擬車靜止、高速時的場景,在相機曝光不匹配、復雜的天氣干擾、以及復雜光照差異下都可以工作。206ec9e0-880d-11ee-939d-92fbcf53809c.png

EmerNeRF剛剛開源,并提供了復雜場景數據集NOTR,有多種玩法。

2. 摘要

本文提出的EmerNeRF基于NeRF,可以自監督地同時捕獲野外場景的幾何形狀、外觀、運動和語義。EmerNeRF將場景分層為靜態場和動態場,在instant-NGP對三維空間進行Hash的基礎上,多尺度增強動態對象的渲染精度。通過結合靜態場、動態場和光流(場景流)場,EmerNeRF能夠在不依賴于有監督動態對象分割或光流估計的前提下表示高度動態的場景,并實現了最先進的性能。

3. 算法解析

EmerNeRF為得到四維的時空表示,將整體場景分解為一個表征背景的靜態場,一個構成動態前景的動態場,一個表征運動的光流場和一個天空預測的模塊構成。具體地,所有分解后的輻射場都以instant-NGP為backbone,也即使用可微的hash grids參數化每個神經輻射場。靜態場的輸入僅有位置,動態場與光流場的輸入則為位置與相應的時間。

20be1900-880d-11ee-939d-92fbcf53809c.png

后半部分的多頭解碼器則全部由MLP完成,這里為了達到合成的目的,比instant-NGP多出了一個預測shadow ratio的頭。這個0到1之間的shadow ratio 用來控制動態前景體素與靜態背景體素間的合成比例。另外,基于靜態場的體素占比總體場景體素較大的假設,EmerNeRF在NeRF的基礎損失上額外加了一項動態體素密度的約束。這種設計不再需要預先做額外的實例分割,充分利用了NeRF本身的特性。

場景流估計

為了進一步解除密集的光流標簽監督,EmerNeRF使用了假設,多幀特征聚合只對temporally-consistent的特征有效。因此,額外的場景流分支不僅要學習動態物體間的關系,還要能夠有效聚合幀間關系,以便讓RGB信息能夠監督光流。具體地,還是采取hash grid + MLP的組合,這里的MLP輸出為6維,包含前向3維和反向3維的轉移預測。而特征聚合則是采用了當前時間戳與前后共三步的特征加權平均值。

解決一下使用ViT中位置編碼的問題

單純使用NeRF輸出顏色場和體素密度場,還達不到仿真的要求。為了能給有關語義場景理解任務鋪好路,EmerNeRF將2D視覺基礎模型(Vision Foundation Model)應用到4D的時空數據。然而在使用目前最先進的模型例如DINOv2時,Positional Embedding(PE)的feature pattern 不太正常:

20e513ca-880d-11ee-939d-92fbcf53809c.png

無論 3D 視點如何變化,feature pattern卻在圖像中保持固定,從而破壞了3D 多視圖一致性。

EmerNeRF基于 ViT 提取特征的觀察 逐圖像進行映射,并且這些 PE pattern在不同圖像中顯示(幾乎)一致。這表明單個PE pattern可能足以表示此共享的現象。因此,這里假設PE pattern為一個加性噪聲模型,這樣從原始特征中減去就能獲得無PE特征。有了這個假設,我們構造可學習且全局共享的 2D 特征圖 U 來作為補償。

218d358c-880d-11ee-939d-92fbcf53809c.png

對于目標像素坐標(u, v),首先對無 PE 特征進行體積渲染,然后對U進行雙線性插值并使用單層MLP解碼得到PE pattern特征,然后將其添加到無PE特征中。

4. 實驗

在Waymo公開數據集的基礎上,本文提出新數據集NeRF On-The-Road (NOTR)。

NOTR包含120個獨特的駕駛序列,分為32個靜態場景、32個動態場景和56個包含七種挑戰條件的場景:靜態、高速、曝光不匹配、黃昏/黎明、陰天、多雨和夜間。

駕駛感知任務:動態物體的邊界框,地面真實的3D場景流動以及3D語義占用。我們希望這個數據集能夠促進NeRF在駕駛場景中的研究,將NeRF的應用從僅僅的視圖合成擴展到運動理解,例如3D流動,以及場景理解,比如語義。

場景分類NOTR 靜態場景遵循StreetSuRF中提出的劃分,其中包含沒有移動物體的干凈場景。動態場景,這些場景在駕駛記錄中經常出現,是根據光照條件選擇的,以區分它們與“多樣化”類別中的場景。Diverse-56樣本也可能包含動態物體,但它們主要基于自車狀態(例如,自車靜止、高速、相機曝光不匹配)、天氣條件(例如,雨天、昏暗)、以及光照差異(例如,夜晚、黃昏/黎明)進行劃分。

渲染實驗包含了靜態,動態的新視角合成評估

在場景分解上,EmerNeRF主要與D^2 NeRF 與HyperNeRF相比較,在靜態和動態的圖像合成任務上均領先。

21b111fa-880d-11ee-939d-92fbcf53809c.png

隱式場景流任務

在場景流估計任務上, EmerNeRF主要與目前僅有的工作NSFP(Neural scene flow prior)相比較,并采用相同的評估指標:

3D端點誤差(EPE3D),計算為所有點預測值與實際地面真實值之間的平均L2距離;

Acc5,代表EPE3D小于5厘米或相對誤差在5%以下的點的比例;

Acc10,表示EPE3D小于10厘米或相對誤差在10%以下的點的比例;

θ,表示預測值與地面真實值之間的平均角度誤差。比較結果如下:

21c62db0-880d-11ee-939d-92fbcf53809c.png

下游感知任務

為了調查ViT位置編碼模式對三維感知和特征合成的影響,這里的ablation study主要比較是否帶有本文提出的位置編碼分解模塊對于下游任務的影響。這里采用了few-shot的occupancy估計,這里使用的Occ3D數據集為不同尺寸occupancy 提供了語義標注。對于每個序列,妹隔10幀允許帶著標簽,這樣產生10%的有標簽數據。占用的坐標是輸入到預訓練的EmerNeRF模型以計算每個類的特征centroid。然后剩余 90% 的幀用于query,并根據其最近的特征質心進行分類。

21debff6-880d-11ee-939d-92fbcf53809c.png

PE改進的ablation study

通過比較包含 PE 和無 PE 模型的特征 PSNR,能夠發現使用EmerNeRF中提出的PE分解方法時特征合成質量顯著提高,尤其對于 DINOv2。而DINOv1受 PE 模式的影響較小。這里也推薦工坊推出的新課程《深度剖析面向自動駕駛領域的車載傳感器空間同步(標定)》。

222c1580-880d-11ee-939d-92fbcf53809c.png

5. 總結

今天筆者為大家介紹了一種基于NeRF的簡單而強大的自動駕駛仿真框架 EmerNeRF。EmerNeRF 解決了基于 Transformer 的框架中特征時出現的問題性位置嵌入模式。由于使用NeRF的思路,EmerNeRF在靜態場景重建、新視角合成還是場景流估計方面都是以自監督的方式學習的,而無需依賴于地面真實對象標注或預先訓練的模型。同時,EmerNeRF 在傳感器模擬方面表現出色,可以處理文中提出的NOTR數據集中具有挑戰性的駕駛場景。







審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • RGB
    RGB
    +關注

    關注

    4

    文章

    801

    瀏覽量

    58625
  • 自動駕駛
    +關注

    關注

    784

    文章

    13916

    瀏覽量

    166776
  • Hash算法
    +關注

    關注

    0

    文章

    43

    瀏覽量

    7407
  • 車載傳感器
    +關注

    關注

    0

    文章

    44

    瀏覽量

    4369
  • MLP
    MLP
    +關注

    關注

    0

    文章

    57

    瀏覽量

    4260

原文標題:英偉達最新開源|EmerNeRF:全面基于NeRF的自動駕駛仿真框架,無需分割

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    FPGA在自動駕駛領域有哪些應用?

    。未來,FPGA將會更多地應用于自動泊車、自動剎車、防碰撞、自動駕駛拐彎等領域,為自動駕駛的實現提供更加全面和強大的支持。同時,隨著技術的不
    發表于 07-29 17:09

    FPGA在自動駕駛領域有哪些優勢?

    。 長期可維護性: 隨著自動駕駛技術的不斷發展和更新,系統需要經常進行維護和升級。FPGA的可編程性和可配置性使得系統維護和升級變得更加容易和靈活。用戶可以通過重新編程FPGA來更新算法或優化性能,而無需
    發表于 07-29 17:11

    【話題】特斯拉首起自動駕駛致命車禍,自動駕駛的冬天來了?

    `特斯拉首起自動駕駛致命車禍,自動駕駛的冬天來了?“一個致命的事故一定是由多個小的錯誤組成的。”  7月初,特斯拉發表博客敘述了NHTSA(美國國家公路交通安全管理局)正在著手調查第一起Tesla
    發表于 07-05 11:14

    自動駕駛真的會來嗎?

    ,包括進行3D雷達開發,進行360度探測,獲得更完整、全面的數據。但大家也知道新型硬件方面成本居高不下,需要時間等到硬件成本不斷降低,才能廣泛應用。”張璐介紹說:  她稱在特斯拉事故之后,圍繞自動駕駛
    發表于 07-21 09:00

    自動駕駛的到來

      傳統汽車廠商更趨向于通過技術的不斷積累,場景的不斷豐富,逐步從輔助駕駛過渡到半自動駕駛,進而在將來最終實現無人駕駛;某些高科技公司則希望通過各種外部傳感器實時采集海量數據,處理器經過數據分析然后
    發表于 06-08 15:25

    AI/自動駕駛領域的巔峰會議—國際AI自動駕駛高峰論壇

    由南德意志出版及活動有限公司舉辦的 國際AI自動駕駛高峰論壇 將于 2017年11月28/29日 在 德國慕尼黑 舉辦,中德聯合股份公司作為中國獨家合作伙伴,誠邀您撥冗蒞臨!【活動背景】AI
    發表于 09-13 13:59

    如何讓自動駕駛更加安全?

    的博園路和北安德路之間,有一段長約5.6公里的公共道路,這是一條全面支持車對車信息交換的智能道路。獲得測試牌照的自動駕駛汽車,正是在這條開放的路上進行路測。專家認為,自動駕駛技術是多選擇、交叉性、綜合性
    發表于 05-13 00:26

    自動駕駛汽車的處理能力怎么樣?

    作在未來20 - 30年中,自動駕駛汽車(AV)將改變我們的駕駛習慣、運輸行業并更廣泛地影響社會。 我們不僅能夠將汽車召喚到我們的家門口并在使用后將其送走,自動駕駛汽車還將挑戰個人擁有汽車的想法,并
    發表于 08-07 07:13

    自動駕駛系統要完成哪些計算機視覺任務?

    Geiger 的研究主要集中在用于自動駕駛系統的三維視覺理解、分割、重建、材質與動作估計等方面。他主導了自動駕駛領域著名數據集 KITTI 及多項自動駕駛計算機視覺任務的基準體系建設,
    發表于 07-30 06:49

    自動駕駛系統設計及應用的相關資料分享

    作者:余貴珍、周彬、王陽、周亦威、白宇目錄第一章 自動駕駛系統概述1.1 自動駕駛系統架構1.1.1 自動駕駛系統的三個層級1.1.2 自動駕駛系統的基本技術架構1.2
    發表于 08-30 08:36

    自動駕駛技術的實現

    k隨著汽車電子的日益復雜化以及汽車電子電氣架構(EEA)的升級,人們對于聯網智能汽車的需求也在逐步上升,大量先進技術往汽車上應用,如高級駕駛輔助系統(ADAS)、自動駕駛等,這些新技術也對車載網絡
    發表于 09-03 08:31

    美國自動駕駛政策框架發布,自動駕駛立法國際呼聲高漲

    發聲,發布自動駕駛政策框架, 旨在從政策法規層面破除自動駕駛行業發展障礙 , 以實現美國自動駕駛技術全面部署。 我國在
    的頭像 發表于 03-17 17:02 ?2600次閱讀

    自動駕駛仿真工具

    仿真平臺側重于提供虛擬場景的搭建,以測試自動駕駛軟件的性能,第一類是專門的自動駕駛模擬仿真軟件,如Prescan、 VTD、51sim-one、Panosim、GaiA等等。第二類是
    發表于 06-01 14:31 ?1次下載
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>仿真</b>工具

    Autoware自動駕駛框架介紹

    之前巴拉過百度Apollo自動駕駛的學習資料, 最近看ROS的時候,發現也有一個針對自動駕駛框架Autoware,今天就來分享下Autoware.
    發表于 06-02 14:40 ?1次下載
    Autoware<b class='flag-5'>自動駕駛</b><b class='flag-5'>框架</b>介紹

    自動駕駛場景圖像分割(Unet)

    本文使用matlab環境,測試了自動駕駛場景的圖像分割任務。分割網絡使用Unet。 一千張標注圖像,最終訓練精度達到 90%。 ? ?數據準備 場景預標注數據下載地址: Semantic
    發表于 06-07 11:58 ?0次下載
    <b class='flag-5'>自動駕駛</b>場景圖像<b class='flag-5'>分割</b>(Unet)
    主站蜘蛛池模板: 国产一区免费在线观看| oldgrand欧洲老妇人| 女bbbbxxx孕妇| 国产手机在线视频| 99热在线精品免费全部my| 亚洲欧洲自拍偷拍| 色婷婷粉嫩AV精品综合在线| 老师你下面好紧夹死了| 国产日韩欧美另类| jazzjazzjazz欧美| 一二三四免费中文在线1| 世界第一黄暴漫画家| 欧美Av无码高清在线| 久久国产影院| 国产午夜在线观看视频| 成人在线视频网站| 97人人碰免费视频公开| jiapanese50欧美熟妇| 伊人综合在线22| 武侠古典久久亚洲精品| 日本韩国欧美一区| 免费啪视频观试看视频| 精品久久久无码21P发布| 在线观看a视频| 亚洲AV综合99一二三四区| 日本亚洲中文字幕无码区| 男女交性视频无遮挡全过程| 久久久久久免费观看| 国产一区二区在线观看免费| 国产精品视频一区二区猎奇| 高龄熟女50P| 高清午夜福利电影在线| 成人在线小视频| 动漫美女喷水| 成人精品视频在线观看| 把手戳进美女尿口里动态图| a在线免费观看视频| avv天堂| 99婷婷久久精品国产一区二区| 7723日本高清完整版在线观看| 最新无码国产在线视频9299|