色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

港中文等發(fā)布MagicDrive:日夜、雨晴、多視角全覆蓋,人、物位置隨意變更

CVer ? 來源:新智元 ? 2023-10-20 16:18 ? 次閱讀

efaf7ad2-6f13-11ee-939d-92fbcf53809c.gif

【導讀】MagicDrive可以細粒度生成高保真、多相機街景,可以隨意變換天氣、光照條件以及人物位置,海量自動駕駛數(shù)據(jù)觸手可及!

深度學習算法的應用中,高質(zhì)量的數(shù)據(jù)是技術(shù)創(chuàng)新的關(guān)鍵驅(qū)動力,尤其在自動駕駛領(lǐng)域,獲取和標注3D感知數(shù)據(jù)的成本不菲,對于許多研究者和開發(fā)者來說都是一個重大挑戰(zhàn)。

為此,來自香港中文大學、香港科技大學和華為諾亞方舟實驗室的研究人員聯(lián)合提出了基于 Diffusion的3D自動駕駛數(shù)據(jù)生成方法MagicDrive。

通過多種3D幾何條件的細粒度控制,MagicDrive在生成高保真多相機街景圖像的同時,還能夠支持多種下游感知任務的訓練。

efd1f9ea-6f13-11ee-939d-92fbcf53809c.png

論文地址:https://arxiv.org/abs/2310.02601

項目主頁:https://gaoruiyuan.com/magicdrive/

Github: https://github.com/cure-lab/MagicDrive

?MagicDrive多樣化生成數(shù)據(jù)

MagicDrive是一個突破性的解決方案利用可控生成技術(shù)合成自動駕環(huán)視相機視圖,生成更多樣化的自動駕駛數(shù)據(jù),為自動駕駛場景仿真提供了新思路。

efe7a682-6f13-11ee-939d-92fbcf53809c.gif

先來看一些MagicDrive的生成效果。

多視角下,前景和背景都能保持一致性:

effec998-6f13-11ee-939d-92fbcf53809c.png

可以一鍵轉(zhuǎn)雨天:

f00cc6c4-6f13-11ee-939d-92fbcf53809c.png

不止生成車,人、障礙物都能準確控制位置:

f01a1e6e-6f13-11ee-939d-92fbcf53809c.png

還可以一鍵轉(zhuǎn)夜晚:

f03233fa-6f13-11ee-939d-92fbcf53809c.png

物體位置可以實現(xiàn)細粒度控制:

f03b78f2-6f13-11ee-939d-92fbcf53809c.gif

?

?關(guān)鍵問題:多種3D條件的編碼與注入

描述自動駕駛場景的條件是多維度的,包括:相機參數(shù)、物體框、路面地圖以及對場景屬性的語言描述(比如天氣和時間)。如何將如此復雜的場景信息同時作為條件指導生成,是3D自動駕駛街景數(shù)據(jù)合成的重點問題。

BEVGen[1]將3D幾何信息(路面和物體位置)都投影在BEV空間中,這會丟失全部高度信息,既無法控制物體高度/遮擋,也無法體現(xiàn)路面起伏;BEVControl[2]將3D幾何信息分別投影在相機視圖中,對于沒有高度信息的路面地圖而言,投影本身就是一個欠定義的問題,而且這種做法丟失了深度信息,同樣無法準確控制遮擋。

f063e59e-6f13-11ee-939d-92fbcf53809c.png

?

3D幾何信息與不同2D投影(相機投影/BEV)控制的比較

MagicDrive在完整考慮這些控制條件的基礎(chǔ)上,首次實現(xiàn)3D幾何的直接控制。MagicDrive結(jié)合Diffusion Model進行條件生成的優(yōu)勢,根據(jù)每個控制條件的形式,采用不同的方法對生成進行控制。

f070217e-6f13-11ee-939d-92fbcf53809c.png

MagicDrive的方法框架

具體來說,對于場景級別的信息(語言描述和相機參數(shù))和物體框信息,由于他們具有可變長的性質(zhì),MagicDrive先使用不同的編碼器講輸入數(shù)據(jù)編碼成嵌入序列,然后使用交叉注意力模塊控制圖像生成過程;

對于路面地圖信息,BEV能夠很好地將路面表示成圖像的形式,因此,使用類似ControlNet[3]的額外編碼器分支,就能夠讓生成遵循路面地圖的條件。

刪繁就簡:不同視角的一致性生成

多視角一致性是3D場景相機視圖生成的另一個重要要求。此前,已經(jīng)有一些工作探索了室內(nèi)場景中的多視角一致性約束方法,例如:MVDiffusion[5]和[6],但室內(nèi)場景通常視角之間重疊較大,因此他們借助了不同的幾何先驗來限制視角之間的關(guān)系。

對于自動駕駛場景,不同相機之間重疊程度是有限的,因此并不需要過強的幾何約束。相反,在幾何條件足夠的情況下(即不同視角已經(jīng)有獨立的幾何條件信息),只需要讓不同視角的生成過程有信息交互,就能夠保證前景和背景的一致生成。

因此MagicDrive提出cross-view attention模塊,用于在各個視角的生成過程中與左右相鄰視角交換信息,確保了從多個視角看到的前景和背景是一致的,這大大提高了數(shù)據(jù)的真實性與可靠性。

f085263c-6f13-11ee-939d-92fbcf53809c.png

Corss-view attention 模塊控制多視角的一致性

生成效果:在多個下游任務上提升明顯

用以真實圖像訓練的感知模型評價生成模型產(chǎn)生的圖片,MagicDrive不僅可以在BEV分割任務上超過baseline,并且能夠直接支持3D物體檢測任務,體現(xiàn)出優(yōu)越的生成效果。

MagicDrive生成的圖片還可以直接用于數(shù)據(jù)增強,支持BEV分割和3D物體檢測任務,提升BEVFusion[6]和CVT[7]的性能。

除此之外,MagicDrive的多條件控制還可以實現(xiàn)場景、背景和前景的多層次街景圖像編輯,用來生成更多的新街景圖像。

更多評價結(jié)果與討論請參考原論文。

總結(jié)

總的來說,MagicDrive帶給我們一個全新的、高效的數(shù)據(jù)生成途徑。不僅成功解決了之街景生成中的3D幾何控制問題,而且提供了一種全新的方法,利用細粒度可控生成技術(shù)為3D自動駕駛產(chǎn)生訓練數(shù)據(jù),生成數(shù)據(jù)的質(zhì)量和真實性向自動駕駛的感知技術(shù)注入了新的活力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2721

    瀏覽量

    47567
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2894

    瀏覽量

    107655
  • 自動駕駛
    +關(guān)注

    關(guān)注

    784

    文章

    13867

    瀏覽量

    166604

原文標題:自動駕駛數(shù)據(jù)不用愁!港中文等發(fā)布MagicDrive:日夜、雨晴、多視角全覆蓋,人、物位置隨意變更

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【Tisan聯(lián)網(wǎng)申請】戶外集

    申請理由:由于傳統(tǒng)的采都是人工的,既費時費力,而且效率不高,基于單片機控制的集器不僅能自動采集雨水,而且還自動換瓶,省時省力。項目描述:由于有多個采樣地點,同時控制集板的開合不太容易,基于
    發(fā)表于 11-16 11:17

    工廠車間無線WiFi覆蓋解決方案

    都是在一個AP覆蓋下,手持設(shè)備和移動終端隨意移動,不會出現(xiàn)跨AP切換斷線或延時的問題,真正意義上的零延時零切換。扇區(qū)覆蓋的缺點:  適合于敞開的車間、倉庫、貨場,中間不能有橫墻或隔斷
    發(fā)表于 08-11 17:15

    定制段碼液晶屏如何確認視角反向?

    的是視角就是有LCD顯示屏安裝在儀器上的位置來確定的,(如:計算器一般是放在桌子上或握在手上,這種做6:00視角比較好,有些LCD液晶屏是安裝在低于
    發(fā)表于 07-08 09:13

    G104XVN01.0?友達10.4寸高清視角工業(yè)顯示屏

    G104XVN01.0?友達10.4寸高清視角工業(yè)顯示屏一、友達10.4寸液晶屏G104XVN01.0應用詳情品牌:友達型號名稱:G104XVN01.0屏幕類型:a-Si TFT-LCD , 液晶
    發(fā)表于 03-16 10:02

    中文C語言編程玩轉(zhuǎn)聯(lián)網(wǎng)華為鴻蒙Hi3861開發(fā)-基礎(chǔ)案例合集

    繼《一套支持中文C語言編程的鴻蒙Hi3861智能硬件開發(fā)套件》發(fā)布后,中文C語言編程玩轉(zhuǎn)聯(lián)網(wǎng)華為鴻蒙Hi3861開發(fā),多個基礎(chǔ)案例視頻,包括交通紅綠燈、數(shù)碼管、光電開關(guān)、手指偵測心率
    發(fā)表于 05-08 23:50

    指示器電路圖

    指示器電路圖
    發(fā)表于 04-13 09:26 ?809次閱讀
    <b class='flag-5'>晴</b><b class='flag-5'>雨</b>指示器電路圖

    霓虹燈控制器電路圖

    霓虹燈控制器電路圖
    發(fā)表于 06-16 15:46 ?983次閱讀
    霓虹燈<b class='flag-5'>晴</b><b class='flag-5'>雨</b>控制器電路圖

    熵加權(quán)視角核K-means算法

    在基于視角加權(quán)的視角聚類中,每個視角的權(quán)重取值對聚類結(jié)果的精度都有著重要的影V向。針對此問題,提出熵加權(quán)
    發(fā)表于 12-17 09:57 ?1次下載

    基于視角相容性的視角數(shù)據(jù)缺失補全

    隨著信息技術(shù)的快速發(fā)展,現(xiàn)實生活中不斷涌現(xiàn)出大量的視角數(shù)據(jù),由此應運而生的視角學習已成為機器學習領(lǐng)域的研究熱點.然而,在數(shù)據(jù)獲取過程中,由于收集的難度、高額成本或設(shè)備故障
    發(fā)表于 12-18 10:46 ?1次下載

    基于源數(shù)據(jù)融合高時空分辨率分類

    高時空分辨率分類與交通、旅游、農(nóng)業(yè)灌溉及人們?nèi)粘3鲂卸济芮邢嚓P(guān),然而天有不測風云,東邊日頭西邊。準確的高時空分辨率分類是極具挑戰(zhàn)性
    發(fā)表于 12-25 11:48 ?0次下載
    基于<b class='flag-5'>多</b>源數(shù)據(jù)融合高時空分辨率<b class='flag-5'>晴</b><b class='flag-5'>雨</b>分類

    瓶制作方法

    感覺淘寶賣的瓶不值那個價格,今天上午用白熾燈泡做了一個試試看效果。
    的頭像 發(fā)表于 09-14 14:08 ?4485次閱讀

    北京聯(lián)通實現(xiàn)了五個5G覆蓋

    今年全國兩會,北京聯(lián)通實現(xiàn)了“五個5G覆蓋”,滿足 “四個”新媒體需求,即:兩會會場區(qū)域5G覆蓋;大會堂部長通道/媒體展示廳/金色大廳
    發(fā)表于 03-19 13:41 ?1588次閱讀

    如何實現(xiàn)大區(qū)域聯(lián)網(wǎng)的低成本覆蓋

    低功耗廣域網(wǎng)(LPWAN)技術(shù)是近年國際上一種革命性的聯(lián)網(wǎng)接入技術(shù),具有遠距離、低功耗、低運維成本特點,可以真正實現(xiàn)大區(qū)域聯(lián)網(wǎng)低成本覆蓋
    的頭像 發(fā)表于 07-21 10:11 ?4373次閱讀

    行業(yè)首款RISC-V聯(lián)網(wǎng)安全芯片“華芯”正式發(fā)布

    近日,由華集團主辦的“‘華芯’產(chǎn)品發(fā)布會暨合作伙伴戰(zhàn)略合作發(fā)布會”隆重舉行。賽昉科技、微五科技、紫光展銳、海思、移遠通信、中移聯(lián)、中國
    的頭像 發(fā)表于 12-15 10:04 ?910次閱讀
    行業(yè)首款RISC-V<b class='flag-5'>物</b>聯(lián)網(wǎng)安全芯片“<b class='flag-5'>港</b>華芯”正式<b class='flag-5'>發(fā)布</b>

    洪水資源管理遠程監(jiān)控平臺

    數(shù)據(jù)必將耗費大量人力物力。 通過EMCP聯(lián)網(wǎng)云平臺搭建的洪水遠程監(jiān)測預警系統(tǒng),實現(xiàn)以水庫(河道)水雨情信息“全要素、量程、覆蓋”自動
    的頭像 發(fā)表于 11-06 17:17 ?555次閱讀
    <b class='flag-5'>雨</b>洪水資源管理遠程監(jiān)控平臺
    主站蜘蛛池模板: 灌饱娇嫩H将军公主最新章节| 精品日产1区2卡三卡麻豆| 蜜臀AV999无码精品国产| 综合伊人久久| 日本一卡二卡三卡四卡无卡免费播放 | 女人被躁到高潮嗷嗷叫69| 国产亚洲精品久久久久小| 久久国产精品萌白酱免费| 成年黄网站免费大全毛片| 最近的中文字幕免费完整| 亚洲第一成年人网站| 日韩人妻少妇一区二区三区| 男人的天堂色| 老熟人老女人国产老太| 狠狠色丁香婷婷久久综合五月| 高清视频在线观看SEYEYE| adc网址在线观看| 中国字字幕在线播放2019| 亚洲无线观看国产| 校园全肉高h湿一女多男| 日本工口生肉全彩大全| 免费观看的毛片| 久久是热频国产在线| 国产亚洲精品在浅麻豆| 观看免费做视频| 成人综合在线视频免费观看完整版| 最近中文字幕2019免费版日本| 亚洲欧美日韩国产另类电影| 亚欧免费观看在线观看更新| 色综合久久中文色婷婷| 青青娱乐网| 欧美三级aaa| 欧美国产一区二区三区激情无套| 久久99这里只有精品| 黑人娇小BBW| 果冻传媒9CM在线观看| 国产亚洲精品在线视频| 国产原创中文视频| 国精产品一区二区三区有限公司| 国产精品麻豆高潮刺激A片| 国产成人精品三级在线|