色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

高分工作!Uni3D:3D基礎(chǔ)大模型,刷新多個SOTA!

CVer ? 來源:CVer ? 2024-01-30 15:56 ? 次閱讀

我們近期的工作:3D視覺大模型Uni3D在ICLR 2024的評審中獲得了688分,被選為Spotlight Presentation

02be4964-b8ed-11ee-8b88-92fbcf53809c.jpg

在本文中,我們第一次將3D基礎(chǔ)模型成功scale up到了十億(1B)級別參數(shù)量,并使用一個模型在諸多3D下游應(yīng)用中取得SoTA結(jié)果。代碼和各個scale的模型(從6M-1B)均已開源,歡迎大家關(guān)注和使用:

論文:https://https://arxiv.org/pdf/2310.06773

代碼:https://https://github.com/baaivision/Uni3D

02cb5d02-b8ed-11ee-8b88-92fbcf53809c.jpg

我們主要探索了3D視覺中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域,scale up大模型(GPT-4,SAM,EVA等)已經(jīng)取得了很impressive的結(jié)果,但是在3D視覺中模型的scale up始終沒有成功。我們旨在將NLP/2D中scale up的成功復(fù)現(xiàn)到3D表征模型上。

02d03426-b8ed-11ee-8b88-92fbcf53809c.jpg

在這項工作中,我們提出了一個3D基礎(chǔ)大模型Uni3D,直接將3D backbone統(tǒng)一為ViT(Vision Transformer),以此利用豐富和強大的2D預(yù)訓(xùn)練大模型作為初始化。Uni3D使用CLIP模型中的文本/圖像表征作為訓(xùn)練目標(biāo),通過學(xué)習(xí)三個模態(tài)的表征對齊(點云-圖像-文本)實現(xiàn)3D點云對圖像和文本的感知。同時,通過使用ViT中成功的scale up策略,我們將Uni3D逐步 scale up,訓(xùn)練了從Tiny到giant的5個不同scale的Uni3D模型,成功地將Uni3D擴展到10億級別參數(shù)。

02df8750-b8ed-11ee-8b88-92fbcf53809c.jpg

Uni3D模型不同scale下的參數(shù)量和zero-shot分類結(jié)果

Uni3D在多個3D任務(wù)上達(dá)到SoTA,如:zero-shot classification, few-shot classification,open-world understanding, open-world part segmentation.

02f5e8f6-b8ed-11ee-8b88-92fbcf53809c.jpg

Zero-shot classification

030673b0-b8ed-11ee-8b88-92fbcf53809c.jpg

Real-world zero-shot recognition

由于學(xué)到了強大的多模態(tài)表征能力,Uni3D還能夠做一些有意思的應(yīng)用,如point cloud painting(點云繪畫),text/image-based 3D shape retrieval(基于圖像/文本的3D模型檢索),point cloud captioning(點云描述):

030d818c-b8ed-11ee-8b88-92fbcf53809c.jpg

Point cloud painting

03126e90-b8ed-11ee-8b88-92fbcf53809c.jpg

Image-based 3D shape retrieval

032b3eca-b8ed-11ee-8b88-92fbcf53809c.jpg

Text-based 3D shape retrieval

03421aaa-b8ed-11ee-8b88-92fbcf53809c.jpg

Point cloud captioning.

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D視覺
    +關(guān)注

    關(guān)注

    4

    文章

    431

    瀏覽量

    27520
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2423

    瀏覽量

    2640

原文標(biāo)題:ICLR 2024 | 高分工作!Uni3D:3D基礎(chǔ)大模型,刷新多個SOTA!

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    安寶特產(chǎn)品 安寶特3D Analyzer:智能的3D CAD高級分析工具

    安寶特3D Analyzer包含多種實用的3D CAD高級分析工具,包括自動比對模型、碰撞檢測、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠有效提升3D CAD
    的頭像 發(fā)表于 08-07 10:13 ?372次閱讀
    安寶特產(chǎn)品  安寶特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高級分析工具

    安寶特產(chǎn)品 3D Evolution : 基于特征實現(xiàn)無損CAD格式轉(zhuǎn)換

    安寶特3D Evolution具有強大的3D CAD模型轉(zhuǎn)換功能,可在保留模型特征參數(shù)、注釋、約束的前提下,完成不同格式3D CAD
    的頭像 發(fā)表于 08-06 17:26 ?328次閱讀
    安寶特產(chǎn)品   <b class='flag-5'>3D</b> Evolution : 基于特征實現(xiàn)無損CAD格式轉(zhuǎn)換

    歡創(chuàng)播報 騰訊元寶首發(fā)3D生成應(yīng)用

    App。 騰訊元寶APP發(fā)布時,就圍繞工作效率場景、日常生活等場景提供了豐富的應(yīng)用,并有創(chuàng)建個人智能體等個性化體驗,“3D角色夢工廠”則將大模型生成技術(shù)和3D應(yīng)用結(jié)合,進一步創(chuàng)新了元寶
    的頭像 發(fā)表于 07-18 11:39 ?752次閱讀
    歡創(chuàng)播報 騰訊元寶首發(fā)<b class='flag-5'>3D</b>生成應(yīng)用

    裸眼3D筆記本電腦——先進的光場裸眼3D技術(shù)

    隨著科技的不斷進步,裸眼3D技術(shù)已經(jīng)不再是科幻電影中的幻想。如今,英倫科技裸眼3D筆記本電腦將這一前沿科技帶到了我們的日常生活中。無論你是專業(yè)的3D模型設(shè)計師,還是希望在視頻播放和
    的頭像 發(fā)表于 07-16 10:04 ?516次閱讀

    奧比中光3D相機打造高質(zhì)量、低成本的3D動作捕捉與3D動畫內(nèi)容生成方案

    ? 在過去幾十年里,動作捕捉(MoCap)技術(shù)經(jīng)歷了顯著的發(fā)展,廣泛被應(yīng)用于電影、游戲、虛擬現(xiàn)實、醫(yī)療等多個領(lǐng)域。近期,奧比中光合作客戶Moverse使用Orbbec Femto系列3D相機,打造出
    的頭像 發(fā)表于 06-25 16:37 ?1067次閱讀

    3D建模的特點和優(yōu)勢都有哪些?

    的應(yīng)用。 特點: 1.三維模型化:3D建模允許用戶在虛擬空間內(nèi)創(chuàng)建具有長度、寬度和高度的物體,從而形成真實感十足的三維模型。 2.精確性:通過3D建模軟件,用戶可以精確地控制對象的尺寸
    的頭像 發(fā)表于 05-13 16:41 ?2396次閱讀

    ad19中3d模型不顯示?

    封裝庫導(dǎo)入3d模型不顯示,但導(dǎo)入3d模型后的封裝庫生成pcb文件時顯示3d模型,這是什么原因?qū)е?/div>
    發(fā)表于 04-24 13:41

    包含具有多種類型信息的3D模型

    Desktop是一個3D建模CAD程序,用于多種繪圖和設(shè)計,涵蓋建筑、土木和機械工程,以及室內(nèi)設(shè)計、產(chǎn)品設(shè)計、景觀建筑甚至游戲開發(fā)。它通常用于創(chuàng)建和編輯3D模型,同時提供與BIM工作
    發(fā)表于 03-28 17:18

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨特的功能吸引了眾多關(guān)注。此模型具備從單張圖像中生成多視圖
    的頭像 發(fā)表于 03-22 10:30 ?832次閱讀

    Stability AI推出Stable Video 3D模型,可制作多視角3D視頻

    SV3D_u是Stable Video 3D的一個版本,僅需單幅圖片即可生成運動軌跡視頻,無須進行相機調(diào)整。擴充版本的SV3D_p加入了軌道視圖的特性,使其可以根據(jù)預(yù)設(shè)的相機路徑創(chuàng)建3D
    的頭像 發(fā)表于 03-21 14:57 ?1017次閱讀

    3D動畫原理:電阻

    電阻3D
    深圳崧皓電子
    發(fā)布于 :2024年03月19日 06:49:19

    Adobe提出DMV3D3D生成只需30秒!讓文本、圖像都動起來的新方法!

    因此,本文研究者的目標(biāo)是實現(xiàn)快速、逼真和通用的 3D 生成。為此,他們提出了 DMV3D。DMV3D 是一種全新的單階段的全類別擴散模型,能直接根據(jù)
    的頭像 發(fā)表于 01-30 16:20 ?850次閱讀
    Adobe提出DMV<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>生成只需30秒!讓文本、圖像都動起來的新方法!

    探索ICLR‘24 Spotlight中的首個十億級別3D通用大模型

    Uni3D在少樣本點云部件分割任務(wù)上也展示出了卓越的性能。下表結(jié)果顯示,在各種實驗條件下,Uni3D的性能都明顯優(yōu)于Point-BERT等基線方法。
    的頭像 發(fā)表于 01-25 10:10 ?491次閱讀
    探索ICLR‘24 Spotlight中的首個十億級別<b class='flag-5'>3D</b>通用大<b class='flag-5'>模型</b>

    友思特C系列3D相機:實時3D點云圖像

    3D相機
    虹科光電
    發(fā)布于 :2024年01月10日 17:39:25

    如何搞定自動駕駛3D目標(biāo)檢測!

    可用于自動駕駛場景下基于圖像的3D目標(biāo)檢測的數(shù)據(jù)集總結(jié)。其中一些數(shù)據(jù)集包括多個任務(wù),這里只報告了3D檢測基準(zhǔn)(例如KITTI 3D發(fā)布了超過40K的圖像,其中約15K用于
    發(fā)表于 01-05 10:43 ?580次閱讀
    如何搞定自動駕駛<b class='flag-5'>3D</b>目標(biāo)檢測!
    主站蜘蛛池模板: 精品国产99久久久久久麻豆| 亚洲国产精品一区二区动图| 最美白虎逼| 涩涩爱涩涩电影网站| 久久成人国产精品一区二区 | 天天看学生视频| 久久午夜宫电影网| 国产精品人妻无码77777| 97超碰免费人妻中文| 亚洲精品嫩草研究院久久| 轻点灬大ji巴太粗太双性高h| 精品视频免费在线| 国产精品毛片在线视频| 啊好深啊别拔就射在里面| 中文在线日韩亚洲制服| 亚洲精品久久久WWW游戏好玩| 日欧一片内射VA在线影院| 男女边吃奶边做边爱视频| 激情床戏揉胸吃胸视频| 国产精品JK白丝AV网站| 成人小视频在线观看免费| 18亚洲男同gay1069| 伊人久久大香线蕉综合影| 午夜福利小视频400| 日韩黄色免费| 热99RE久久精品国产| 男女夜晚在爽视频免费观看| 久久才是精品亚洲国产| 极品少妇高潮XXXXX| 国产精品日本无码久久一老A| yellow片在线观看免费观看动漫 | 被男按摩师添的好爽在线直播| 中文字幕一区二区三区在线不卡| 亚洲人成电影网站在线观看| 涩涩免费网站| 视频一区在线免费观看| 日产国产欧美韩国在线| 日韩精品免费在线观看| 日韩大胆视频| 丝袜美女被啪啪不带套漫画| 色婷婷激婷婷深爱五月小蛇|