色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么說三維重建才是計算機視覺的靈魂?

WpOh_rgznai100 ? 來源:YXQ ? 2019-07-02 14:18 ? 次閱讀

編者按:在“全民計算機視覺”的今天,其發(fā)展歷程卻鮮少有人追溯。梳理研究的過去將能讓我們更好地探索未來。權龍教授為我們介紹了三維重建的歷史發(fā)展與應用前景,也為大家在研究學習、職業(yè)選擇等方面給出了一些實用建議。

王井東:您的主要研究方向是三維重建,它的發(fā)展現(xiàn)狀和應用前景如何,您為什么看好它?

權龍:說三維重建首先要從計算機視覺講起。計算機視覺包含兩個基本方向,物體識別和三維重建。圖像識別的突破性進展源自于2012年卷積神經網絡(CNN)的興起。在此之前,計算機視覺的核心研究方向是三維重建。因為在當時,對于圖像的特征提取主要是通過三維重建的方法來定義和實現(xiàn)的。自2012年以來,圖像的特征便逐漸由神經網絡來自動學習。

三維重建的應用是很廣泛的,對于自動駕駛VR、AR等應用領域應用來講,三維重建是核心技術,并且實時三維重建是必然趨勢,因為我們生活在三維空間里,必須將虛擬世界恢復到三維,我們才可以和環(huán)境進行交互。所以僅僅研究識別肯定是不夠的,計算機視覺下一步必須走向三維重建,并且把三維重建和識別融為一體。

古建筑修復與重建是三維重建的一個具有代表性的應用,比如近期被燒毀的巴黎圣母院,如果通過三維模型(https://www.altizure.cn/project-model?pid=57f8d9bbe73f6760f10e916a)進行數字重建,應該能夠達到原汁原味還原其真實面貌的目的。目前在我們的三維重建項目中,名勝古跡的三維電子存檔是很重要的一部分。從表面上看,三維重建似乎沒有自動駕駛那么復雜,其實它比自動駕駛更難,因為自動駕駛的三維感知是給車識別,而VR、AR中的三維重建場景是提供給人類感知的,所以對三維重建的結果要求非常高。總體來講,三維重建是計算機視覺的靈魂。

權龍教授(左)和王井東博士(右)合影

王井東:三維重建在計算機視覺中確實非常重要,您可以帶大家回顧一下計算機視覺和三維重建的發(fā)展歷程嗎?

權龍:1987年在倫敦舉辦的第一屆國際計算機視覺大會ICCV可以作為現(xiàn)代計算機視覺研究的一個開端。之前很多人認為做圖像處理就是計算機視覺,其實是二者是有區(qū)別的。

計算機視覺的目標是對圖像進行理解。準確來講,計算機無法做到“理解”,只能做到“認知”。我們的研究目的是從圖像中獲取視覺特征,有了視覺特征才能開展一系列的工作。因此回顧計算機視覺的發(fā)展歷程,根據算力條件的不同,我們可以看到一個特征提取的演化過程。

80年代,人人都在做以edge為主的邊緣提取,有了edge之后,再把它高層化后的線段元做簡單的統(tǒng)計分類或者三維重建。Edge在數學上很容易定義,在定義了很多優(yōu)化準則后,到1986年John Canny提出了Canny edge detection之后,這個研究方向就到頭了。

90年代,人們對三維重建愈加重視,當時歐洲比美國要領先。幾何也追求特征提取,但一維的edge不適合幾何計算,幾何最本質的元素是點,所以很多工作開始圍繞點的特征去展開,對點的特征進行描述,然后就可以把很多東西變成矢量的無序集合,再做統(tǒng)計。三維重建的終極目標是用非標定相機(uncalibrated camera)進行重建。

1992年,Oliver Faugeras和Richard Hartley各自獨立地解決了非標定相機兩張圖像下的三維重建問題,引入了基于七點算法的基礎矩陣(Fundamental Matrix)概念,這標志著三維視覺的崛起。

1994年,我提出了六點算法(Invariants of six points and projective reconstruction from three uncalibrated images),解決了非標定相機三張圖像下的三維重建,進而在理論上徹底解決了多視重建的幾何問題(multi-view geometry)。這兩項工作共同奠定了三維重建的理論基礎,對計算機視覺的發(fā)展起到了決定性的作用。

到了2012年,卷積神經網絡(CNN)的出現(xiàn)對于特征提取和圖像識別都是一個顛覆性的飛躍,從而觸發(fā)了新一波人工智能高速發(fā)展的浪潮。事實上,卷積神經網絡在1989年就應用于圖像識別問題,它是今天所有卷積神經網絡的鼻祖模型。

從誕生到2012年的十幾年之間,發(fā)生變化的并非卷積神經網絡的架構,而是:(一)GPU的出現(xiàn)提升了計算力;(二)斯坦福大學教授李飛飛創(chuàng)建的ImageNet,她把上百萬張照片發(fā)到網絡上進行標注。這兩件事促成了卷積神經網絡在2012年的復活。CNN的本質其實是兩點,第一點是提取特征,第二點是標準分類器。所以本質上還是提取特征,只不過特征的表達能力比之前的手工定義要高得多。

所以從特征提取這條線索上看,雖然目前計算機視覺看似處于一輪新的熱潮,但事實上一直以來大家都在做同樣的事情,只不過在不同的階段,提取的特征和采用的方式有所不同。

王井東:現(xiàn)在主流的計算機視覺研究主要集中在歐洲、美國和中國。您認為這三者的發(fā)展現(xiàn)狀和未來將如何?

權龍:確實是三足鼎立。上個世紀八九十年代,歐洲的計算機視覺發(fā)展迅速,研究人員在一定意義上把計算機視覺當作一個應用數學的問題。三維重建需要大量傳統(tǒng)數學知識,這批研究人員都有非常好的應用數學基礎,那就用數學工具去解決這些視覺問題。

同期,美國計算機視覺的研究人員也非常活躍,但主要集中在應用領域,研究方向并不是非常清晰。隨著2012年這一波由卷積神經網絡引發(fā)的人工智能的再次崛起,美國在應用方面突飛猛進,歐洲依然保持扎實的基礎研究的風格。后起之秀就是中國了,飛速發(fā)展的經濟和創(chuàng)新氣氛使得計算機視覺的研究和商業(yè)應用在極短的時間內快速發(fā)展起來了。

王井東:您不僅在計算機視覺的研究上一如既往,也創(chuàng)立了專注三維重建的公司Altizure,那么關于學術和產業(yè)的選擇,您能為同學們分享一些經驗和建議嗎?

權龍:每個人都有不同的理想和發(fā)展方向,有的人可能更適合做應用,有的人更適合做學術研究,這是因人而異的。沒必要每個人都要去做科研當教授,也沒必要每個人都去創(chuàng)業(yè),只要能發(fā)揮自己的特長,選擇哪一條路都是非常好的。在這個多元化的社會,大家都在從不同的角度推進科技的進步。

王井東:當時是什么促使您從學術界“跨界”進入產業(yè)界?

權龍:很簡單,我一直在研究計算機視覺三維重建,以前的結果還不成熟,而到了某一個時機它終于能投入應用了,那我們當然要做應用,這是研究的最高境界。研究就是這樣,可能在很長時間里效果都不夠理想,那我們就要繼續(xù)研究,但當它有了用武之地時,我覺得投入實踐是順理成章的。

王井東:您認為一個計算機視覺方向的學生應該學好哪些知識,才能做更好的研究?

權龍:我對所有的人的建議是,打好應用數學和計算機的功底。應用數學是理論基礎,計算機是實現(xiàn)手段,兩方面的能力缺一不可。我不太贊同大學開設人工智能專業(yè)的做法,其實人工智能在一定意義上就是應用數學,尤其是卷積神經網絡,本質上是數學優(yōu)化和統(tǒng)計,你要有很好的應用數學功底。

王井東:很多人說深度學習和計算機視覺到了瓶頸期,您認為目前最大的問題是什么?您最期待的突破又在哪里?

權龍:“瓶頸期”不是一個合適的詞匯。因為它本質上是一個應用科學,現(xiàn)在有了卷積神經網絡這樣強大的工具,所有的應用方向都可以重新去摸索。剛才講到特征提取,提取完特征后去做具體的應用,很多東西是可以繼續(xù)改進的,差別在于進步有多大。

卷積神經網絡的特征提取已經是一個很大的突破了,在這個基礎之上,我想會有一系列新的應用出現(xiàn)。如果實在要說突破,那就是硬件和算力的突破。目前大熱的自動駕駛領域將很大力度地推進算力的發(fā)展,VR、AR也是同樣。有朝一日,如果算力能夠有一個顯著的突破性進展,很多無法想象的事情將會發(fā)生。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:港科大教授權龍:為什么三維重建才是計算機視覺的靈魂?| 對話

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    三維測量在醫(yī)療領域的應用

    技術可以對CT(計算機斷層掃描)、MRI(磁共振成像)等醫(yī)學影像進行三維重建,生成病灶或器官的三維模型。 這些模型為醫(yī)生提供了更為直觀、立體的視覺信息,有助于醫(yī)生更準確地了解患者的解剖
    的頭像 發(fā)表于 12-30 15:21 ?237次閱讀

    CASAIM與邁普醫(yī)學達成合作,三維掃描技術助力醫(yī)療輔具實現(xiàn)高精度三維建模和偏差比對

    近期,CASAIM與廣州邁普再生醫(yī)學科技股份有限公司(簡稱:邁普醫(yī)學)合作,基于CT數據三維重建和設計,在醫(yī)療輔具研究開發(fā)中實現(xiàn)高精度三維建模和偏差比對,實現(xiàn)與缺損區(qū)域的精確匹配。
    的頭像 發(fā)表于 11-12 14:48 ?224次閱讀

    建筑物邊緣感知和邊緣融合的多視圖立體三維重建方法

    航空建筑深度估計是三維數字城市重建中的一項重要任務,基于深度學習的多視圖立體(MVS)方法在該領域取得了較好的成果。目前的主要方法通過修改MVS 框架實現(xiàn)建筑物的深度估計,缺乏對建筑物內在結構的考慮,易導致精度不足等問題。
    的頭像 發(fā)表于 11-07 10:16 ?288次閱讀
    建筑物邊緣感知和邊緣融合的多視圖立體<b class='flag-5'>三維重建</b>方法

    詳細介紹三維建模的優(yōu)勢和未來發(fā)展方向

    三維建模是一種廣泛應用于多個領域的技術,通過使用計算機軟件創(chuàng)建逼真的三維物體或場景。在過去幾十年里,隨著計算機圖形學的發(fā)展和3D建模軟件的普及,三維
    的頭像 發(fā)表于 09-12 14:30 ?409次閱讀

    留形科技借助NVIDIA平臺提供高效精確的三維重建解決方案

    本案例中,留形科技借助 NVIDIA Jetson 和 Omniverse 平臺,實現(xiàn)邊緣設備上的實時、全彩、無損三維重建,從而在建筑細節(jié)捕捉、大型基礎設施的數字孿生等應用中,大幅提升三維數據采集與處理的效率與精度。
    的頭像 發(fā)表于 09-09 09:42 ?510次閱讀

    基于大模型的仿真系統(tǒng)研究一——三維重建大模型

    問題,賽目推出了基于大模型的仿真系統(tǒng),利用機器學習、深度學習等人工智能技術,不僅推出自動標注大模型、多模態(tài)檢測大模型和場景生成大模型等模塊,并且引入三維重建大模型加強渲染畫面真實性。 ? ?通過上述模塊,賽目的路采
    的頭像 發(fā)表于 07-30 14:51 ?1773次閱讀
    基于大模型的仿真系統(tǒng)研究一——<b class='flag-5'>三維重建</b>大模型

    機器視覺計算機視覺有什么區(qū)別

    機器視覺計算機視覺是兩個密切相關但又有所區(qū)別的概念。 一、定義 機器視覺 機器視覺,又稱為計算機
    的頭像 發(fā)表于 07-16 10:23 ?595次閱讀

    cad如何進行三維建模

    三維建模是計算機輔助設計(CAD)中的一項重要技術,它可以幫助設計師在計算機上創(chuàng)建和編輯三維模型。本文將介紹如何使用CAD軟件進行三維建模,
    的頭像 發(fā)表于 07-09 10:23 ?1124次閱讀

    計算機視覺與人工智能的關系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等多個領域的知識。人工智能則是研究如何使計算
    的頭像 發(fā)表于 07-09 09:25 ?724次閱讀

    計算機視覺和機器視覺區(qū)別在哪

    計算機視覺和機器視覺是兩個密切相關但又有明顯區(qū)別的領域。 一、定義 計算機視覺 計算機
    的頭像 發(fā)表于 07-09 09:22 ?506次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有視覺
    的頭像 發(fā)表于 07-09 09:11 ?1381次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學習、大數據等技術的快速發(fā)展,計算機
    的頭像 發(fā)表于 06-06 17:17 ?1089次閱讀

    三維可視:展現(xiàn)未來的視覺盛宴

    帶你了解這一領域的種種奇跡。 一、三維可視化技術的定義 三維可視化技術是基于計算機圖形學和計算機視覺的一種技術,用于創(chuàng)建和呈現(xiàn)逼真的
    的頭像 發(fā)表于 06-05 15:48 ?361次閱讀

    計算機圖形學:探索虛擬世界的構建之道

    計算機圖形學是計算機科學的一個分支,它專注于創(chuàng)建和操縱計算機生成的視覺和圖形內容。這一領域涵蓋了從基礎的二圖形繪制到復雜的
    的頭像 發(fā)表于 05-07 08:27 ?453次閱讀
    <b class='flag-5'>計算機</b>圖形學:探索虛擬世界的構建之道

    計算機視覺的十大算法

    隨著科技的不斷發(fā)展,計算機視覺領域也取得了長足的進步。本文將介紹計算機視覺領域的十大算法,包括它們的基本原理、應用場景和優(yōu)缺點。這些算法在圖像處理、目標檢測、人臉識別等領域有著廣泛的應
    的頭像 發(fā)表于 02-19 13:26 ?1311次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法
    主站蜘蛛池模板: 国产AV天堂一区二区三区 | 沟沟人体一区二区 | 国产人成高清在线视频99 | 久久精品伊人 | 三八成人网 | 公粗挺进了我的密道在线播放贝壳 | 日本高清免费一本视频在线观看 | 无码AV精品一区二区三区 | max girls 大感谢祭| 国内久久久久影院精品 | a级毛片高清免费视频 | 三级网址在线观看 | 抽插内射高潮呻吟V杜V | 久久a在线视频观看 | 亚洲国产欧美在线人成aaaa20 | 贵妇局长的蕾丝乳罩 | a级男女性高爱潮高清试看 A级毛片无码久久精品免费 | 老太婆风流特黄一级 | 日本无码色哟哟婷婷最新网站 | 国自产精品手机在线视频 | www免费看.男人的天堂 | 国产h视频在线观看免费 | 十九岁在线观看免费完整版电影 | 中文字幕不卡在线视频 | 男人免费网站 | 顶级欧美不卡一区二区三区 | 国产精品一区二区20P | 亚洲高清中文字幕免费 | 小舞被爆操 | 精品人妻伦九区久久AAA片69 | 无码专区久久综合久综合字幕 | 菠萝菠萝蜜高清观看在线 | 武侠艳妇屈辱的张开双腿 | 极品美女久久久久久久久久久 | 亚洲 日本 天堂 国产 在线 | 她也色在线视频站 | 国产高清精品自在久久 | 思思久99久女女精品 | 四虎永久免费网址 | 亚洲色欲H网在线观看 | 欧美日韩高清一区二区三区 |