色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習在圖像識別領域的四大方向

ml8z_IV_Technol ? 2018-12-01 08:54 ? 次閱讀

計算機視覺領域,圖像識別這幾年的發展突飛猛進。例如,在PASCAL VOC物體檢測基準測試中,檢測器的性能從平均準確率30%飆升到了今天的超過90%。對于圖像分類,在極具挑戰性的ImageNet數據集上,目前先進算法的表現甚至超過了人類。

圖像識別技術的高價值應用就發生在你我身邊,例如視頻監控、自動駕駛智能醫療等,而這些圖像識別最新進展的背后推動力是深度學習。深度學習的成功主要得益于三個方面:大規模數據集的產生、強有力的模型的發展以及可用的大量計算資源。對于各種各樣的圖像識別任務,精心設計的深度神經網絡已經遠遠超越了以前那些基于人工設計的圖像特征的方法。

盡管到目前為止深度學習在圖像識別方面已經取得了巨大成功,但在它進一步廣泛應用之前,仍然有很多挑戰需要我們去面對。與此同時,我們也看到了很多具有未來價值的研究方向。

挑戰一:如何提高模型的泛化能力

圖像識別技術在可以被廣泛應用之前,一個重要的挑戰是,怎樣才能知道一個模型對未曾出現過的場景仍然具有很好的泛化能力。

在目前的實踐中,數據集被隨機劃分為訓練集和測試集,模型也相應地在這個數據集上被訓練和評估。需要注意的是,在這種做法中,測試集擁有和訓練集一樣的數據分布,因為它們都是從具有相似場景內容和成像條件的數據中采樣得到的。

然而,在實際應用中,測試圖像或許會來自不同于訓練時的數據分布。這些未曾出現過的數據可能會在視角、大小尺度、場景配置、相機屬性等方面與訓練數據不同。

一項研究表明,數據分布上的這種差異會導致各種深度網絡模型的準確率產生明顯的下降 。當前模型對數據分布自然變化的敏感性可能成為自動駕駛等關鍵應用的一個嚴重問題。

挑戰二:如何利用小規模和超大規模數據

我們需要面對的另一個重要的挑戰是如何更好地利用小規模訓練數據。雖然深度學習通過利用大量標注數據在各種任務中都取得了巨大的成功,但現有的技術通常會因為只有很少的標記實例可用而在小數據情景中崩潰。這個情景通常被稱為“少樣本學習(few-shot learning)”,并需要在實際應用中仔細考慮。例如,一個家庭機器人被期望可以完成這樣的任務:向它展示一個新物體,且只展示一次,之后它便可以識別這個物體。一個人可以很自然地完成這個任務,即使這個物體之后又被操作過了,例如一個毛毯被折疊起來了。如何賦予神經網絡像人類這樣的泛化能力是一個開放的研究問題。

另一個極端是如何利用超大規模數據有效地提高識別算法的性能。對于像自動駕駛這樣的關鍵應用,圖像識別的出錯成本非常高。因此,研究者們創造出了非常龐大的數據集,這些數據集包含了數以億計的帶有豐富標注的圖像,并且他們希望通過利用這些數據使模型的準確度得到顯著提高。

然而,目前的算法并不能很好地利用這種超大規模數據 。在包含了3億張標注圖片的JFT數據集上,各種深度網絡的性能隨著訓練數據量的增加,僅僅呈現出對數級的提高(圖一)。在大規模數據的情況下,繼續增加訓練數據帶來的收益會變得越來越不明顯,這是一個有待解決的重要問題。

一目標檢測在JFT-300M數據集上的性能隨訓練樣例的增多呈對數倍的提高。x軸是對數尺度下的數據大小。y軸是目標檢測的性能。左圖使用COCO minival測試集上的mAP@[0.5,0.95] 指標,右圖使用PASCAL VOC 2007測試集上的mAP@0.5指標 。紅藍兩條曲線分別代表兩種不同的模型。

挑戰三:全面的場景理解

除了這些與訓練數據和泛化能力相關的問題外,還有一個重要的研究課題是全面的場景理解。除了識別和定位場景中的物體之外,人類還可以推斷物體和物體之間的關系、部分到整體的層次、物體的屬性和三維場景布局。

獲得對場景的更廣泛的理解將會幫助例如機器人交互這樣的應用,因為這些應用通常需要物體標識和位置以外的信息。這個任務不僅涉及到對場景的感知,而且還需要對現實世界的認知理解。要實現這一目標,我們還有很長的路要走。全面的場景理解的一個例子為全景分割,見圖二。

圖二 (a)原圖;(b)語義分割:識別天空、草地、道路等沒有固定形狀的不可數材質(stuff),標記方法通常是給每個像素加上標簽 ;(c)實例分割:分割人、動物或工具等可數且獨立的物體實例(object instance),通常用包圍盒或分割掩碼標記目標;(d)全景分割:生成統一的、全局的分割圖像,既識別材質,也識別物體。

挑戰四:自動化網絡設計

最后一個值得一提的挑戰是使網絡設計自動化。近年來,圖像識別這一領域的重心從設計更好的特征轉向了設計更新的網絡架構。然而,設計網絡架構是一個冗長乏味的過程,它需要處理大量的超參數和設計選擇。調優這些元素需要有經驗的工程師花費大量的時間和精力。

更重要的是,一個任務的最優架構和另一個任務的最優架構可能是完全不同的。盡管我們對自動神經架構搜索的研究已經開始了,但它們仍然處于早期階段并且僅適用于圖像分類任務。當前方法的搜索空間非常狹窄,因為它們尋找的是現有網絡模塊的局部最優組合(例如深度可分離卷積和恒等連接),并且無法發現新的模塊。目前還不清楚這些現有的方法是否足以勝任更復雜的任務。

圖三 神經架構搜索算法的抽象圖解。搜索策略首先從事先定義好的搜索空間中選擇一個架構A,這個構架接著被評估策略進行評估,并將評估的A的性能傳遞給搜索策略 。

盡管在圖像識別領域存在上述諸多挑戰,但我們仍然相信深度學習在圖像識別領域的巨大潛力。解決這些問題的機會比比皆是,下面我們看看這其中的幾個研究方向:

方向一:整合常識

圖像識別領域有一個重要的研究方向是將常識融入到深度學習中。目前,深度學習主要作為一種純粹的數據驅動技術被使用。在深度學習中,神經網絡利用訓練集中的標注樣本學習一個非線性函數,之后在測試時則將這個學習到的函數作用到圖片像素上。訓練集之外的信息則一點也沒有被用到。

相比之下,人類識別物體不僅基于已經看到的樣本,還基于他們有關真實世界的常識。人們能夠對他們所看到的東西進行推理,以避免不合邏輯的識別結果。此外,當遇到新的或超出預期的東西時,人類可以迅速調整他們的知識來解釋這次的新經歷。如何在深度網絡中獲取、表示常識以及利用常識進行推理是一個挑戰。

方向二:幾何推理

聯合執行圖像識別和幾何推理則是另一個有潛力的方向。圖像識別的主要模型只考慮了二維外觀,而人類可以感知三維場景布局以及推斷其內在的語義類別。三維布局不僅可以從雙目視覺中獲得,還可以從二維輸入的幾何推理中得到,就像人們看照片時所做的那樣。聯合圖像識別和幾何推理為雙方都提供了好處。

從幾何推理中確定的三維布局可以幫助在看不見的視角、變形和外觀的情況下引導識別。它還可以消除不合理的語義布局,并幫助識別由其三維形狀或功能定義的類別。例如,沙發中存在著巨大的類內外觀差異。然而,它們擁有共同的屬性,可以幫助識別它們。比如它們都有一個水平面用來坐,一個背面用于支撐。另一方面,識別出來的語義可以規范化幾何推理的解空間。例如,如果一只狗在一個場景中被識別,它相應的三維結構應該符合狗的三維形狀模型。

圖四 從視頻的兩個不同視角的幀重建出復雜動態場景的點云

方向三:對關系建模

關系建模也有很大的研究潛力。想要全面理解一個場景,對場景中存在的目標實體之間的關系和相互作用的建模非常重要(圖四)。考慮兩張圖片,每個圖片都包含一個人和一匹馬。如果一張展示的是騎著馬的人,另一張展示的是踩著人的馬,顯然這兩張圖片表達了完全不同的意思。此外,通過關系建模提取的底層場景結構可以幫助補償當前深度學習方法因數據有限而出現的模糊不確定等問題。盡管人們已經在努力解決關系建模這個問題,但這項研究仍然是初步的,并且還有很大的探索空間。

圖五 目標檢測中的關系網絡。表示物體的外表特征,表示物體的幾何特征

方向四:學習如何學習

這里還有一個值得一提的方向是元學習,它的目標是學習學習過程。這個課題最近引起了相當多的關注,而且神經架構搜索也可以被認為是它的一種應用。

然而,由于目前對學習過程建模的機制、表示和算法還比較初級,元學習的研究仍處于早期階段。以神經架構搜索為例,它只局限于現有網絡模塊的簡單組合。元學習者無法捕捉到創作新網絡模塊所需的微妙的直覺和敏銳的洞察力。隨著元學習的進步,自動架構設計的潛力可能會被完全釋放出來,進而得到遠超手工設計的網絡結構。

圖六 元學習近期的進展。自左至右分別為元學習的超參數優化 、神經架構搜索 、少樣本圖像分類 。

這是一個激動人心的從事圖像識別的時代,一個充滿了推動領域發展、影響未來應用的機會時代。我們熱切盼望即將到來的進步,并期待這些新技術以深刻而神奇的方式改變我們的生活。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像識別
    +關注

    關注

    9

    文章

    520

    瀏覽量

    38276
  • 深度學習
    +關注

    關注

    73

    文章

    5503

    瀏覽量

    121198

原文標題:圖像識別的未來:機遇與挑戰并存

文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI圖像識別攝像機

    隨著科技的迅猛發展,人工智能(AI)各個領域的應用越來越廣泛,其中圖像識別技術尤為引人注目。AI圖像識別攝像機作為這一技術的重要應用之一,正在逐步改變我們的生活和工作方式。什么是AI
    的頭像 發表于 11-08 10:38 ?250次閱讀
    AI<b class='flag-5'>圖像識別</b>攝像機

    GPU深度學習應用案例

    GPU深度學習中的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別
    的頭像 發表于 10-27 11:13 ?399次閱讀

    AI大模型圖像識別中的優勢

    AI大模型圖像識別中展現出了顯著的優勢,這些優勢主要源于其強大的計算能力、深度學習算法以及大規模的數據處理能力。以下是對AI大模型
    的頭像 發表于 10-23 15:01 ?694次閱讀

    圖像識別算法都有哪些方法

    圖像識別算法是計算機視覺領域的核心任務之一,它涉及到從圖像中提取特征并進行分類、識別和分析的過程。隨著深度
    的頭像 發表于 07-16 11:14 ?5620次閱讀

    圖像識別算法的提升有哪些

    引言 圖像識別是計算機視覺領域的核心任務之一,旨在使計算機能夠自動地識別和理解圖像中的內容。隨著計算機硬件的發展和深度
    的頭像 發表于 07-16 11:12 ?662次閱讀

    圖像識別算法的優缺點有哪些

    圖像識別算法可以快速地處理大量圖像數據,提高工作效率。與傳統的人工識別方法相比,圖像識別算法可以短時間內完成對大量
    的頭像 發表于 07-16 11:09 ?1661次閱讀

    圖像識別算法的核心技術是什么

    圖像識別算法是計算機視覺領域的一個重要研究方向,其目標是使計算機能夠像人類一樣理解和識別圖像中的內容。
    的頭像 發表于 07-16 11:02 ?654次閱讀

    圖像識別技術醫療領域的應用

    一、引言 圖像識別技術是一種利用計算機視覺技術對圖像進行分析和處理的技術。隨著計算機技術、人工智能技術、大數據技術等的發展,圖像識別技術各個領域
    的頭像 發表于 07-16 10:48 ?914次閱讀

    圖像識別技術的原理是什么

    圖像識別技術是一種利用計算機視覺和機器學習技術對圖像進行分析和理解的技術。它可以幫助計算機識別和理解圖像中的對象、場景和活動。
    的頭像 發表于 07-16 10:46 ?1052次閱讀

    圖像識別屬于人工智能嗎

    的過程。它涉及到圖像的獲取、預處理、特征提取、分類和識別等多個環節。 1.2 重要性 圖像識別技術人工智能領域具有重要的地位,它使計算機能
    的頭像 發表于 07-16 10:44 ?1151次閱讀

    如何利用CNN實現圖像識別

    卷積神經網絡(CNN)是深度學習領域中一種特別適用于圖像識別任務的神經網絡結構。它通過模擬人類視覺系統的處理方式,利用卷積、池化等操作,自動提取圖像
    的頭像 發表于 07-03 16:16 ?1403次閱讀

    卷積神經網絡圖像識別中的應用

    卷積神經網絡(Convolutional Neural Networks, CNNs)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。 1. 卷積神經網絡的基本原
    的頭像 發表于 07-02 14:28 ?1151次閱讀

    神經網絡圖像識別中的應用

    隨著人工智能技術的飛速發展,神經網絡圖像識別領域的應用日益廣泛。神經網絡以其強大的特征提取和分類能力,為圖像識別帶來了革命性的進步。本文將詳細介紹神經網絡
    的頭像 發表于 07-01 14:19 ?684次閱讀

    圖像識別技術原理 圖像識別技術的應用領域

    圖像識別技術已經各個領域廣泛應用,其應用領域包括但不限于以下幾個方面。 一、智能安防領域 圖像識別
    的頭像 發表于 02-02 11:01 ?2486次閱讀

    如何使用Python進行圖像識別的自動學習自動訓練?

    如何使用Python進行圖像識別的自動學習自動訓練? 使用Python進行圖像識別的自動學習和自動訓練需要掌握一些重要的概念和技術。本文中
    的頭像 發表于 01-12 16:06 ?594次閱讀
    主站蜘蛛池模板: 久久精品亚洲精品国产欧美| 果冻传媒在线观看资源七夕| 国产美女影院| 热巴两次用约老师屁股发底线球| 中文字幕人妻无码系列第三区| 国产主播AV福利精品一区| 亚州AV中文无码乱人伦在线| 国产精品久久毛片A片软件爽爽 | 久久精品国产在热亚洲| 亚洲AV成人片色在线观看网站| 国产欧美一区二区三区久久| 亚州AV人片一区二区三区99久| 国产亚洲精品久久综合阿香蕉| 亚洲精品午夜VA久久成人| 精品国产自在现线拍400部| 永久免费精品影视网站| 美女诱点第6季| 成人网站国产在线视频内射视频| 神马电影dy888午夜我不卡| 国产精品免费久久久久影院| 亚洲精品久久AV无码蜜桃| 久久黄视频| av狼新人开放注册区| 日韩人妻无码专区一本二本| 国产人妻人伦精品1国产| 一区三区不卡高清影视| 暖暖日本 在线 高清| 高清国产在线播放成人| 亚洲精品不卡视频| 免费成年人在线观看视频| 出租屋交换人妻 全文| 亚洲成AV人片一区二区不卡| 久久综合色一综合色88中文| SM高H黄暴NP辣H调教性奴| 午夜福利免费0948视频| 久久香蕉国产线看观看| 成人小视频免费在线观看| 亚洲精品乱码一区二区三区| 免费视频亚洲| 国产精品久久人妻无码网站一区无| 野花日本韩国视频免费高清观看|