色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像處理之目標(biāo)檢測(cè)的入門(mén)總結(jié)

新機(jī)器視覺(jué) ? 來(lái)源:新機(jī)器視覺(jué) ? 2023-09-08 17:08 ? 次閱讀

1 背景介紹

目標(biāo)檢測(cè),object detection,就是在給定的圖片中精確找到物體所在位置,并標(biāo)注出物體的類(lèi)別。

d7b4f438-4df9-11ee-a25d-92fbcf53809c.png

目標(biāo)檢測(cè)要解決的問(wèn)題有兩個(gè):物體在哪里,物體是什么的整個(gè)流程問(wèn)題。

目標(biāo)檢測(cè)問(wèn)題的難點(diǎn):物體的尺寸變化范圍很大;擺放物體的角度,姿態(tài)不定;而且可以出現(xiàn)在圖片的任何地方;物體還可以是多個(gè)類(lèi)別。

d7f728da-4df9-11ee-a25d-92fbcf53809c.png

目前主要算法分兩類(lèi):1) 候選區(qū)域/框 + 深度學(xué)習(xí)分類(lèi);2) 基于深度學(xué)習(xí)的回歸方法

目標(biāo)檢測(cè)中有很大一部分工作是做圖像分類(lèi)。對(duì)于圖像分類(lèi),不得不提的是2012年ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽(ILSVRC)上,機(jī)器學(xué)習(xí)泰斗 Geoffrey Hinton 教授帶領(lǐng)學(xué)生Krizhevsky使用卷積神經(jīng)網(wǎng)絡(luò)將ILSVRC分類(lèi)任務(wù)的Top-5 error降低到了15.3%,而使用傳統(tǒng)方法的第二名 top-5 error高達(dá) 26.2%。

此后,卷積神經(jīng)網(wǎng)絡(luò)CNN占據(jù)了圖像分類(lèi)任務(wù)的絕對(duì)統(tǒng)治地位。

2 候選區(qū)域+深度學(xué)習(xí)

通過(guò)提取候選區(qū)域,并對(duì)相應(yīng)區(qū)域進(jìn)行以深度學(xué)習(xí)方法為主的分類(lèi)的方案,如:

2.1 R-CNN(Selective Search + CNN + SVM)

先找出圖中目標(biāo)可能出現(xiàn)的位置,即候選區(qū)域(Region Proposal)。

利用圖像中的紋理、邊緣、顏色等信息,可以保證在選取較少窗口(幾千甚至幾百)的情況下保持較高的召回率(Recall)。

有了候選區(qū)域,剩下的工作實(shí)際就是對(duì)候選區(qū)域進(jìn)行圖像分類(lèi)的工作(特征提取+分類(lèi))。

2014年,RBG(Ross B. Girshick)使用 Region Proposal + CNN代替?zhèn)鹘y(tǒng)目標(biāo)檢測(cè)使用的滑動(dòng)窗口+手工設(shè)計(jì)特征,設(shè)計(jì)R-CNN框架,使得目標(biāo)檢測(cè)取得巨大突破,并開(kāi)啟了基于深度學(xué)習(xí)目標(biāo)檢測(cè)的熱潮。

d8381ade-4df9-11ee-a25d-92fbcf53809c.png

R-CNN的簡(jiǎn)要步驟如下

輸入測(cè)試圖像

利用選擇性搜索Selective Search算法在圖像中從下到上提取2000個(gè)左右的可能包含物體的候選區(qū)域Region Proposal

因?yàn)槿〕龅膮^(qū)域大小各自不同,所以需要將每個(gè)Region Proposal縮放(warp)成統(tǒng)一的227x227的大小并輸入到CNN,將CNN的fc7層的輸出作為特征

將每個(gè)Region Proposal提取到的CNN特征輸入到SVM進(jìn)行分類(lèi)

R-CNN 存在一個(gè)較大的問(wèn)題:R-CNN雖然不再像傳統(tǒng)方法那樣窮舉,但R-CNN流程的第一步中對(duì)原始圖片通過(guò)Selective Search提取的候選框region proposal多達(dá)2000個(gè)左右,而這2000個(gè)候選框每個(gè)框都需要進(jìn)行CNN提特征+SVM分類(lèi),計(jì)算量很大,導(dǎo)致R-CNN檢測(cè)速度很慢,一張圖都需要47s。

2.2 SPP-net(ROI Pooling)

d87618ac-4df9-11ee-a25d-92fbcf53809c.png

SPP:Spatial Pyramid Pooling(空間金字塔池化)

SPP-Net是出自2015年發(fā)表在IEEE上的論文-《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》

2.3 Fast R-CNN(Selective Search + CNN + ROI)

d8be1c24-4df9-11ee-a25d-92fbcf53809c.png

Fast R-CNN就是在R-CNN的基礎(chǔ)上采納了SPP Net方法,對(duì)R-CNN作了改進(jìn),使得性能進(jìn)一步提高。

與R-CNN框架圖對(duì)比,可以發(fā)現(xiàn)主要有兩處不同:一是最后一個(gè)卷積層后加了一個(gè)ROI pooling layer,二是損失函數(shù)使用了多任務(wù)損失函數(shù)(multi-task loss),將邊框回歸Bounding Box Regression 直接加入到CNN網(wǎng)絡(luò)中訓(xùn)練。

Fast-RCNN 很重要的一個(gè)貢獻(xiàn)是成功的讓人們看到了 Region Proposal + CNN 這一框架實(shí)時(shí)檢測(cè)的希望,原來(lái)多類(lèi)檢測(cè)真的可以在保證準(zhǔn)確率的同時(shí)提升處理速度,也為后來(lái)的Faster R-CNN做下了鋪墊。

2.4 Faster R-CNN(RPN + CNN + ROI)

https://arxiv.org/pdf/1506.01497.pdf

d91fd05e-4df9-11ee-a25d-92fbcf53809c.png

Fast R-CNN存在性能瓶頸:選擇性搜索,找出所有的候選框,也非常耗時(shí)。能不能找出一個(gè)更加高效的方法來(lái)求出這些候選框呢?

解決方法:加入一個(gè)提取邊緣的神經(jīng)網(wǎng)絡(luò),也就說(shuō)找到候選框的工作也交給神經(jīng)網(wǎng)絡(luò)來(lái)做。

以上四種算法都基于region proposal的R-CNN系列,是目標(biāo)檢測(cè)技術(shù)領(lǐng)域主要的一個(gè)分支。

3 基于深度學(xué)習(xí)的回歸方法

3.1 YOLO1

YOLO,全稱(chēng):You Only Look Once

d991b4b2-4df9-11ee-a25d-92fbcf53809c.png

以上介紹的 R-CNN 系列很難滿(mǎn)足實(shí)時(shí)性的要求。YOLO一類(lèi)的方法慢慢顯現(xiàn)出其重要性,這類(lèi)方法使用回歸的思想,利用整張圖作為網(wǎng)絡(luò)的輸入,直接在圖像的多個(gè)位置上回歸出這個(gè)位置的目標(biāo)邊框,以及目標(biāo)所屬的類(lèi)別。

YOLO將目標(biāo)檢測(cè)任務(wù)轉(zhuǎn)換成一個(gè)回歸問(wèn)題,大大加快了檢測(cè)的速度,使得 YOLO 可以每秒處理45 張圖像。而且由于每個(gè)網(wǎng)絡(luò)預(yù)測(cè)目標(biāo)窗口時(shí)使用的是全圖信息,使得false positive比例大幅降低(充分的上下文信息)。

d9f61d8a-4df9-11ee-a25d-92fbcf53809c.png

daa07ed8-4df9-11ee-a25d-92fbcf53809c.png

但是YOLO也存在問(wèn)題:沒(méi)有了Region Proposal機(jī)制,只使用7*7的網(wǎng)格回歸會(huì)使得目標(biāo)不能非常精準(zhǔn)的定位,這也導(dǎo)致了YOLO的檢測(cè)精度并不是很高。

3.2 YOLO2

https://arxiv.org/pdf/1612.08242.pdf

dad46ca2-4df9-11ee-a25d-92fbcf53809c.png

YOLOv2 相對(duì)v1版本,在繼續(xù)保持處理速度的基礎(chǔ)上,從預(yù)測(cè)更準(zhǔn)確(Better),速度更快(Faster),識(shí)別對(duì)象更多(Stronger)這三個(gè)方面進(jìn)行了改進(jìn)。其中識(shí)別更多對(duì)象也就是擴(kuò)展到能夠檢測(cè)9000種不同對(duì)象,稱(chēng)之為YOLO9000。

YOLO v2 代表著比較先進(jìn)的物體檢測(cè)水平,在多種監(jiān)測(cè)數(shù)據(jù)集中都要快過(guò)其他檢測(cè)系統(tǒng),并可以在速度與精確度上進(jìn)行權(quán)衡。

3.3 YOLO3

https://pjreddie.com/media/files/papers/YOLOv3.pdf

dbe650ce-4df9-11ee-a25d-92fbcf53809c.png

YOLO v3的模型比之前的模型復(fù)雜了不少,可以通過(guò)改變模型結(jié)構(gòu)的大小來(lái)權(quán)衡速度與精度。

速度上,YOLOv3 在實(shí)現(xiàn)相同準(zhǔn)確度下要顯著地比其它檢測(cè)方法快。

改進(jìn)之處:

1).多尺度預(yù)測(cè) (類(lèi)FPN)

2).更好的基礎(chǔ)分類(lèi)網(wǎng)絡(luò)(類(lèi)ResNet)和分類(lèi)器 darknet-53,見(jiàn)下圖。

3). 分類(lèi)器-類(lèi)別預(yù)測(cè):

YOLOv3不使用Softmax對(duì)每個(gè)框進(jìn)行分類(lèi),主要考慮因素有兩個(gè):

a. Softmax使得每個(gè)框分配一個(gè)類(lèi)別(score最大的一個(gè)),而對(duì)于Open Images這種數(shù)據(jù)集,目標(biāo)可能有重疊的類(lèi)別標(biāo)簽,因此Softmax不適用于多標(biāo)簽分類(lèi)。

b. Softmax可被獨(dú)立的多個(gè)logistic分類(lèi)器替代,且準(zhǔn)確率不會(huì)下降。

分類(lèi)損失采用 binary cross-entropy loss

多尺度預(yù)測(cè)

dc1cf188-4df9-11ee-a25d-92fbcf53809c.png

每種尺度預(yù)測(cè)3個(gè)box, anchor的設(shè)計(jì)方式仍然使用聚類(lèi),得到9個(gè)聚類(lèi)中心,將其按照大小均分給3中尺度.

尺度1: 在基礎(chǔ)網(wǎng)絡(luò)之后添加一些卷積層再輸出box信息.

尺度2: 從尺度1中的倒數(shù)第二層的卷積層上采樣(x2)再與最后一個(gè)16x16大小的特征圖相加,再次通過(guò)多個(gè)卷積后輸出box信息.相比尺度1變大兩倍.

尺度3: 與尺度2類(lèi)似,使用了32x32大小的特征圖.

dd2b1294-4df9-11ee-a25d-92fbcf53809c.png

4 總結(jié)

最后總結(jié)兩類(lèi)算法的不同:

RCNN, Fast-RCNN,F(xiàn)aster-RCNN是基于深度學(xué)習(xí)的分類(lèi)方法。

YOLO系列是基于深度學(xué)習(xí)的回歸方法。

本文是我業(yè)余時(shí)間學(xué)習(xí)目標(biāo)檢測(cè)的一篇整理文章,希望對(duì)目標(biāo)檢測(cè)入門(mén)者有一定幫助。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1295

    瀏覽量

    56803
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4620

    瀏覽量

    93047
  • 目標(biāo)檢測(cè)
    +關(guān)注

    關(guān)注

    0

    文章

    209

    瀏覽量

    15632
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5507

    瀏覽量

    121272

原文標(biāo)題:圖像處理之目標(biāo)檢測(cè)的入門(mén)總結(jié)

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于matlab的圖像處理--飛機(jī)檢測(cè)

    處理過(guò)程中也用到了灰度變化、二值化、濾波、腐蝕、膨脹、開(kāi)閉運(yùn)算等圖像處理的基本方法,其核心算法是面積檢測(cè)和角點(diǎn)檢測(cè),借助MATLAB強(qiáng)大的
    發(fā)表于 09-30 11:46

    PowerPC小目標(biāo)檢測(cè)算法怎么實(shí)現(xiàn)?

    目標(biāo)檢測(cè)系統(tǒng)的任務(wù)是根據(jù)探測(cè)器獲取的圖像序列實(shí)時(shí)地把小目標(biāo)從噪聲中檢測(cè)出來(lái),它的實(shí)現(xiàn)是目標(biāo)識(shí)別
    發(fā)表于 08-09 07:07

    模糊神經(jīng)網(wǎng)絡(luò)在圖像目標(biāo)檢測(cè)中的應(yīng)用

    紅外圖像中的微弱目標(biāo)檢測(cè)與跟蹤是數(shù)字圖像處理領(lǐng)域中的研究熱點(diǎn)。針對(duì)紅外圖像中微弱
    發(fā)表于 02-23 14:06 ?18次下載

    基于目標(biāo)檢測(cè)的SAR圖像匹配算法

    該文提出一種基于目標(biāo)檢測(cè)的SAR 圖像匹配算法。針對(duì)SAR 圖像的特點(diǎn),該算法先檢測(cè)SAR 圖像
    發(fā)表于 04-24 08:49 ?23次下載

    基于PowerPC的小目標(biāo)檢測(cè)系統(tǒng)

    目標(biāo)檢測(cè)系統(tǒng)的任務(wù)是根據(jù)探測(cè)器獲取的圖像序列實(shí)時(shí)地把小目標(biāo)從噪聲中檢測(cè)出來(lái),它的實(shí)現(xiàn)是目標(biāo)識(shí)別
    發(fā)表于 03-03 10:11 ?1150次閱讀
    基于PowerPC的小<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>系統(tǒng)

    一種圖像拼接的運(yùn)動(dòng)目標(biāo)檢測(cè)方法

    利用代數(shù)多重網(wǎng)格(AMG)方法對(duì)原始圖像進(jìn)行處理,得到重構(gòu)的多層網(wǎng)格圖像,在此基礎(chǔ)上利用背景差分法對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行檢測(cè)消除干擾。如拼接中出現(xiàn)多
    發(fā)表于 12-08 10:05 ?2次下載

    機(jī)器視覺(jué)圖像處理目標(biāo)檢測(cè)入門(mén)總結(jié)

    本文首先介紹目標(biāo)檢測(cè)的任務(wù),然后介紹主流的目標(biāo)檢測(cè)算法或框架,重點(diǎn)為Faster R-CNN,SSD,YOLO三個(gè)檢測(cè)框架。本文內(nèi)容主要整理
    的頭像 發(fā)表于 11-27 10:31 ?4113次閱讀

    計(jì)算機(jī)視覺(jué)目標(biāo)檢測(cè)

    目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域中一個(gè)新興的應(yīng)用方向。圖像分類(lèi)是對(duì)圖像進(jìn)行分類(lèi),比如判斷圖像中是否是車(chē)。定位分類(lèi)不僅要圖片分類(lèi),而且需要確定
    發(fā)表于 03-06 06:02 ?2次下載
    計(jì)算機(jī)視覺(jué)<b class='flag-5'>之</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>

    基于數(shù)字圖像處理的紅外弱小目標(biāo)檢測(cè)

    對(duì)于紅外圖像弱小目標(biāo)檢測(cè),先后提出了諸多算法,其中有,基于模糊分類(lèi)的微小目標(biāo)檢測(cè)算法,但是它的適用范圍比較小,有諸多的局限性。基于小波變域擴(kuò)
    的頭像 發(fā)表于 04-18 10:28 ?4959次閱讀
    基于數(shù)字<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>的紅外弱小<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>

    解析在目標(biāo)檢測(cè)中怎么解決小目標(biāo)的問(wèn)題?

    的發(fā)展中,也出現(xiàn)了一些提高小目標(biāo)檢測(cè)性能的解決方案。本文將對(duì)這些方法進(jìn)行分析、整理和總結(jié)圖像金字塔和多尺度滑動(dòng)窗口檢測(cè) 一開(kāi)始,在深學(xué)習(xí)
    的頭像 發(fā)表于 04-26 14:13 ?6278次閱讀
    解析在<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>中怎么解決小<b class='flag-5'>目標(biāo)</b>的問(wèn)題?

    基于改進(jìn)YOLOv2的遙感圖像目標(biāo)檢測(cè)技術(shù)

    ,并結(jié)合特征金字塔思想,増加了檢測(cè)尺度,達(dá)到了提高檢測(cè)精度的目的。冋時(shí)給岀了一種基于深度學(xué)習(xí)的遙感圖像目標(biāo)檢測(cè)算法的通用
    發(fā)表于 06-16 15:28 ?11次下載

    如何區(qū)分圖像分類(lèi)和目標(biāo)檢測(cè)技術(shù)

    目標(biāo)檢測(cè)的問(wèn)題定義是確定目標(biāo)在給定圖像中的位置,如目標(biāo)定位,以及每個(gè)目標(biāo)屬于哪個(gè)類(lèi)別,即
    發(fā)表于 07-11 12:50 ?524次閱讀

    目標(biāo)檢測(cè)的后處理:NMS vs WBF

    作者:Ching(Chingis)編譯:ronghuaiyang來(lái)源:AI公園導(dǎo)讀對(duì)目標(biāo)檢測(cè)處理中的NMS和WBF的解釋和對(duì)比。目前,計(jì)算機(jī)視覺(jué)在許多地方都有重要的應(yīng)用,例如自動(dòng)駕駛汽車(chē)、監(jiān)控系統(tǒng)
    的頭像 發(fā)表于 07-31 23:44 ?1171次閱讀
    <b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>的后<b class='flag-5'>處理</b>:NMS vs WBF

    圖像處理算法——邊緣檢測(cè)

    基于邊緣檢測(cè)的分析不易受整體光照強(qiáng)度變化的影響,同時(shí)利用邊緣信息容易凸顯目標(biāo)信息和達(dá)到簡(jiǎn)化處理的目的,因此很多圖像理解方法都以邊緣為基礎(chǔ)。邊緣檢測(cè)
    的頭像 發(fā)表于 11-30 16:56 ?1218次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>處理</b>算法——邊緣<b class='flag-5'>檢測(cè)</b>

    圖像分割與目標(biāo)檢測(cè)的區(qū)別是什么

    的區(qū)別。 定義 圖像分割是將圖像劃分為若干個(gè)區(qū)域或?qū)ο蟮倪^(guò)程,這些區(qū)域或?qū)ο缶哂邢嗨频膶傩裕珙伾⒓y理或形狀。圖像分割的目的是將圖像中的不同對(duì)象或區(qū)域分離出來(lái),以便進(jìn)行進(jìn)一步的分析和
    的頭像 發(fā)表于 07-17 09:53 ?1400次閱讀
    主站蜘蛛池模板: 亚洲男人天堂2018av| 一个人在线观看的视频| 榴莲推广APP网站入口官网| 黄得让人湿的片段| 韩国免费啪啪漫画无遮拦健身教练| 国产免费人成在线视频有码| 国产手机在线视频| 狠狠色狠狠色综合系列| 美女厕所撒尿ass| 欧美亚洲日韩国码在线观看 | 中文天堂www资源| 91夫妻交友论坛| wwww69| 公么我好爽再深一点| 国产精品自在在线午夜精品| 果冻传媒9CM在线观看| 久久久久久久久a免费| 六月婷婷国产精品综合| 世界第一黄暴漫画家| 亚洲精品久久AV无码蜜桃| 友田真希息与子中文字幕| 99久久国产综合精品| 粉嫩AV国产一区二区福利姬| 国产精品99久久久久久AV蜜臀| 教室眠催白丝美女校花| 全黄h全肉短篇禁乱np| 涩涩伊人久久无码欧美| 亚洲精品无码午夜福利在线观看| 56prom在线精品国产| 陈红下面又紧又小好爽| 国产亚洲精品AV片在线观看播放 | 嫩草影院在线观看精品视频| 让人爽到湿的小黄书| 亚洲色综合狠狠综合区| 60老妇性xxxxhd| 国产在线精品亚洲| 久久香蕉国产线看观看精品| 人和拘一级毛片| 长泽梓黑人初解禁bdd07| 国产精品色吧国产精品| 强被迫伦姧惨叫VIDEO|