色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

華為諾亞提出全新目標檢測器Focus-DETR

CVer ? 來源:CVer ? 2023-08-02 15:43 ? 次閱讀

目前 DETR 類模型已經(jīng)成為了目標檢測的一個主流范式。但 DETR 算法模型復雜度高,推理速度低,嚴重影響了高準確度目標檢測模型在端側(cè)設備的部署,加大了學術(shù)研究和產(chǎn)業(yè)應用之間的鴻溝。

來自華為諾亞、華中科技大學的研究者們設計了一種新型的 DETR 輕量化模型 Focus-DETR 來解決這個難題。

c9be268e-3084-11ee-9e74-dac502259ad0.png

論文地址:https://arxiv.org/abs/2307.12612

代碼地址 - mindspore:https://github.com/linxid/Focus-DETR

代碼地址 - torch:https://github.com/huawei-noah/noah-research/tree/master/Focus-DETR

為實現(xiàn)模型性能和計算資源消耗、顯存消耗、推理時延之間的平衡,F(xiàn)ocus-DETR 利用精細設計的前景特征選擇策略,實現(xiàn)了目標檢測高相關(guān)特征的精確篩選;繼而,F(xiàn)ocus-DETR 進一步提出了針對篩選后特征的注意力增強機制,來彌補 Deformable attention 遠距離信息交互的缺失。相比業(yè)界全輸入 SOTA 模型, AP 降低 0.5 以內(nèi),計算量降低 45%,F(xiàn)PS 提高 41%,并在多個 DETR-like 模型中進行了適配。 作者對多個 DETR 類檢測器的 GFLOPs 和時延進行了對比分析,如圖 1 所示。從圖中發(fā)現(xiàn),在 Deformable-DETR 和 DINO 中,encoder 的計算量分別是 decoder 計算量的 8.8 倍和 7 倍。同時,encoder 的時延大概是 decoder 時延的 4~8 倍。這表明,提升 encoder 的效率至關(guān)重要。

c9c6fc82-3084-11ee-9e74-dac502259ad0.png

圖 1:多個 DETR 類檢測器的計算量和時延對比分析 網(wǎng)絡結(jié)構(gòu) Focus-DETR 包括一個 backbone,一個由 dual-attention 組成的 encoder 和一個 decoder。前景選擇器(Foreground Token Selector)在 backbone 和 encoder 之間,是一個基于跨多尺度特征的自頂向下評分調(diào)制,用來確定一個 token 是否屬于前景。Dual attention 模塊通過多類別評分機制,選擇更細粒度的目標 token,然后將其輸入到一個自注意模塊來彌補 token 交互信息的缺失。

c9ee46d4-3084-11ee-9e74-dac502259ad0.png

圖 2 :Focus-DETR 整體網(wǎng)絡結(jié)構(gòu) 計算量降低:前景篩選策略 目前已經(jīng)有一些對于前景 token 進行剪枝提升性能的方法。例如,Sparse DETR(ICLR2022)提出采用 decoder 的 DAM(decoder attention map)作為監(jiān)督信息。然而作者發(fā)現(xiàn),如圖 3 所示,Sparse DETR 篩選的 token 并不都是前景區(qū)域。作者認為,這是由于 Sparse DETR 使用 DAM 來監(jiān)督前景 token 導致的,DAM 會在訓練的時候引入誤差。而 Focus-DETR 使用 ground truth(boxes 和 label)來監(jiān)督前景的 token 的篩選。

ca3ffee8-3084-11ee-9e74-dac502259ad0.png

圖 3:Focus-DETR 和 Sparse DETR 在不同 feature map 上保留的 token 對比 為了更好地訓練前景篩選器,作者優(yōu)化了 FCOS 的前背景標簽分配策略,如圖 4 所示。作者首先為不同特征映射的包圍框設置了一個大小范圍。與傳統(tǒng)的多尺度特征標簽分配方法不同,它允許相鄰兩個特征尺度之間的范圍重疊,以增強邊界附近的預測能力。對每個擁有步長ca4c858c-3084-11ee-9e74-dac502259ad0.png?的特征?ca5cfb10-3084-11ee-9e74-dac502259ad0.png ,其中ca6d2986-3084-11ee-9e74-dac502259ad0.png代表多尺度特征的層級序號,ca7558a4-3084-11ee-9e74-dac502259ad0.png 代表在二維特征圖上的位置坐標,作者定義該特征在原圖上的映射位置為?ca854a16-3084-11ee-9e74-dac502259ad0.png,那么?

ca97164c-3084-11ee-9e74-dac502259ad0.png

,因此ca9c5a3a-3084-11ee-9e74-dac502259ad0.png 特征所對應的標簽應該為: ?

caa9f866-3084-11ee-9e74-dac502259ad0.png

其中cabf338e-3084-11ee-9e74-dac502259ad0.png 代表坐標和真值框中心之間的最大棋盤距離,cac620f4-3084-11ee-9e74-dac502259ad0.png 代表真值目標框,cad3c420-3084-11ee-9e74-dac502259ad0.png 分別代表被第cae219f8-3084-11ee-9e74-dac502259ad0.png層特征圖預測的目標的尺度的最大值和最小值,由于尺度重疊設置,

cae6ce80-3084-11ee-9e74-dac502259ad0.png

caff7a7a-3084-11ee-9e74-dac502259ad0.png

圖 4. 前背景標簽分配可視化 此外,來自不同特征映射的特征選擇的差異也被忽略,這限制了從最合適的分辨率選擇特征的潛力。為彌補這一差距,F(xiàn)ocus-DETR 構(gòu)造了基于多尺度 feature map 的自頂向下的評分調(diào)制模塊,如圖 5 所示。為了充分利用多尺度特征圖之間的語義關(guān)聯(lián),作者首先使用多層感知器 (MLP)模塊來預測每個特征圖中的多類別語義得分。考慮到高層語義特征,低層語義特征包含更豐富的語義信息,作者利用高層 feature map 的 token 重要性得分,作為補充信息來調(diào)制低層 feature map 的預測結(jié)果。

cb388e50-3084-11ee-9e74-dac502259ad0.png

圖 5:top-down 前景篩選評分調(diào)制策略 細粒度特征增強策略 在依靠前期設計的前景篩選器得到較為準確的前景特征后,F(xiàn)ocus-DETR 使用一種有效的操作來獲得更為細粒度的特征,利用這些細粒度特征以獲得更好的檢測性能。直觀地說,作者假設在這個場景中引入更細粒度的類別信息將是有益的。基于這一動機,作者提出了一種新的注意力機制,并結(jié)合前景特征選擇,以更好地結(jié)合利用細粒度特征和前景特征。 如圖 2 所示,為了避免對背景 token 進行冗余的計算,作者采用了一種同時考慮位置信息和類別語義信息的堆疊策略。具體來說,預測器cb3fd37c-3084-11ee-9e74-dac502259ad0.png?(?) 計算出的前景評分cb5b35c2-3084-11ee-9e74-dac502259ad0.png和類別評分cb68b04e-3084-11ee-9e74-dac502259ad0.png的乘積將作為作者最終的標準cb718b42-3084-11ee-9e74-dac502259ad0.png來確定注意力計算中涉及的細粒度特征,即: ?

cb7b2328-3084-11ee-9e74-dac502259ad0.png

其中cb915418-3084-11ee-9e74-dac502259ad0.pngcb96ba0c-3084-11ee-9e74-dac502259ad0.png分別代表前景得分和類別概率。 ? 與兩階段 Deformable DETR 的 query 選擇策略不同,F(xiàn)ocus-DETR 的多類別概率不包括背景類別 (?)。該模塊可以被視為一個 self-attention ,對細粒度特征進行增強計算。然后,已增強的特征將被 scatter 回原始的前景特征并對其進行更新。 ?實驗結(jié)果?主要結(jié)果? 如表一所示,作者將 Focus-DETR 在 COCO 驗證集上和其他模型的性能進行比較。可以發(fā)現(xiàn)同樣基于 DINO,F(xiàn)ocus-DETR 僅使用 30% token 的情況下,超過 Sparse DETR 2.2 個 AP。相比原始 DINO,僅損失 0.5 個 AP,但是計算量降低 45%,推理速度提升 40.8%。 ?

cba7fe20-3084-11ee-9e74-dac502259ad0.png

表 1:總體對比實驗結(jié)果 模型效能分析 在圖 6 中,從不同模型的精度和計算量之間的關(guān)系來看,F(xiàn)ocus-DETR 在精度和計算復雜度之間達到了最好的平衡。整體來看對比其他模型,獲得了 SOTA 的性能。

cbd627a0-3084-11ee-9e74-dac502259ad0.png

圖 6 不同模型測試精度和計算復雜度之間的關(guān)聯(lián)分析 消融實驗 如表 2 所示,作者針對模型設計進行消融實驗,以驗證作者提出的算法的有效性。

cbdc7fc4-3084-11ee-9e74-dac502259ad0.png

表 2 本研究提出的前景特征剪枝策略和細粒度特征自注意力增強模塊對實驗性能的影響 1. 前景特征選擇策略的影響 直接使用前景得分預測 AP 為 47.8,增加 label assignment 策略生成的標簽作為監(jiān)督,AP 提升 1.0。增加自上而下的調(diào)制策略,能夠提升多尺度特征圖之間的交互,AP 提升 0.4。這表明提出的策略對于提升精度是非常有效的。如圖 7 可視化可以發(fā)現(xiàn),F(xiàn)ocus-DETR 可以精確地選擇多尺度特征上的前景 token。并且可以發(fā)現(xiàn),在不同尺度的特征度之間,可以檢測的物體存在重疊,這正是因為 Focus-DETR 使用了交疊的設置導致的。

cc00b718-3084-11ee-9e74-dac502259ad0.png

圖 7 多尺度特征保留的 token 2. 自上而下的評分調(diào)制策略的影響

cc8feb22-3084-11ee-9e74-dac502259ad0.png

表 3. 多尺度特征圖前景評分的關(guān)聯(lián)方法,作者嘗試自頂向下和自底向上的調(diào)制。 作者對比了自上而下的調(diào)制策略和自下而上的調(diào)制策略的影響,對比結(jié)果可以發(fā)現(xiàn),作者提出的自上而下的調(diào)制策略可以獲得更好的性能。 3. 前景保留比率對實驗性能的影響

cc98f244-3084-11ee-9e74-dac502259ad0.png

表 4.Focus-DETR、Sparse DETR 和 DINO+Sparse DETR 保留前景 token 的比例 作者對比了不同的剪枝比例的性能,從實驗結(jié)果可以發(fā)現(xiàn),F(xiàn)ocus-DETR 在相同的剪枝比例情況下,均獲得了更優(yōu)的結(jié)果。 總結(jié) Focus-DETR 僅利用 30% 的前景 token 便實現(xiàn)了近似的性能,在計算效率和模型精度之間取得了更好的權(quán)衡。Focus-DETR 的核心組件是一種基于多層次的語義特征的前景 token 選擇器,同時考慮了位置和語義信息。Focus-DETR 通過精確地選擇前景和細粒度特征,并且對細粒度特征進行語義增強,使得模型復雜度和精度實現(xiàn)更好平衡。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 檢測器
    +關(guān)注

    關(guān)注

    1

    文章

    869

    瀏覽量

    47760
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3298

    瀏覽量

    49074

原文標題:ICCV 2023 | 華為諾亞提出全新目標檢測器Focus-DETR

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    ECD檢測器的原理是什么?

    ECD的發(fā)現(xiàn)是一系列射線電離檢測器發(fā)展的結(jié)果。1952 年首次出現(xiàn)了 β-射線橫截面電離檢測器;1958 年 Lovelock 提出 β-射線氬電離檢測器
    發(fā)表于 10-16 09:01

    Arm連接到新目標時的常見問題

    了解使用Arm連接到新目標時的常見問題和答案開發(fā)工作室(Arm DS)。此內(nèi)容側(cè)重于使用的自動檢測、連接和調(diào)試新的或定制的仿真、FPGA和硅靶。 如果您無法在此處找到問題的解決方案: ?單擊我需要幫助連接到我的目標。我該去哪里?
    發(fā)表于 08-02 08:54

    一種基于順序統(tǒng)計量的距離擴展目標檢測器

    一種基于順序統(tǒng)計量的距離擴展目標檢測器::該文提出一種高斯白噪聲中的距離擴展目標檢測器。實際目標
    發(fā)表于 10-29 13:07 ?13次下載

    電池檢測器原理

    電池檢測器原理 電池或電池包裝上的一次性小型電池檢測器是綜合技術(shù)得以應用的好例子。綜合技術(shù)是用全新的方式組合多種現(xiàn)有的技術(shù)!電池檢測器依賴兩種特殊墨水:
    發(fā)表于 08-20 18:10 ?3493次閱讀

    Xilinx推出基于28nm Kintex-7 FPGA 的全新目標參考設計和全新開發(fā)基板

    賽靈思公司 (Xilinx, Inc. (NASDAQ:XLNX) )今天宣布推出基于 28 nm Kintex?-7 FPGA 的全新目標參考設計和全新開發(fā)基板
    發(fā)表于 01-09 09:44 ?1694次閱讀

    介紹RT-DETR兩種風格的onnx格式和推理方式

    RT-DETR是由百度近期推出的DETR-liked目標檢測器,該檢測器由HGNetv2、混合編碼
    的頭像 發(fā)表于 05-17 17:46 ?3424次閱讀
    介紹RT-<b class='flag-5'>DETR</b>兩種風格的onnx格式和推理方式

    Focus-DETR:30%Token就能實現(xiàn)SOTA性能,效率倍增

    目前 DETR 類模型已經(jīng)成為了目標檢測的一個主流范式。但 DETR 算法模型復雜度高,推理速度低,嚴重影響了高準確度目標
    的頭像 發(fā)表于 08-02 15:12 ?862次閱讀
    <b class='flag-5'>Focus-DETR</b>:30%Token就能實現(xiàn)SOTA性能,效率倍增

    一種新型的DETR輕量化模型Focus-DETR

    作者對多個 DETR檢測器的 GFLOPs 和時延進行了對比分析,如圖 1 所示。從圖中發(fā)現(xiàn),在 Deformable-DETR 和 DINO 中,encoder 的計算量分別是 decoder
    的頭像 發(fā)表于 08-02 15:34 ?720次閱讀
    一種新型的<b class='flag-5'>DETR</b>輕量化模型<b class='flag-5'>Focus-DETR</b>

    基于BEV的視覺3D目標檢測器

    根據(jù)我們的實驗分析,我們認為實現(xiàn)這一目標的關(guān)鍵在于提升檢測器在 BEV 空間和 2D 空間的適應性。這種適應性是針對 query 而言的,即對于不同的 query,檢測器要能以不同的方式來編碼和解碼特征。
    發(fā)表于 09-16 10:09 ?827次閱讀
    基于BEV的視覺3D<b class='flag-5'>目標</b><b class='flag-5'>檢測器</b>

    CCV 2023 | SparseBEV:高性能、全稀疏的純視覺3D目標檢測器

    本文介紹在3D 目標檢測領域的新工作:SparseBEV。我們所處的 3D 世界是稀疏的,因此稀疏 3D 目標檢測是一個重要的發(fā)展方向。然而,現(xiàn)有的稀疏 3D
    的頭像 發(fā)表于 09-19 10:00 ?1062次閱讀
    CCV 2023 | SparseBEV:高性能、全稀疏的純視覺3D<b class='flag-5'>目標</b><b class='flag-5'>檢測器</b>

    基于OpenVINO Python API部署RT-DETR模型

    RT-DETR 是在 DETR 模型基礎上進行改進的,一種基于 DETR 架構(gòu)的實時端到端檢測器,它通過使用一系列新的技術(shù)和算法,實現(xiàn)了更高效的訓練和推理,我們將在 Python、C+
    的頭像 發(fā)表于 10-20 11:15 ?1036次閱讀
    基于OpenVINO Python API部署RT-<b class='flag-5'>DETR</b>模型

    基于OpenVINO C# API部署RT-DETR模型

    RT-DETR 是在 DETR 模型基礎上進行改進的,一種基于 DETR 架構(gòu)的實時端到端檢測器,它通過使用一系列新的技術(shù)和算法,實現(xiàn)了更高效的訓練和推理,在前文我們發(fā)表了《基于 Op
    的頭像 發(fā)表于 11-10 16:59 ?793次閱讀
    基于OpenVINO C# API部署RT-<b class='flag-5'>DETR</b>模型

    百度開源DETRs在實時目標檢測中勝過YOLOs

    這篇論文介紹了一種名為RT-DETR的實時檢測Transformer,是第一個實時端到端目標檢測器
    的頭像 發(fā)表于 03-06 09:24 ?1739次閱讀
    百度開源DETRs在實時<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>中勝過YOLOs

    OpenVINO? Java API應用RT-DETR目標檢測器實戰(zhàn)

    本文將從零開始詳細介紹環(huán)境搭建的完整步驟,我們基于英特爾開發(fā)套件AIxBoard為硬件基礎實現(xiàn)了Java在Ubuntu 22.04系統(tǒng)上成功使用OpenVINO? Java API,并且成功運行了RT-DETR實現(xiàn)實時端到端目標檢測器
    的頭像 發(fā)表于 03-18 15:04 ?859次閱讀
    OpenVINO? Java API應用RT-<b class='flag-5'>DETR</b>做<b class='flag-5'>目標</b><b class='flag-5'>檢測器</b>實戰(zhàn)

    微波檢測器的原理是什么 微波檢測器的工作原理和用途

    的傳播規(guī)律。微波是一種頻率在300MHz至300GHz之間的電磁波,具有波長較短、穿透力強、抗干擾能力好等特點。微波檢測器利用這些特性,通過接收和處理微波信號,實現(xiàn)對目標物體的檢測和識別。 微波的傳播特性:微波在傳播過程中,
    的頭像 發(fā)表于 05-27 16:09 ?2054次閱讀
    主站蜘蛛池模板: 国产伦精品一区二区三区免费 | 国内外成人免费在线视频 | 色综合久久中文色婷婷 | 伊人第一路线 | 91久久线看在观草草青青 | 日韩在线av免费视久久 | bt天堂午夜国产精品 | 亚洲中文字幕永久在线全国 | 中国国产不卡视频在线观看 | 久久久国产精品免费A片蜜臀 | 久久免费看少妇高潮A片2012 | 国产免费看黄的私人影院 | 深夜草逼逼 | 国产精品自产拍在线观看中文 | 强奷乱码中文字幕熟女免费 | 色迷迷电影 | 亚洲国产av | 亚洲 自拍 清纯 综合图区 | 午夜福利小视频400 午夜福利网国产A | 99精品视频在线免费观看 | 菲律宾毛片 | 免费精品美女久久久久久久久 | 久久视频精品38线视频在线观看 | 露露的性战k8经典 | 亚洲另类中文字幕 | 久久在精品线影院精品国产 | 国产成人免费观看 | 午夜国产理论 | 久久久久影视 | 午夜噜噜噜私人影院在线播放 | 伊人久久中文 | 大肥婆丰满大肥奶bbw肥 | 差差差差差差差差免费观看 | 国内卡一卡二卡三免费网站 | 国产精品成人不卡在线观看 | 青青伊人影院 | 日韩精品无码久久一区二区三 | 19不插片免费视频 | 手机在线亚洲日韩国产 | 在线视频免费国产成人 | 精品视频在线一区 |