色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種免反向傳播的 TTA 語義分割方法

jf_pmFSk4VX ? 來源:GiantPandaCV ? 2023-06-30 15:10 ? 次閱讀

我們已經介紹過兩篇關于 TTA 的工作,可以在 GiantPandaCV 公眾號中找到,分別是:

Continual Test-Time 的領域適應

CVPR 2023 中的領域適應: 通過自蒸餾正則化實現內存高效的 CoTTA

推薦對領域適應不了解的同學先閱讀前置文章。目前的 TTA 方法針對反向傳播的方式可以大致劃分為:

7a9f5ae0-16ef-11ee-962d-dac502259ad0.png請添加圖片描述

之前介紹過的 CoTTA 可以屬于 Fully Backward,EcoTTA 劃分為 Partial Backward 中的 Meta Network 類別,這次要介紹的方法屬于 Backward-Free 中的 BN-Based 和 Prototype-Based 的混合。下圖是一些 TTA 語義分割方式的比較,在(a)中是最樸素的重新做反向傳播優化目標域模型梯度的方法,效率低,存在誤差積累,且會導致長期遺忘。(b)是直接用每個實例的統計數據替代源統計數據(通過修改 Instance Normalization),但由于丟棄了基本的源知識,因此對目標變化非常敏感,導致不穩定。(c)研究了通過實例統計數據以固定動量或動態波動動量更新歷史統計數據的影響(相當于(b)的集群),然而,這種方法也容易受到誤差積累的影響。(d)表示這篇工作提出的方法,主要思想是以非參數化的方式利用每個實例來動態地進行自適應,這種方法既高效又能在很大程度上避免誤差積累問題。具體來說,計算 BN 層中源統計數據和當前統計數據的加權和,以適應目標分布,從而使模型獲得更健壯的表示,還通過將歷史原型與實例級原型混合構建動態非參數分類頭。7acd720e-16ef-11ee-962d-dac502259ad0.png

下面看下具體實現。

DIGA 概述

TTA 在語義分割中的應用,效率和性能都至關重要。現有方法要么效率低(例如,需要反向傳播的優化),要么忽略語義適應(例如,分布對齊)。此外,還會受到不穩定優化和異常分布引起的誤差積累的困擾。為了解決這些問題,這篇工作提出了不需反向傳播優化的 TTA 語義分割方法,被叫做稱為動態實例引導自適應(DynamicallyInstance-Guided Adaptation, DIGA)。DIGA 的原則是以非參數化的方式利用每個實例動態引導其自身的適應,從而避免了誤差累積問題和昂貴的優化成本(內存)。具體而言,DIGA 由分布適應模塊(DAM)和語義適應模塊(SAM)組成。DAM 將實例和源 BN 層統計信息混合在一起,以鼓勵模型捕獲不變的表示。SAM 將歷史原型與實例級原型結合起來調整語義預測,這可以與參數化分類頭相關聯。具體細節在后文介紹。

DAM 和 SAM 兩者都由實例感知信息引導。如下圖所示,給定一個測試樣本,首先將其輸入到源預訓練模型中,并通過 DAM 在每個 BN 層進行分布對齊。分布對齊是通過加權求和源統計和實例統計來實現的。之后,通過 SAM 在最后的特征層級上進行語義適應,通過加權混合歷史原型和實例感知原型來構建一個動態非參數化分類頭。這使我們能夠調整語義預測。最后,我們利用原始參數化分類頭和動態非參數化分類頭之間的相互優勢獲得最終的預測結果。

7b549f68-16ef-11ee-962d-dac502259ad0.png請添加圖片描述

Distribution Adaptation Module (DAM)

調整分布可以提高跨域測試性能,由于訓練數據有限和反向傳播成本高,最常見的方法是對抗訓練和分布差距最小化,但是不適合 TTA 任務。通常 BN 層中各域之間的靜態不匹配是跨域測試性能下降的主要原因。BN 層是使用可訓練參數 gamma 和 beta 進行縮放和移動。對于每個 BN 層,給定輸入特征表示 F,相應的輸出由以下公式給出:

E[F] 和 Var[F] 分別代表輸入特征 F 的期望值和方差。在實踐中,由于批次訓練過程,它們的值通過 running mean 在訓練期間計算:

所以,有一種方法源域的 running mean 的最后一個值被凍結,用作測試階段測試數據的預期值和方差的估計。但是,源統計信息仍會嚴重影響性能。還有一種方法提出了一種動態學習模塊,將 BN 層的統計信息 γ、β 調整為目標域(更新 γ、β)。盡管該方法具有高效性,但其性能仍然不理想。可能的原因之一是模型更新速率通常較小,并且在每個實例評估過程中沒有充分考慮實例級別的信息。

所以 DAM 考慮到了利用實例級別的信息。DAM 不是直接更新 γ、β,而是通過動態地合并(加權求和)源統計信息和實例級別的 BN 統計信息來計算 E[F] 和 Var[F] 的估計值。

其中, 和 是在測試期間使用第 t 個實例計算的均值和方差。

Semantic Adaptation Module (SAM)

DAM 是與類別無關的,如上所述,因為它僅在全局上對特征圖的分布進行調整。然而,對于分割自適應任務來說,類別特定性也很重要,因為即使在同一張圖像中,每個類別的分布也會有很大變化。為了解決這一點,之前的工作提出了兩種直觀的方法,熵最大化和偽標簽。然而,它們都需要基于梯度的反向傳播,因此限制了測試效率,和我們的思路背道而馳。受少樣本學習和域自適應中基于原型的方法(Prototype-Based)的啟發,引入了用于類別特定自適應的 SAM。具體做法,總結有如下幾步,我們用通俗的話解釋下,至于論文中的公式,也會貼上。

計算 Instance-aware prototypes:

根據輸入圖像中每個類別的像素,計算其在特征空間中的中心點(prototypes),稱為實例感知原型。這些原型表示了每個類別的特征分布。

通過對不同實例的原型進行平均計算,得到歷史原型。歷史原型是在大量目標實例上計算得到的,具有較高的穩定性。

Ensemble historical prototypes:

將歷史原型與實例感知原型進行集成,以進一步提高分類的準確性和穩定性。

Cal prototype-based classification result:

使用計算得到的實例感知原型和歷史原型,通過比較輸入像素與原型之間的相似度,進行分類預測。這種基于原型的分類方法可以更好地適應不同類別的變化。

Classifier Association

SAM 本質上是 prototype-based classification。在最后的部分,可以得到兩種類型的預測:一種來自原始的參數化分類器(p?),另一種來自引入的非參數原型分類器(p ?)。為了利用它們之間的互補性,DIGA 還是通過加權求和來獲得最終的預測結果,表示為:

實驗

在實驗的部分,我們更關心的是這些組合的有效性。下表是對 DAM 和 SAM 的消融實驗,最后一行表示分類器關聯。對于 BN 分支和語義分支,都分別比較出最佳和次佳。7b87a53e-16ef-11ee-962d-dac502259ad0.png和直接使用源域模型、其他的 SOTA TTA 方法的可視化比較如下,可以發現在 cityscapes 上的優化效果是最明顯的。

7ba0fe08-16ef-11ee-962d-dac502259ad0.png在這里插入圖片描述

總結

這篇工作提出了一種名為動態實例引導適應(DIGA)的方法來解決 TTA 語義分割問題,該方法兼備高效性和有效性。DIGA 包括兩個適應性模塊,即分布適應模塊(DAM)和語義適應模塊(SAM),兩者均以非參數方式受實例感知信息引導。此外,這是第三篇關于 TTA 的論文解讀了,后面出現有趣的工作還會繼續這個系列的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 內存
    +關注

    關注

    8

    文章

    3052

    瀏覽量

    74215
  • 像素
    +關注

    關注

    1

    文章

    205

    瀏覽量

    18613
  • 訓練模型
    +關注

    關注

    1

    文章

    36

    瀏覽量

    3880
收藏 人收藏

    評論

    相關推薦

    一種新的粘連字符圖像分割方法

    一種新的粘連字符圖像分割方法針對監控畫面采樣圖像中數字的自動識別問題,提出一種新的粘連字符圖像分割方法
    發表于 09-19 09:19

    一種帶驗證的自適應鏡頭分割算法

    :文中針對鏡頭分割在基于內容的視頻檢索中的重要性,首先介紹了普通的鏡頭分割方法,進而針對這些方法的不足,提出了一種帶檢測的自適應鏡頭
    發表于 12-16 12:25 ?21次下載

    一種目標飛機分割提取方法

    提出了一種目標飛機分割提取方法,該方法采用改進的使用金字塔式分割策略的以彩色高斯混合模型CMM(Gaussian Mixture Model
    發表于 11-10 15:46 ?7次下載
    <b class='flag-5'>一種</b>目標飛機<b class='flag-5'>分割</b>提取<b class='flag-5'>方法</b>

    一種自動生成反向傳播方程的方法

    為此,我們提出一種領域特定語言(domain specific language),以將這些數學公式描述為原始函數列表,并使用一種基于進化(evolution-based)的方法來發現新的傳播
    的頭像 發表于 08-14 09:55 ?3861次閱讀
    <b class='flag-5'>一種</b>自動生成<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>方程的<b class='flag-5'>方法</b>

    MIT提出語義分割技術,電影特效自動化生成

    來自 MIT CSAIL 的研究人員開發了一種精細程度遠超傳統語義分割方法的「語義分割」技術,
    的頭像 發表于 08-23 14:18 ?3907次閱讀

    Facebook AI使用單神經網絡架構來同時完成實例分割語義分割

    新架構“全景 FPN ”在 Facebook 2017 年發布的 Mask R-CNN 的基礎上添加了個用于語義分割的分支。這新架構
    的頭像 發表于 04-22 11:46 ?2915次閱讀
    Facebook AI使用單<b class='flag-5'>一</b>神經網絡架構來同時完成實例<b class='flag-5'>分割</b>和<b class='flag-5'>語義</b><b class='flag-5'>分割</b>

    語義分割方法發展過程

    語義分割的最簡單形式是對個區域設定必須滿足的硬編碼規則或屬性,進而指定特定類別標簽. 編碼規則可以根據像素的屬性來構建,如灰度級強度(gray level intensity). 基于該技術的
    的頭像 發表于 12-28 14:28 ?5147次閱讀

    分析總結基于深度神經網絡的圖像語義分割方法

    隨著深度學習技術的快速發展及其在語義分割領域的廣泛應用,語義分割效果得到顯著提升。對基于深度神經網絡的圖像語義
    發表于 03-19 14:14 ?21次下載
    分析總結基于深度神經網絡的圖像<b class='flag-5'>語義</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>

    基于深度神經網絡的圖像語義分割方法

    對應用于圖像語義分割的幾種深度神經網絡模型進行簡單介紹,接著詳細闡述了現有主流的基于深度神經網絡的圖像語義分割方法,依據實現技術的區別對圖像
    發表于 04-02 13:59 ?11次下載
    基于深度神經網絡的圖像<b class='flag-5'>語義</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>

    語義分割模型 SegNeXt方法概述

    語義分割是對圖像中的每個像素進行識別的一種算法,可以對圖像進行像素級別的理解。作為計算機視覺中的基礎任務之,其不僅僅在學術界廣受關注,也在無人駕駛、工業檢測、輔助診斷等領域有著廣泛的
    的頭像 發表于 09-27 15:27 ?3344次閱讀

    圖像語義分割的概念與原理以及常用的方法

    (Graph partitioning segmentation methods),在深度學習(Deep learning, DL)“統江湖”之前,圖像語義分割方面的工作可謂“百花齊放”。
    的頭像 發表于 04-20 10:01 ?4773次閱讀

    CVPR 2023 中的領域適應: 一種反向傳播TTA語義分割方法

    TTA語義分割中的應用,效率和性能都至關重要。現有方法要么效率低(例如,需要反向傳播的優化)
    的頭像 發表于 06-30 15:13 ?984次閱讀
    CVPR 2023 中的領域適應: <b class='flag-5'>一種</b><b class='flag-5'>免</b><b class='flag-5'>反向</b><b class='flag-5'>傳播</b>的<b class='flag-5'>TTA</b><b class='flag-5'>語義</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>

    一種在線激光雷達語義分割框架MemorySeg

    本文提出了一種在線激光雷達語義分割框架MemorySeg,它利用三維潛在記憶來改進當前幀的預測。傳統的方法通常只使用單次掃描的環境信息來完成語義
    的頭像 發表于 11-21 10:48 ?645次閱讀
    <b class='flag-5'>一種</b>在線激光雷達<b class='flag-5'>語義</b><b class='flag-5'>分割</b>框架MemorySeg

    圖像分割語義分割中的CNN模型綜述

    圖像分割語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡(CNN)作為深度學習的一種核心
    的頭像 發表于 07-09 11:51 ?1107次閱讀

    圖像語義分割的實用性是什么

    圖像語義分割一種重要的計算機視覺任務,它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術在許多領域都有廣泛的應用,如自動駕駛、醫學圖像分析、機器人導航等。
    的頭像 發表于 07-17 09:56 ?502次閱讀
    主站蜘蛛池模板: 国产成人精品自拍 | 午夜国产在线观看 | 色人阁综合 | 国产无遮挡色视频免费观看性色 | 97精品国产自产在线观看永久 | 午夜DV内射一区区 | 亚洲精品无码国产爽快A片百度 | jj插入bb| 免费精品国偷自产在线在线 | 国产精品九九久久 | 一级毛片在线免费视频 | 乱叫抽搐流白浆免费视频 | 亚欧成人毛片一区二区三区四区 | chinese情侣自拍啪hd | 色久久久综合88一本道 | 嗯 用力啊 嗯 c我 啊哈老师 | 免费看 a一级毛片 免费久久狼人香蕉网 | 成人免费无毒在线观看网站 | 国产av在线看的 | 色爱AV综合区 | 超碰视频在线 | 99re5久久热在线 | 久久88综合 | 久久热这里只有 精品 | 新影音先锋男人色资源网 | 91久久偷偷看嫩草影院无费 | 晓雪老师我要进你里面好爽 | 亚洲国产成人精品无码区APP | 亚洲 欧美 综合 高清 在线 | 色在线视频亚洲欧美 | 久久精品电影 | 伊人热 | 大陆老太交xxxxxhd在线 | 99久久做夜夜爱天天做精品 | 张津瑜的9分58秒7段免费 | 久草网国产自偷拍 | 在线涩涩免费观看国产精品 | 人性本色联盟 | 世界第一黄暴漫画家 | 中文字幕不卡在线高清 | 超碰在线观看 |