色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

探索對抗訓練的概率分布偏差:DPA雙概率對齊的通用域自適的目標檢測方法

智能感知與物聯(lián)網技術研究所 ? 來源:智能感知與物聯(lián)網技術研 ? 2025-01-15 13:45 ? 次閱讀

論文標題:Universal Domain Adaptive Object Detection via Dual Probabilistic Alignment

論文地址:

https://arxiv.org/abs/2412.11443

代碼地址:

https://github.com/WeitaiKang/SegVG/tree/main

▲ 圖1. UniDAOD任務示例 (通用跨域目標檢測

目標檢測作為計算機視覺領域的核心任務,在閉集場景中已經取得了顯著的進展。然而,現(xiàn)有的方法通常假設類別集合是固定的,并依賴于大量的標注數(shù)據(jù),這導致它們在處理跨域數(shù)據(jù)時,特別是在源域與目標域之間存在域偏移的情況下,泛化性能受限。例如,針對晴天數(shù)據(jù)訓練的目標檢測模型往往難以有效適應霧天或其他場景條件下的場景變化。

為了應對這一挑戰(zhàn),域自適應目標檢測(Domain Adaptive Object Detection, DAOD)方法被提出。DAOD 的主要目標是通過將源域的有標簽數(shù)據(jù)遷移到目標域的無標簽數(shù)據(jù)上,從而緩解源域與目標域之間分布不一致所帶來的性能下降問題。

在源域和目標域類別集合相同的前提下,DAOD 能夠有效實現(xiàn)跨域遷移,并減少對大規(guī)模標注數(shù)據(jù)的依賴,從而降低了高昂的數(shù)據(jù)標注成本。然而,在開放世界場景中,源域與目標域之間可能會存在私有類別(即目標域包含源域未見過的類別)。因此,傳統(tǒng)的 DAOD 方法受限于閉集假設,無法處理私有類別的域對齊問題,從而限制了其在開放世界場景中的應用。

為了解決這一問題,通用域自適應目標檢測(Universal Domain Adaptive Object Detection, UniDAOD)方法被提出。UniDAOD 通過放寬類別集合的閉集假設,能夠在沒有類別先驗信息的情況下實現(xiàn)源域與目標域的跨域對齊,從而適應包括閉集、部分集和開放集等多種場景。此方法顯著提升了目標檢測模型在開放世界中的魯棒性和泛化能力,拓展了目標檢測技術在更復雜和動態(tài)場景中的應用范圍。

現(xiàn)有UniDAOD模型的不足

現(xiàn)有的通用域自適應目標檢測(UniDAOD)方法的核心思想借鑒了域自適應目標檢測(DAOD)和通用域自適應(UniDA)方法的范式。

具體而言,UniDAOD 方法結合了 DAOD 系列的基礎對齊方法,包括實例對齊與全局對齊,并借鑒了 UniDA 系列方法來挖掘源域和目標域中的公共類別樣本。在 UniDA 中,通過構建概率閾值機制,域判別器的概率層面能夠篩選出公共類別的樣本,從而實現(xiàn)源域與目標域的對齊。

因此,現(xiàn)有的 UniDAOD 方法的基本流程通常包括以下步驟:

首先,區(qū)分源域和目標域中的類別,并將其劃分為公共類別和私有類別;

接著,去除私有類別,僅保留公共類別;

然后,針對這些公共類別的特征進行對齊,從而實現(xiàn)從開放集場景到閉集場景的轉變。

在域判別器的設計上,UniDAOD 通過設定概率閾值來進一步區(qū)分源域和目標域中的公共類別與私有類別,從而達到更精確的對齊效果。

盡管 UniDAOD 方法在許多場景下表現(xiàn)良好,尤其是在處理從閉集場景到開放集場景的轉變時,然而,直接使用 DAOD 和 UniDA 的方法結論,使得 UniDAOD 方法在開放世界場景下仍然存在次優(yōu)化問題。具體來說,以下兩個問題值得進一步探索:

1. 全局特征與實例特征是否都對齊公共類別特征?

2. 概率閾值是否在復雜的檢測任務中對不同特征都有效?

▲ 圖2. 域鑒別器中的概率的可視化。橫軸為訓練迭代次數(shù)(×100),縱軸為域判別器的概率。

為了探索上述問題,我們在圖 2 中對域判別器的概率進行了可視化分析。圖 2 為源域(Source Domain)和目標域(Target Domain)域鑒別器中的概率差異分析,分為全局級別(Global-level)和實例級別(Instance-level),在不同的域私有類別占比(25%、50%、75%)下進行評估。

在全局級別,圖 2(a) 中展示了隨著域私有類別比例的增加,源域與目標域之間的整體預測概率差異逐步擴大,表現(xiàn)為兩條概率曲線之間的間距逐漸增大,反映出域私有類別比例的提高顯著增強了域間的概率差異。

在實例級別圖 2(b) 中,呈現(xiàn)了實例目標特征的概率在源域和目標域中的概率差異。與全局級別相比,實例級別的概率差異更加顯著,即目標實例特征的概率差異在源域和目標域之間存在較大偏差。

此外,隨著域私有類別比例的增加,實例級別的概率差異并未發(fā)生顯著變化,而是保持相對穩(wěn)定。全局級別的概率差異隨著私有類別的增加而增加。

針對第一個問題,現(xiàn)有的域自適應目標檢測(DAOD)方法假設域共享類別集是已知的,并且在進行域對齊時,假定全局特征和實例特征對齊的貢獻是相同的。也就是說,全局特征和實例特征都應該對齊共享類別特征。然而,這與圖 2 中的結論相悖:全局特征傾向于對齊域私有類別,而實例特征則更傾向于對齊域共享類別。

針對第二個問題,現(xiàn)有的 UniDA 方法通過使用閾值對樣本進行篩選,但這依賴于穩(wěn)定的概率分布。在圖 2(a) 中,概率差異波動較大,導致閾值難以有效篩選樣本;而在圖 2(b) 中,概率變化相對穩(wěn)定,因此閾值篩選樣本效果較好。不同的特征在概率分布上是異構的。因此,現(xiàn)有基于閾值的范式難以在目標檢測中有效適應不同特征下的概率分布。

為了解決上述兩個問題,我們通過公式推導(見圖 3)證明了在最小化標簽函數(shù)期望的條件下,全局級別的特征傾向于對齊域私有類別,而實例級別的特征則傾向于對齊域共享類別。這一理論推導的結果與圖 2 中的實驗現(xiàn)象高度一致,進一步驗證了我們模型假設的合理性。基于這一發(fā)現(xiàn),接下來我們將引入雙概率建模方法,以實現(xiàn)異構域分布下的樣本采樣和權重估計。

▲ 圖3. UniDAOD的泛化誤差上界

在全局特征層面,區(qū)域提議網絡(RPN)構建了前景類別 和背景類別 的類別空間。 表示標簽函數(shù)。因此,域共享和域私有類別標簽函數(shù)的概率為:。

在實例特征層面,ROI頭部(ROI-head)構建了前景域共享類別(c)、域私有類別( )和背景類別()的類別空間,其中類別數(shù)量 假設條件是大于 1 。因此,域共享和域私有類別標簽函數(shù)的概率可以表示為:

我們通過分析 P 以估計當前特征標簽函數(shù)的概率。全局特征層面最小化;

1. 當滿足條件 (global-feature) (instance-feature) 時,域私有標簽函數(shù)可以在全局特征層面最小化;

2. 當滿足條件 (global-feature) (instance-feature) 時,域共享標簽函數(shù)可以在實例特征層面最小化。

雙概率建模

▲ 圖4. 實例級別特征的概率分布與頻率建模

通過圖 3 中的理論分析,我們已經明確了全局特征與實例特征在對齊過程中的不同作用,并揭示了域私有類別與域共享類別之間的關系。在此基礎上,雙概率建模方法能夠有效解決這些問題。

具體而言,我們通過對全局特征和實例特征進行正態(tài)分布建模,從而實現(xiàn)樣本的采樣與加權,進而更好地進行對齊。由于對抗訓練中的數(shù)據(jù)概率分布近似正態(tài)分布,因此我們采用正態(tài)分布對全局特征和實例特征進行建模,以進行樣本的采樣與加權。

在圖 4(a) 中,左圖展示了多次對實例特征進行采樣后的概率分布,結果表明這些特征的概率分布基本符合正態(tài)分布。因此,我們提出的一個直觀思路是通過正態(tài)分布建模概率,并剔除那些不符合正態(tài)分布的樣本。圖 4(b) 展示了我們的方法:首先計算樣本梯度的模長,并將其劃分為不同的 bins,進而建模高斯分布。

可以看到,位于分布邊緣之外的 bins 對應的樣本是需要剔除的樣本。所有這些 bins 的總和代表了特征空間中距離特征質心的采樣半徑,并且在對抗訓練過程中,基于源域或目標域數(shù)據(jù)的高斯分布,該半徑會動態(tài)調整。

▲ 圖5. 全局級別特征的分布累計函數(shù)CDF

在全局特征層面,我們通過使用累計分布函數(shù)(Cumulative Distribution Function, CDF)來估計私有類別的分布,從而避免因過度域對齊而導致的負遷移問題。根據(jù)圖 2 的結論,私有類別的增強概率通常偏離 0.5,因此在 CDF 上,私有類別的數(shù)量與其對應的分布值之間存在一定的關系。

為了避免直接將 CDF 作為權重進行對齊所可能引發(fā)的過度域對齊問題,我們計算源域和目標域的 CDF,并采用正則化方法對其進行調整。具體的 CDF 計算公式如下:

為了避免直接將 CDF 作為權重進行對齊所導致的過度域對齊,我們對源域和目標域的 CDF 值進行正則化調整。具體來說,我們設計了以下正則化形式作為域對齊的權重:

DPA模型框架

DPA 的模型設計思路主要來源于我們得到的公式(見圖 3)。在圖 6 中,DPA 包含三個定制模塊:全局級別域私有對齊(GDPA)、實例級別域共享對齊(IDSA)和私有類別約束(PCC)。

為了最小化目標域的域共享類別的上限 ,DPA 包括 GDPA、IDSA 和 PCC,以優(yōu)化方程:

中的項。GDPA 最小化域私有類別 域分布差異 ,適用于全局級特征;IDSA 最小化域共享類別域分布差異 ,適用于實例級特征。此外,PCC 最大化目標域的域私有類別風險誤差 。

具體來說,GDPA 利用全局級別采樣挖掘域私有類別樣本并通過累積分布函數(shù)計算對齊權重來解決全局級別私有類別對齊。IDSA 利用實例級別采樣挖掘域共享類別樣本并通過高斯分布計算對齊權重來進行域共享類別域對齊以解決特征異質性問題。PCC 在特征和概率空間之間聚合域私有類別質心以緩解負遷移。

▲ 圖6. 本文所提出的DPA 框架示意圖

實驗結果

我們在三個域自適應場景(開放集、部分集和封閉集)中,針對五個數(shù)據(jù)集對我們的DPA框架進行了評估。這些數(shù)據(jù)集包括:Foggy Cityscapes、Cityscapes、Pascal VOC、Clipart1k 和 Watercolor。

我們在三鐘域自適應場景(開放集、部分集和封閉集)中,針對五個數(shù)據(jù)集對我們的DPA框架進行了評估。這些數(shù)據(jù)集包括:Foggy Cityscapes、Cityscapes、Pascal VOC、Clipart1k 和 Watercolor。

在開放集場景中,源域和目標域均包含共享類別和私有類別樣本。我們引入了多個共享類別比例 來構建不同的共享類別比例基準,其中 和 分別表示源域和目標域的類別集合。在部分集場景中,源域的類別集合是目標域類別集合的子集,或者反之亦然。在封閉集場景中,源域和目標域的類別集合完全相同。

開放集場景中的性能結果

開放集場景中的性能結果

部分集場景中的性能結果

封閉集場景中的性能結果

消融實驗

可視化分析

為了比較所提方法與現(xiàn)有 DAOD 和 UniDAOD 方法在正遷移和負遷移方面的性能,我們在圖 7 中展示了 DAOD 和 UniDAOD 相對于僅使用源域模型的性能提升。

結果顯示,DAOD 方法存在顯著的負遷移,其中 DAF、MAF 和 HTCN 在類別 0 上的平均精度(AP)分別下降約 2%、4% 和 1%。

相比之下,UniDAOD 方法有效緩解了負遷移,CODE 和 DPA 在類別 4 上分別實現(xiàn)了約 3% 和 10% 的正遷移。這種基于類別的性能分析證明了所提方法能夠有效應對負遷移并增強正遷移效果。

▲ 圖7. 相較于Source-Only模型的類別性能提升(類別包括飛機、自行車、鳥、船和瓶子)。正遷移以綠色表示,負遷移以紅色表示。

▲ 圖8. 關于類別對齊的定性分析,以平均概率差為指標:(a) 全局特征對齊,(b) 實例特征對齊。橫軸表示訓練迭代次數(shù)(×100),縱軸為域判別器的概率。基準實驗采用 Pascal VOC 到 Clipart1k 數(shù)據(jù)集()。

我們進一步分析了 DPA 框架在開放集對齊中的概率差表現(xiàn)。如圖8(a) 所示,全局級別的平均概率差在 DPA 中更加顯著,這突顯了其在區(qū)分域私有類別方面的有效性。相比之下,圖 8(b) 顯示實例級別的平均概率差較小,這表明 DPA 能更好地對齊域共享類別。

此外,我們對全局域私有對齊進行了權重定量分析(見圖 9)。隨著域私有類別比例的增加,平均權重差也隨之增大,這表明對抗訓練通過權重調整,自適應地懲罰了與域私有類別相關的特征。

▲ 圖9. 針對全局域私有特征的權重定量分析。橫軸表示訓練迭代次數(shù)(×100),縱軸表示源域和目標域的權重值。

總結

我們提出了一種用于通用域自適應目標檢測的 DPA 框架,包含兩種概率對齊方式。受理論視角啟發(fā),我們設計了 GDPA 模塊,用于對齊全局私有樣本,以及 IDSA 模塊,用于對齊實例級域共享樣本。為應對負遷移問題,我們引入了 PCC 模塊,用于混淆私有類別的可辨識性。

大量實驗表明,在開放集、部分集和封閉集場景中,DPA 框架顯著優(yōu)于現(xiàn)有的通用域自適應目標檢測方法。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DPA
    DPA
    +關注

    關注

    0

    文章

    31

    瀏覽量

    15736
  • 目標檢測
    +關注

    關注

    0

    文章

    211

    瀏覽量

    15650

原文標題:AAAI 2025 | 探索對抗訓練的概率分布偏差:DPA雙概率對齊的通用域自適的目標檢測方法

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    LM98640是給一個過滿度的正弦波采集大量全碼數(shù)據(jù)進行概率分布計算DNL還是給個斜坡波進行靜態(tài)測試?

    是給一個過滿度的正弦波采集大量全碼數(shù)據(jù)進行概率分布計算DNL還是給個斜坡波進行靜態(tài)測試? 我用的正弦波測試結果怎么使兩頭各有一大坨黑的?
    發(fā)表于 12-25 07:11

    一文解析LOPA應用-點火概率估算的策略與實踐

    收到關于點火概率確定方法的咨詢,因其評估方法眾多且難獲全員認同,成為 LOPA 分析的痛點和難點。本文將探討 LOPA 分析時點火概率的估算方法
    的頭像 發(fā)表于 12-21 14:46 ?278次閱讀
    一文解析LOPA應用-點火<b class='flag-5'>概率</b>估算的策略與實踐

    AI模型部署邊緣設備的奇妙之旅:目標檢測模型

    并非易事,它涉及到從選擇合適的算法架構到針對特定硬件平臺進行優(yōu)化等一系列復雜的工作。 接下來,我們將詳細介紹如何在資源受限的邊緣設備上成功部署目標檢測模型,探索其背后的原理和技術,并討論解決該領域內常見
    發(fā)表于 12-19 14:33

    SAR ADC輸出規(guī)律性偏差是什么原因呢?

    串行輸出,ADC輸出整體趨勢正確,但是存在規(guī)律性偏差,DNL和INL出現(xiàn)分層現(xiàn)象,輸出碼字在類似010101這種連續(xù)變化的碼字缺失,類似0111這種碼字出現(xiàn)概率偏高,請問是什么原因呢?
    發(fā)表于 11-18 07:00

    RNN的損失函數(shù)與優(yōu)化算法解析

    函數(shù)有以下幾種: 交叉熵損失函數(shù) :交叉熵(Cross Entropy)是一種評估兩個概率分布之間差異的度量方法,即通過比較模型預測的概率分布
    的頭像 發(fā)表于 11-15 10:16 ?562次閱讀

    TAS5731M零下15度開機后概率無聲音是怎么回事?

    零下15度開機后概率無聲音,重啟后正常,查看日志發(fā)現(xiàn)是osc_trim寄存器值異常,有時候是82,有時候是00,正確的應該是C0。設置了一個修復機制即檢測到值異常后復位芯片,重新讀取,共計四次
    發(fā)表于 09-30 08:23

    stm32f407+ksz8863rlli概率性ping不通

    使用stm32f407+ksz8863rlli,有的板子概率性ping不通(每秒ping一次,概率性超時)。測量REF_CLK和RMII信號串聯(lián)0R電阻,波形有過沖,電阻全改為22R,REF_CLK
    發(fā)表于 09-27 15:02

    LM49450輸出引腳概率性燒壞的原因?

    喇叭使用8Ω/2W或4Ω/3W,芯片輸出Pin20和Pin22引腳都出現(xiàn)概率性燒壞現(xiàn)象,對地測量電阻值接近0歐姆,Pin20和Pin22引腳一般不同時出現(xiàn)燒壞,有時是Pin20引腳,有時是Pin22引腳,同時也測量喇叭的阻值,是正確的。僅更換新的LM49450芯片,又恢復正常工作了。
    發(fā)表于 09-27 09:48

    【探討】DTAS尺寸公差分析與尺寸鏈計算邀您探索單孔銷浮動之奧秘(二),快來圍觀吧!

    。即建立數(shù)學模型,然后運用數(shù)學知識求解新的隨機變量的累積分布函數(shù)、概率密度函數(shù)、期望方差等,然后與計算結果作對比。 利用同樣的方法我們也可以去推導解釋為什么在三維公差仿真分析中當我們用幅度與角度兩個
    發(fā)表于 08-08 17:12

    OPA548輸出脈沖概率性失真怎么解?

    使用OPA548輸出大電流窄脈沖驅動鐳射,發(fā)現(xiàn)脈沖信號概率性發(fā)生失真,具體波形如下 電路圖如下 麻煩請教出波形失真的具體原因以及改進方案
    發(fā)表于 07-29 07:57

    【大語言模型:原理與工程實踐】大語言模型的基礎技術

    概率推斷,利用共現(xiàn)矩陣學習每個詞的主題分布,進而將其作為詞的表示向量。在大規(guī)模語料庫中進行模型訓練,使語義相似的詞具有相似的主題分布。然而,這類方法
    發(fā)表于 05-05 12:17

    雷達檢測概率曲線的影響因素

    在閱讀雷達書籍和相關論文時發(fā)現(xiàn),雷達的檢測概率Pd和信噪比有一個函數(shù)關系 我的問題是如果這個函數(shù)關系是通用的,那么在門限一定的情況下,不同的雷達的檢測
    發(fā)表于 03-27 19:54

    SPI從模式MISO會概率性出現(xiàn)毛刺的原因?

    我們在使用F401RC這款MCU配置SPI1為從模式,速率為8MHZ,測試發(fā)現(xiàn)MISO信號,發(fā)現(xiàn)信號出現(xiàn)概率性如下圖所示的毛刺信號。我們斷開PCB上的串聯(lián)電阻把MCU的PIN腳懸空測試PIN腳依然出現(xiàn)毛刺信號,同時我們也檢測3.3V電源沒有發(fā)現(xiàn)有異常波動。請問是什么原因?
    發(fā)表于 03-20 08:00

    深度學習檢測目標常用方法

    深度學習的效果在某種意義上是靠大量數(shù)據(jù)喂出來的,小目標檢測的性能同樣也可以通過增加訓練集中小目標樣本的種類和數(shù)量來提升。
    發(fā)表于 03-18 09:57 ?778次閱讀
    深度學習<b class='flag-5'>檢測</b>小<b class='flag-5'>目標</b>常用<b class='flag-5'>方法</b>

    SPI雙機通信有極低概率丟幀要如何處理?

    SPI主從機通信,主從站用的是相同的板子,主站采用定時器觸發(fā)中斷發(fā)收,從站也采用中斷觸發(fā)發(fā)收,未使用DMA,可以正常通信收發(fā)數(shù)據(jù),通信周期為2ms,但正常通信過程中有極低概率出現(xiàn)從機片選被拉低到被拉高過程中,從站無數(shù)據(jù)接收的情況,有大佬遇到過或知道原因嗎?求解惑,謝謝!
    發(fā)表于 03-18 06:07
    主站蜘蛛池模板: 午夜视频在线网站| 精品免费在线视频| 国产精品亚洲污污网站入口| 精品国产麻豆免费人成网站| 欧美亚洲曰韩一本道| 亚洲一区电影在线观看| 成人性视频全过程| 久久精品国产清白在天天线| 色综合伊人色综合网站| 97在线视频免费播放| 精品欧美18videosex欧美| 日韩欧美亚洲精品综合在线| 在线观看免费视频播放视频| 国产精品一区二区四区| 欧美熟妇VIVOE精品| 伊人影院亚洲| 好姑娘BD高清在线观看免费| 十二月综合缴缴情| 办公室激情在线观看| 久青草国产97香蕉在线视频| 亚洲AV综合色一区二区三区| 岛国大片在线播放免费| 嫩草AV久久伊人妇女| 在线免费观看视频a| 久久91精品国产91久久户| 亚洲国产中文字幕新在线| 国产成人精品精品欧美| 日本xxx护士与黑人| 99精品免费观看| 麻豆E奶女教师国产精品| 亚洲一区免费看| 教室眠催白丝美女校花| 亚洲国产中文在线视频| 好爽胸大好深好多水| 亚洲 综合 欧美在线 热| 国产高清在线观看视频| 少爷不要别揉了高H| 国产av在线看的| 手机在线播放成人亚洲影院电影| 动漫美女被到爽了流漫画| 日本妈妈xxxx|