使用生成對抗網絡(GAN)進行圖像超分辨率(SR)已經在恢復逼真細節方面取得了巨大成功。然而,眾所周知,基于 GAN 的 SR 模型會產生令人難以接受的偽影,特別是在實際場景中。以往的研究通常在訓練階段通過額外的損失懲罰來抑制瑕疵,但這些方法只適用于訓練過程中生成的同分布下的瑕疵類型。而當這些方法應用于真實世界場景中時,我們觀察到這些方法在推理過程中仍然會產生明顯的瑕疵。針對此,來自騰訊 ARC Lab,XPixel 團隊和澳門大學的研究者們提出了 DeSRA 的新方法并發表論文。它能夠對在推理階段中產生的超分瑕疵進行檢測并消除。該論文被 ICML 2023 所接收。 ? “GAN 訓練時出現的瑕疵” 與 “GAN 推理時出現的瑕疵” 基于 GAN 的方法在生成帶有紋理的逼真復原結果方面取得了巨大成功。BSRGAN [1] 和 Real-ESRGAN [2] 將基于 GAN 的模型擴展到了真實場景應用,展示了它們恢復真實世界圖像紋理的能力。然而, GAN-SR 方法經常會生成令人視覺上難以接受的偽影,嚴重影響用戶體驗。這個問題在真實世界場景中更加嚴重,因為低分辨率圖像的退化是未知且復雜的。
第一列:低清輸入;第二列:現有超分方法引起瑕疵;第三列:DeSRA 檢測出瑕疵區域;第四列:DeSRA 去除瑕疵
為了緩解瑕疵的生成,LDL [3] 通過分析紋理類型,計算每個像素是瑕疵的概率,并在訓練過程中通過增加損失進而對瑕疵進行抑制。雖然它確實改善了 GAN-SR 的結果,但我們仍然可以觀察到 LDL 在推理真實世界測試數據時會存在明顯瑕疵,如上圖所示。因此,僅僅通過改善模型的訓練很難解決這些瑕疵問題,因為這些瑕疵在 GAN-SR 模型的訓練過程中可能并不出現。 這里我們區分一下 GAN 訓練出現的瑕疵和測試出現的瑕疵:
- GAN 訓練出現的瑕疵(GAN-training artifacts):出現在訓練階段,主要是由于訓練時網絡優化的不穩定和在同分布數據上的 SR 的 ill-pose 導致。在有干凈的高清圖像存在的情況下,可以在訓練過程中對這些瑕疵加以約束,進而緩解瑕疵的生成,如 LDL [3]。
- GAN 推理出現的瑕疵(GAN-inference artifacts):出現在推理階段,這些偽影通常是在真實世界未見過的數據中出現的。這些瑕疵通常不在訓練數據的分布中,并不會在訓練階段出現。因此,通過改善訓練過程的方法(例如 LDL [3])無法解決這些瑕疵問題。
- 這些瑕疵不會出現在預訓練的 MSE-SR 模型中。
- 這些瑕疵很明顯且面積較大,能夠很容易被人眼捕捉到。上圖展示了一些包含這些瑕疵的樣例。
- 局部紋理復雜性:局部區域 P 內像素強度的標準差 σ(i, j) 來表示局部紋理
- 絕對紋理差異 d:兩個局部區域的標準差(x 表示 GAN-SR 區域,y 表示 MSE-SR 區域)
- 相對紋理差異 d’:
- 歸一化到 [0, 1]:
- 引入一個常數 C:處理分母相對較小的情況
由于缺乏真實世界低分辨率數據的高清參考圖片,經典指標如 PSNR、SSIM 無法采用。因此,研究團隊考慮三個指標來評估檢測結果,包括 1) 檢測到的瑕疵區域與實際的(人工標注的)瑕疵區域之間的交并比(IoU),2) 檢測結果的精確度和 3) 檢測結果的召回率。當用 A 和 B 表示特定區域 z 的檢測到的瑕疵區域和實際的瑕疵區域時,IoU 定義為:
計算每個圖像的 IoU,并使用驗證集上的平均 IoU 來評估檢測算法。較高的 IoU 意味著更好的檢測準確性。然后,我們將檢測到的瑕疵區域集合定義為 S,正確樣本集合 T 定義為:
精確度 =表示正確檢測的區域數()占總檢測到的區域數()的比例。
研究團隊將實際的瑕疵區域定義為 G,并通過以下方式計算檢測到的 GT 瑕疵區域集合 R: ?召回率 =表示正確檢測到的 GT 瑕疵區域數()占總 GT 瑕疵區域數()的比例。其中,p 是一個閾值,研究團隊根據經驗將其設置為 0.5。
瑕疵檢測結果 如下表所示,針對 LDL 模型中的瑕疵檢測結果中,本文方法獲得了最好的 IoU 和 Precision,遠遠超過其他方案。需要注意的是,LDL 在 threshold=0.001 時獲得了最高的召回率。這是因為該方案將大部分區域視為瑕疵,因此這種檢測結果幾乎沒有意義。Real-ESRGAN 和 SwinIR 的結果可以參考原文。 ?研究團隊同時對比了使用 DeSRA 微調策略之前和之后的瑕疵檢測結果,結果如下表所示,當應用他們的 DeSRA 之后,Real-ESRGAN 的 IoU 從 51.1 降至 12.9,LDL 的 IoU 從 44.5 降至 13.9,說明瑕疵區域的檢測面積大大減少。去除率分別為 75.43% 和 74.97%,表明在微調之后,測試數據中四分之三的瑕疵可以完全消除。此外,他們的方法沒有引入額外瑕疵,添加率為 0。 本文在下圖中提供了使用與未使用該文方法改進 GAN-SR 模型的結果的視覺比較。與原始的模型結果相比,改進的 GAN-SR 模型生成的結果在視覺質量上更好,沒有明顯的 GAN-SR 瑕疵。所有這些實驗結果證明了本文方法能有效的緩解模型在處理真實的低清圖片時會出現的瑕疵。 ? ? ?User Study ?為了進一步驗證本文 DeSRA 微調策略的有效性,研究團隊進行了兩項用戶研究。第一項是比較原始 GAN-SR 模型和微調后的 GAN-SR 模型生成的結果。對于這個實驗,比較的重心是圖片中是否存在明顯的偽影。研究團隊產生了共 20 組圖像,每組包含 GAN-SR 模型和微調后的 GAN-SR 模型的輸出結果。這些圖像被隨機打亂。共有 15 人參與了用戶研究,并為每組選擇他們認為偽影較少的圖像。最終的統計結果如圖 9 所示。82.23% 的參與者認為微調后的 GAN-SR 模型生成的結果較少存在偽影。可以看出,本文方法在很大程度上消除了原始模型產生的瑕疵。 第二項是對微調的 GAN-SR 模型和原始的 MSE-SR 模型結果的比較。這個實驗是為了比較模型生成的結果是否有更多的細節。研究團隊總共產生了 20 組圖像,每組圖像包含了 MSE-SR 模型和微調的 GAN-SR 模型的輸出結果。這些圖像被隨機打亂。總共有 15 個人參加用戶研究,并為每組選擇他們認為有更多細節的圖像。最終的統計結果如圖 9 所示。93% 的參與者認為微調的 GAN-SR 模型生成的結果有著更多的細節。可以看出,微調的 GAN-SR 模型仍然比 MSE-SR 模型能夠生成更多的細節。 結論 在這項工作中,研究團隊分析了 GAN 在推理階段引入的瑕疵,并提出了方法來檢測和消除這些瑕疵。具體而言,他們首先計算了 MSE-SR 和 GAN-SR 的相對局部方差,并進一步結合語義信息來定位有瑕疵的區域。在檢測到存在瑕疵的區域后,他們使用基于 MSE 的結果作為偽高清圖片來微調模型。通過僅使用少量數據,微調的模型可以成功消除原始模型在推理過程中的瑕疵。實驗結果顯示了他們的方法在檢測和去除瑕疵方面的優越性,并且顯著提高了 GAN-SR 模型在實際應用中的能力。 在線持續學習 本文方法可以與持續學習相結合,從而提供一個新的范式來解決在線推理階段中出現的瑕疵問題。例如,對于處理真實世界數據的在線超分辨率系統,可以使用研究團隊的檢測流程來檢測復原的結果是否具有 GAN-inference 瑕疵。然后,他們可以使用檢測到的帶有瑕疵的圖像快速對超分辨率模型進行微調,使其能夠處理類似的瑕疵,直到系統遇到新的 GAN-inference 瑕疵。持續學習已經在高層視覺任務上得到廣泛研究,但尚未應用于超分辨率。研究團隊希望在未來研究這個問題,因為它可以極大地推進 GAN-SR 方法在實際場景中的應用。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
物聯網
+關注
關注
2912文章
44912瀏覽量
375933
原文標題:檢測并消除瑕疵,DeSRA讓真實場景超分中的GAN更加完美
文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
低電平靈敏專用儀器的技術原理和應用場景
:低電平靈敏專用儀器還采用先進的信號處理技術,如濾波、校準和自動量程切換等,以進一步提高測量的準確性和可靠性。這些技術能夠消除噪聲干擾、校正測量誤差,并自動適應不同范圍的信號測量。
二、應用場景低電平靈敏
發表于 12-06 14:45
汽車雷達回波發生器的技術原理和應用場景
路場景、不同天氣條件下的目標回波信號,包括距離、速度、角度等參數的精確控制。它利用調頻發射機產生強大的電磁感應動能,并通過收發切換開關將這一動能傳輸給天線。天線隨后將電磁感應動能輻射至空氣中,形成特定方向
發表于 11-15 14:06
納芯微提供全場景GaN驅動IC解決方案
作為當下熱門的第三代半導體技術,GaN在數據中心、光伏、儲能、電動汽車等市場都有著廣闊的應用場景。和傳統的Si器件相比,GaN具有更高的開關頻率與更小的開關損耗,但對驅動IC與驅動電路設計也提出
優可測超景深數碼顯微鏡AH-3000系列 產品手冊
優可測超景深顯微鏡:可進行360°無死角高像素高清觀察;應用于各行各業的瑕疵檢測、材料分析、失效分析、三維檢測等;一臺機器同時替代體式、金相、工具顯微鏡等,達到成本于效率的最大化。
發表于 09-25 14:06
?0次下載
利用TI GaN中的集成電流檢測功能更大限度提高系統效率
電子發燒友網站提供《利用TI GaN中的集成電流檢測功能更大限度提高系統效率.pdf》資料免費下載
發表于 08-29 11:28
?0次下載
單北斗定位終端的優勢在哪些場景下更加凸顯
單北斗定位終端以其高精度、實時性、廣泛覆蓋及自主可控等優勢,在應急救援、特種行業作業、危險環境監控、物流追蹤及精準農業等場景下更加凸顯其價值。在這些復雜多變的應用環境中,單北斗定位終端不僅確保了定位
GaN晶體管的應用場景有哪些
GaN(氮化鎵)晶體管,特別是GaN HEMT(高電子遷移率晶體管),近年來在多個領域展現出廣泛的應用場景。其出色的高頻性能、高功率密度、高溫穩定性以及低導通電阻等特性,使得GaN晶體
深圳恒興隆|制造業的新星:高光超精電主軸的崛起...
的多樣化,高光超精電主軸將更加注重定制化服務,滿足不同客戶的個性化需求。
綜上所述,高光超精電主軸作為精密制造領域的重要裝備之一,其高精度、高穩定性和高效率的特點使其成為制造業中不可
發表于 05-13 09:55
會議平板:讓遠程會議更真實、更生動
會議平板:讓遠程會議更真實、更生動 在數字化時代,遠程會議已經成為企業日常溝通的重要方式。然而,傳統的遠程會議方式往往因為溝通障礙、信息傳遞不全等問題,使得參會者難以獲得真實的交流體驗。如今,隨著
評論