聲明:作為全網 AI 領域 干貨最多的博主之一,?? 不負光陰不負卿 ??
10w+讀者
論文基本信息【 CVPR2021 】
https://github.com/daooshee/HLA-Face-Code?github.com/daooshee/HLA-Face-Code
HLA-Face: Joint High-Low Adaptation for Low Light Face Detection?arxiv.org/abs/2104.01984
摘要翻譯
0. Abstract
微光下的人臉檢測對許多實際應用來說具有挑戰性,但卻至關重要,例如監控視頻、夜間自動駕駛。大多數現有的人臉探測器嚴重依賴于大量的注釋,而收集數據是費時費力的。為了減少在弱光條件下建立新的數據集的負擔,我們充分利用現有的正常光數據,探索如何將人臉探測器從正常光適應到弱光。這項任務的挑戰在于,對于像素級和物體級來說,普通光和弱光之間的差距太大,太復雜。因此,大多數現有的低光增強和適應方法并沒有達到理想的性能。為了解決這個問題,我們提出了一個聯合高-低適配(HLA)框架。通過雙向的低水平適應和多任務高水平適應方案,我們的HLA-Face即使沒有使用黑色面孔標簽進行訓練,也比最先進的方法表現得更好。
1. Introduction
人臉檢測是許多視覺任務的基礎,已廣泛應用于各種實際應用中,如智慧城市智能監控、人臉解鎖、手機美容濾鏡等。在過去的幾十年里,大量的研究在人臉檢測方面取得了很大的進展。然而,在不利光照條件下的人臉檢測仍然具有挑戰性。在光照不足的情況下拍攝的圖像會遭受一系列的退化,例如低能見度、強烈的噪聲和色彩。這些退化不僅會影響人類的視覺質量,還會使機器視覺任務的性能惡化,在監控視頻分析和夜間自動駕駛中可能會產生潛在的風險。在圖1 (a)中,目前最先進的人臉檢測器DSFD[1]很難檢測到光照不足的人臉,這與它在WIDER face[2]上超過90%的精度形成了直接對比。
為了促進微光人臉檢測的研究,構建了一個大尺度基準DARK face[3]。暗臉數據的出現催生了大量的暗臉檢測研究[4]。然而,現有的方法依賴于廣泛的注釋,因此健壯性和可伸縮性較差。
本文基于DARK FACE提供的標桿平臺,探討了如何在不需要DARK FACE標注的情況下,將普通光照人臉檢測模型適應于微光場景。我們發現在正常光和弱光之間存在兩級間隙。一個是像素級外觀上的差距,如照明不足、相機噪音和顏色偏差。另一個是普通燈光場景和弱光場景之間的對象層次語義差異,包括但不限于路燈、汽車前照燈和廣告牌的存在。傳統的低光照增強方法(5、6)設計用于提高視覺質量,因此不能填補語義空白,如圖1所示(b)。典型的適應方法[7,8]主要為場景設計的兩個域共享相同的場景,如適應從城市多霧的城市風光[10][9]。但就我們的任務而言,領域差距更大,為適應氣候變化提出了更艱巨的挑戰
為了適應從正常光照到低光照,我們提出了一種高-低適應人臉檢測框架(hlface)。我們考慮聯合低水平和高水平的適應。具體來說,對于低水平的適應,典型的方法要么使暗圖像變亮,要么使亮圖像變暗。然而,由于域隙巨大,它們并沒有達到理想的性能。我們不是單向的低到正常或正常到低的翻譯,而是雙向地使兩個領域彼此走向對方。通過使弱光圖像變亮,使正常光圖像失真,我們建立了介于正常和弱光之間的中間狀態。對于高階自適應,我們使用多任務自監督學習來縮小低階自適應建立的中間狀態之間的特征距離。
通過結合低級和高級自適應,即使我們不使用深色人臉的標簽,我們也勝過最先進的人臉檢測方法。
主要工作:
墨理學AI
2. Related Works
- Low Light Enhancement.
低照度是一種常見的視覺失真,可能由不良的拍攝條件、錯誤的相機操作、設備故障等引起。關于低照度增強的文獻很多。 直方圖均衡化及其變體 [11] 擴展了圖像的動態范圍。 基于去霧的方法 [12] 將暗圖像視為倒置的模糊圖像。Retinex 理論假設圖像可以分解為光照和反射。 基于 Retinex 理論,大部分作品 [5, 13] 估計光照和反射率,然后單獨或同時處理每個組件。 最近的方法主要基于深度學習。 一些設計端到端的處理模型[14],而一些則注入了傳統的思想,例如 Retinex 理論 [15,16,6]。 除了處理 8 位 RGB 圖像外,還有用于 RAW 圖像的模型 [17]。
問題是這些方法主要是為人類視覺而不是機器視覺設計的。 像素級調整如何有益于和指導高級任務尚未得到很好的探索。 在本文中,我們為深色人臉檢測提供了相應的解決方案。
- Face Detection.
早期的人臉檢測器依賴于手工制作的特征 [18],現在這些特征被從數據驅動的卷積神經網絡中學習到的深度特征所取代。 繼承通用對象檢測,典型的人臉檢測器可以分為兩類:兩階段和一階段。 兩階段模型 [19, 20] 首先生成區域提議,然后對其進行細化以進行最終檢測。 一階段模型 [21] 直接預測邊界框和置信度。 通用對象和人臉檢測之間的區別在于,在人臉檢測中,尺度變化通常要大得多。 現有方法通過多尺度圖像和特征金字塔 [22, 23] 或各種錨點采樣和匹配策略 [24, 25, 26] 解決了這個問題。
盡管人臉檢測研究蓬勃發展,但現有模型很少考慮光照不足的場景。 在本文中,我們提出了一種暗臉檢測器,even without using dark annotations,其性能也優于最先進的方法。
- Dark Object Detection.
With the rapid development of deep learning, object detection has attracted more and more attention. However, few efforts have been made for dark objects. For RAW images, YOLO-in-the-Dark [27] merges models pre-trained in different domains using glue layers and a generative model. For RGB images, Loh et al. build the ExDark [28] dataset and analyze the low light images using both hand-crafted and learned features. DARK FACE [3] is a large-scale low light face dataset, giving birth to a series of dark face detectors in the UG2 Prize Challenge1 . However, most of these models highly rely on annotations, thus are of limited flexibility and robustness.
為了擺脫對標簽的依賴,無監督域適應(Unsupervised Domain Adaptation, UDA)可能是一種簡單的解決方案[8,29]。雖然UDA方法在許多應用中已被證明是有效的,但由于正常和微光之間的巨大差距,這些方法在黑暗人臉檢測方面的性能有限。本文提出了一種結合低水平和高水平自適應的較優方法。
此處就不繼續有道翻譯了,了解到 該論文和代碼是用于 Low Light Face Detection 任務即可
墨理學AI
環境搭建
官方readME
經測試 pytorch==1.4.0 一樣可以順利運行該代碼,因此這里安裝的是 pytorch 1.4.0
torch 1.6.0 運行 測試代碼 則會遇到一個小的報錯
cat /etc/issue
Ubuntu 18.04.5 LTS n l
conda create -n torch14 python=3.6.6
conda activate torch14
conda install pytorch==1.4.0 torchvision==0.5.0 cudatoolkit=10.0 -c pytorch
pip install opencv-python
pip install scipy
pip install thop
pip install easydict
人臉檢測測試
模型準備:
項目結構如下
測試命令如下
python test.py
# 或者指定 gpu 編號
CUDA_VISIBLE_DEVICES=3 python test.py
GPU 占用 7539MiB
可視化檢測框
# 首先要正確設置 檢測圖像的 名字
vim draw_result.py +32
正確設置 檢測圖像的 名字
> 運行命令如下
python draw_result.py
- 效果如下
- 各位小伙伴,學會此文、可以換其他更有趣圖片進行實驗哈
可能遇到的報錯:RuntimeError: CUDA out of memory
RuntimeError: CUDA out of memory. Tried to allocate 190.00 MiB (GPU 0; 15.75 GiB total capacity; 1.40 GiB already allocated; 144.31 MiB free; 1.84 GiB reserved in total by PyTorch)
> 解決方法,使用一塊閑置并且 超過 8G的顯卡 進行測試即可
CUDA_VISIBLE_DEVICES=3 python test.py
nvidia-smi
此次運行源碼+模型+論文
按照此次博文環境搭建教程,即可運行成功
倘若鏈接失效、請評論區告知
鏈接:https://pan.baidu.com/s/1zt6j8uQDcj68W5U-0WYCNA
提取碼:nice
訓練 【這里就不展開啦】
官方該代碼訓練文檔 -- 已經足夠清晰?github.com/daooshee/HLA-Face-Code/tree/main/train_code
訓練數據集準備
魔法加速-即可下載
?? 歡迎和墨理一起學AI
點贊 收藏 ?留言 都是博主堅持寫作、更新高質量博文的最大動力!
各種技術Club : 計算機視覺、超分重建、圖像修復、目標檢測、模型部署等方向小伙伴可簡單交流
審核編輯 黃宇
-
AI
+關注
關注
87文章
31187瀏覽量
269556 -
源碼
+關注
關注
8文章
648瀏覽量
29301 -
人臉識別
+關注
關注
76文章
4012瀏覽量
82066
發布評論請先 登錄
相關推薦
評論