我們每天用人臉識別技術解鎖手機、結賬付款,是那么的自然,但相信很少有同學深入思考這項技術背后是怎樣一個流程。
前面我們說,計算機視覺是人臉識別關系最緊密的技術。所以我們從這一點入手。
計算機視覺,通俗來說就是利用攝像頭等設備代替人眼,來獲取圖像,利用計算機對圖像信息進行處理,綜合人類的認知模式來建立人類視覺的計算理論。
這其中,最難的無疑是如何處理圖像信息、如何模擬人類的認知模式。
為了解決這些問題,計算機視覺還引入了圖像處理、模式識別、圖像理解、圖像生成等學科的知識。
圖像處理就是把原始圖像轉換成計算機更容易識別的圖像;模式識別,就是計算機判斷自己要識別的是什么和怎么識別的過程;圖像理解,就是對圖像中描述的景物進行分析;圖像生成,舉例來說就是當圖像的部分信息缺失時,能夠將缺失的信息補上……
這些都是計算機視覺需要借助的學科技術。這里面我們要著重講的是模式識別,它是一個獨立的理論體系,具體到計算機視覺領域的應用,它表示將計算機表示出來的圖像和一致的類別進行匹配的過程。
有點懂是吧。在這里為大家通俗解釋一下,所謂“識別”,就是先認識,然后辨別。認識什么?認識的是圖像和從圖像中總結的目標物體的特征。怎么辨別?就是將總結出來的特征和自己已經掌握的特征庫進行比對,然后才能實現辨別。
我們人類識別一樣物體也是遵循這個邏輯,先總結特征,然后比對。至于前面的“模式”,就有點抽象了,你可以理解為一種規律,它影響著特征和類型比對的結果。
沒錯,人臉識別本質上也是這個過程。
所以,我們沿著模式識別的思路,來看看它的整體過程:分別為預處理、特征提取和分類等。我們畫出如下流程圖:
預處理是第一步,但是這部分工作可能很多很雜,例如減少圖像中的噪聲干擾、提高清晰度、還有包括圖像濾波、變換、轉碼、模數轉化等。
特征提取,就是在預處理后的圖像中,提取對識別有明顯作用的特征,并在這個過程中降低模式特征的維數,令其便于處理。這是一個復雜的過程,后面我們講到具體方法時候會有體現;
分類,就是對提取到的特征值按照一定的準則進行分類,便于決策。
舉個例子,計算機要識別出這張照片中的男人,當它拿到照片時,可能覺得畫面太暗,先提個亮度,然后又發現噪點太多,再做個降噪……一頓操作后感覺可以了,再將照片轉化為數字信息,這個過程是預處理。
提取出來的特征值會進入單獨的特征空間,因為這樣可以更好地識別和做分類。接下來,就要對特征空間里的數據進行分類了,讓它們眼睛歸眼睛,鼻子歸鼻子,頭發歸頭發……基于這些分類好的數據,計算機才可以進行識別判斷和決策。
當然,為了方便大家理解這個邏輯過程,小編在這里只是舉例粗略地說明,可能不準確,實際的步驟也是相當復雜的,還要考慮各種干擾的因素,例如圖像的質量不清晰、背景復雜、圖像光照分布不均勻、目標姿勢角度出現扭曲或者佩戴了頭飾、眼鏡以及張了胡須、化了妝等等各種情況。
還有要說明的一點是,這個模式識別的系統是需要一個自我訓練、學習的過程的,其中最重要的是對前面分類錯誤率的訓練(分類器訓練),因為在前面的分類中,我們無法保證分類的結果是100%正確的,但必須控制在一定的錯誤率之類,這必須通過大量的訓練樣本來不斷修正,令錯誤率符合要求。
好了,基于以上對計算機視覺模式識別的討論,我們就可以給出人臉識別系統的主要功能模塊了:
可能有小伙伴覺得上面這個舉出功能模塊太簡單了,所以我們再精確一些,給出下面的邏輯架構圖,相信不難理解:
-
架構
+關注
關注
1文章
519瀏覽量
25514 -
人臉識別
+關注
關注
76文章
4015瀏覽量
82168
原文標題:PLC編程和繼電器控制,很全面的入門干貨全在這
文章出處:【微信號:GKYXT1508,微信公眾號:工控云學堂】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論