人臉識別的基本思想是比較類似的,都是要將圖像中的特征提取出來,轉(zhuǎn)換到一個(gè)合適的子空間里,然后在這個(gè)子空間里衡量類似性或分類學(xué)習(xí)。但問題在于,對客觀世界采用怎樣協(xié)調(diào)統(tǒng)一且有成效的表示法?我們要找到怎樣合適的子空間,怎樣去分類,才能區(qū)分不同類,聚集相似的類別?為解決這些問題,衍生出了很多種方法和解決方案。
所以說,我們所說的人臉識別技術(shù)是籠統(tǒng)的,事實(shí)上,這是一個(gè)很多技術(shù)和方法的集合。我們不妨依據(jù)上面的邏輯結(jié)構(gòu)圖來逐步說明。
預(yù)處理
人臉圖像的預(yù)處理,這一步?jīng)]有太多可說的,主要包括消除噪聲、灰度歸一化、幾何校正等,這些操作一般有現(xiàn)成的算法可以實(shí)現(xiàn),屬于比較基本的操作。不過要說明的是,這里主要說的是靜態(tài)人臉圖像的預(yù)處理,如果是動態(tài)人臉圖像的預(yù)處理,就比較復(fù)雜了,一般是要先將動態(tài)人臉圖像分割成一組靜態(tài)人臉圖像,然后對人臉進(jìn)行邊緣檢測和定位,在做一系列的處理,這里就不展開了。
特征提取
圖像特征的提取是比較關(guān)鍵的一步(上文所說的模式空間向特征空間的跨越),但對于圖像處理來說也是比較初級的一步。目前關(guān)于圖像特征提取的方法有很多,但其實(shí)我們想一想,通常而言圖像的特征還是可以歸類的,例如顏色特征、紋理特征、空間關(guān)系特征、形狀特征等,每一種特征都有匹配的方法,其中有一些比較經(jīng)典、好用的方法,例如HOG特征法,LBP特征法,Haar特征法等,這里就不一一講解,所以選取了其中一種——HOG特征法。
HOG特征也叫方向梯度直方圖,它是由Navneet Dalal和Bill Triggs在2005年的一篇博士論文中提出的。我們簡單來看它是怎么進(jìn)行的。
我們以這張照片為例,第一步是要將它變成黑白的照片,因?yàn)樯?a target="_blank">信息在這里對識別并沒有幫助。
在這張黑白照片中,我們從單個(gè)像素看起,觀察它周圍的像素,看它是往哪個(gè)方向逐漸變暗的,然后用箭頭表示這個(gè)像素變暗的方向。
如果對每個(gè)像素執(zhí)行這樣的操作,這樣所有像素都會被這樣的箭頭取代,它們表示了像素明暗變化的方向。每一個(gè)這樣的箭頭表示明暗梯度。
事實(shí)上,對于每一個(gè)像素,給定坐標(biāo)系,我們能夠求出它的梯度方向值。計(jì)算的方法比較復(fù)雜,我們不需要了解,只需要知道這一步是為了捕獲目標(biāo)的輪廓信息,同時(shí)進(jìn)一步弱化光照的干擾。
如果是以這樣的方式做提取的話,計(jì)算量會很大。所以我們會把圖像分割成8x8像素的小方塊,叫做一個(gè)Cell,然后對每個(gè)Cell計(jì)算梯度信息,包括梯度的大小和方向。得到的是這個(gè)Cell的9維特征向量。
相信到這里大家有些不懂了。在這里再為小伙伴們稍微解釋一下,其實(shí)這一步的目的是為每個(gè)Cell構(gòu)建梯度方向直方圖,直方圖就是我們大家熟知的條形統(tǒng)計(jì)圖,這個(gè)直方圖中,X軸是將方向劃分的區(qū)間,Navneet Dalal等人研究表示劃分9個(gè)區(qū)間效果是最好的,如果是180°的方向,每個(gè)區(qū)間就代表20°。y軸表示某個(gè)方向區(qū)間內(nèi)的梯度大小。這樣就等于是每個(gè)Cell的特征描述符。
圖片來源:加州大學(xué)舊金山分校圖像處理論文
大致就是這個(gè)意思。
這里還有一步,就是如果你的圖像受到光照的影響比較大,那么還可以將一定的Cell組成一個(gè)block,例如2x2個(gè)Cell,這樣每個(gè)block上就是36維的特征向量,然后對這36維特征向量做規(guī)范化(具體怎樣規(guī)范,涉及到高等數(shù)學(xué)的知識,大家也不需要知道)。
如果我們輸入的圖像大小是256x512像素,那么就有32x64=2048個(gè)Cell,有31x63=1953個(gè)block,每個(gè)block有36維向量,那么這個(gè)圖像就有1953x36=70308維向量。這70308維向量就是這個(gè)圖像的HOG特征向量了。
當(dāng)然,上面這些步驟你也可都不了解,你只需要知道,最后原始的圖像被表示成了HOG的形式,如下圖:
然后根據(jù)這個(gè)HOG形式,在我們的庫中找到與已知的一些HOG樣式中,看起來最相似的部分。
圖像識別
人臉識別技術(shù)經(jīng)過科學(xué)家多年的研究和發(fā)展,已經(jīng)形成了多種研究方向和更多種的研究方法,如果我們梳理一下,主要包括基于幾何特征的方法、基于模板的方法、基于模型的方法以及其他方法。
基于幾何特征的方法是比較早期、傳統(tǒng)的方法了,它主要是研究人臉眼睛、鼻子等器官的形狀和結(jié)構(gòu)關(guān)系的幾何描述,以此作為人臉識別的重要特征。
基于模板的方法基本思想是拿已有的模板和圖像中同樣大小的區(qū)域去比對,包括基于相關(guān)匹配的方法、特征臉方法、線性判別分析方法、神經(jīng)網(wǎng)絡(luò)方法等。
基于模型的方法的方向是對人臉的顯著特征進(jìn)行特征點(diǎn)定位,然后進(jìn)行人臉的編碼,再利用相應(yīng)的模型進(jìn)行處理實(shí)現(xiàn)人臉識別,例如隱馬爾柯夫模型,主動形狀模型和主動外觀模型的方法等。
-
圖像處理
+關(guān)注
關(guān)注
27文章
1299瀏覽量
56838 -
人臉識別
+關(guān)注
關(guān)注
76文章
4015瀏覽量
82151
原文標(biāo)題:工控幫-7月電氣工程師班火熱報(bào)名中!
文章出處:【微信號:GKYXT1508,微信公眾號:工控云學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論