摘 要: 由于自然圖像摳圖具有高度的不確定性,目前的摳圖方法中對于前背景顏色較為復雜的圖片處理效果并不理想。本文首先通過采集大量的樣本對來估計初始的掩膜值,但是通過采樣得到的樣本對并不能很好地估計掩膜值,為此定義未知像素與前背景樣本點的空間距離和顏色距離函數來對其進行優化。
通過最小化該代價函數來求得最優的樣本對,使得最終得到的結果實現了準確性和魯棒性的良好均衡。自然圖像摳圖實驗結果表明,與其他幾種摳圖算法相比,本算法在視覺效果上和均差誤差上都優于其他算法。
0 引言
摳圖就是從一張給定的圖片中提取出感興趣的部分,數字圖像摳圖可以表示為前景F和背景B的線性組合,即顏色組合公式:
對于圖像中的每個像素點(x, y),式(1)中的I(x, y)代表該點的像素值,F(x, y)和B(x, y)代表該點的前景色和背景色的像素值,α代表前景色所占的比例,稱之為透明度或者掩膜值,α的取值介于[0, 1]之間,當α=1時表明當前像素是完全前景像素,當α=0時表示當前像素是完全背景像素,而摳圖的本質就是求出每個像素點對應的α值。由于式(1)中α、F和B都是未知的,所以式(1)的解具有高度不確定性,因此自然圖像摳圖實際上是一個不能精確求解的過程。
當前的摳圖方法根據研究圖像近鄰像素的相關性和圖像統計,可分為基于采樣、基于傳播、采樣傳播相結合三種方法。
其中基于采樣的摳圖方法通過計算前景和背景的顏色來估計掩膜值,早期的方法如Bayesian Matting[1]、Ruzon-Tomasi[2]、Hillman[3]等都是基于采樣的方法,但是通過采樣的方法采集到的前景和背景像素的樣本點具有不確定性,使得最終得到的掩膜值不夠精確;
基于傳播的方法不需要通過采集樣本點來估計掩膜值,它假設未知像素在一個小窗口內是局部平滑的,再在閉合空間中求解α。Random Walk Matting[4] 、Closed Form Solution[5] 、Poisson Matting[6]等都屬于基于傳播的方法,該方法對大部分圖片都能取得較好的結果,但是對一些前景和背景顏色較為復雜的圖像,采樣與傳播相結合的方法能取得更好的結果,如Shared Matting[7]、Robust Matting[8]、Comprehensive Sampling Matting[9]等。
對于復雜的圖像,要計算得到精確的掩膜值是比較困難的。本文首先采集大量的與未知像素相鄰的樣本點,然后通過未知像素與前景和背景樣本點的顏色空間距離來定義一個目標函數對其進行優化,從而選出最優的樣本對來求圖像的掩膜值,最后結合拉普拉斯矩陣和信度值函數對其進行優化得到最終的掩膜值。將本文得到的結果與多種摳圖算法進行比較,結果表明本文算法能取得更好的掩膜值。
1 Comprehensive Sampling Sets方法介紹
為了求出每個未知像素的最優樣本對,Comprehensive Sampling Sets方法根據光學和圖像空間統計來建立一個目標函數:
其中K表示像素點Iz與由式(1)求出的估計值之間的彩色誤差:
S表示樣本對(F,B)和未知像素的空間距離:
其中SzF是像素z的所有前景樣本點的集合,│SzF│表示樣本點的個數,SzB與其類似,FiS表示樣本點Fi的空間坐標。
C表示圖像中的顏色統計:
其中d(Fi, Bi)是Fi和Bi的顏色分布:
是樣本 Fi的均值、方差以及樣本群的大小。根據目標函數O,從中選出最優的樣本對,再根據下式:
計算出一個初始的掩膜值α,然后根據參考文獻[7]的方法對初始掩膜值進行優化。
2 基于顏色采樣摳圖
2.1 區域劃分
本文的算法需要用戶預先提供一張原圖像的trimap圖,也叫三分圖,它通過用戶手工操作得到目標邊界的前景、背景和未知區域的精細劃分,在得到的三分圖中,白色部分即為已知的前景區域,黑色部分為已知的背景區域,灰色部分則是需要計算的未知區域。
區域劃分的目的是減少計算的復雜度,因為圖像中大部分區域的掩膜值都是已知的,即前景部分的掩膜值為1,背景部分的掩膜值為0,只需要計算未知區域每個像素點的掩膜值。區域劃分的準確性對掩膜值有很大的影響,因此,為了使得到的結果更加精確,本文實驗所需的三分圖都由下載得到。
2.2 初始掩膜值的估計
由式(1)可知,對于一幅彩色圖像,該式中α、 F和B都是未知的,所以首先通過采樣的方法來采集前景像素樣本點F和背景像素樣本點B。在本文的算法中,采用參考文獻[8]的方法來采樣,即沿著己知前景區域和己知背景區域的邊界稀疏地采集樣本點,這樣采集得到的樣本集合能夠較好地捕捉到前景色或背景色的變化,當采集到足夠的樣本點之后,再根據式(7)來求初始的missing image file,但是僅僅通過采樣得到的missing image file還很粗糙,需要進一步優化。
為了優化初始的掩膜值,定義一個顏色空間代價函數來選擇最終的樣本對:
其中,
表示當前像素I與由顏色線性組合式(1)得到的估計值的顏色距離,如果當前像素I與顏色組合公式估計的值十分接近,那么(Fi, Bj)就可以作為較優的樣本對來估計掩膜值。這個式子在參考文獻[8]中首次被提出,在文獻參考[9]和[10]中也采用了相同的顏色代價函數,但是由于采集到的樣本對較多,僅僅通過式(8)來選擇最終的樣本對并不可靠,所以接下來定義空間代價函數
:
與參考文獻[9]的空間代價函數類似,為每個前景和背景樣本點定義一個空間距離函數missing image file和missing image file,式(9)和(10)中missing image file、missing image file和xI代表前景樣本點、背景樣本點和未知像素的空間坐標,missing image file和missing image file表示已知的前景和背景樣本點的集合。
接下來根據顏色代價函數定義Pα,它表示當一個未知像素與前景樣本點的顏色較近而與背景樣本點的顏色相差較大時,就認為該未知像素很有可能就是一個完全前景像素,因此定義下式:
其中:
當PF趨近于0時,最小化Pα就相當于最小化α;當PF趨近于1時,最小化Pα就相當于最大化α;當PF=0.5時,則Pα是一個常數項。式(11)將會在目標函數中用來求最優的樣本對。
結合顏色空間代價函數定義一個選擇最終樣本對的代價函數:
最小化式(13)來求最優的樣本對,并且把求得的最優的樣本對記為
:
再利用求得的最優樣本對
來重新估計未知像素的掩膜值 。
2.3 掩膜值的優化
在上述算法中已經計算得到一個掩膜值,但是這個掩膜值并不夠精確,所以接下來采用閉合式空間中求解的方法對其進行優化。首先采用參考文獻[5]的方法構造一個拉普拉斯矩陣,由于摳圖問題是典型的不確定問題,因此需要添加一定的約束條件,把求得的掩膜值missing image file和信度值f作為數據項,信度值missing image file,其中σ=0.01,并且結合拉普拉斯矩陣作為約束項來構造一個代價函數:
missing image file
上式中,missing image file和missing image file是權重參數,設為200和0.1,D是一個對角矩陣,已知區域的像素記為1,未知像素的像素記為0,F是對角線元素為信度值f的對角矩陣;對式(15)關于α求導并令導數為0即可求得最終的α,圖1所得結果即為最終得到的掩膜值。
3 實驗及結果
本文實驗均在matlab下完成。實驗的系統配置為Inter(R) Core(TM) Quad CPU處理器、2.66 GHz主頻以及3.46 GB內存。實驗所需圖片均由下載得到,其中包括實驗原圖、trimap圖和ground-truth圖,如圖2所示。本文將5幅圖得到的實驗結果與Robust Matting[8],Global Sampling[10]、Comprehensive Sampling Sets [9]所得的結果進行比較。還計算出各個算法得到的掩膜圖與其相應的ground-truth圖的均方誤差作為算法性能評價的量化指標,如表1所示。
從表1及圖3可以看出,通過對5組圖片進行實驗,本文算法不管是從視覺角度還是均方誤差角度都具有明顯的優勢,其他三種算法中,Comprehensive Sampling Sets最好,Global Sampling次之,Robust Matting效果較差。從實驗結果可以看出,Robust Matting對于前背景顏色較為相近的圖片處理效果較差, Global Sampling對細節的把握不夠精確。本文算法得到的掩膜圖不僅在細節部分優于其他3種算法,而且與ground-truth相比,誤差最小。
4 結論
本文首先通過采集大量的樣本對求出初始的掩膜值,再定義一個顏色空間代價函數來選擇最優的樣本對,與以前的算法比較,本文利用未知像素與其較近的前景或背景樣本點的距離來判斷該未知像素是否為完全前景像素或者完全背景像素,并且在最終掩膜值的優化過程中把信度值作為約束項,使得最終得到的結果在細節方面更加精確,而且對于前背景顏色較為相近的圖片也能得到較為理想的結果。
參考文獻
[1] Chuang Y Y, Curless B, Salesin D H, et al. A bayesian approach to digital matting[C]。 Computer Vision and Pattern
Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on. IEEE, 2001, 2(2):
264-271.
[2] Ruzon M A, Tomasi C. Alpha estimation in natural images[C]。 Computer Vision and Pattern Recognition, 2000: Proceedings of IEEE Conference on. IEEE, 2000: 18-25.
[3] Hillman P, Hannah J, Renshaw D. Alpha channel estimation in high resolution images and image sequences[C].Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer SocietyConference on. IEEE, 2001, 1(1)::1063-1068.
[4] Grady L, Schiwietz T, Aharon S, et al. Random walks for interactive alpha-matting[C]。 Proceedings of VIIP. 2005,2005: 423-429.
[5] Levin A, Lischinski D, Weiss Y. A closed-form solution to natural image matting[J]。 Pattern Analysis and MachineIntelligence, IEEE Transactions on, 2008, 30(2): 228-242.
編輯:jq
-
編程
+關注
關注
88文章
3628瀏覽量
93817 -
CPU處理器
+關注
關注
0文章
20瀏覽量
9851
發布評論請先 登錄
相關推薦
評論