下面就的幾個重要特性進行詳細介紹:
1、幀內預測
對I幀的編碼是利用空間相關性而非時間相關性而實現的。以前的標準只利用了一個宏塊內部的相關性,而忽視了宏塊之間的相關性,所以編碼后的數據量較大。為了進一步利用空間相關性,引入了幀內預測以提高壓縮效率。簡單地說,幀內預測編碼就是用周圍鄰近的象素值來預測當前的象素值,然后對預測誤差進行編碼。這種預測是基于塊的,對于亮度分量,塊的大小可以在16×16和4×4之間選擇,16×16塊有4種預測模式16×16 、 16×8 、 8×16 和 8×8,4×4塊有9種
預測模式;對于色度分量,預測是對整個8×8塊進行的,有4種預測模式。除了DC預測外,其他每種預測模式對應不同方向上的預測。
1)預測時所用塊的大小可變
假設基于塊的運動模型塊內所有象素都做了相同的平移,在運動比較劇烈時或者在運動物體的邊緣處,這一假設會與實際出入較大,導致較大的預測誤差,這時減小塊的大小可以使假設在小的塊中依然成立。同時,小的塊所造成的塊效應相對也小,從而提高預測的效果。
一 共采用了7種方式對一個宏塊進行分割,每種方式下塊的大小和形狀都不相同,這就使編碼器可以根據圖像的內容選擇最好的預測模式以提高預測效果。與僅使用16×16塊進行預測相比,使用不同大小和形狀的塊可以使碼率降低15%以上。
?。?)更精細的預測精度
在中,亮度分量的運動矢量使用1/4象素精度。色度分量的運動矢量由亮度運動矢量導出,由于色度分量的分辨率是亮度分量的一半(對4∶2∶0),所以其運動矢量精度將為1/8。既一個單位的色度分量的運動矢量所代表的位移僅為色度分量取樣點間距離的1/8。如此精細的預測精度,比整數精度可使碼率降低20%以上。
(3)多參考幀
支持多參考幀預測,即可以有多于一個(最多5個)在當前幀之前的解碼幀作為參考幀,產生對當前幀的預測。這適用于視頻序列中含有周期性運動的情況。這種技術,可以改善運動估計的性能,提高解碼器的錯誤恢復能力;但它也增加了緩存的容量,加大了編解碼器的復雜性。與只使用一個參考幀相比,使用5個參考幀可以使碼率降低5~10%。
(4)去塊效應濾波器
它的作用是消除經反量化和反變換后重建圖像中由于預測誤差產生的塊效應,即消除塊邊緣處的象素值跳變,從而改善圖像的主觀質量,并減小預測誤差。中的去塊效應濾波器還可以根據圖像內容做出判斷,只對由于塊效應產生的象素值跳變進行平滑,而對圖像中物體邊緣處的象素值不連續給予保留,以免造成邊緣模糊。與以往的去塊效應濾波器同的是,經過濾波后的圖像將根據需要放在緩存中用于幀間預測,而不是僅僅在輸出重建圖像時用來改善主觀質量。對于幀內預測,使用的是未經過濾波的重建圖像。
3、整數變換
對幀內或幀間預測的殘差進行DCT編碼。為了避免舍入誤差造成的編碼器和解碼器之間不匹配的問題,對DCT的定義做了修改,使得變換僅用整數加減法和移位操作即可實現,這樣在不考慮量化影響的情況下,解碼端的輸出可以準確地恢復編碼端的輸入。當然,這樣做的代價是壓縮性能略微下降。此外,該變換是針對4×4塊進行的,這也有助于減小塊效應。
為了進一步利用圖像的空間相關性,在對色度分量的預測殘差和16×16幀內預測的預測殘差進行上述整數DCT之后,標準還將每個4×4變換系數塊中的DC系數組成2×2或4×4大小的塊,進一步做哈達瑪(Hadamard)變換。
4、熵編碼
對于Slice層以上的數據,采用Exp-Golomb碼,這是一種沒有自適應能力的VLC。而對于Slice層(含)以下的數據,如果是殘差,有兩種熵編碼方式:基于上下文的自適應變長碼(CAVLC)和基于上下文的自適應二進制算術編碼(CABAC);如果不是殘差,采用Exp-Golomb碼或CABAC編碼,視編碼器的設置而定。
?。?)CAVLC
VLC的基本思想就是對出現頻率高的符號使用較短的碼字,而對出現頻率低的符號采用較長的碼字。這樣可以使得平均碼長最小。
在CAVLC中,采用若干VLC碼表,不同的碼表對應不同的概率模型。編碼器能夠根據上下文,如周圍塊的非零系數或系數的絕對值大小,在這些碼表中自動地選擇,盡可能地與當前數據的概率模型匹配,從而實現上下文自適應的功能。
?。?)CABAC
算術編碼是一種高效的熵編碼方案,其每個符號所對應的碼長被認為是分數。由于對每一個符號的編碼都與以前編碼的結果有關, 所以它考慮的是信源符號序列整體的概率特性,而不是單個符號的概率特性,從而能夠更大程度地逼近信源的極限熵,降低碼率。
中的CABAC實現了繞開算術編碼中無限精度小數的表示問題和對信源符號概率進行估計的問題。在CABAC中,每編碼一個二進制符號,編碼器就會自動調整對信源概率模型(用一個“狀態”來表示)的估計,隨后的二進制符號就在這個新的概率模型基礎上進行編碼。這樣的編碼器不需要信源統計特性的先驗知識,而是在編碼過程中自適應地估計。這使得CABAC有更大的靈活性,可以獲得更好的編碼性能—碼率降低大約10%。
5、SP Slice
SP Slice的主要目的是用于不同碼流的切換,也可用于碼流的隨機訪問、快進/快退和錯誤恢復。這里指的不同碼流,是指在不同比特率限制下對同一信源進行編碼所產生的碼流。設切換前傳輸碼流中最后一幀為Al,切換后的目標碼流第一幀為B2(假設是P幀),由于B2的參考幀不存在,直接切換顯然會導致嚴重失真,而且這種失真會向后傳遞。簡單的解決方法就是傳輸幀內編碼的B2,但是一般I幀的數據量很大,這種方法會造成傳輸碼率陡然增大。根據前面的假設,由于是對同一信源進行編碼,盡管比特率不同,但切換前后的兩幀必然有相當大的相關性,所以編碼器可以將Al作為B2的參考幀,對B2進行幀間預測,預測誤差就是SP Slice,然后通過傳遞SP Slice完成碼流的切換。與常規P幀不同的是,生成SP Slice所進行的預測是在Al和B2的變換域中進行的。SP Slice要求切換后B2的圖像和直接傳送目標碼流時一樣。當然,如果切換的目標是毫不相關的另一碼流,SP Slice就不適用了。
6、靈活的宏塊排序
靈活的宏塊排序(FMO),是指將一幅圖像中的宏塊分成幾個組,分別獨立編碼,某一個組中的宏塊不一定是在常規掃描順序下前后連續,而可能是隨機地分散在圖像中各個不同的位置。這樣,在傳輸時,如果發生錯誤,某個組中的某些宏塊不能正確解碼時,解碼器仍然可以根據圖像的空間相關性,依靠其周圍正確譯碼的象素,對其進行恢復。
這些特點使得它的應用場合相當廣泛,包括可視電話(固定或移動)、實時視頻會議系統、視頻監控系統及因特網視頻傳輸、多媒體信息存儲等。
三、小結
最終,DVB-H標準主要解決了基于DVB數據廣播和地面電視標準融合后的兩個問題:它采用的基于時分復用的策略,實現了節省功耗和業務的無縫交互;使用MPE-FEC技術,可提供魯棒性更強的信號,使得在室內低速率移動和室外高速率移動的手持終端(特別是手機)能進行正常的業務訪問。
以其高效的編碼性能可以適用于多種網絡,同時也可滿足多種應用的需求。可以應用在基于電纜、衛星、 調制解調器、 DST 等信道的多種領域;也可應用于視頻數據在光學或磁性設備上的存儲和基于 ISDN 、以太網、 DSL 無線及移動網絡的公話服務、視頻流服務、彩信服務等方面。
未來的移動視頻接收中解決了編碼問題,DVB-H標準解決了視頻流在傳輸中存在的問題,使得從收聽廣播節目、觀看影像檔案到在手機上觀看電視直播,成為一個再自然不過的發展過程。這種體驗對于消費者所帶來的沖擊,絕對會令人難以想象。隨著電信網、計算機網和有線電視網的三網融合趨勢,已經注定這些各具優勢的技術在交叉和互補的運用過程中會誕生出多種多樣的新媒體,而手機將成為多種傳播媒體的載體,將成為一種新興媒體——多媒體的綜合服務終端。這必將給人們帶來更快、更多的信息獲取方式。
評論
查看更多