色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

采用5階流水線的去塊效應濾波器設計

電子設計 ? 來源:郭婷 ? 作者:電子設計 ? 2019-02-06 08:59 ? 次閱讀

引 言

圖像的編解碼技術是多媒體技術的關鍵,H.264/AVC是國際上最先進的視頻壓縮技術,其主要特點是采用小尺寸整數余弦變換、1/4像素的運動估計精度、多參考幀預測,基于上下文可變長度編碼和環路內去塊效應濾波器等技術。由于去塊效應濾波器大約占整個解碼器1/3的運算量,因此該部分的設計成為整個解碼器設計的瓶頸,在此研究了一種新穎的環路內去塊效應濾波器設計。設計中采用5階流水線的去塊效應模塊,利用混合濾波順序與打亂的存儲更新機制的方法提高了流水線暢順性,濾波一個16×16大小的宏塊僅需要198個時鐘周期。

1 H.264/AVC的去塊效應

在基于塊的視頻編碼方法中,各個塊的編解碼是互相獨立的,由于預測、補償、變化、量化等引起塊與塊之間的邊界處會產生不連續,因此新版H.264/AVC標準采用了環路內去塊濾波器來解決每個16×16宏塊重建后的邊界扭曲問題。去塊效應濾波有兩種方法:后處理去塊效應濾波;環路內去塊效應濾波。H.264/AVC采用環路內去塊效應濾波(見圖1),即濾波后的幀作為后面預測的參考幀。與之前的H.263或MPEG的濾波器相比較,新版H.264標準采用的濾波器基于更小的4×4的基本宏塊,基本宏塊的邊界根據片級/宏塊級的特性與根據像素穿過濾波邊界的漸變度,對需要濾波的宏塊邊界進行有條件的濾波。重建幀的每個像素都需要從外部存儲器中重調出來以進行濾波處理或作為相鄰像素來判斷當前像素是否需要進行濾波。顯然,這些操作需要消耗巨大的存儲器帶寬,對像素值進行修改。

采用5階流水線的去塊效應濾波器設計

本文設計的去塊效應濾波模塊采用流水線技術來提高系統吞吐量。理想流水線的高效率實現基于相鄰的濾波操作沒有數據性。文獻[3,4]采用了非流水線的架構,因此無法提高系統的吞吐量。而對于流水線架構,如若不優化濾波順序與存儲器訪問次序,則所產生的數據與結構冒險也將大大降低流水線的效率。有人使用雙端口的片上SRAM來減少片外存儲器的帶寬,增加了系統的吞吐量,但是雙端口存儲器面積較大且增加功耗。與流水線的濾波器相比,非流水線濾波器的操作(包括條件判斷、查表、像素計算等)是順序化的,即每個時鐘僅處理一個操作類型,因此它所能達到的最大系統頻率要低很多。

采用不同的邊界濾波順序,會大大的影響去塊效應濾波器的性能。在H.264/AVC標準中,每個宏塊的濾波順序得到了描述,只要保持濾波數據依賴性,H.264/AVC標準所描述的濾波順序可以被改進。其濾波順序包括兩類:順序濾波和混合濾波。但是其濾波順序以及相應的存儲更新機制都是針對非流水線結構的,因此如果直接將之應用于本文的流水線設計,就有可能引發嚴重的競爭與冒險從而降低流水線的性能。

2 去塊效應濾波器的存儲管理與濾波算法

H.264/AvC標準基于4×4宏塊作為濾波的基本宏塊,它有5種濾波強度,分別是Bs=0,1,2,3,4。濾波方式分為強濾波、標準濾波和直通3種方式,其中強濾波影響邊界兩邊的共6個像素,標準濾波影響邊界兩邊的共4個像素,直通方式不修改邊界兩側的像素。H.264/AVC標準規定先對垂直邊界進行濾波,然后再對水平邊界進行濾波,只有對垂直與水平邊界全部濾波完成后,才可以對下一個宏塊進行濾波。同一個宏塊中,先對亮度部分進行濾波,再對色度部分進行濾波;色度部分濾波時,先對C6部分進行濾波,再對Cr部分進行濾波,對整個16×16宏塊的濾波順序如圖2所示。

采用5階流水線的去塊效應濾波器設計

(1)邊界濾波強度與像素濾波的存儲器

按照H.264/AVC的標準,需要對被濾波的邊界兩側的像素進行有條件的濾波。該條件決定于邊界強度BS與像素穿越邊界的傾斜度。邊界強度BS:0,1,2,3或4,在進行濾波之前被賦給相應的邊界。BS=4表示強濾波,BS=0表示不需要進行濾波,即直通方式;否則,BS=1,2,3表示中等強度的濾波,色度部分邊界的濾波強度與對應亮度部分是相同的。濾波每條水平或垂直邊界需要被提供邊界兩邊的8個像素,p0~p3&q0~q3;需要更新的像素共6個或4個:p0~p2&q0~q2或聲p0,p1&q0,q1。

對一個16×16宏塊進行濾波需要提供左邊相鄰像素、右邊相鄰像素和本宏塊的像素。對于宏塊邊界,比如最左邊界與最右邊界而言,p0~p3與q0~q3來自不同的模塊(即分別來自相鄰宏塊的像素與本宏塊的像素);對于非16×16宏塊的邊界濾波,像素p0~p3與q0~q3均來自16×16宏塊本身,因此至少需要4個存儲單元:左相鄰像素存儲單元、上相鄰像素存儲單元、本身模塊的像素存儲單元和轉換緩沖單元,每個存儲單元的帶寬是32位。

當濾波從垂直邊界向水平邊界變換時,為了方便濾波過程中的存儲器訪問,這里利用額外的轉換緩沖器BUF0~BUF3來緩存中間濾波數據,采用轉換緩沖器后獲取一行或一列像素的值(即p0~p3&q0~q3)只需要1個時鐘周期,否則需要4個時鐘周期。

(2)濾波算法

環路濾波的基本思想是:判斷該邊界是圖像的真實邊界還是編碼所形成的塊效應邊界;對真實邊界不濾波,對偽邊界根據像素穿越邊界的漸變度和編碼方式進行濾波;根據濾波強度,選擇不同的濾波系數對邊界兩側像素進行濾波操作。濾波強度Bs=0的邊界將不會進行濾波,而濾波強度Bs不為0的邊界,依賴于獲取的量化參數α與β,進行閾值判斷,對鄰近的像素進行有條件的濾波。當濾波強度Bs不是0,并且下面3個條件成立時,才對鄰近像素進行濾波。

采用5階流水線的去塊效應濾波器設計

直接計算α,β是非常困難,而且消耗了很多硬件資源,因此通過查找表(LUT)獲取α,β的操作。像素的計算可以被分成下述兩種類型:

(1)Bs=4

如果以下的兩個條件成立,一個非常強的4抽頭或5抽頭濾波器將被用來對鄰近像素進行濾波,修改像素p0,p1,p2。

采用5階流水線的去塊效應濾波器設計

否則,若式(2)中有一個不成立,將不會對p1與p2進行濾波,只會對p0進行弱強度的濾波。對于色度部分邊界的濾波,如果式(2)成立,只會對p0與q0進行濾波。

(2)Bs=1~3

亮度像素p0與q0的計算如下:

采用5階流水線的去塊效應濾波器設計

而d_0是在裁減操作中被定義的:

采用5階流水線的去塊效應濾波器設計

式中:c0來自于c1,而c1是通過查找兩維的LUT表獲取的。

像素p1僅在式(3)成立的時候進行修改,同p0與q0修改的方式相同;而像素p2與q2對于濾波強度Bs不為4的情況下,不進行濾波。在色度分量進行濾波時,只有對p0與q0進行濾波,濾波的方式與亮度濾波的方式相同。

3 流水線濾波架構

3.1 流水線分析

流水線技術適合于連續的批處理任務,當一個N階流水線被灌滿以后,系統在一個周期內可以并行處理N個任務,由此提高了整組任務的處理速度并增大了系統吞吐能力。如果相鄰的濾波操作沒有數據競爭,并且所有的階段都被很好地進行了平衡,則濾波過程能夠被進行流水線操作化并可將速度提高N倍數。然而,如若存在競爭與冒險問題,則無法實現。此時的主要任務是如何均衡流水線的各個階段,如何把總的操作盡可能平均的分配給不同的流水線階段,如何避免或消除競爭與冒險,以便獲得一個比較平衡暢順的流水線架構。按照去塊效應濾波器模塊的實現算法,大多數的關鍵路徑位于以下操作中。

(1)查找表操作:取得α,β,c1參數。α,β參數均需在查找表操作之前進行基于量化參數與片級偏移參數的計算中使用。當Bs=1,2,3時,為獲取c1進行LUT操作,該操作比獲取α,β的LUT操作大3倍。

(2)當Bs=4時,需用4或5抽頭的濾波器進行濾波,原來的p,q像素值需要進行移位、相加等操作,以得到最后的結果。

3.2 流水線架構

基于上述分析,這里提出了5階流水線以提高吞吐量,見圖3。由于整個任務被分配到不同的階段實現,降低濾波的平均時間。

采用5階流水線的去塊效應濾波器設計

4 階流水線每個階段的任務

階流水線每個階段的任務為:獲取像素與濾波強度;閾值判斷;預濾波;二次濾波;回寫。操作類型轉換與可重新配置路徑設計:首先進行操作類型的變換,使用加法與移位操作硬件替換了原來所有的乘法與除法硬件。當Bs=4時,濾波被3,4,5抽頭的濾波器執行,盡管應用不同抽頭數目的濾波器,仍考慮硬件復用以及輸入數據路徑重新配置。由于設計中的表達式采用兩輸入加法,因而可以公用加法的中間結果。此外,通過重新配置在不同濾波抽頭系數時的加法器的輸入,達到共享資源的目的。同理,當Bs=1,2,3時,通過輸入路徑的重新配置,同樣達到共享加法與減法器,達到共享資源的目的,資源使用前后對比見表1。

采用5階流水線的去塊效應濾波器設計

5 流水線競爭與混合濾波順序

5.1 流水線競爭的原因

(1)數據競爭:當目的結果需要用作源操作數時;

(2)結構競爭:由于有限的存儲器帶寬,大量而頻繁的像素訪問需要以及存儲器的低效率管理而引起;

(3)控制競爭:相鄰邊界的濾波是相對獨立的,當一條邊界進入它的流水線階段時,它不能夠停止,直到它的第5階段新像素值回寫存儲器操作結束。控制競爭,由于分支語句或延遲等待引起的。

5.2 一種新穎的混合濾波順序

傳統的設計按照H.264/AVC標準使用了基本的順序濾波,沒有考慮到相鄰濾波邊界的數據重用與數據相互依賴性以及存儲器的讀與寫訪問延時,因此這里提出了新穎的濾波方法。新穎的濾波順序仍然遵守先左后右,先上后下的原則,但是考慮了相鄰邊界的數據依賴性與重用性,解決了數據冒險與結構冒險問題,避免了流水線的延遲。濾波包括亮度部分與色度部分,共48條邊界,濾波順序按照如圖4所示的從小到大的數字進行。

采用5階流水線的去塊效應濾波器設計

5.3 新穎的存儲更新策略

考慮到外部存儲器的帶寬是32位的,為了配合這里提出的邊界濾波順序,避免由于存儲器的帶寬限制而引起的結構競爭從而導致流水線出現延遲,這里提出了新穎的存儲器更新機制,即給不同的4×4宏塊分配不同的時隙進行像素回寫。

去塊效應模塊被分配在整個解碼模塊的最后一步實現,而其它的重建步驟、像幀內濾波模塊、幀間濾波模塊均以4×4宏塊為基本單位來進行流水線處理,但是由于去塊效應濾波模塊中不同邊界之間的數據依賴關系,因而它是以整個16×16宏塊為基本單位進行濾波的。此外,只有整個16×16宏塊的像素重建完畢之后.才可以進行該宏塊的濾波,因而使用了2個SRAM,一個為像素重建提供像素;另一個為像素濾波提供像素,當一個宏塊被處理完畢,兩個SRAM交換角色,這樣避免在兩個SRAM之間傳遞數據導致的時間與功耗開銷。使用仿真工具對整個去塊效應頂層模塊DF_top進行了仿真,仿真部分結果如圖5所示。

采用5階流水線的去塊效應濾波器設計

6 結 語

使用硬件描述語言完成了設計,并在FPGA平臺上得到驗證。設計采用流水線技術,混合濾波方法,配合新穎的存儲器更新機制等方案,實時濾波頻率上限約為200 MHz,吞吐量為濾波每個16×16宏塊需要198個時鐘周期。使用HJTC,CMOS工藝,使用Syn-opsys Co.的DC工具進行綜合,時序分析以及功耗分析,結論是時序滿足收斂要求,并且完成單個宏塊的濾波消耗的能量大約為2μW,功耗得到了很大的降低。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1630

    文章

    21760

    瀏覽量

    604382
  • 解碼器
    +關注

    關注

    9

    文章

    1144

    瀏覽量

    40803
  • 濾波器
    +關注

    關注

    161

    文章

    7846

    瀏覽量

    178417
收藏 人收藏

    評論

    相關推薦

    FPGA中的流水線設計

    令預取、 譯碼、 執行、 寫回結果, openrisc采用的是 5 級整數流水線。當然它們的核心思想都是利用并行執行提高效率??偨Y一下,流水線就是插入寄存
    發表于 10-26 14:38

    H.264解碼中一種新穎的效應濾波器設計,不看肯定后悔

    一種新穎的環路內效應濾波器設計,設計中采用5
    發表于 04-12 06:35

    現代RISC中的流水線技術

    作Stretch計算機)。后來的CDC 6600同時采用流水線和多功能部件。到了20世紀80年代,流水線技術成為RISC處理設計方法中最基本的技術之一。RISC設計方法的大部分技術
    發表于 03-01 17:52

    一種流水線結構AD轉換的速度分析方法

    提出了一種開關電容流水線結構A/D轉換(ADC)的速度分析方法。流水線結構ADC的速度取決于其級電路中開關電容反饋放大器的建立速度。根據流水線結構的特點,推導出輸入等效
    發表于 12-03 13:02 ?30次下載

    基于流水線技術的并行高效FIR濾波器設計

    基于流水線技術的并行高效FIR濾波器設計 基于流水線技術,利用FPGA進行并行可重復配置高精度的FIR濾波器設計。使用VHDL可以很方便地改變濾波
    發表于 03-28 15:12 ?825次閱讀
    基于<b class='flag-5'>流水線</b>技術的并行高效FIR<b class='flag-5'>濾波器</b>設計

    什么是流水線技術

    什么是流水線技術 流水線技術
    發表于 02-04 10:21 ?3934次閱讀

    基于流水線的并行FIR濾波器設計

    基于流水線技術,利用FPGA進行并行可重復配置高精度的 FIR濾波器 設計。使用VHDL可以很方便地改變濾波器的系數和數。在DSP中采用
    發表于 07-18 17:09 ?63次下載
    基于<b class='flag-5'>流水線</b>的并行FIR<b class='flag-5'>濾波器</b>設計

    電鍍流水線的PLC控制

    電鍍流水線的PLC控制電鍍流水線的PLC控制電鍍流水線的PLC控制
    發表于 02-17 17:13 ?36次下載

    通過并行流水線結構實現直接型FIR濾波器的系統設計方案

    必要在性能和實現復雜性之間做出選擇,也就是選擇不同的濾波器實現結構。這里運用并行流水線結構來實現速度和硬件面積之間的互換和折衷。
    發表于 03-04 09:22 ?3625次閱讀
    通過并行<b class='flag-5'>流水線</b>結構實現直接型FIR<b class='flag-5'>濾波器</b>的系統設計方案

    各種流水線特點及常見流水線設計方式

    按照流水線的輸送方式大體可以分為:皮帶流水裝配線、板鏈線、倍速鏈、插件線、網帶線、懸掛線及滾筒流水線這七類流水線。
    的頭像 發表于 07-05 11:12 ?7422次閱讀
    各種<b class='flag-5'>流水線</b>特點及常見<b class='flag-5'>流水線</b>設計方式

    如何選擇合適的LED生產流水線輸送方式

    LED生產流水線輸送形式分為平面直線傳輸流水線、各種角度平面轉彎傳輸流水線、斜面上傳流水線、斜面下傳流水線這四種輸送方式,企業也是可以根據L
    發表于 08-06 11:53 ?1033次閱讀

    CPU流水線的問題

    1989 年推出的 i486 處理引入了五級流水線。這時,在 CPU 中不再僅運行一條指令,每一級流水線在同一時刻都運行著不同的指令。這個設計使得 i486 比同頻率的 386 處理
    的頭像 發表于 09-22 10:04 ?2028次閱讀

    新版本Jenkins推薦使用聲明式流水線

    stage:和聲明式的含義一致,定義流水線的階段。Stage 在腳本化流水線語法中是可選的,然而在腳本化流水線中實現 stage ,可以
    的頭像 發表于 01-13 15:34 ?1016次閱讀

    什么是流水線 Jenkins的流水線詳解

    jenkins 有 2 種流水線分為聲明式流水線與腳本化流水線,腳本化流水線是 jenkins 舊版本使用的流水線腳本,新版本 Jenkin
    發表于 05-17 16:57 ?1094次閱讀

    新版本Jenkins推薦使用聲明式流水線

    stage:和聲明式的含義一致,定義流水線的階段。Stage 在腳本化流水線語法中是可選的,然而在腳本化流水線中實現 stage ,可以
    的頭像 發表于 07-20 16:43 ?698次閱讀
    主站蜘蛛池模板: 久久99国产精品一区二区| 亚洲性夜夜色综合网站| 高清AV熟女一区| 亚洲中文无码亚洲人在线观看-| 欧美日韩精品一区二区三区高清视频| 国产日韩精品一区二区在线观看| 99久久久无码国产精品免费人妻 | 免费一级特黄欧美大片久久网| 国产强奷伦奷片| 被两根巨大同时进去高H| 在线自拍亚洲视频欧美| 亚洲.欧美.中文字幕在线观看| 奇米狠狠干| 免费看到湿的小黄文软件APP| 金发欧美一区在线观看| 国产剧情麻豆mv| 动漫美女人物被黄漫在线看| 99成人在线| 亚洲在线成色综合网站| 亚洲国产在线2020最新| 天天色天天综合网| 日本熟妇乱妇熟色A片蜜桃| 免费人成网站永久| 久久婷婷色一区二区三区| 国语自产精品一区在线视频观看| 国产成人精品精品欧美| 超大号黑吊magnet| GOGOGO高清在线播放免费| 97超级碰碰人妻中文字幕| 最近的2019中文字幕HD| 在线国产视频观看| 伊人久久精品AV无码一区| 一边捏奶头一边啪高潮会怎么样| 亚洲国产中文字幕在线视频综合| 我把寡妇日出水好爽| 天美传媒果冻传媒入口视频| 视频专区亚洲欧美日韩| 色青青草原桃花久久综合| 日韩av片无码一区二区不卡电影 | 在线视频 国产精品 中文字幕| 亚洲日本天堂在线|