文章轉(zhuǎn)發(fā)自51CTO【ELT.ZIP】OpenHarmony啃論文俱樂部——《這些小風(fēng)景你不應(yīng)該錯(cuò)過》
1.圖像壓縮
在如今這個(gè)通信高度發(fā)展的時(shí)代,圖像壓縮已經(jīng)成為一個(gè)要求很高的領(lǐng)域。短視頻、音視頻通話、直播等等,相信這些都是大家每天能都能見到且離不開的東西。多媒體數(shù)據(jù),無論是圖形、音頻還是視頻數(shù)據(jù),解壓時(shí)都需要相當(dāng)大的傳輸帶寬和存儲(chǔ)容量;且圖像、視頻序列和計(jì)算機(jī)動(dòng)畫的需求以非常高的速度增長,因此有必要研究和分析圖像壓縮的技術(shù)來壓縮圖像和所有多媒體應(yīng)用程序,以節(jié)省存儲(chǔ)和傳輸時(shí)間。
1.1 圖像壓縮的歷史
圖像壓縮的研究起源于20世紀(jì)40年代。1948年香農(nóng)的經(jīng)典論文《通信的數(shù)學(xué)原理》中首次提到信息率失真函數(shù)的概念,1959年他又建立了率失真理論,從而奠定了信源編碼的理論基礎(chǔ)。隨后伯杰等人有對(duì)其進(jìn)行了深入的研究,并取得了一定的進(jìn)步,一些研究人員逐漸開始對(duì)聲音、文字和圖像信號(hào)的壓縮技術(shù)進(jìn)行了研究。
80年代中后期,相關(guān)學(xué)科的迅速發(fā)展和新興學(xué)科的不斷涌現(xiàn)為圖像壓縮編碼注入量新的活力。人們對(duì)圖像信息需求的劇增也有利地促進(jìn)了圖像壓縮技術(shù)的進(jìn)步,許多學(xué)者結(jié)合模式識(shí)別、計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺、神經(jīng)網(wǎng)絡(luò)、小波分析和分析幾何等理論,開始探索研究圖像壓縮的新理論和新方法。
1.2 如何壓縮
減少冗余和無關(guān)性一直是壓縮領(lǐng)域兩個(gè)重要和基本的部分,在圖像壓縮中也不例外。
其次圖像壓縮最終都是為人服務(wù)的,壓縮到什么程度并在這個(gè)程度將圖片壓縮到最優(yōu)的情況是很最重要的。就像很多人總想著買高刷屏打游戲,但是實(shí)際上,很多不是經(jīng)常打游戲的人是看不出來用不用高刷屏的區(qū)別的,而這就和我們的人眼視覺系統(tǒng)有關(guān)。
人眼視覺系統(tǒng)(HVS)是世界上最好的圖像處理系統(tǒng),但它遠(yuǎn)遠(yuǎn)不是完美的。人眼的視覺系統(tǒng)對(duì)圖像的認(rèn)知是非均勻的和非線性的,并不是對(duì)圖像中的任何變化都能感知。例如圖像系數(shù)的量化誤差引起的圖像變化在一定范圍內(nèi)是不能為人眼所覺察的。因此,如果編碼方案能利用人眼視覺系統(tǒng)的一些特點(diǎn),是可以得到高壓縮比的。
對(duì)人眼視覺特性的深入研究及由此而建立的各種數(shù)學(xué)模型,一直是各種圖像數(shù)字壓縮算法的基礎(chǔ)。
比如人眼的分辨率:當(dāng)空間平面上兩個(gè)黑點(diǎn)相互靠攏到一定程度時(shí),離開黑點(diǎn)一定距離的觀察者就無法區(qū)分它們,這意味著人眼分辨景物細(xì)節(jié)的能力是有限的,這個(gè)極限值就是分辨率。研究表明人眼的分辨率有如下一些特點(diǎn):
-
當(dāng)光照度太強(qiáng)、太弱或當(dāng)背景亮度太強(qiáng)時(shí),人眼分辨率降低
-
當(dāng)視覺目標(biāo)運(yùn)動(dòng)速度加快時(shí),人眼分辨率降低
-
人眼對(duì)彩色細(xì)節(jié)的分辨率比對(duì)亮度細(xì)節(jié)的分辨率要差,若黑白分辨率為1,則黑紅為0.4,綠藍(lán)為0.19
1.3醫(yī)學(xué)圖像的壓縮
隨著現(xiàn)代醫(yī)療水平的不斷進(jìn)步和經(jīng)濟(jì)實(shí)力的增強(qiáng),更多的醫(yī)療成像設(shè)備投入臨床應(yīng)用,數(shù)字化的醫(yī)學(xué)圖像在醫(yī)學(xué)臨床診斷中發(fā)揮的作用越來越重要,對(duì)醫(yī)學(xué)圖像壓縮技術(shù)的研究顯得尤為迫切。
DICOM(Digital Imaging and Communications in Medicine) 即醫(yī)學(xué)數(shù)字成像和通信,是醫(yī)學(xué)圖像和相關(guān)信息的國際標(biāo)準(zhǔn)。它定義了質(zhì)量能滿足臨床需要的可用于數(shù)據(jù)交換的醫(yī)學(xué)圖像格式。
從商業(yè)上來說,DICOM 數(shù)據(jù)壓縮和圖像質(zhì)量是會(huì)極大地影響醫(yī)療機(jī)構(gòu)企業(yè)成像效率的兩個(gè)因素。DICOM 數(shù)據(jù)壓縮有助于有效管理醫(yī)療機(jī)構(gòu)的醫(yī)學(xué)圖像工作流程,是設(shè)計(jì)企業(yè)成像工作流程時(shí)要考慮的關(guān)鍵要素。由于數(shù)據(jù)壓縮和傳輸速度而導(dǎo)致的延遲造成的累計(jì)時(shí)間損失量會(huì)直接影響產(chǎn)生的收入水平。傳輸速度的提高會(huì)帶來更高的生產(chǎn)率,從而轉(zhuǎn)化為更多的收入。
但是從個(gè)人的生命安全上來說,DICOM 的數(shù)據(jù)壓縮和圖像質(zhì)量關(guān)乎很多人的性命。例如,假設(shè)帶寬在 12 Mbps 左右,則發(fā)送平均為 930.17 MB 的 1542 圖像 CT 研究需要 5 分鐘。未壓縮的研究需要 10 分鐘才能路由,而 JPEG 無損壓縮則需要 6 分鐘,假設(shè)壓縮是在從模態(tài)接收?qǐng)D像時(shí)完成的,其開銷最小,這會(huì)導(dǎo)致位延遲(6 分鐘對(duì)比 5 分鐘)。在急診室設(shè)置中,周轉(zhuǎn)時(shí)間縮短 4 分鐘至關(guān)重要,甚至可以挽救生命。
上圖就是一個(gè)支持DICOM圖像壓縮的綜合急診室示例:A:滑動(dòng)CT掃描儀、B:CT檢查床、C:可移動(dòng)CT檢查懸臂、D:監(jiān)控屏幕、E:機(jī)械呼吸機(jī)
2.視頻壓縮
視頻編碼方式是指通過壓縮技術(shù),將原始視頻格式的文件轉(zhuǎn)換成另一種視頻格式文件的方式。視頻流傳輸中最為重要的編解碼標(biāo)準(zhǔn)有國際電聯(lián)的H.261、H.263、H.264。從 1967 年引入 H.120 作為第一個(gè)數(shù)字編碼標(biāo)準(zhǔn)的開始,數(shù)字視頻編碼已經(jīng)走了很長一段路。MPEG2 于 1994 年推出,MPEG4 于 1999 年推出,H.264 于 2003 年推出。本文接下來將列舉MPEG2、MPEG4和H.264的特點(diǎn),并說明它們的區(qū)別。
2.1MPEG2
MPEG2 是用于壓縮數(shù)字廣播視頻和 DVD 的編解碼器。使用 MPEG-2 編解碼器編碼的媒體文件通常具有文件擴(kuò)展名 .mpg、.mpeg、.m2v、.mp2,或在某些情況下為 .mp3。它也被稱為 H.262,并且仍在數(shù)字電視廣播和 DVD 視頻標(biāo)準(zhǔn)中使用。
MPEG2 于 1994 年創(chuàng)建,以修復(fù)其前身 MPEG1 的缺點(diǎn),需要與現(xiàn)有硬件和軟件相互兼容。它主要由索尼、湯姆遜和三菱電機(jī)開發(fā),之后成為 DVD 和 SD 數(shù)字電視的標(biāo)準(zhǔn)視頻格式。
2.2MPEG4
MPEG4 標(biāo)準(zhǔn)是 1995 年發(fā)起的一種 MPEG4 格式。最初是專門為非常低的比特率而創(chuàng)建的,現(xiàn)在它可以支持高達(dá) 4Mbps。MPEG4 包含六個(gè)部分:視覺、軟件、系統(tǒng)、交付多媒體集成框架 (DMIF)、一致性測(cè)試和音頻。
該視頻編碼標(biāo)準(zhǔn)旨在用于廣播、對(duì)話和交互環(huán)境。它還旨在執(zhí)行基于內(nèi)容的可擴(kuò)展性。由于 MPEG4 的構(gòu)建方式(采用了 MPEG1、MPEG2 和 VRML 的功能),可以在 Web 環(huán)境和電視中使用它,并且可以將來自兩個(gè)頻道的內(nèi)容集成到同一個(gè)多媒體環(huán)境中。
2.3H.264
H.264 視頻編碼格式,也稱為 H.264/MPEG-4 AVC(高級(jí)視頻編碼)是截至今最廣泛用于視頻內(nèi)容的錄制、壓縮和分發(fā)的格式。如果使用過 Netflix 和 YouTube 等互聯(lián)網(wǎng)流媒體資源以及 Adobe Flash Player 等網(wǎng)絡(luò)軟件,那么肯定已經(jīng)知道了 H.264 的作用。地面、有線和衛(wèi)xing上的各種 HDTV 廣播也使用 H.264 視頻編碼格式。
它由 ITU-T 視頻編碼專家組 (VCEG) 和 ISO/IEC JTC1 動(dòng)態(tài)圖像專家組 (MPEG) 標(biāo)準(zhǔn)化。第一個(gè)版本于 2003 年完成。H.264 視頻格式旨在以低于之前的視頻編碼格式的比特率提供良好的視頻質(zhì)量,這樣做的目的是在不增加設(shè)計(jì)復(fù)雜性或?qū)崿F(xiàn)成本太高的情況下做到這一點(diǎn)。它還具有靈活性,因此可以應(yīng)用于各種網(wǎng)絡(luò)和系統(tǒng)。
2.4AVS
AVS(Audio Video coding Standard),即數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn),是中國自主制定的音視頻標(biāo)準(zhǔn)。AVS2為中國第二代信源編碼標(biāo)準(zhǔn)。AVS3標(biāo)準(zhǔn)的制定工作已經(jīng)完成。現(xiàn)在很熱的HDR Vivid(菁彩HDR)(編者注:HDR是High-Dynamic Range 高動(dòng)態(tài)范圍的英文縮寫)支持的就是AVS2/AVS3的編解碼。HDR Vivid技術(shù)通過智能計(jì)算,讓不同的顯示設(shè)備都能呈現(xiàn)最優(yōu)畫面觀看效果,消費(fèi)者將在畫面里看到前所未見的豐富色彩與細(xì)節(jié)。
3. 其他關(guān)鍵技術(shù)
3.1 細(xì)胞神經(jīng)網(wǎng)絡(luò)的圖像壓縮技術(shù)
各種細(xì)胞神經(jīng) N/w 通用機(jī)(CNNUM)算法提出了極快的壓縮靜態(tài)和運(yùn)動(dòng)圖像。其關(guān)鍵思想是將圖像分割成空間子帶,只存儲(chǔ)下一子帶的重建圖像和去除空間冗余的原始圖像。該算法在無損壓縮方面表現(xiàn)更好,在壓縮比和速度方面優(yōu)于JPEG 標(biāo)準(zhǔn)。
-
優(yōu)點(diǎn):快速的壓縮效率
-
應(yīng)用:射線照相,圖像存儲(chǔ)和多媒體應(yīng)用程序
3.2S樹陰影方法
1998年之后,提出了一種新的灰度圖像壓縮方法,圖像的比特率和質(zhì)量表明STC方法比 BTCC 方法可靠。該方法的執(zhí)行周期小于 BTCC 的一半。
-
優(yōu)點(diǎn):在每個(gè)塊中考慮噪聲并增加執(zhí)行時(shí)間圖像的質(zhì)量也保持在令人滿意的方式,提出的樹蔭樹方法可以得到非常高的速度改進(jìn)。
-
應(yīng)用:實(shí)時(shí)通信和檢索圖像
3.3雙層圖像壓縮算法
適合的無損壓縮集中在分組編碼算法上。對(duì)于二進(jìn)制源符號(hào)概率 P0 和 p1算法,它解析其編碼區(qū)間。在 BAC 的基礎(chǔ)上,采用了跨雙級(jí)的模板移動(dòng)方法。為了對(duì)概率表模板進(jìn)行索引,我們構(gòu)造了一個(gè) 12 位的上下文表。
-
優(yōu)點(diǎn):適應(yīng)于每一位圖像信息。
3.4基于模糊算法的壓縮
模糊向量量化算法:在滿足矢量量化問題的同時(shí),提出了一種高效利用模糊聚類優(yōu)勢(shì)的算法。
-
優(yōu)點(diǎn):快速簡捷、概念有吸引力
基于模糊算法的圖像壓縮:系統(tǒng)性能取決于基于小波的子帶和矢量量化分解。
-
優(yōu)點(diǎn):低計(jì)算要求及更好的圖像質(zhì)量
<本文完>
參考文獻(xiàn)
https://sciencedirect.53yu.com/science/article/pii/S0167865501001064https://tarjomefa.com/wp-content/uploads/2017/09/7774-English-TarjomeFa.pdfhttp://www.txxb.com.cn/CN/abstract/abstract1885.shtmlhttps://ezinearticles.com/?Advantages-Of-DICOM-Imaging&id=6945078https://article.sciencepublishinggroup.com/pdf/10.11648.j.ijdsa.20170301.11.pdfhttps://www.docin.com/p-522878503.htmlhttps://huifu.wondershare.cn/repair/10070867.html
- Chung K L, Tseng S Y. New progressive image transmission based on quadtree and shading approach with resolution control[J]. Pattern Recognition Letters, 2001, 22(14): 1545-1555.
- Rehman M, Sharif M, Raza M. Image compression: A survey[J]. Research Journal of Applied Sciences, Engineering and Technology, 2014, 7(4): 656-672.
- 蔣東華, 劉立東, 王興元, 等. 基于細(xì)胞神經(jīng)網(wǎng)絡(luò)和并行壓縮感知的 圖像加密算法[J]. 圖學(xué)學(xué)報(bào), 2022, 42(6): 891.
- Advantages Of DICOM Imaging
- Embedded Image Compression:A Review
- 醫(yī)學(xué)圖像壓縮國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢(shì)
- 視頻格式MPEG2 、MPEG4和H264有什么區(qū)別
ELT.ZIP是誰?
ELT<=>Elite(精英),.ZIP為壓縮格式,ELT.ZIP即壓縮精英。
成員:
上海工程技術(shù)大學(xué)大二在校生閆旭
合肥師范學(xué)院大二在校生楚一凡
清華大學(xué)大二在校生趙宏博
成都信息工程大學(xué)大一在校生高云帆
黑龍江大學(xué)大一在校生高鴻萱
山東大學(xué)大三在校生張智騰
ELT.ZIP是來自6個(gè)地方的同學(xué),在OpenHarmony成長計(jì)劃啃論文俱樂部里,與來自華為、軟通動(dòng)力、潤和軟件、拓維信息、深開鴻等公司的高手一起,學(xué)習(xí)、研究、切磋操作系統(tǒng)技術(shù)...
寫在最后
OpenHarmony 成長計(jì)劃—“啃論文俱樂部”(以下簡稱“啃論文俱樂部”)是在 2022年 1 月 11 日的一次日常活動(dòng)中誕生的。截至 3 月 31 日,啃論文俱樂部已有 87 名師生和企業(yè)導(dǎo)師參與,目前共有十二個(gè)技術(shù)方向并行探索,每個(gè)方向都有專業(yè)的技術(shù)老師帶領(lǐng)同學(xué)們通過啃綜述論文制定技術(shù)地圖,按“降龍十八掌”的學(xué)習(xí)方法編排技術(shù)開發(fā)內(nèi)容,并通過專業(yè)推廣培養(yǎng)高校開發(fā)者成為軟件技術(shù)學(xué)術(shù)級(jí)人才。
啃論文俱樂部的宗旨是希望同學(xué)們?cè)陂_源活動(dòng)中得到軟件技術(shù)能力提升、得到技術(shù)寫作能力提升、得到講解技術(shù)能力提升。大學(xué)一年級(jí)新生〇門檻參與,已有俱樂部來自多所高校的大一同學(xué)寫出高居榜首的技術(shù)文章。
如今,搜索“啃論文”,人們不禁想到、而且看到的都是我們——OpenHarmony 成長計(jì)劃—“啃論文俱樂部”的產(chǎn)出。
-
開源技術(shù)
+關(guān)注
關(guān)注
0文章
389瀏覽量
7978 -
OpenHarmony
+關(guān)注
關(guān)注
25文章
3744瀏覽量
16487
原文標(biāo)題:關(guān)于圖像和視頻壓縮這些小風(fēng)景你不應(yīng)該錯(cuò)過
文章出處:【微信號(hào):開源技術(shù)服務(wù)中心,微信公眾號(hào):共熵服務(wù)中心】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論