色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

華為云如何助力行業實現音視頻體驗升級

華為開發者社區 ? 來源:華為開發者社區 ? 作者:華為開發者社區 ? 2022-04-14 11:26 ? 次閱讀

隨著5G的落地和消費終端的不斷升級,消費環節對視頻畫質的要求也越來越高,為了給消費者帶來更清晰、更逼真和更具沉浸感的觀感體驗,對云端視頻處理技術也提出了更高的要求。在本次2022 LiveVideoStack線上公開課中,華為云媒體處理服務研發負責人查勇,結合華為云在超高清視頻轉碼領域的實踐經驗,詳細介紹了云上使用AI技術提升視頻視聽體驗的關鍵技術,以及如何助力行業實現音視頻體驗升級。

公開課

大家晚上好,非常榮幸參加LiveVideoStack線上公開課。首先自我介紹下,我是查勇,來自華為云,是媒體處理服務的研發負責人。近10年我一直是在從事視頻編解碼產品的開發和架構設計工作,我本人是非常熱愛媒體處理相關技術的研究的。

參與此次公開課分享的目的主要有兩方面,一方面是想通過本次分享,為大家介紹華為云媒體處理服務在視頻AI轉碼領域的一些技術實踐;另一方面是想與更多專家交流,互相學習,以促進下一代視頻轉碼技術的快速發展,助力行業實現音視頻體驗升級。

7a14a676-bb14-11ec-aa7f-dac502259ad0.png

本次分享的主題包括三個部分:首先介紹超高清視頻行業發展趨勢,以及這些趨勢為云轉碼帶來的機遇和挑戰;其次從技術層面分析一下,在超高清視頻時代,通過云轉碼提升音視頻體驗的一些關鍵技術點;最后從華為云媒體處理服務自身的實踐出發,詳細介紹一下華為云如何使用AI轉碼技術來打造視頻的超高清體驗,希望能給大家帶來一些收獲和啟發。

01/超高清視頻行業發展的趨勢

在大視頻時代,隨著5G、AI以及云技術的發展,超高清視頻行業迎來了一個高速發展期。我們可以看到,在生產端,4K/8K超高清制播平臺正在加快建設中,超高清電視的制播模式也在不斷創新,當前超高清內容的生產能力得到了極大提升。在消費端,隨著芯片技術的發展,4K/8K電視和沉浸式終端的逐漸普及,消費端體驗超高清內容的媒介也在不斷豐富。

在傳輸環節,5G高帶寬、低時延的特點,使得超高清內容更容易獲取,互動性場景的體驗也越來越好。在處理環節,借助云端的強大算力和AI技術,我們可以實現超高清內容的極致壓縮和畫質增強,在提升播放體驗的同時,可以極大地降低分發和制作的成本。另外借助邊緣云計算的技術和能力也可以進一步地降低超高清視頻的制作和分發成本。

在應用場景上,我們可以看到超高清視頻也逐步地在向直播、VR、多視角、自由視角等領域發展,應用范圍正在逐步擴展。

總的來說,超高清視頻行業的基礎設施正在逐步完善,應用場景也在逐步走向成熟。

7a3491ac-bb14-11ec-aa7f-dac502259ad0.png

大家都知道一個產業的快速發展,是和生態建設的成熟度息息相關的。下面我們一起看一下超高清視頻產業在標準生態建設以及政策方面的情況。

首先在組織層面,中國已經成立了超高清產業聯盟。在標準方面,超高清視頻產業發展的白皮書和與之關聯的軟硬件諸多協議也都相繼出臺,這些都進一步促進了超高清視頻產業的健康有序發展。在政策方面,14省市發布了超高清視頻產業發展的行動計劃,為超高清產業消費體驗升級,行業創新提供指導意見。

在生態和政策的雙重驅動下,當前多地已經啟動了超高清項目實驗基地,如成都的超高清基地、青島高清視頻基地、廣州花果山基地以及馬欄山內容基地等,超高清產業實現進一步向縱深發展。

根據權威機構預測,2022年中國超高清視頻產業總值將達到4萬億元,超高清用戶總數也將達到2億。我們可以看到,當前4K/8K電視已經成為電視機廠商的旗艦標配,消費者對視頻畫質的關注度也越來越高,HDR、高幀率、寬色域、高色深,這些指標都成為終端性能的一個新賣點。

另外隨著芯片技術的發展,沉浸式終端的種類也越來越多,消費者越來越追求高逼真、更加接近現實的視頻體驗,我們正面臨一個視頻消費體驗升級的時代。

7a5b3032-bb14-11ec-aa7f-dac502259ad0.png

超高清行業的高速發展以及消費體驗的升級,為云端視頻處理也帶來了更多的機會點:一是當前超高清內容的供給跟不上硬件發展的速度,為了讓市場上非超高清視頻內容帶來超高清的體驗,我們可以使用云端視頻處理的技術來解決;二是視頻在采集、制作和壓縮環節都會引入噪聲或者失真,我們可以借助云端視頻處理的能力來降低引入專業設備和人工處理的成本。

但很多時候機遇與挑戰是并存的,通過云端視頻處理來提升音視頻體驗,也面臨著幾方面的挑戰:一方面,市場上存量的視頻內容,例如老舊影片和電視劇,局限于當時的采集設備和制作技術,畫質是參差不齊的,涉及畫質修復的種類和場景非常多;另一方面,影響視頻體驗的客觀指標非常多,例如低分辨率、噪聲、模糊、低幀率、色彩灰暗、暗亮斑等等,當前無法使用單一技術來完成所有場景的體驗提升,這對技術的積累要求非常高。

02/云轉碼打造視頻超高清體驗的關鍵技術點

7a7d8308-bb14-11ec-aa7f-dac502259ad0.png

那么云端視頻處理需要具備哪些關鍵技術點來提升視頻的畫質呢?要具備超高清視頻的體驗,從一些低質量視頻的表現出發我們可以總結出影響體驗的一些關鍵特征,比如低分辨率、噪聲、模糊、劃痕、閃爍、低幀率、色彩灰暗等等。對應的我們在云端轉碼的系統,就可以針對這些低質視頻的特征,使用相應的技術來改善低質視頻的畫質,主要技術包括超分、降噪、修復、插幀、SDR2HDR。

2.1 超分算法

7a9d7136-bb14-11ec-aa7f-dac502259ad0.png

首先來看一下超分,也叫空間分辨率增強。超分本質上是指在單位空間內生成更多的像素,增大像素的密度,來增強圖像細節,提高視頻的清晰度。

深度學習網絡應用于超分之前,提升分辨率大多使用傳統的插值算法。如比較常用的雙線性插值,雙三次插值,lanczos插值等算法,我們在轉碼系統中經常會用到這些算法做下采樣。如上圖(左)是一個雙三次插值的示例,該算法利用的是待采樣點周圍16個點的灰度值做三次差值,再通過選取適當的插值基函數來擬合數據。

從算法的描述上我們能看出,傳統的插值算法一般是要預定義一個插值基函數,也叫映射函數,考慮到計算量,我們的映射函數一般不會太復雜,因此傳統算法在這種場景的泛化能力是比較差的。另外因為大多是幀內插值,我們插入的值與前后幀是無時間關聯性的,與鄰近像素點空間關聯性也相對較少,因此效果一般不會太好。

當前要追求超分的效果,大家越來越傾向于選擇基于深度學習的超分算法。如圖(右)是一個簡單的超分網絡 — SRCNN,大家都很熟悉這個網絡模型。隨著SRCNN的出現,我們真正地進入到了深度學習的超分時代,基本上每年都有一些新的研究方向出現,超分神經網絡也變得越來越強大。相比于傳統的超分算法,基于神經網絡的超分映射函數是多層非線性且可以學習的,插入的值在時間和空間維度能夠關聯更多的周邊像素,細節上的體現更加精確,在超高清領域應用也越來越廣泛。

2.2 視頻插幀

7abbe6d4-bb14-11ec-aa7f-dac502259ad0.png

除了空間分辨率會影響畫質,時間分辨率也就是幀率對人的主觀體驗影響也很大。我們知道現在終端設備更新換代的速度很快,支持的分辨率從480p、720p到1080p,再到現在的4K和8K。同樣的,終端支持的幀率也從25fps到60fps再到120fps甚至更高,高刷新率現在也是終端的一個重要賣點。

除了依賴采集的硬件來提高幀率,目前使用軟件的方法也逐步得到應用。大家都體驗過, 在一些劇烈的運動場景下,低幀率會帶來明顯的卡頓感,影響人的視覺感受。視頻插幀算法,就是在原始的視頻幀之間合成不存在的幀來提高畫面的流暢度,簡單來說就是提高幀率。基于插幀算法的研究非常多,例如傳統的基于光流的插幀算法。

傳統算法有什么缺點呢,現實畫面中存在一些大的物體快速運動或者遮擋的場景,基于傳統的光流插幀難以解決這種場景帶來的問題,因此插幀的質量在這些場景無法得到改善。想要提升效果的話,我們就回歸到了基于AI的思路上面。

目前AI插幀的思路方法一般都是預訓練生成光流估計模型,算法實現上首先輸入兩幀,計算幀間的光流和提取特征金字塔,然后把warpping之后的圖、特征金字塔和原始圖像一起送入圖像合成網絡,生成插幀之后的圖像。目前這個方向上相關的論文也非常多,大家感興趣的可以去研究一下。

2.3 視頻降噪技術

7ad7570c-bb14-11ec-aa7f-dac502259ad0.png

接下來我們看一下視頻降噪技術,大家應該都體驗過視頻中的噪聲,我們經常看的一些老片中的雪花噪聲和閃爍噪聲是很明顯的,給人帶來的畫質體驗是非常差的。我們知道在視頻采集到送顯的一個完整的周期內,涉及到的各個階段都會引入不同種類的噪聲,最終都會反饋到消費環節的播放體驗中。正因為噪聲引入的來源是多樣且廣泛的,所以視頻降噪是非常必要的。

通過降噪技術,我們可以在保持原始信息完整性的同時,又能夠去除無用的一些信息。當前各種圖像降噪算法非常多,比如基于空域像素特征去噪和變換域去噪的傳統降噪算法。傳統的降噪算法在降噪的同時往往會丟失圖像的一些細節或者邊緣信息,而且一般來說我們需要設置降噪參數,效果受參數的影響也比較大,因此在通用場景上難以廣泛應用。

另一個快速發展的方向是基于神經網絡的自適應降噪算法,算法可以根據輸入圖像噪聲的級別,自適應地調節降噪的強度,圖像的細節或邊緣信息損失也會相對較小,能夠最大程度的保留原始信息。

基于神經網絡的自適應降噪算法,同樣也有自身的缺點。比如由于訓練的素材有限,場景無法全覆蓋,一些場景會超出網絡的學習能力,當然這也是采用深度學習算法遇到的普遍問題。因為噪聲來源的場景會更廣泛,所以對算法的考驗也更大。

2.4 視頻修復技術

7af181fe-bb14-11ec-aa7f-dac502259ad0.png

視頻修復分為狹義的修復和廣義的修復,狹義的修復是指針對視頻中存在的一些問題,比如劃痕、暗亮斑、閃爍等問題的針對性修復。廣義的修復是在修復視頻瑕疵的同時,對原視頻做一些增強。廣義的修復應用范圍會更廣一些,主要應用在老舊影片、老舊電視劇、一些低質的UGC視頻等。

在AI智能修復老片技術出現以前,經典老片修復通常是由人工逐幀修復的,效率低,許多大片修復的時間以年為單位。如果使用AI的智能修復技術框架,就可以基于海量的樣本去訓練和自動學習,可以大幅的提升老片修復的質量和效率。人工無法做到的修復效果,借助當前的AI技術都可以輕松完成。

盡管目前可以使用AI技術修復老片,但修復經典老片仍然不是一件容易的事情,最大的難度是在保留老片的藝術風格和美感的同時還要處理不同的問題和瑕疵。

2.5 SDR2HDR

7b128e94-bb14-11ec-aa7f-dac502259ad0.png

另外一個關鍵技術點,我們看一下近幾年發展較快的一項技術,SDR 2HDR 。HDR由于其相比SDR具有更高的亮度范圍、更廣的色彩范圍和更深的位深而被大家所熟知,對應帶來的是視頻具有更豐富的細節,更寬廣的色域和更自然的色彩過渡。我們可以看到上圖中SDR和HDR的對比,在亮度、色彩飽和度以及對比度上,能明顯地感受到HDR的圖片帶來的視覺效果更好一些。另外,當前HDR領域也出現了不同的標準,從圖表中可以看到這些標準在不同維度的差異。

03/華為云在視頻AI轉碼領域的技術實踐

下面我們一起來看一下,在超高清視頻時代,華為云是如何使用AI技術來提升視頻畫質并改善播放體驗的。

針對視頻體驗提升,華為云推出了智享超清技術,它是一套完整的視頻增強和修復的解決方案,主要的技術包括我們上文提到的超分、倍幀,SDR2HDR、HDRVivid、2D轉3D以及畫質修復等。華為云智享超清技術是完全基于華為自研AI算法,采用多任務AI增強方式,通過智能修復和智能增強技術來打造視頻的超高清體驗,能夠更好地服務直播、點播和互動文娛等場景。

3.1 華為云智享超清技術總體架構

7b31649a-bb14-11ec-aa7f-dac502259ad0.png

上圖是華為云智享超清技術的總體架構:基于AI Deep Learning的一個多任務畫質增強。前面講到單一任務是很難解決畫質的所有問題的,我們綜合分析后采用了圖中的pipeline架構,每一個增強模塊相當于一個算法插件,可以自由組合,使用起來也相對靈活。在處理之前我們會做一些基本的預分析,比如說噪聲強度分析、畫面亮度分析、ROI區域檢測等等,這些分析結果會用于指導后續模塊的智能化處理。

從圖中可以看出,畫質增強的整體解決方案主要包括:基礎層的修復,時域、空域的清晰度增強,亮度和顏色增強,3D增強等。在實際的處理中也可以做一些選擇性的修復,選擇性修復主要包括去劃痕、去亮斑、去閃爍等。在算法設計上我們會更強調自適應能力,也就是在面對不同場景的畫質損失時,視頻增強技術在盲修復時要有很強的泛化能力。

在實際應用過程中,這些模塊并不都是順序處理的,因為這樣時間花費很大,為了提高效率,我們也會將多個視頻增強的任務進行聯合優化處理。

3.2 面向混合失真的AI畫質修復

7b50a292-bb14-11ec-aa7f-dac502259ad0.png

眾所周知,真實的視頻源會包含多種混合失真,比如說噪聲、壓縮失真、模糊等等,并且這些失真程度會差異很大。如果僅考慮分辨率因素,假設我們對一個視頻進行超分,超分之后可能反而會引起瑕疵的放大,難以帶來顯著的視覺效果改善。

華為云智享超清技術通過構建多任務的混合失真修復網絡,來實現更優的主觀效果。我們使用了很多的步驟來模擬失真的視頻,通過多種途徑構建生成更多用于畫質修復的樣本,比如加上高斯噪聲,隨機加上一些運動模糊,加上一些彩色噪聲,降采樣來降低分辨率,壓縮時使用很高的壓縮率來產生壓縮噪聲等。構建了這樣的一種數據集之后,我們通過混合失真的多任務視頻增強算法,自適應地去估計各種失真,這樣就可以增強算法對不同質量視頻的泛化能力。

當然這里也會面臨許多挑戰,比如在失真估計模塊中如何估計噪聲強度,因為不同圖像的噪聲不同,同一圖像的不同區域噪聲也不同。我們提出了AI自適應的降噪算法,對圖片不同區域主觀視覺的噪聲差異進行評估。首先會對噪聲明顯區域進行精準的定位,然后綜合考慮時域和空域的噪聲強度差異,進行不同區域的噪聲強度估計。

還有一個很大的挑戰就是噪聲的模擬,上面提到的方法模擬出的噪聲與真實噪聲還是有差異的。我們使用了AI網絡例如CycleGAN來模擬真實的噪聲,這樣訓練后我們就可以在畫面自然度和清晰度等維度實現一個更優的主觀效果。

3.3 基于語義特征的視頻超分

7b728bb4-bb14-11ec-aa7f-dac502259ad0.png

我們再來看一下華為基于語義特征的視頻超分技術。對于畫質的空間分辨率增強,我們提出了基于語義特征的視頻超分,即先根據語義對圖像進行分割,然后分區域進行處理,最后再對增強后的結果進行融合。例如針對大部分電影、電視劇中人眼關注較強的一些區域,像字幕、人臉、紋理等,基于人眼主觀的特點,使用單獨的算法模塊對這些關注區域進行重點處理,確保人眼關注區域可以達到比較好的增強效果,從多個局部最優解獲得全局最優解。

這種基于語義特征的視頻超分,一般可以獲得比盲超分更好的增強效果,因為它們具有較強的先驗,比如字幕增強,字幕和每個字大概是什么樣子是確定的;人臉增強,人臉都包含眼睛、嘴、鼻子、耳朵。我們可以收集很多字幕、紋理的數據庫,有了這種先驗,增強的效果會得到很大的提升。

3.4 基于耦合光流網絡的視頻插幀

7b9ade16-bb14-11ec-aa7f-dac502259ad0.png

大家應該都有過這種體驗,普通20fps或者30fps的視頻在手機上看很流暢,一旦放到大屏上,運動被放大,卡頓就會比較明顯,所以我們需要對時域進行增強,提高視頻的幀率。

針對視頻插幀的任務,華為云提出了一種耦合光流網絡模型,這種光流網絡模型可以準確地估計出前后兩幀之間的光流,在一些困難的場景,比如說小物體快速運動、遮擋等場景,光流估計都比較準確。如圖是一個例子,左邊是目前比較先進的視頻插幀算法RIFE估計的光流,右邊是華為云自研算法估計的光流。大家可以不關注這些顏色代表的含義,僅從形狀上來看,可以看出右邊的光流模型估計出的光流會更細膩一些,細節會更豐富一些。

3.5 基于場景自適應的SDR2HDR技術

7bc28f10-bb14-11ec-aa7f-dac502259ad0.png

大家都清楚從SDR到HDR轉換的時候會面臨許多挑戰,比如亮場景和暗場景,我們要使用不同的方案來實現場景的自適應,實現最佳的亮度動態擴展;再比如說SDR中的綠色在轉換成HDR時,有時會出現綠色失真的問題;人臉的顏色可能因為背景色導致轉換后偏紅,這種情況需要做到色彩擴展的場景自適應,在擴展色彩時控制色偏;再比如有些噪聲或者失真,在轉換成HDR時被放大了,或者更容易被感知到了,這種情況下,我們就應該控制亮度提升導致的噪聲和失真。

華為云SDR2HDR的方案是基于AI技術來實現場景自適應的轉換,舉個例子:對于一個待處理的原視頻,首先會進行一個場景識別,分類出比如人臉、風景等類別,進行場景分類后,就可以實現自適應場景的亮度擴展和自適應場景的色彩擴展,對轉制過程中各場景的Tone Mapping算法進行優化,來抑制8比特擴展到10比特后出現的失真。

在實際應用時,我們會對大量轉換后的視頻進行主觀評測,會針對不同場景轉換后視頻出現的一些問題做針對性調優,這樣做之后,算法當前在影視劇和電視劇場景都有非常好的效果。

3.6 基于CUVA HDR標準的場景自適應SDR2HDR技術

7bd833d8-bb14-11ec-aa7f-dac502259ad0.png

上面我們提到的華為云SDR2HDR技術轉換的是HDR10,前面的介紹中也列舉了HDR技術的不同標準。華為公司作為主要貢獻方深度參與了CUVA HDR技術標準的制定。HDR10采用的是靜態的色調映射,會有顯示設備兼容性的問題,比如原場景的亮度是1000nit,大于顯示屏500nit的最大亮度值,使用靜態的映射曲線映射后,視頻在500nit顯示屏上顯示時就容易出現過曝的問題,很多細節就消失了。

華為云當前基于CUVA HDR標準的 SDR2HDR技術采用的是動態元數據方案,會適應不同的亮度屏幕來達到最佳的顯示效果,能夠確保同一內容在不同亮度屏上實現最優的體驗,避免產生色彩變暗、過曝等問題。我們前面提到的場景自適應技術同樣也適用在CUVA HDR轉換中,這種多技術結合的方案,能夠帶來更好的設備兼容性和場景適應性。

04/總結

7bfe449c-bb14-11ec-aa7f-dac502259ad0.png

以上就是華為云媒體處理服務打造視頻超高清體驗的幾個關鍵技術。影響視頻體驗的指標是很多的,但提升體驗的方向是基本明確的,雖然這里面有很多的困難和技術層面的挑戰,但相信我們技術人能夠直面挑戰,用技術上的創新給用戶帶來極致的體驗。超高清視頻的時代已然到來,要打造極致的體驗,云上技術創新只是其中重要的一環,唯有端管云協同服務、協同創新,才能給消費者帶來更真實的視頻感官享受。

本次分享全部內容到此結束,謝謝大家。

Q&A

Q:HDRVivid標準的優勢和前景在哪里?

HDR Vivid標準,是在現有HDR基礎上,通過增加動態元數據,為不同亮度顯示終端提供更加準確的動態范圍映射方式,可以最大限度地還原HDR內容原有藝術效果。因為采用的是動態元數據的方案,就可以有效解決SDR轉換成HDR后,在不同終端上顯示可能帶來的一些問題,比如暗場景產生色彩過暗,亮場景產生過曝的問題。HDR Vivid標準的呈現效果明顯優于國際主流的靜態元數據HDR方案,在亮度適配和終端兼容性方面表現尤為出色。作為中國超高清視頻產業聯盟(CUVA)發布的中國首個高動態范圍視頻標準,提供了端到端媒體系統標準,并且采取了友好的知識產權政策,更容易推廣和產業化部署。

Q:在視頻增強和修復這塊,有沒有遇到一些比較有挑戰的點,具體是怎么解決的?

采用AI的技術遇到的問題和挑戰有時候會比傳統的算法更多,在視頻增強和修復這塊,最大的難題是如何做到場景自適應。今天我們講解中提到最多的也是場景自適應的技術,我們講神經網絡的泛化能力,要做到全場景覆蓋是很難的。受限于訓練數據總有一些場景效果是不滿足的,依賴我們對特殊場景做針對性的優化。

Q:視頻插幀,1080p分辨率視頻,速度怎么樣?

華為云的視頻插幀算法也在不斷地做性能優化,目前視頻插幀結合超分已經在1080p分辨率視頻實現商用,端到端性能還是可以滿足客戶訴求的。針對這些AI增強算法我們使用了GPU加速,對于不同的算法我們也會通過調整或者簡化模型結構來降低算法復雜度。

Q:華為云官網哪個服務開放了智享超清能力,可以試用嗎?

華為云媒體處理服務官網有智享超清能力的介紹和效果示例的,大家可以上我們的官網去看一下。智享超清只是我們云轉碼其中的一個子能力,我們華為云媒體處理服務對外開放了豐富的媒體處理能力,比如標準轉碼、高清低碼、截圖、水印、加密等等。

Q:基于光流的插幀算法目前咱們有哪些應用嗎?實際效果如何?

基于光流的插幀算法,目前我們已經應用到超高清轉制場景了,華為云媒體處理服務的智享超清特性里面就包含了基于AI的插幀能力,對于30fps及以內的普通幀率高清影片,可以生成60fps甚至120fps的高幀率視頻,讓普通影片在大屏上也能流暢播放。大家手機上如果有華為視頻APP,可以觀看AiMax專區的影片,在大屏上播放效果特別好。

Q:請問下,FFmpeg本身也有一些視頻修復算法,華為云使用了FFmpeg的AI修復算法嗎?

FFmpeg基于AI框架的能力,比如超分、去雨等,給了我們基于FFmpeg的框架如何去集成深度學習算法的一個指導,主要是一個技術牽引,這些FFmpeg開放出來的示例距離商用還是有一定的GAP的。我們有專業的AI算法團隊,可以在技術上做持續的積累。

Q:AR視頻源比如高清4K、8K,對這些高分辨率素材處理有什么加速建議嗎?

針對4K、8K的超高清片源,首先在編解碼上使用CPU已經有了一定的性能瓶頸,我們會使用硬件編碼卡來做加速;其次在AI增強上,我們會使用GPU來加速,但不是所有的算法都使用GPU,其中一部分也使用了 CPU的能力,比如說噪聲強度檢測、亮度檢測等模塊,因為其本身對性能消耗是不大的,我們就可以基于CPU去處理。對于算法是基于CPU還是GPU處理,可以根據算法的復雜度來決定。

Q:華為云的轉碼耗時比現狀是多少,在轉多格式的情況下,怎么提升耗時比呢?

目前我們轉碼分為標準轉碼和高清低碼,在標準轉碼和高清低碼上都是支持一入多出的。

在做長視頻轉碼的時候,我們會做并行轉碼,先對長視頻進行切片,然后進行分布式并行轉碼,最后做轉碼后分片的合并。華為云轉碼提供的是倍速轉碼模式,在長視頻場景下這種切轉合的模式都能提供很高的轉碼效率。

Q:字幕增強更多是構造字幕數據集嗎?模型上有沒有針對文字進行特殊的設計?

字幕數據集達到一定的覆蓋即可,也不是越多效果就會越好。我們會利用華為已經獲得版權的一些電視劇和電影中的實際字幕文本來做訓練集。因為字幕中的文字本身具有一定的先驗,而且文字結構信息強,我們在模型上會針對文字結構和loss函數進行針對性的設計。

原文標題:2022 LiveVideoStack 分享:華為云在視頻AI轉碼領域的技術實踐

文章出處:【微信公眾號:華為開發者社區】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 華為
    +關注

    關注

    216

    文章

    34477

    瀏覽量

    252131
  • 音視頻
    +關注

    關注

    4

    文章

    480

    瀏覽量

    29903
  • 5G
    5G
    +關注

    關注

    1355

    文章

    48479

    瀏覽量

    564792

原文標題:2022 LiveVideoStack 分享:華為云在視頻AI轉碼領域的技術實踐

文章出處:【微信號:Huawei_Developer,微信公眾號:華為開發者社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AMS-HE200:HDMI音視頻網絡延長器,開啟傳輸新時代

    在數字化時代,高清音視頻傳輸已經成為各行各業不可或缺的重要技術。無論是安防監控、視頻會議,還是戶外廣告、家庭影院,高清音視頻信號的無縫傳輸都扮演著至關重要的角色。深圳市程達科技有限公司,作為高清
    的頭像 發表于 11-27 10:04 ?174次閱讀
    AMS-HE200:HDMI<b class='flag-5'>音視頻</b>網絡延長器,開啟傳輸新時代

    盤點那些常見音視頻接口

    我們熟知的一些常見音視頻接口,發展至今在日常使用中已經漸漸少了。但是在工業領域的音視頻連接,依然能看到其身影。這些看似消失的接口,它們現在發展成什么樣子了?本期我們將做一個大盤點。
    的頭像 發表于 09-09 14:34 ?558次閱讀

    常見音視頻接口的靜電浪涌防護和濾波方案

    音視頻接口在現代多媒體設備中扮演著至關重要的角色,它們確保了音視頻信號在不同設備間的順暢傳輸,各種類型的音視頻接口滿足了多樣化的應用場景需求。 在音視頻接口的設計領域,靜電浪涌防護與濾
    的頭像 發表于 06-25 11:28 ?693次閱讀

    音視頻IP化浪潮全面來襲,分布式系統開創音視頻行業新時代!

    在傳統音視頻頻系統中,廠商們各自采用不同的通訊方式和控制協議,這使得不同的產品之間就像一座座的信息孤島,要連接起來就需要復雜的轉換設備和系統再開發。隨著音視頻項目的規模不斷擴大,各類音頻設備產品
    的頭像 發表于 05-30 16:55 ?692次閱讀

    音視頻產品EMC整改案例解析

    音視頻產品EMCRE整改案例解析
    的頭像 發表于 05-20 16:49 ?457次閱讀
    <b class='flag-5'>音視頻</b>產品EMC整改案例解析

    高清HDMI轉USB 3.0音視頻多功能音采集卡-測評

    LCC380的設計理念在于全面考慮到各種用戶場景下的需求。為了實現高品質的音視頻采集效果,卡體搭載了業界領先的音頻處理器解決方案。無論您是熱衷于游戲直播、視頻會議還是其他音視頻應用,都
    的頭像 發表于 05-14 17:45 ?920次閱讀
    高清HDMI轉USB 3.0<b class='flag-5'>音視頻</b>多功能音采集卡-測評

    【RTC程序設計:實時音視頻權威指南】音視頻的編解碼壓縮技術

    音視頻所載有的信息在通過傳輸的時候就需要壓縮編碼。 其中,文本壓縮是指通過使用各種算法和技術,將文本數據表示為更緊湊的形式,以減少存儲空間。 霍夫曼編碼是一種無損壓縮算法,它可以根據字符出現
    發表于 04-28 21:04

    音視頻SoC與AI技術融合,帶來更智能的音視頻處理解決方案

    電子發燒友網報道(文/李彎彎)音視頻SoC,即音視頻系統級芯片或片上系統,是一種高度集成化的芯片,它將電路板上的多塊芯片以及嵌入式軟件全部集成到一塊芯片中。音視頻SoC芯片廣泛應用于各種嵌入式系統
    的頭像 發表于 04-26 01:20 ?4480次閱讀

    【RTC程序設計:實時音視頻權威指南】音頻采集與預處理

    閑暇之余,繼續學習【RTC程序設計:實時音視頻權威指南】這本書。 書中對于音頻采集的介紹非常詳細和全面,包括原理、方法、技術細節以及實踐應用等方面的內容。 音頻采集是實時音視頻通信中的關鍵步驟之一
    發表于 04-25 10:41

    【RTC程序設計:實時音視頻權威指南】新書一瞥

    本人從事音視頻領域的開發,經常接觸實時音視頻處理相關的技術,看到這本書非常有興趣閱讀,這本書全面介紹實時音視頻(RTC)技術的權威著作,該書詳細講解了RTC的基本概念、技術原理、系統設計以及實際
    發表于 04-22 09:09

    海思推出了一種面向音視頻行業的鴻鵠媒體解決方案

    2024年中國家電及消費電子博覽會(AWE 2024)期間,海思推出了面向音視頻行業的鴻鵠媒體解決方案,提供了創新的一攬子解決方案,全面支持國家超高清入戶戰略,并極大的提升智慧家庭中的影音娛樂、智慧交互等體驗。
    的頭像 發表于 03-14 18:11 ?1641次閱讀

    音視頻解碼生成:打造極致觀影體驗的關鍵技術

    在現代多媒體時代,音視頻解碼生成技術已成為提供極致觀影體驗的核心要素。它不僅能夠確保音視頻數據的高效傳輸,還能保證播放的流暢性和畫質清晰度,為用戶帶來身臨其境的觀影享受。 1. 解碼生成的重要性
    的頭像 發表于 02-25 14:43 ?489次閱讀

    音視頻解碼生成在多媒體制作中的應用

    音視頻解碼生成是多媒體制作中不可或缺的一部分,它扮演著將編碼的音視頻數據轉化為可播放、可編輯的內容的關鍵角色。在多媒體制作的全過程中,音視頻解碼生成技術都有廣泛的應用。 1. 視頻編輯
    的頭像 發表于 02-21 14:39 ?394次閱讀

    音視頻解碼生成與流媒體傳輸的結合

    音視頻解碼生成與流媒體傳輸是現代數字媒體技術中兩個不可或缺的部分,它們的結合為用戶提供了高質量、實時性的多媒體體驗。 1. 解碼生成與流媒體傳輸的關系 解碼生成是流媒體傳輸的前提。在流媒體服務中
    的頭像 發表于 02-21 14:36 ?413次閱讀

    如何用USB-C端口實現快充及高清音視頻傳輸?

    求助,用USB-C端口實現快充及高清音視頻傳輸
    發表于 01-24 06:52
    主站蜘蛛池模板: 无码人妻精品一区二区蜜桃色欲| 亚洲AV永久无码精品澳门| 伊人久久大香线蕉综合电影 | 最近免费中文MV在线字幕| 妺妺窝人体色WWW偷窥女厕| 草久热的视频在线观看| 性色爽爱性色爽爱网站| 榴莲推广APP网站入口官网| 久久综合中文字幕佐佐木希| 97国产人妻精品无码AV在线| 日本又黄又裸一级大黄裸片| 国产亚洲美女在线视频视频| 116美女写真午夜电影z| 精品久久久久久久高清| 67194在线入口免费| 十九禁啊啪射视频在线观看 | 无码专区久久综合久综合字幕| 久久精品国产视频澳门| youjizz护士| 亚洲精品无码不卡在线播HE| 内射无码AV-区二区在线观看| 国产精品九九久久精品视| 中文字AV字幕在线观看| 特黄特色大片免费播放器试看| 久久精品亚洲牛牛影视| 大学生高潮无套内谢视频| 一本久道久久综合狠狠躁AV| 日本熟妇乱妇熟色A片蜜桃| 久久国产高清视频| 国产精品igao视频网网址| 亚洲 中文 自拍 无码| 乱辈通奷XXXXXHD猛交| 国产成人精品区在线观看| 91国内精品久久久久免费影院| 忘忧草在线| 青草精品国产福利在线视频| 久久久97人妻无码精品蜜桃| 国产毛片视频网站| 把极品白丝班长啪到腿软| 中文有码中文字幕免费视频| 亚洲 日韩 欧美 国产专区|