從編解碼到 WebRTC,實時互聯網技術標準的演進,影響著行業里每個公司的戰略與技術選型。盡管 H.264 仍然是覆蓋最廣的主流標準,但 HEVC 、VP9、AV1 在編碼效率上都更具優勢。
在過去一年里,H.265/HEVC 正式推出已是第5年個年頭,盡管 Apple 將它添加到 HLS,但其還會面對哪些機遇?今年3月以草案形式發布的AV1,在行業中備受關注,其實際應用效果如何?有哪些實踐案例?國內 AVS 標準,相比其它編解碼技術有哪些優勢?WebRTC 1.0 之后將面對哪些挑戰?
關于編解碼與 WebRTC 最新的技術實踐與演進趨勢,在本屆 RTC 2018 實時互聯網大會上,你將聽到最官方的解答。
01
四大亮點話題,不虛此行
語音通信與人機語音交互原本是兩個不同的領域,但隨著技術的發展,這兩個領域無論是在自身的技術需求還是在面對應用的需求方面都出現了高度交叉,尤其是在聲信號獲取、處理與重構方面,兩者均需要在復雜場景下實現高保真、高質量的遠場拾音,并保留和重構信號及其空間信息。
信號處理領域首屈一指的科學家將和大家分享聲信號感知、處理與重構的一般過程和這個過程中所要解決的主要科學難題,及關鍵技術的現狀,并一同探討在復雜、遠場拾音環境下聲信號感知、獲取、處理、傳輸與重構所面臨的主要挑戰。
亮點二:新編碼時代,AVS2 音視頻標準演進及應用實例
AVS2 已經開始應用于電影、電視和視頻行業。而AVS2 關鍵技術、相對優勢是什么?應用實踐中有哪些經驗?未來計劃又是如何?可能很多人并不了解。
來自 AVS 標準委員會音頻組、測試組和視頻組的組長,不僅將解答這些問題,還將分享國際/國內新一代視頻編碼標準的最新進展,點云、光場等新興沉浸式媒體編碼,以及深度學習在視頻編碼領域的應用等內容。
亮點三:新一代視頻編碼,在互動直播服務的抉擇困境與機遇
互動直播相對于點播(VOD)以及傳統線性電視(地面電視、有線電視、IPTV)在播放平臺、后臺架構、技術要求等,存在諸多緯度的差異。基于這些特殊性連帶上游視頻編碼行業近期的劇烈下滑,互動直播平臺對于上線新編碼格式面臨著前所未有的技術挑戰。事實上,在全球范圍內部署H.264以外編碼格式的直播平臺寥寥無幾。與此同時,HEVC、VP9、AV1相對H.264都有非常明顯的編碼效率優勢。
Twitch 目前是日活躍用戶達1500萬,高峰并發觀眾超250萬的互動直播平臺。來自 Twitch 的首席研發工程師將從前后臺兩方面分析播放平臺的兼容性和高畫質實時編碼的可行性,從而大致勾勒出主講人對于未來5年內編碼格式演進的預測。此外,也會重點解析AV1中SWITCH_FRAME的設計,對于SWITCH_FRAME進一步降低直播時延的計劃。
亮點四:WebRTC 1.0 與未來的演進
在過去的一年里,WebRTC實現了瀏覽器端上的統一,并推出了業界標準WebRTC 1.0。而 WebRTC 新版本的標準制定工作已經開始。我們在此之前也透露過一部分信息。在本屆大會上,來自 Google 的 WebRTC 產品經理和 WebRTC 標準委員會成員們,將帶來更進一步的分享。
02
將有誰來分享?
這位信號處理領域的科學家的技術經歷豐富,由于篇幅有限,我們僅分享一部分。
他先后在日本國際電氣通信基礎技術研究所(ATR)和澳大利亞的格里菲斯大學從事過信號處理、語音合成、語音識別等領域的研究工作。
也在美國的貝爾實驗室從事過自適應信號處理、陣列及MIMO信號處理和語音信號處理與通信等領域的研發工作。
還曾擔任WeVoice公司的首席科學家。2010年回國,入選第三批國家“千人計劃”,后加入西北工業大學任“智能聲學與臨境通信中心”主任兼首席科學家,所開發的部分技術已成功用于無線通訊、電話會議、遠程協作、智能音箱、車載等語音通信系統之中。
得過國際IEEE信號處理學會最佳論文獎,兩次獲得貝爾實驗室模范團隊獎,兩次榮獲 NASA技術創新獎,現已出版專著12部、在信號處理領域的國際著名學術刊物和會議上發表論文近200篇。
沈悅時博士在 Twitch 帶領的研發團隊負責Twitch核心視頻技術的研發,職責涵蓋直播視頻轉碼、ABR播放算法、多平臺播放兼容性、畫面質量、時延等。
沈博士同時還是 AllianceofOpenmedia 視頻編碼協議 AV1 中 SWITCH_FRAME 的發明者,他發表、申請超過15項技術專利。
在加入Twitch之前,沈博士分別就職、服務于多個數字電視設備公司(GDMediware,Ambarella,Harmonic,EricssonTV)以及開創云游戲產業的初創企業OnLive。在這些公司,他主導、參與開發多個廣泛應用的H.264編碼、轉碼、非線性編輯和實時廣告插播產品,以及在公共互聯網上超低時延視頻傳輸的云游戲核心技術。
北京大學信息科學技術學院教授,2005年博士畢業于中國科學院計算技術研究所。2005年至2007年在美國南加州大學攻讀博士后,之后到北大工作至今。主要研究方向為視頻編碼及處理,已發表論文200余篇,已獲授權發明專利40多項。擔任IEEETransactionsonCircuitsandSystemforVideoTechnolgoy(TCSVT)、JournalofVisualCommunicationandRepresentation(JVCIR)期刊編委(AE)、中國圖象圖形學學會理事、AVS視頻組聯合組長等。自2002年起,陸續參與組織AVS1、AVS+、AVS2一系列國家標準的制定,曾獲國家技術發明獎二等獎、國家科學技術進步獎二等獎等獎勵。
潘興德博士,北京郵電大學博士,全景聲科技&天籟K歌創始人,AVS音頻組、測試組聯合組長。長期從事音頻編解碼技術、聲場技術和音效技術的研究和應用。主持或參與了EVD、AVS和IEEEP1857等標準的制定工作,在音頻技術領域申請了近百項發明專利,并被各項音頻技術標準廣泛采用。
目前,全景聲科技的中國全景聲技術(WANOS)已經作為全球二套全景聲技術標準,在電影制作和發行放映獲得廣泛應用,并已逐步進入OTT電視等網絡應用領域。除了AVS音頻組聯合組長、測試組聯合組長,現在還兼任IEEEVR 音頻標準召集人、IEEE、AES、電子學會和聲學學會員等職位。
陳誠本科畢業于清華大學自動化系,后在美國愛荷華大學獲得博士學位,現就職于谷歌,隸屬于視頻壓縮核心算法組,從事VP9與AV1視頻壓縮標準的研發和軟件開發,主要貢獻包括AV1標準中去方塊濾波器的擴展,基于相對距離的幀間運動補償預測方法,VP9/AV1編碼優化,等。除視頻壓縮技術外,研究興趣還包括圖像壓縮,機器學習算法及其在圖像和視頻領域的應用。
Zoe Liu(劉宇新)是Visionular(微幀科技)的聯合創始人、董事長兼首席科學家。
在此之前的5年,Zoe曾任Google Chrome Media團隊軟件工程師一職,并作為開源視頻編解碼標準AOM/AV1的核心成員參與研發與標準制定。
她在清華大學獲得了學士、碩士與博士學位,并在美國普度大學獲得了第二個博士學位。
不論作為主要貢獻者還是技術負責人,Zoe在多個音視頻產品的設計與研發工作中都有突出貢獻,包括蘋果FaceTime、Tango視頻電話、Google Glass視頻電話等。Zoe還在多個著名研究實驗室有多年的創新研究經驗,包括貝爾實驗室、諾基亞研究中心、太陽微處理器中心實驗室、惠普實驗室等。
Daniel C. Burnett在計算機標準領域已經工作了十年有余,作為PeerConnection和getUserMedia W3C WEBRTC規范的編輯者,以及國際互聯網工程任務組(IETF)的參與者,Daniel從一開始便投身于這個激動人心的新領域中。他所編寫的W3C標準目前廣泛應用于大部分自動交互式語音應答(IVR)系統之中。 由于其在自動語音識別領域標準上的卓越貢獻,Daniel曾兩度榮獲在業界久負盛名的“語音杰出人物獎”(由《語音技術雜志》(Speech Tech Magazine頒發)。
Huib現任職Google產品經理,在瀏覽器行業有著豐富經驗,目前帶領團隊從事 Chrome 中WebRTC 1.0 的研發工作。在加入Google之前,他一直在Opera領導工程師團隊。他為瀏覽器體驗創新做出了巨大貢獻,并與工程師團隊在Opera中集成了WebRTC。在瑞典,Huib與Google 的其它工程師一同進行WebRTC項目的研發工作。曾在Philips研究院共同參與發明了多項專利,比如因蘋果手機而流行的多點觸控。
掌握 RTC 技術標準未來動向,從這里開始
-
編解碼
+關注
關注
1文章
140瀏覽量
19630 -
互聯網技術
+關注
關注
0文章
74瀏覽量
11208 -
語音交互
+關注
關注
3文章
286瀏覽量
28036
原文標題:從AV1、AVS到WebRTC,他們將告訴你技術標準的未來趨勢
文章出處:【微信號:shengwang-agora,微信公眾號:聲網Agora】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論