色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何降低開發門檻助力音視頻創新玩法

華為麒麟 ? 來源:華為麒麟 ? 作者:華為麒麟 ? 2021-09-28 10:26 ? 次閱讀

9月16日,華為多媒體管線服務(AV Pipeline Kit)技術直播正式開啟。華為多媒體管線服務產品經理Michelle、華為多媒體技術專家Salvatore、華為計算機視覺算法專家Ting、和華為AI技術專家Eric相聚直播間,深度解析了AV Pipeline Kit的技術要點和應用場景,助力廣大音視頻開發者以更輕松更高效的方式,為用戶提供新玩法,新交互。

緣起:音視頻開發面臨諸多挑戰,麒麟協同各團隊力量推AV Pipeline Kit

隨著寬帶提速,5G 普及,AI技術應用,用戶對網絡視頻的內容、互動性、播放速度和清晰度的要求越來越高。相應的,多媒體開發呈現出實時化和智能化的趨勢,開發者在開發與管理過程中,面臨更高的技術門檻、更多的開發工作量等諸多挑戰。

其一,開發難度進一步加大,開發成本更高。很多視頻+AI的開發,需要在傳統管線中加入AI處理技術,這涉及到諸多數據處理能力,對于開發者來說技術門檻很高。

其二,端側實時化的智能視頻開發可能會遇到算力和功耗的限制。以端側超分為例,手機端算力比較受限,而視頻逐幀的超分實時處理對時延和功耗的要求是極高的。此外,視頻解碼后的數據要拿去做超分,就涉及到數據在不同IP之間的流轉和拷貝,會影響功耗,導致手機發燙。

以上諸多痛點,阻礙了開發者創新的腳步。為此,麒麟團隊整合了各個部門的能力,包括多媒體團隊、NPU團隊以及算法團隊,在今年7月份推出了華為多媒體管線服務(AV Pipeline Kit)。AV Pipeline Kit是一個面向安卓開發者的多媒體開放能力體系,它包含一個輕量級的多媒體開發框架和一系列高性能的音視頻處理插件,幫助開發者們降低開發難度,讓開發者們可以通過自定義流水線編排,將多種高性能插件快速集成到應用中,輕松實現更加豐富的多媒體功能。

輕量化設計:“拼樂高”式的流水線編排,助力開發者高效開發

在AV Pipeline Kit多媒體開發框架中,包含了多個預置的流水線編排,即一些現成的開箱即用的業務場景,被封裝成了接口供直接調用;同時也支持自定義流水線編排,將不同插件按不同的連接關系串聯起來形成新的業務場景。

如何簡單理解流水線編排的過程呢?以視頻超分為例,按照插件之間的處理順序來看,首先是一個音視頻的解封裝過程,然后會經歷音視頻的解碼,而后解碼視頻幀會進行視頻超分處理,最后進行送顯。從輸入到輸出,可以看成是一個流水線的過程。

談及流水線編排的設計思路,華為多媒體技術專家Salvator表示,首先是對業務進行抽象,然后把它分割成子過程,對子過程再進行一個抽象,實現具體的插件,最后再把插件用Pipeline的方式拼接起來。這樣的好處一方面是便于統一管理,另一方面提高了復用度。

這個過程可以簡單理解為拼樂高,一個個插件就是一個個不同形狀的樂高片,開發者的業務就像搭樂高一樣,不同的開發者可以從插件庫里選擇需要的插件,拼成想要的業務場景。AV Pipeline Kit定義了一套插件標準接口,開發者只需要繼承這個接口類,并實現初始化和數據處理相關的邏輯即可,無需考慮并發、線程同步、狀態轉移、buffer池管理、多實例等問題,這些已經全部由框架層實現好了。

突破:視頻超分,最高3倍超分效果背后的技術優勢

所謂“超分”,可以理解為在視頻播放過程中進行智能識別與銳度優化,從而讓視頻看起來比原本更清晰、明麗。在大型影視和游戲制作中,超分是一種非常關鍵的技術。想要在端側在線場景中,幫助開發者獲得實時化、高性能、低功耗的超分,就需要從AI技術到硬件資源調用的一系列優化。

據華為計算機視覺算法專家Ting介紹,AV Pipeline Kit提供傳統的GPU超分方案和AI超分方案兩種,以達到性能和功耗的平衡。“比如我們檢測到在麒麟高端芯片上,就會優先采用NPU的AI超分算法,最高可實現3倍的超分效果。如果沒有NPU的硬件,我們就會選擇GPU方案做超分處理,效果可能會有一些下降,但性能上是滿足了實時性要求的。”

為了幫助開發者便捷獲取真實可用的逐幀超分能力,實現超分不卡頓的體驗,AV Pipeline Kit首先在機器視覺算法上進行了一系列技術突破。比如,在AI模型結構上應用了卷積神經網絡,提升了復雜真實場景的超分效果;在數據工程方面,用一系列方法還原了多媒體數據的構造過程,提升網絡的優化結果;在端側模型壓縮方面,進行了新的網絡小型化探索,確保超分效果可以在端側場景中被很好地執行。

其次,為了兼顧高性能與低功耗,AV Pipeline Kit和華為 HiAI Foundation之間也有不少配合。據華為AI技術專家Eric介紹,華為HiAI Foundation作為NPU使能的基礎平臺,能夠快速將原始模型轉換成華為Davinci Model,并通過Davinci Model的調優技術,優化模型結構,充分發揮NPU硬件單元的算力,令模型算子以更低功耗在手機端側高效運轉。

在超分業務中,內存DDR的頻繁讀寫對性能和功耗都是很大的挑戰。HiAI Foudation算子庫在優化模型執行時,重點對算力和帶寬利用做了平衡,在滿足業務要求的算力情況下,盡可能的減少對于內存的反復讀寫,更多的利用內部buffer和cache,極大地提供了性能,降低了功耗。

在一系列的技術突破之后,用戶可以獲得更好的畫質體驗,視頻平臺可以節省帶寬和服務器資源,開發者則能夠高效集成業務,降低工作量。

突破:聲音事件檢測,為實現98%識別率攻克的技術難題

對于開發者來說,聲音事件檢測是相對比較復雜的技術,需要豐富的技術資源與開發經驗。AV Pipeline Kit將這些功能以文件配置的形式直接帶給開發者,且經過麒麟團隊的長期深耕,聲音檢測事件插件可以確保聲音識別的準確與穩定。

目前,AV Pipeline Kit聲音事件檢測目前已經可以支持日常使用的13種聲音,包括無障礙功能、健康檢測、輔助安全駕駛、安全防盜、事故報警防剮蹭、停車啟動安全等豐富的場景。經過研發團隊的深度優化和組合驗證,當前識別準確率平均在98%以上,無論從聲音事件類別還是識別性能上來看,都屬于業界領先。

據華為計算機視覺算法專家Ting介紹,團隊主要聚焦在兩個點上做突破,確保了聲音識別的準確及穩定性。一是解決了不同聲音事件的時間片段的長短。不同聲音事件長短不同,比如孩子的哭聲以及寵物叫聲,貓叫狗叫是瞬發型的,而哭是一個持續性的動作,所以他們的事件片段,時間片和長短是不一樣的,聲音事件檢測插件在設計網絡的時候,參考了Inception網絡,計算多個不同大小的卷積,這樣感受野就不同,進而提出的特征就更加具有針對性,特征空間更加豐富。

二是易混淆類別頻譜的區分。有一些聲音事件的混淆度比較高,比如在某些情況下小孩的哭聲和貓叫聲相當接近,無論是人區分以及轉化為頻譜信息之后去查看,都很容易混淆。聲音事件檢測插件引入技術注意力機制,對易混淆的類別做一個區分。

面向未來:

深挖視頻播放、編輯場景,為開發者提供創新能力

最后,華為多媒體技術專家Salvatore表示,AV Pipeline Kit后續會繼續完善框架和插件,重點關注如視頻播放、視頻編輯等對性能要求比較高,對功耗比較敏感的場景,包括考慮預置錄制和編輯業務,以及與人像拍攝美化相關的插件能力。

未來,麒麟團隊將持續投入核心技術,突破技術難點,簡化底層開發繁瑣流程和難點,降低智能化視頻開發的門檻,助力音視頻開發者技術創新,在激烈的競爭角逐中取勝。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • DDR
    DDR
    +關注

    關注

    11

    文章

    712

    瀏覽量

    65362
  • 帶寬
    +關注

    關注

    3

    文章

    937

    瀏覽量

    40939
  • 服務器
    +關注

    關注

    12

    文章

    9184

    瀏覽量

    85482
  • AI
    AI
    +關注

    關注

    87

    文章

    30946

    瀏覽量

    269196
  • AV
    AV
    +關注

    關注

    2

    文章

    268

    瀏覽量

    44513

原文標題:如何降低開發門檻,助力音視頻創新玩法?AV Pipeline Kit深度技術解析

文章出處:【微信號:Huawei_Kirin,微信公眾號:華為麒麟】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AMS-HE200:HDMI音視頻網絡延長器,開啟傳輸新時代

    傳輸領域的領軍企業,憑借其強大的技術實力和創新能力,推出了全新的AMS-HE200 HDMI音視頻網絡延長器,旨在為用戶帶來更加高效、穩定、便捷的傳輸體驗。 一、產品亮點? AMS-HE200作為一款高性能的HDMI音視頻網絡延
    的頭像 發表于 11-27 10:04 ?151次閱讀
    AMS-HE200:HDMI<b class='flag-5'>音視頻</b>網絡延長器,開啟傳輸新時代

    Amoonsky創新音視頻連接技術:全新推出AMS-HE200 HDMI網線延長器

    簡介: 在不斷向高清多媒體體驗邁進的世界中,強大的音視頻連接需求變得前所未有的重要。AMS-HE200,Amoonsky開創性的HDMI網線延長器,成為重新定義音視頻網絡格局的解決方案。這款創新
    的頭像 發表于 10-24 16:09 ?213次閱讀
    Amoonsky<b class='flag-5'>創新</b><b class='flag-5'>音視頻</b>連接技術:全新推出AMS-HE200 HDMI網線延長器

    dm368錄制音視頻后用vlc播放不同步是怎么回事?

    目前我們用其他的開發板 能夠錄制音視頻,但是用vlc播放的時候發現每次都是視頻播放完成了音頻還要播放一會,隨著錄制時間加上,延后的這個時間也會變長 請問有知道怎么回事的嗎?
    發表于 10-15 06:56

    盤點那些常見音視頻接口

    我們熟知的一些常見音視頻接口,發展至今在日常使用中已經漸漸少了。但是在工業領域的音視頻連接,依然能看到其身影。這些看似消失的接口,它們現在發展成什么樣子了?本期我們將做一個大盤點。
    的頭像 發表于 09-09 14:34 ?545次閱讀

    常見音視頻接口的靜電浪涌防護和濾波方案

    音視頻接口在現代多媒體設備中扮演著至關重要的角色,它們確保了音視頻信號在不同設備間的順暢傳輸,各種類型的音視頻接口滿足了多樣化的應用場景需求。 在音視頻接口的設計領域,靜電浪涌防護與濾
    的頭像 發表于 06-25 11:28 ?676次閱讀

    音視頻IP化浪潮全面來襲,分布式系統開創音視頻行業新時代!

    在傳統音視頻頻系統中,廠商們各自采用不同的通訊方式和控制協議,這使得不同的產品之間就像一座座的信息孤島,要連接起來就需要復雜的轉換設備和系統再開發。隨著音視頻項目的規模不斷擴大,各類音頻設備產品
    的頭像 發表于 05-30 16:55 ?685次閱讀

    音視頻產品EMC整改案例解析

    音視頻產品EMCRE整改案例解析
    的頭像 發表于 05-20 16:49 ?436次閱讀
    <b class='flag-5'>音視頻</b>產品EMC整改案例解析

    高清HDMI轉USB 3.0音視頻多功能音采集卡-測評

    LCC380的設計理念在于全面考慮到各種用戶場景下的需求。為了實現高品質的音視頻采集效果,卡體搭載了業界領先的音頻處理器解決方案。無論您是熱衷于游戲直播、視頻會議還是其他音視頻應用,都能通過LCC380獲得出色的音頻輸入輸出體驗
    的頭像 發表于 05-14 17:45 ?895次閱讀
    高清HDMI轉USB 3.0<b class='flag-5'>音視頻</b>多功能音采集卡-測評

    【RTC程序設計:實時音視頻權威指南】音視頻的編解碼壓縮技術

    音視頻所載有的信息在通過傳輸的時候就需要壓縮編碼。 其中,文本壓縮是指通過使用各種算法和技術,將文本數據表示為更緊湊的形式,以減少存儲空間。 霍夫曼編碼是一種無損壓縮算法,它可以根據字符出現
    發表于 04-28 21:04

    音視頻SoC與AI技術融合,帶來更智能的音視頻處理解決方案

    電子發燒友網報道(文/李彎彎)音視頻SoC,即音視頻系統級芯片或片上系統,是一種高度集成化的芯片,它將電路板上的多塊芯片以及嵌入式軟件全部集成到一塊芯片中。音視頻SoC芯片廣泛應用于各種嵌入式系統
    的頭像 發表于 04-26 01:20 ?4427次閱讀

    【RTC程序設計:實時音視頻權威指南】音頻采集與預處理

    音視頻通信對音頻采集的實時性和性能要求很高。為了降低延遲并提高吞吐量,可能需要采用一些優化技術,如硬件加速、多線程處理等。 最后,音頻采集還需要考慮與后續處理步驟的銜接問題。例如,采集到的音頻
    發表于 04-25 10:41

    【RTC程序設計:實時音視頻權威指南】新書一瞥

    本人從事音視頻領域的開發,經常接觸實時音視頻處理相關的技術,看到這本書非常有興趣閱讀,這本書全面介紹實時音視頻(RTC)技術的權威著作,該書詳細講解了RTC的基本概念、技術原理、系統設
    發表于 04-22 09:09

    【RTC程序設計:實時音視頻權威指南】本書概覽

    ,這都是按照音視頻流的開發的一般流程介紹的。然后介紹了編解碼以上所技術,信令與媒體協商(個人覺得協商這里用協議更合適,因為里面講解的是各種音視頻傳輸的協議)。然后是控制傳輸優化,可擴展架構,評價指標等
    發表于 04-21 17:09

    音視頻解碼生成:打造極致觀影體驗的關鍵技術

    在現代多媒體時代,音視頻解碼生成技術已成為提供極致觀影體驗的核心要素。它不僅能夠確保音視頻數據的高效傳輸,還能保證播放的流暢性和畫質清晰度,為用戶帶來身臨其境的觀影享受。 1. 解碼生成的重要性
    的頭像 發表于 02-25 14:43 ?478次閱讀

    音視頻解碼生成與流媒體傳輸的結合

    音視頻解碼生成與流媒體傳輸是現代數字媒體技術中兩個不可或缺的部分,它們的結合為用戶提供了高質量、實時性的多媒體體驗。 1. 解碼生成與流媒體傳輸的關系 解碼生成是流媒體傳輸的前提。在流媒體服務中
    的頭像 發表于 02-21 14:36 ?402次閱讀
    主站蜘蛛池模板: 97在线免费观看视频| 最美白虎逼| MATURETUBE乱妇| 午夜福利免费0948视频| 麻豆XXXX乱女少妇精品-百度| 第一精品福利导福航| 失禁h啪肉尿出来高h| 久久精品亚洲精品国产欧美| 高h全肉图| 99热精品一区| 伊人成综合网伊人222| 美女脱了内裤张开腿让男人爽 | 中文字幕亚洲乱码熟女在线| 免费三级现频在线观看| 操老太太的逼| 天堂色| 九九热视频免费观看| 799是什么意思网络用语| 欧美国产一区二区三区激情无套| 成人小视频在线免费观看| 中文字幕精品无码一区二区| 亚洲精品久久久久久偷窥| 免费果冻传媒2021视频| 好姑娘社区在线视频| 国产成人精品电影| 一边啪啪的一边呻吟声口述| 美女扣逼软件| 九九黄色大片| 韩国女人高潮嗷嗷叫视频| 国产精品久久久久久久久99热| 成年人免费观看视频网站| AAA级精品无码久久久国片| 69ZXX少妇内射无码| 中文字幕乱码亚洲无线三区| 亚洲专区中文字幕视频专区| 亚洲精品久久无码AV片银杏| 蜜桃成熟时2在线| 久久久久婷婷国产综合青草 | Zoofilivideo人馿交| 99久久99久久精品| 999久久免费高清热精品|