色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

實時通信中的AI降噪技術分析

jf_uPRfTJDa ? 來源:5G通信 ? 2023-01-15 10:37 ? 次閱讀

Part 01●概述●

在實時音視頻通信場景,麥克風采集用戶語音的同時會采集大量環境噪聲,傳統降噪算法僅對平穩噪聲(如電扇風聲、白噪聲、電路底噪等)有一定效果,對非平穩的瞬態噪聲(如餐廳嘈雜噪聲、地鐵環境噪聲、家庭廚房噪聲等)降噪效果較差,嚴重影響用戶的通話體驗。針對泛家庭、辦公等復雜場景中的上百種非平穩噪聲問題,融合通信系統部生態賦能團隊自主研發基于GRU模型的AI音頻降噪技術,并通過算法和工程優化,將降噪模型尺寸從2.4MB壓縮至82KB,運行內存降低約65%;計算復雜度從約186Mflops優化至42Mflops,運行效率提升77%;在現有的測試數據集中(實驗環境下),可有效分離人聲和噪聲,將通話語音質量Mos分(平均意見值)提升至4.25。

Part 02●噪聲分類和降噪算法選擇●

實時音視頻的應用場景中,設備處于復雜的聲學環境,麥克風采集語音信號的同時還會采集大量噪聲,對實時音視頻質量來說是一個非常大的挑戰。噪聲的種類是多種多樣的。根據噪聲的數學統計特性可以將噪聲分為兩類:

平穩噪聲:噪聲的統計特性在比較長的時間里不會隨時間而變化,比如白噪聲、電風扇、空調、車內噪聲等;

非平穩噪聲:噪聲的統計特性隨時間在變化,如餐廳嘈雜噪聲、地鐵站、辦公室、家庭廚房等。

在實時音視頻應用中,通話易受到各類噪聲干擾從而影響體驗,因此實時音頻降噪已經成為實時音視頻中的一個重要功能。對于平穩的噪聲,比如空調出風口呼呼聲或者錄制設備的底噪,它不會隨著時間變化而產生較大變化,可以將其估計預測出來,通過簡單的減法的方式把它去掉,常見的有譜減法、維納濾波以及小波變換。對于非平穩噪聲,例如馬路上車子呼嘯而過的聲音、餐廳內餐盤的撞擊聲、家庭廚房內的鍋具的敲擊聲,都是隨機突發出現,是不可能通過估計預測的方式去解決的。傳統算法對于非平穩噪聲難以估計和消除,這也是我們采用深度學習算法的原因。

Part 03●深度學習降噪算法設計●

29899ec2-940e-11ed-bfe3-dac502259ad0.png

為了提高音頻SDK對于各種噪聲場景的降噪能力,彌補傳統降噪算法的不足,我們研發了基于RNN的AI降噪模塊,結合傳統降噪技術和深度學習技術。重點針對家庭和辦公室使用場景的降噪處理,在噪聲數據集中加入大量的室內噪聲類型,諸如辦公室內的鍵盤敲擊、辦公桌與辦公用品拖拉的摩擦聲、座椅拖動、家庭中的廚房嘈雜聲、地板撞擊聲等等。

與此同時,為了在移動端的實時語音處理落地,該AI音頻降噪算法將計算開銷和庫的尺寸控制在一個非常低的量級。在計算開銷上,以48KHz為例,每幀語音的RNN網絡處理處理僅需約17.5Mflops,FFT和IFFT每幀語音需要約7.5Mflops,特征提取需要約12Mflops,總計約42Mflops,計算復雜度約和48KHz的Opus編解碼相當,在某品牌中端手機型號,統計RNN降噪模塊CPU占用約為4%。在音頻庫的尺寸上,開啟RNN降噪編譯后,音頻引擎庫的體積僅僅增加約108kB。

Part 04●網絡模型及處理流程●

該模塊采用RNN 模型,原因是 RNN 相比其他學習模型(例如 CNN)攜帶時間信息,可以對時序信號進行建模,而不僅僅是單獨的音頻輸入和輸出幀。同時,模型采用門控循環單元(GRU,如圖1所示),實驗表明,GRU在語音降噪任務上的性能略好于LSTM,并且由于GRU的權值參數更少,可以節省計算資源。與簡單的循環單元相比,GRU有兩個額外的門。重置門控制狀態是否用于計算新狀態,而更新門控制狀態將根據新輸入改變的程度。這個更新門使GRU可以長時間記憶時序信息,這也是GRU比簡單的循環單元表現更好的原因。

29b6a818-940e-11ed-bfe3-dac502259ad0.png

圖1 左側為簡單循環單元,右側為GRU

模型的結構如圖2所示。訓練后的模型會被嵌入到音視頻通信 SDK 中,通過讀取硬件設備的音頻流,對音頻流進行分幀處理并送入 AI 降噪預處理模塊中,預處理模塊會將對應的特征(Feature)計算出來,并輸出到訓練好的模型中,通過模型計算出對應的增益(Gain)值,使用增益值對信號進行調整,最終達到降噪的目的(如圖3所示)。

29cba42a-940e-11ed-bfe3-dac502259ad0.png

圖 2. 基于GRU的RNN網絡模型

29e5646e-940e-11ed-bfe3-dac502259ad0.png

圖3. 上方為模型訓練流程,下方為實時降噪流程

Part 05●AI降噪處理效果和落地●

圖4為帶有鍵盤敲擊噪聲的降噪前后語音語譜圖的對比,上半部分為降噪前的帶噪語音信號,其中紅色矩形框內為鍵盤敲擊噪聲。下半部分為降噪后的語音信號,通過觀測可以發現,絕大部分鍵盤敲擊聲均可以被抑制,同時語音損傷控制在較低的程度。

29fafa4a-940e-11ed-bfe3-dac502259ad0.png

圖4. 帶噪語音(通話過程伴隨著鍵盤敲擊聲)降噪前后對比

目前的AI降噪模型,已經在手機端和家親上線,改善手機端和家親APP通話降噪效果,對泛家庭、辦公室等100多種噪聲場景具備優秀的抑制能力,同時保持語音不失真。下一階段,將將持續優化AI降噪模型的計算復雜度,以在IoT低功耗設備上能夠推廣使用。

審核編輯:陳陳

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31155

    瀏覽量

    269481
  • 降噪技術
    +關注

    關注

    2

    文章

    46

    瀏覽量

    12789
  • 實時通信
    +關注

    關注

    0

    文章

    18

    瀏覽量

    9728

原文標題:技術趣談 | 實時通信中的AI降噪技術

文章出處:【微信號:5G通信,微信公眾號:5G通信】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NanoEdge AI技術原理、應用場景及優勢

    NanoEdge AI 是一種基于邊緣計算的人工智能技術,旨在將人工智能算法應用于物聯網(IoT)設備和傳感器。這種技術的核心思想是將數據處理和分析從云端轉移到設備本身,從而減少數據傳
    發表于 03-12 08:09

    全國高技術重點圖書·通信技術領域_現代通信中的排隊論

    全國高技術重點圖書·通信技術領域_現代通信中的排隊論
    發表于 08-18 20:32

    labview通信中如果有通信協議,如何處理通信中傳輸的協議數據?

    我要接受的數據在一個數據包中,通信中數據包一位一位的傳輸,我現在想將通信的過程中(實時)將數據包分別提取出來,該如何實現?
    發表于 04-11 15:31

    PROFINET及其同步實時通信分析

    PROFINET是一種新的實時以太網標準,本文介紹了PROFINET兩類不同性能的實時通信技術特點,并對等時同步實時
    發表于 02-21 15:24 ?12次下載

    PROFINET及其同步實時通信分析

    PROFINET是一種新的實時以太網標準,本文介紹了PROFINET兩類不同性能的實時通信技術特點,并對等時同步實時
    發表于 07-22 17:32 ?14次下載

    MIMO技術在對流層散射通信中的性能分析

    介紹了MIMO技術的基本原理,分析了MIMO系統的模型以及信道容量。運用Matlab/Simulink對MIMO技術在散射通信中的性能進行了仿真。仿真結果表明,應用MIMO
    發表于 11-03 15:20 ?23次下載

    McWiLL系統在應急通信中的應用分析

    McWiLL系統在應急通信中的應用分析
    發表于 11-10 17:52 ?18次下載
    McWiLL系統在應急<b class='flag-5'>通信中</b>的應用<b class='flag-5'>分析</b>

    網絡通信中差錯控制技術的應用與研究

    網絡通信中差錯控制技術的應用與研究,網絡通信技術資料,很好很實用。
    發表于 03-28 10:11 ?18次下載

    藍牙技術在遠程電力線通信中的應用下載

    藍牙技術在遠程電力線通信中的應用下載
    發表于 09-01 11:02 ?3次下載
    藍牙<b class='flag-5'>技術</b>在遠程電力線<b class='flag-5'>通信中</b>的應用下載

    高速DSP技術及其在通信中的應用

    高速DSP技術及其在通信中的應用
    發表于 10-20 08:45 ?14次下載
    高速DSP<b class='flag-5'>技術</b>及其在<b class='flag-5'>通信中</b>的應用

    基于DSP的語音降噪系統設計方案解析

    在現實的語音通信中會不可避免地受到來自環境中的背景噪聲影響,致使通信質量嚴重下降,甚至聽不清楚對方講話的內容,因此對帶噪語音信號進行降噪已經成為語音通信中的一個非常迫切的課題。近年來,
    發表于 10-31 11:52 ?15次下載
    基于DSP的語音<b class='flag-5'>降噪</b>系統設計方案解析

    無線通信中的MIMO技術

    無線通信中的MIMO技術免費下載。
    發表于 06-15 17:00 ?16次下載

    光纖通信技術在電力通信中的應用

    電力通信中的光纖通信技術,光波效率高,傳輸的容量非常大,在通信傳輸的過程中,提升了運行效率。光纖通信技術
    發表于 04-19 15:25 ?1621次閱讀

    通信及光纖通信中的光譜分析

    通信及光纖通信中的光譜分析? 光通信及光纖通信是一種用于傳輸數據的重要技術。在光
    的頭像 發表于 01-19 10:32 ?1585次閱讀

    RTC技術實時通信中的應用 RTC與VoIP的區別

    在數字化時代,實時通信(RTC)技術已經成為我們日常生活和工作中不可或缺的一部分。從視頻會議到在線教育,從遠程醫療到社交網絡,RTC技術都在發揮著重要作用。 一、RTC
    的頭像 發表于 12-11 15:38 ?613次閱讀
    主站蜘蛛池模板: 日本理伦片午夜理伦片| 国产精品久久久久久免费播放| 免费欧美大片| 国产高清美女一级a毛片久久w| 中国国产不卡视频在线观看| 双腿打开揉弄高潮H苏安安秦慕深| 久久久久国产| 国产看午夜精品理论片| A级韩国乱理伦片在线观看| 亚洲中久无码永久在线| 牲高潮99爽久久久久777| 男人天堂2018亚洲男人天堂| 黄色jjzz| 国产高清在线观看| 在线天天看片视频免费观看 | 国产成人免费高清视频| 99久久免费精品国产| 与嫂子同居的日子在线观看| 性色AV乱码一区二区三区视频| 秋霞成人午夜鲁丝一区二区三区| 久久精品亚洲国产AV涩情| 国产亚洲免费观看| 国产成人免费观看| 百度影音第四色| 99久久久久精品国产免费麻豆 | 高h原耽肉汁动漫视频| 99国内精品| 中文字幕精品在线视频| 艳妇臀荡乳欲伦岳TXT下载| 亚洲 欧美 日本 国产 高清| 视频一区国产第一页| 日韩精品 电影一区 亚洲高清| 嫩B人妻精品一区二区三区| 乱叫抽搐流白浆免费视频| 久久国语精品| 久久精品国产欧美成人| 久久国产香蕉| 久久亚洲网站| 猫咪av永久最新域名| 牢记永久免费网址| 麻豆免费版|