色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種用于音樂源分離的新型深度學習系統

倩倩 ? 來源:互聯網分析沙龍 ? 2020-03-22 15:46 ? 次閱讀

Facebook Research最近發布了Demucs,這是一種用于音樂源分離的新型深度學習系統。根據人類對分離后聲音總體質量的評估,Demucs的性能優于先前報道的結果。

音樂源分離是經過大量研究的一種應用,稱為盲源分離。該過程包括在不借助元信息的情況下從一組混合信號中分離出一組源信號。對于音樂,各個組成部分可能包括人聲或其他樂器軌道。當空中交通管制員開始在單個揚聲器上聽到多個飛行員的混合聲音時出現問題時,源分離領域首先受到了廣泛關注。這導致英國科學家科林·切里(Colin Cherry)在1953年將這種效應稱為“雞尾酒會問題”。

在源分離領域的現有研究的推動下,研究科學家于2000年代初開始使用AI分離音樂中的聲音。如今,短時傅立葉變換產生的頻譜圖(STFT)是最新音樂源分離的核心。這些系統在每個幀和每個源的幅度譜上產生一個掩碼,并且通過在掩碼頻譜圖上運行逆STFT的同時重新使用輸入混合相位,來生成輸出音頻。

建立在頻譜圖分析基礎上的系統在諸如中音鋼琴或連奏小提琴之類的樂器的源分離方面表現出色,因為它們可以產生一致的頻率和振鈴。但是,這些系統很難隔離敲擊聲音,因為敲擊樂器所產生的殘留噪聲會產生更寬的頻率范圍,并且當與多個樂器的重疊相結合時,信息就會丟失,并且掩蓋操作將使信息不再可逆。

Demucs是一種深度學習模型,可直接對原始輸入波形進行操作并為每個源生成一個波形。U-net體系結構使用卷積編碼器和解碼器,該解碼器和解碼器基于跨步卷積較大的步幅。波形模型的工作方式與常見的計算機視覺模型相似,因為它們都使用神經網絡在推斷更高級別的模式之前先檢測基本模式。

基于頻譜圖的模型優于Wave-U-Net,后者是Demucs之前最先進的基于波形的模型。Demucs建立在Wave-U-Net體系結構的基礎上,具有可調整的超參數和較長的短期內存,允許網絡處理整個數據序列,而不是單個數據點。

這些改進幫助系統解決了一個聲音超過另一個聲音的問題,因為解碼器足夠聰明,可以填充柔和的音符。

人類在MusDB數據集上評估Demucs,并將其與其他最新的源分離系統的結果進行比較。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 傅立葉變換
    +關注

    關注

    3

    文章

    105

    瀏覽量

    32423
  • 深度學習
    +關注

    關注

    73

    文章

    5507

    瀏覽量

    121298
收藏 人收藏

    評論

    相關推薦

    一種新型高效率的服務器電源系統

    一種新型高效率的服務器電源系統
    發表于 12-19 16:45 ?1次下載

    NPU在深度學習中的應用

    設計的硬件加速器,它在深度學習中的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習算法優化的處理器,它與傳統的CPU和G
    的頭像 發表于 11-14 15:17 ?695次閱讀

    pcie在深度學習中的應用

    與主機系統連接,提供必要的計算支持。 2. PCIe技術概述 PCIe是一種點對點串行連接,用于計算機內部硬件組件之間的連接。它以其高速數據傳輸能力和低延遲特性而聞名,是連接高性能硬件(如GPU)的理想選擇。 高速數據傳輸 :P
    的頭像 發表于 11-13 10:39 ?439次閱讀

    一種基于深度學習的二維拉曼光譜算法

    近日,天津大學精密儀器與光電子工程學院的光子芯片實驗室提出了一種基于深度學習的二維拉曼光譜算法,成果以“Rapid and accurate bacteria identification
    的頭像 發表于 11-07 09:08 ?248次閱讀
    <b class='flag-5'>一種</b>基于<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的二維拉曼光譜算法

    GPU深度學習應用案例

    能力,可以顯著提高圖像識別模型的訓練速度和準確性。例如,在人臉識別、自動駕駛等領域,GPU被廣泛應用于加速深度學習模型的訓練和推理過程。 二、自然語言處理 自然語言處理(NLP)是深度
    的頭像 發表于 10-27 11:13 ?417次閱讀

    一種新型電流模式控制集成電路

    電子發燒友網站提供《一種新型電流模式控制集成電路.pdf》資料免費下載
    發表于 10-24 10:20 ?0次下載
    <b class='flag-5'>一種</b><b class='flag-5'>新型</b>電流模式控制集成電路

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 、深度學習是AI大模型的基礎 技術支撐 :
    的頭像 發表于 10-23 15:25 ?936次閱讀

    PyTorch深度學習開發環境搭建指南

    PyTorch作為一種流行的深度學習框架,其開發環境的搭建對于深度學習研究者和開發者來說至關重要。在Windows操作
    的頭像 發表于 07-16 18:29 ?1138次閱讀

    深度學習中的時間序列分類方法

    時間序列分類(Time Series Classification, TSC)是機器學習深度學習領域的重要任務之,廣泛應用于人體活動識別
    的頭像 發表于 07-09 15:54 ?1038次閱讀

    深度學習與nlp的區別在哪

    深度學習和自然語言處理(NLP)是計算機科學領域中兩個非常重要的研究方向。它們之間既有聯系,也有區別。本文將介紹深度學習與NLP的區別。 深度
    的頭像 發表于 07-05 09:47 ?981次閱讀

    深度學習常用的Python庫

    深度學習作為人工智能的個重要分支,通過模擬人類大腦中的神經網絡來解決復雜問題。Python作為一種流行的編程語言,憑借其簡潔的語法和豐富的庫支持,成為了
    的頭像 發表于 07-03 16:04 ?670次閱讀

    基于深度學習的鳥類聲音識別系統

    的泛化能力,然后提出了個輕量級的鳥類聲音識別模型,以MobileNetV3為骨干構建了一種輕量級的特征提取和識別網絡。通過調整模型中的深度分離卷積,提高了模型的識別能力。設計了
    發表于 05-30 20:30

    一種利用光電容積描記(PPG)信號和深度學習模型對高血壓分類的新方法

    [22]。就像平均池化樣,最大池化是另一種用于減小特征圖大小的常用方法。它通過僅取每個區域的最大值來獲得最重要的特征。在機器學習中,池化方法的選擇可以顯著影響機器
    發表于 05-11 20:01

    FPGA在深度學習應用中或將取代GPU

    將 AI 框架模型映射到硬件架構。 Larzul 的公司 Mipsology 希望通過 Zebra 來彌合這差距。Zebra 是一種軟件平臺,開發者可以輕松地將深度學習代碼移植到 F
    發表于 03-21 15:19

    基于機器視覺和深度學習的焊接質量檢測系統

    基于機器視覺和深度學習的焊接質量檢測系統一種創新性的技術解決方案,它結合了先進的計算機視覺和深度學習
    的頭像 發表于 01-18 17:50 ?831次閱讀
    主站蜘蛛池模板: 高傲教师麻麻被同学调教123| 国产一区二区在线观看免费| 印度学生xxxxx性14一16| 亚洲黄色高清视频| 亚洲国产中文在线视频免费| 亚洲日韩一区精品射精| 伊人网中文字幕| 最新亚洲中文字幕在线观看| 99久久精品免费国产一区二区三区 | 哒哒哒影院在线观看免费高清| 国产av免费观看日本| 国产亚洲视频中文字幕| 久久久久久免费高清电影| 男女作爱在线播放免费网页版观看| 欧美高清69vivo| 乌克兰16~18sex| 亚洲视频在线免费观看| 97国产精品人妻无码免费| 大学生宿舍飞机china free| 国产亚洲精品视频在线网| 久久综合色悠悠| 青青草国产精品| 亚洲国产在线视频精品 | 欧美亚洲国产免费高清视频| 四虎国产一区| 伊人久久大香线蕉综合网站| bbw videos 欧美老妇| 国产精品亚洲在钱视频| 久久久久久电影| 日本肉肉口番工全彩动漫| 亚洲精品无码不卡| 99在线精品国自产拍| 国产精品视频第一区二区三区| 久久国产主播福利在线| 日本福利片午夜免费观着| 亚洲欧洲自拍偷拍| RUNAWAY韩国动漫免费官网版| 国产午夜a理论毛片在线影院 | 国产成人无码精品久久久影院| 久久久久综合网| 翁公与小莹在客厅激情|