衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種用于音樂源分離的新型深度學習系統

倩倩 ? 來源:互聯網分析沙龍 ? 2020-03-22 15:46 ? 次閱讀

Facebook Research最近發布了Demucs,這是一種用于音樂源分離的新型深度學習系統。根據人類對分離后聲音總體質量的評估,Demucs的性能優于先前報道的結果。

音樂源分離是經過大量研究的一種應用,稱為盲源分離。該過程包括在不借助元信息的情況下從一組混合信號中分離出一組源信號。對于音樂,各個組成部分可能包括人聲或其他樂器軌道。當空中交通管制員開始在單個揚聲器上聽到多個飛行員的混合聲音時出現問題時,源分離領域首先受到了廣泛關注。這導致英國科學家科林·切里(Colin Cherry)在1953年將這種效應稱為“雞尾酒會問題”。

在源分離領域的現有研究的推動下,研究科學家于2000年代初開始使用AI分離音樂中的聲音。如今,短時傅立葉變換產生的頻譜圖(STFT)是最新音樂源分離的核心。這些系統在每個幀和每個源的幅度譜上產生一個掩碼,并且通過在掩碼頻譜圖上運行逆STFT的同時重新使用輸入混合相位,來生成輸出音頻

建立在頻譜圖分析基礎上的系統在諸如中音鋼琴或連奏小提琴之類的樂器的源分離方面表現出色,因為它們可以產生一致的頻率和振鈴。但是,這些系統很難隔離敲擊聲音,因為敲擊樂器所產生的殘留噪聲會產生更寬的頻率范圍,并且當與多個樂器的重疊相結合時,信息就會丟失,并且掩蓋操作將使信息不再可逆。

Demucs是一種深度學習模型,可直接對原始輸入波形進行操作并為每個源生成一個波形。U-net體系結構使用卷積編碼器和解碼器,該解碼器和解碼器基于跨步卷積較大的步幅。波形模型的工作方式與常見的計算機視覺模型相似,因為它們都使用神經網絡在推斷更高級別的模式之前先檢測基本模式。

基于頻譜圖的模型優于Wave-U-Net,后者是Demucs之前最先進的基于波形的模型。Demucs建立在Wave-U-Net體系結構的基礎上,具有可調整的超參數和較長的短期內存,允許網絡處理整個數據序列,而不是單個數據點。

這些改進幫助系統解決了一個聲音超過另一個聲音的問題,因為解碼器足夠聰明,可以填充柔和的音符。

人類在MusDB數據集上評估Demucs,并將其與其他最新的源分離系統的結果進行比較。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 傅立葉變換
    +關注

    關注

    3

    文章

    105

    瀏覽量

    32494
  • 深度學習
    +關注

    關注

    73

    文章

    5516

    瀏覽量

    121558
收藏 人收藏

    評論

    相關推薦

    一種新型高效率的服務器電源系統

    一種新型高效率的服務器電源系統
    發表于 12-19 16:45 ?1次下載

    NPU在深度學習中的應用

    設計的硬件加速器,它在深度學習中的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習算法優化的處理器,它與傳統的CPU和G
    的頭像 發表于 11-14 15:17 ?895次閱讀

    pcie在深度學習中的應用

    與主機系統連接,提供必要的計算支持。 2. PCIe技術概述 PCIe是一種點對點串行連接,用于計算機內部硬件組件之間的連接。它以其高速數據傳輸能力和低延遲特性而聞名,是連接高性能硬件(如GPU)的理想選擇。 高速數據傳輸 :P
    的頭像 發表于 11-13 10:39 ?534次閱讀

    一種基于深度學習的二維拉曼光譜算法

    近日,天津大學精密儀器與光電子工程學院的光子芯片實驗室提出了一種基于深度學習的二維拉曼光譜算法,成果以“Rapid and accurate bacteria identification
    的頭像 發表于 11-07 09:08 ?300次閱讀
    <b class='flag-5'>一種</b>基于<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的二維拉曼光譜算法

    GPU深度學習應用案例

    能力,可以顯著提高圖像識別模型的訓練速度和準確性。例如,在人臉識別、自動駕駛等領域,GPU被廣泛應用于加速深度學習模型的訓練和推理過程。 二、自然語言處理 自然語言處理(NLP)是深度
    的頭像 發表于 10-27 11:13 ?511次閱讀

    一種新型電流模式控制集成電路

    電子發燒友網站提供《一種新型電流模式控制集成電路.pdf》資料免費下載
    發表于 10-24 10:20 ?0次下載
    <b class='flag-5'>一種</b><b class='flag-5'>新型</b>電流模式控制集成電路

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 深度學習是AI大模型的基礎 技術支撐 :
    的頭像 發表于 10-23 15:25 ?1283次閱讀

    PyTorch深度學習開發環境搭建指南

    PyTorch作為一種流行的深度學習框架,其開發環境的搭建對于深度學習研究者和開發者來說至關重要。在Windows操作
    的頭像 發表于 07-16 18:29 ?1283次閱讀

    深度學習中的時間序列分類方法

    時間序列分類(Time Series Classification, TSC)是機器學習深度學習領域的重要任務之,廣泛應用于人體活動識別
    的頭像 發表于 07-09 15:54 ?1170次閱讀

    深度學習與nlp的區別在哪

    深度學習和自然語言處理(NLP)是計算機科學領域中兩個非常重要的研究方向。它們之間既有聯系,也有區別。本文將介紹深度學習與NLP的區別。 深度
    的頭像 發表于 07-05 09:47 ?1066次閱讀

    深度學習常用的Python庫

    深度學習作為人工智能的個重要分支,通過模擬人類大腦中的神經網絡來解決復雜問題。Python作為一種流行的編程語言,憑借其簡潔的語法和豐富的庫支持,成為了
    的頭像 發表于 07-03 16:04 ?728次閱讀

    基于深度學習的鳥類聲音識別系統

    的泛化能力,然后提出了個輕量級的鳥類聲音識別模型,以MobileNetV3為骨干構建了一種輕量級的特征提取和識別網絡。通過調整模型中的深度分離卷積,提高了模型的識別能力。設計了
    發表于 05-30 20:30

    一種利用光電容積描記(PPG)信號和深度學習模型對高血壓分類的新方法

    [22]。就像平均池化樣,最大池化是另一種用于減小特征圖大小的常用方法。它通過僅取每個區域的最大值來獲得最重要的特征。在機器學習中,池化方法的選擇可以顯著影響機器
    發表于 05-11 20:01

    傳統計算機視覺對比深度學習

    深度學習一種技術,它使用一種稱為梯度反向傳播的優化技術來生成“程序”(也稱為“神經網絡”),就像上面故事中學者學生編寫的那些程序樣。
    發表于 03-31 09:48 ?493次閱讀

    FPGA在深度學習應用中或將取代GPU

    將 AI 框架模型映射到硬件架構。 Larzul 的公司 Mipsology 希望通過 Zebra 來彌合這差距。Zebra 是一種軟件平臺,開發者可以輕松地將深度學習代碼移植到 F
    發表于 03-21 15:19
    大众百家乐的玩法技巧和规则| 百家乐高手技巧| 百家乐扫描技术| 在线棋牌| 百家乐视频多开| 德州扑克筹码| 葡京百家乐技巧| 在线博弈游戏| 百家乐怎么赢博彩正网| 澳门百家乐官网大揭密| 玩百家乐技巧看| 网络百家乐的陷阱| 百家乐官网赌场优势| 百家乐如何赚洗码| 百家乐官网分析仪有真的吗| 威尼斯人娱乐城地址| 路单百家乐官网的玩法技巧和规则 | 百家乐官网9人桌布| 万豪国际开户| 大发888备用网站| 金木棉百家乐官网的玩法技巧和规则| 任你博百家乐官网现金网| 巴登娱乐城| 大发888娱乐手机版| 摩纳哥百家乐娱乐城| 玩百家乐官网掉房| 至尊百家乐官网吕文婉| 浩博国际| bet365备用网站| 百家乐开放词典新浪| 百家乐官网必胜下注法| 上海二八杠分析仪| 网站百家乐假| 上市百家乐评论| 七胜百家乐娱乐网| 娱乐城百家乐送白菜| 百家乐官网怎样下注| 飞天百家乐官网的玩法技巧和规则 | 真人游戏试玩| 大发888游戏在线客服| 大发888游戏平台寒怕|