世界杯足球直播决赛,香港六合彩137期黄金八码,网络棋牌游戏看牌器(中国)·官方网站

麻省理工學(xué)院(MIT)的研究人員利用機(jī)器學(xué)習(xí)算法中的深度神經(jīng)網(wǎng)絡(luò)，創(chuàng)造出了第一個(gè)可以在識(shí)別音樂類型等聽覺任務(wù)上模擬人類表現(xiàn)的模型。

該模型由許多信息處理單元組成，通過輸入大量的數(shù)據(jù)來訓(xùn)練此模型，以完成特定的任務(wù)。研究人員利用該模型來闡明人腦是如何執(zhí)行同樣的任務(wù)的。

Josh McDermott說：“這些模型第一次給我們提供一個(gè)能夠執(zhí)行對(duì)人類有意義的感官任務(wù)的機(jī)器系統(tǒng)，并且是在人類的水平等級(jí)上進(jìn)行這項(xiàng)工作。”他是麻省理工學(xué)院大腦和認(rèn)知科學(xué)系的神經(jīng)科學(xué)Frederick A.和Carole J. Middleton的助理教授，也是這項(xiàng)研究的資深作者。 “從歷史上看，這種感官的處理方式很難理解，部分原因是我們沒有一個(gè)非常明確的理論基礎(chǔ)，也沒有一個(gè)很好的方法來對(duì)可能正在發(fā)生的事情進(jìn)行開發(fā)建模。”

這項(xiàng)研究發(fā)表在4月19日的《Neuron》雜志上，這項(xiàng)研究也證明了人類的聽覺皮層排列在在一個(gè)等級(jí)分明的組織中，就像視覺皮質(zhì)一樣。在這種類型的排列中，感官信息經(jīng)過連續(xù)的處理，基本信息處理得更早，而像單詞含義一樣的更高級(jí)特征在后期處理。

麻省理工學(xué)院研究生Alexander Kell和斯坦福大學(xué)助理教授Daniel Yamins是論文的主要作者。其他作者是麻省理工學(xué)院前訪問學(xué)生Erica Shook和前麻省理工學(xué)院博士后Sam Norman Haignere。

大腦建模：模型學(xué)會(huì)了像人類一樣準(zhǔn)確地執(zhí)行任務(wù)

當(dāng)神經(jīng)網(wǎng)絡(luò)在20世紀(jì)80年代首次出現(xiàn)時(shí)，神經(jīng)科學(xué)家們希望這種系統(tǒng)可以用來模擬人腦。然而，來自那個(gè)時(shí)代的計(jì)算機(jī)不夠強(qiáng)大，無法建立足夠大的模型來進(jìn)行一些實(shí)際任務(wù)，如物體識(shí)別或語音識(shí)別等。

在過去的五年里，隨著計(jì)算能力和神經(jīng)網(wǎng)絡(luò)技術(shù)的進(jìn)步，使用神經(jīng)網(wǎng)絡(luò)來執(zhí)行這些困難的現(xiàn)實(shí)任務(wù)已經(jīng)成為一種可能，而且它們已經(jīng)成為許多工程應(yīng)用程序中的標(biāo)準(zhǔn)方法。與此同時(shí)，一些神經(jīng)科學(xué)家對(duì)這些系統(tǒng)是否能夠來模擬人腦進(jìn)行了重新審視。

Kell說：“這對(duì)于神經(jīng)科學(xué)來說是一個(gè)激動(dòng)人心的機(jī)會(huì)，因?yàn)槲覀兛梢詣?chuàng)造出可以代替人類來執(zhí)行某些工作的系統(tǒng)，然后我們可以對(duì)這些模型進(jìn)行測(cè)試并將它們與大腦進(jìn)行比較。”

麻省理工學(xué)院的研究人員訓(xùn)練他們的神經(jīng)網(wǎng)絡(luò)來執(zhí)行兩個(gè)聽覺任務(wù)，一個(gè)涉及語音，另一個(gè)涉及音樂。在語音任務(wù)中，研究人員給模型提供了成千上萬的兩秒鐘長的錄音。任務(wù)是識(shí)別音頻中單詞。在音樂任務(wù)中，該模型被要求識(shí)別那些兩秒鐘音樂片段的類型。每個(gè)片段還包括背景噪音，使任務(wù)更加現(xiàn)實(shí)也更加困難。

在完成了成千上萬的數(shù)據(jù)訓(xùn)練之后，模型學(xué)會(huì)了像人類一樣準(zhǔn)確地執(zhí)行任務(wù)。

Kell說：“這個(gè)想法是隨著時(shí)間的推移，模型在任務(wù)中變得越來越好。希望它正在學(xué)習(xí)一些一般的東西，所以如果你給模型輸入一種它以前從未聽過的新聲音，它會(huì)做得很好，這已經(jīng)在實(shí)驗(yàn)中得到了證明。”

該模型還傾向于在人類最容易犯錯(cuò)誤的片段上犯錯(cuò)誤。

組成神經(jīng)網(wǎng)絡(luò)的處理單元可以以多種方式組合在一起，形成可以影響模型的性能的不同模型結(jié)構(gòu)。

麻省理工研究團(tuán)隊(duì)發(fā)現(xiàn)，這兩項(xiàng)任務(wù)的最佳模型是將處理分為兩組階段。第一階段是在任務(wù)之間共享的，但在此之后，它分成兩個(gè)分支，用于進(jìn)一步的分析：一個(gè)用于語音處理任務(wù)，另一個(gè)用于音樂處理任務(wù)。

分級(jí)的證據(jù)：初級(jí)聽覺皮層和其他有區(qū)別

然后，研究人員用他們的模型對(duì)一個(gè)長期存在的關(guān)于聽覺皮層結(jié)構(gòu)的問題進(jìn)行了探索：它是否分級(jí)。

在分級(jí)系統(tǒng)中，一系列的大腦區(qū)域在流經(jīng)系統(tǒng)的感官信息上執(zhí)行不同類型的計(jì)算。有證據(jù)表明，視覺皮層有相同類型的組織結(jié)構(gòu)。前期的區(qū)域，被稱為初級(jí)視覺皮質(zhì)，對(duì)簡(jiǎn)單的特征如顏色或方向做出反應(yīng)。后端的區(qū)域則執(zhí)行更復(fù)雜的任務(wù)，如對(duì)象識(shí)別。

然而，很難測(cè)試這種類型的組織是否也存在于聽覺皮層中，部分原因是沒有一個(gè)好的模型來對(duì)人類的聽覺行為進(jìn)行復(fù)制。

McDermott說：“我們認(rèn)為，如果我們可以構(gòu)建一個(gè)和人類執(zhí)行同樣任務(wù)的模型，我們就能夠比較將模型不同階段的不同部分與大腦進(jìn)行比價(jià)，這樣可以得到一些證據(jù)來證明大腦中的一些部分是否是分級(jí)的組織。”

研究人員發(fā)現(xiàn)，在他們的模型中聲音的基本特征，如頻率在早期階段更容易被提取。當(dāng)信息在神經(jīng)網(wǎng)上不斷向后傳輸?shù)倪^程中，一些基本特征越來越難提取，而更高層次的信息，例如詞的含義變得更容易提取。

為了驗(yàn)證模型階段是否可以復(fù)制人類聽覺皮層處理聲音信息的方式，研究人員使用了功能性磁共振成像(fMRI)來測(cè)量大腦處理真實(shí)聲音時(shí)聽覺皮層的不同區(qū)域。然后，他們比較了在處理相同的聲音時(shí)，大腦和模型的區(qū)別。

他們發(fā)現(xiàn)，模型的中間階段與大腦初級(jí)聽覺皮層的活動(dòng)相似性最高，隨后的網(wǎng)絡(luò)與初級(jí)皮質(zhì)以外的活動(dòng)相呼應(yīng)。研究人員說，這為聽覺皮層以一種類似于視覺皮層的分級(jí)方式排列提供了證據(jù)。

McDermott說：“我們非常清楚地看到，初級(jí)聽覺皮層和其他所有東西之間的區(qū)別。”

作者現(xiàn)在打算開發(fā)一種可以執(zhí)行其他類型的聽覺任務(wù)的模型，例如特定聲音的發(fā)聲位置定位，來探討這些任務(wù)是否可以通過本文中發(fā)現(xiàn)的思路來完成，或者說其他的一些任務(wù)通過對(duì)人腦進(jìn)行研究，以獲得新的思路。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4779

瀏覽量
101174
語音識(shí)別

語音識(shí)別

+關(guān)注

關(guān)注
38

文章
1742

瀏覽量
112927
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8439

瀏覽量
133087

原文標(biāo)題：MIT開發(fā)聽覺神經(jīng)網(wǎng)絡(luò)模型，學(xué)會(huì)從2秒片段識(shí)別音樂類型

文章出處：【微信號(hào)：AI_era，微信公眾號(hào)：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

基于深度神經(jīng)網(wǎng)絡(luò)的嬰兒哭聲識(shí)別算法

語音識(shí)別中使用的機(jī)器學(xué)習(xí)類型可以在嬰兒的哭聲識(shí)別研究中重復(fù)，前提是不同

發(fā)表于 05-20 19:20

人臉識(shí)別、語音翻譯、無人駕駛...這些高科技都離不開深度神經(jīng)網(wǎng)絡(luò)了！

，如何用一個(gè)神經(jīng)網(wǎng)絡(luò)，寫出一套機(jī)器學(xué)習(xí)算法，來自動(dòng)識(shí)別未知的圖像。一個(gè) 4 層的神經(jīng)網(wǎng)絡(luò)輸入層經(jīng)

發(fā)表于 05-11 11:43

深度學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系

理解，但是在其高冷的背后，卻有深遠(yuǎn)的應(yīng)用場(chǎng)景和未來。深度學(xué)習(xí)是實(shí)現(xiàn)機(jī)器學(xué)習(xí)的一種方式或一條路徑。其動(dòng)機(jī)在于建立、模擬人腦進(jìn)行分析

發(fā)表于 07-04 16:07

基于賽靈思FPGA的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)設(shè)計(jì)

FPGA 上實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò) (CNN)。CNN 是一類深度神經(jīng)網(wǎng)絡(luò)，在處理大規(guī)模圖像識(shí)別任務(wù)

發(fā)表于 06-19 07:24

卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

network，DBN）[24]，從此拉開了深度學(xué)習(xí)大幕。隨著深度學(xué)習(xí)理論的研究和發(fā)展，研究人員提出了一系列卷積神經(jīng)網(wǎng)絡(luò)

發(fā)表于 08-02 10:39

什么是深度學(xué)習(xí)？使用FPGA進(jìn)行深度學(xué)習(xí)的好處？

什么是深度學(xué)習(xí)為了解釋深度學(xué)習(xí)，有必要了解神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)是一種

發(fā)表于 02-17 16:56

卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介：什么是機(jī)器學(xué)習(xí)？

通過網(wǎng)絡(luò)訓(xùn)練來確定才能使模型工作。這將在后續(xù)文章“訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)：什么是機(jī)器學(xué)習(xí)？—第 2 部分”中

發(fā)表于 02-23 20:11

淺析三種主流深度神經(jīng)網(wǎng)絡(luò)

來源：青榴實(shí)驗(yàn)室1、引子深度神經(jīng)網(wǎng)絡(luò)(DNNs)最近在圖像分類或語音識(shí)別等復(fù)雜機(jī)器學(xué)習(xí)

發(fā)表于 05-17 09:59 ?2952次閱讀

卷積神經(jīng)網(wǎng)絡(luò)算法流程卷積神經(jīng)網(wǎng)絡(luò)模型工作流程

卷積神經(jīng)網(wǎng)絡(luò)算法流程卷積神經(jīng)網(wǎng)絡(luò)模型工作流程? 卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN）是一種廣泛

發(fā)表于 08-21 16:50 ?2969次閱讀

基于神經(jīng)網(wǎng)絡(luò)算法的模型構(gòu)建方法

神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)算法，廣泛應(yīng)用于各種領(lǐng)域，如圖像識(shí)別、自然語言處理、語音識(shí)別

發(fā)表于 07-02 11:21 ?658次閱讀

卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及其功能

。引言深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支，它通過模擬人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能，實(shí)現(xiàn)對(duì)數(shù)據(jù)的自動(dòng)學(xué)習(xí)

發(fā)表于 07-02 14:45 ?2561次閱讀

神經(jīng)網(wǎng)絡(luò)算法的優(yōu)缺點(diǎn)有哪些

神經(jīng)網(wǎng)絡(luò)算法是一種模擬人腦神經(jīng)元結(jié)構(gòu)的計(jì)算模型，廣泛應(yīng)用于機(jī)器學(xué)習(xí)、

發(fā)表于 07-03 09:47 ?1651次閱讀

神經(jīng)網(wǎng)絡(luò)算法的結(jié)構(gòu)有哪些類型

神經(jīng)網(wǎng)絡(luò)算法是深度學(xué)習(xí)的基礎(chǔ)，它們?cè)谠S多領(lǐng)域都有廣泛的應(yīng)用，如圖像識(shí)別、自然語言處理、語音識(shí)別

發(fā)表于 07-03 09:50 ?539次閱讀

不同類型神經(jīng)網(wǎng)絡(luò)在回歸任務(wù)中的應(yīng)用

神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)模型，可以用于各種任務(wù)，包括回歸。在本文中，我們將討論不同類型的

發(fā)表于 07-11 10:27 ?1433次閱讀

深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)模型

卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò)，其靈感來源于生物的視覺皮層機(jī)制。它通過模擬人類視覺系統(tǒng)的處理方式，能夠自動(dòng)提取圖像特征，從而在圖像識(shí)別和分類任務(wù)

發(fā)表于 11-15 14:52 ?402次閱讀

衡阳派盒市场营销有限公司

搜索歷史

利用機(jī)器學(xué)習(xí)算法中的深度神經(jīng)網(wǎng)絡(luò),識(shí)別音樂類型等聽覺任務(wù)上模擬人類表現(xiàn)的模型

評(píng)論

基于深度神經(jīng)網(wǎng)絡(luò)的嬰兒哭聲識(shí)別算法

人臉識(shí)別、語音翻譯、無人駕駛...這些高科技都離不開深度神經(jīng)網(wǎng)絡(luò)了！

深度學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系

基于賽靈思FPGA的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)設(shè)計(jì)

卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

什么是深度學(xué)習(xí)？使用FPGA進(jìn)行深度學(xué)習(xí)的好處？

卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介：什么是機(jī)器學(xué)習(xí)？

淺析三種主流深度神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)算法流程卷積神經(jīng)網(wǎng)絡(luò)模型工作流程

基于神經(jīng)網(wǎng)絡(luò)算法的模型構(gòu)建方法

卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及其功能

神經(jīng)網(wǎng)絡(luò)算法的優(yōu)缺點(diǎn)有哪些

神經(jīng)網(wǎng)絡(luò)算法的結(jié)構(gòu)有哪些類型

不同類型神經(jīng)網(wǎng)絡(luò)在回歸任務(wù)中的應(yīng)用

深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)模型