百度最新AI算法就能克隆任何人的聲音！只需 3.7 秒!

僅需3.7秒的音頻，中國科技巨頭百度開發(fā)的一種新的AI 算法就可以克隆出一種非常可信的虛假聲音。就像機器學習軟件的迅速發(fā)展一樣，這種軟件可以使虛擬視頻的制作民主化，這項研究表明為什么越來越難相信互聯(lián)網(wǎng)上的任何媒體。

這家科技巨頭的研究人員在Deep Voice發(fā)布了他們的最新進展，Deep Voice是一個為聲音克隆開發(fā)的系統(tǒng)。一年前，該技術(shù)需要大約30分鐘的音頻來創(chuàng)建新的假音頻片段。現(xiàn)在，只需幾秒鐘的培訓材料，它可以創(chuàng)造出更好的結(jié)果。

百度近日宣布，百度開發(fā)的新 AI 算法Deep Voice可以通過3.7秒鐘的錄音樣本數(shù)據(jù)就能完美的克隆出一個人的聲音。

Deep Voice是百度AI研究院一個由深度神經(jīng)網(wǎng)絡(luò)構(gòu)建的高質(zhì)量語音轉(zhuǎn)（TTS ）系統(tǒng)。該系統(tǒng)不僅提高的模擬的時間，百度還優(yōu)化了它出錯的概率。甚至還在一個單GPU服務(wù)器上，把推斷規(guī)模提高到到每天1000萬次以上。

自適應(yīng)說話人編碼方法在訓練、克隆和音頻生成中的應(yīng)用

Deep Voice最早是在2017年的年初發(fā)布了第一版，初版的系統(tǒng)就能模擬初簡短的句子，而且說起話來幾乎無法區(qū)分和真人的區(qū)別。但是該系統(tǒng)一次只能模擬一個人的聲音，而且需要好幾個小時的學習才能克隆成功。但是最新發(fā)布的成功已經(jīng)縮短到3.7秒，并且能將女性聲音轉(zhuǎn)變成男性，英式聲音變成美式。

模擬器編碼器結(jié)構(gòu)

百度研究院的研究人員在預印本網(wǎng)站 arxiv 上的發(fā)表了其 Deep Voice 系統(tǒng)的最新進展《Neural Voice Cloning with a Few Samples》。除了利用少量樣本克隆聲音外，系統(tǒng)還能將女性聲音轉(zhuǎn)變成男性，英式聲音變成美式。百度研究人員表示，這項研究可應(yīng)用于人機交互的個性化方面。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4780

瀏覽量
101175
機器學習

機器學習

+關(guān)注

關(guān)注
66

文章
8439

瀏覽量
133087

原文標題：只需 3.7 秒，百度最新AI算法就能克隆任何人的聲音！

文章出處：【微信號：worldofai，微信公眾號：worldofai】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

2022百度世界大會-百度AI數(shù)字人“希加加”帶你暢游AI世界

2022百度世界大會-百度AI數(shù)字人“希加加”帶你暢游AI世界 ? ? ? 審核編輯：彭靜

發(fā)表于 07-21 17:23 ?1160次閱讀

2022<b class='flag-5'>百度</b>世界大會-<b class='flag-5'>百度</b><b class='flag-5'>AI</b>數(shù)字人“希加加”帶你暢游<b class='flag-5'>AI</b>世界

seo優(yōu)化的百度算法筆記

seo優(yōu)化之百度算法解析（一）

發(fā)表于 05-27 17:15

百度宣布“百度AI加速器”開營,選擇免費開放AI相關(guān)技能

今年的百度專注于AI研發(fā)，據(jù)報道，百度已經(jīng)宣布“百度AI加速器”開營，并選擇免費開放，讓開發(fā)者去摸索AI

發(fā)表于 12-10 10:55 ?1267次閱讀

百度釋出新AI算法可提升腫瘤辨識效率與正確性

百度硅谷AI Lab發(fā)表新的深度學習算法NCRF(Neural Conditional Random Field)，據(jù)稱可改善目前活體組織切片檢查WSI(Whole Slide Image)分析的結(jié)果，協(xié)助病理學家提升腫瘤辨識效

發(fā)表于 07-05 10:17 ?1721次閱讀

百度開發(fā)聲音克隆技術(shù)，通過訓練數(shù)據(jù)便可復制聲音

百度新開發(fā)的語音生成系統(tǒng)不僅可以把說話聲音從固定的一種增加到了上千種，得以模仿數(shù)千個不同說話者的聲音，而且每個說話者只需要不到一個半小時的訓練數(shù)據(jù)。

發(fā)表于 05-15 09:48 ?2320次閱讀

借助深度學習算法實現(xiàn)5秒內(nèi)克隆你的聲音

大家應(yīng)該都知道聲音克隆技術(shù)，通俗的來說就是借助深度學習算法，可以完全模擬某個人的聲音，而且由機器合成的語音連情緒都能夠完美表達出來，基本可以以假亂真，只要不見面，你根本就察覺不出來向你

發(fā)表于 09-29 11:45 ?2684次閱讀

AI算法5秒鐘就能克隆你的聲音

今天，給大家介紹一個算法。 AI 算法 5 秒鐘，就能克隆你的聲音，你信嗎？聽聽這段音頻，猜猜

發(fā)表于 11-17 10:05 ?7071次閱讀

百度Create AI開發(fā)者大會：百度大腦位居中國市場第一

百度Create AI開發(fā)者大會：在2021百度AI開發(fā)者大會上，百度推出了數(shù)字人平臺以及透露了百度

發(fā)表于 12-28 11:33 ?2174次閱讀

2022百度世界大會-百度智慧交管助力AI與交警共同成長

2022百度世界大會-百度智慧交管助力AI與交警共同成長 ? ? ? 審核編輯：彭靜

發(fā)表于 07-21 15:58 ?470次閱讀

2022百度世界大會—百度AI助力電力安全流淌

2022百度世界大會—百度AI助力電力安全流淌 ? ? ? ? 審核編輯：彭靜

發(fā)表于 07-21 16:06 ?642次閱讀

2022百度世界大會—百度AI健身鏡成為居家運動新寵

2022百度世界大會—百度AI健身鏡成為居家運動新寵 ? ? ? 審核編輯：彭靜

發(fā)表于 07-21 17:13 ?1735次閱讀

2022百度世界大會-百度攜手眼科專家AI學習 AI護眼

2022百度世界大會-百度攜手眼科專家AI學習 AI護眼 ? ? ? 審核編輯：彭靜

發(fā)表于 07-21 17:18 ?1489次閱讀

圖為科技聯(lián)合百度飛槳、英偉達共同推出AI軟硬一體快速部署方案

基于圖為科技邊緣計算機系列產(chǎn)品，僅用三行代碼就能搞定百度飛槳AI算法的部署；讓AI算法部署變得簡

發(fā)表于 12-20 11:01 ?1299次閱讀

2024百度移動生態(tài)萬象大會:百度新搜索11%內(nèi)容已AI生成

2024百度移動生態(tài)萬象大會:百度新搜索11%內(nèi)容已AI生成今天2024百度移動生態(tài)萬象大會在江蘇蘇州舉辦，特別是AI搜索與

發(fā)表于 05-30 18:58 ?447次閱讀

百度世界2024大會發(fā)布創(chuàng)新產(chǎn)品：秒嗒與自由畫布

大核心特點是：無代碼編程、多智能體協(xié)作以及多工具調(diào)用。這意味著，用戶無需編寫任何代碼，僅憑直觀的操作和配置，就能將任意想法轉(zhuǎn)化為現(xiàn)實應(yīng)用，極大地降低了編程門檻，拓寬了技術(shù)創(chuàng)新的邊界。此外，百度還攜手

發(fā)表于 11-14 11:31 ?1566次閱讀

精選推薦
更多

文章

資料

帖子

信創(chuàng)算力關(guān)鍵年的三個趨勢與最佳選擇

腦極體
2小時前

135 閱讀

康謀方案 | BEV感知技術(shù)：多相機數(shù)據(jù)采集與高精度時間同步方案

康謀自動駕駛
3小時前

183 閱讀

華為2024年營收超8600億！DeepSeek擴充朋友圈/英飛凌2025財年第一季度業(yè)績熱點科技新聞點評

章鷹觀察
5小時前

532 閱讀

如何使用MATLAB構(gòu)建Transformer模型

MATLAB
6小時前

219 閱讀

線性穩(wěn)壓器的另外一種用法

上海為昕科技有限公司
1天前

250 閱讀

變速箱工作原理及電路圖

百靈千島醬
585

10積分

180下載

集成前置放大電路安裝與調(diào)試

yezi888
7.08 MB

免費

215下載

Northframe單片機極簡信號/狀態(tài)機框架

算一掛
0.43 MB

免費

0下載

Solana快速、安全、抗審查的區(qū)塊鏈

李華瑞
18.77 MB

免費

0下載

neogo Neovim go的開發(fā)插件

楊帆
0.16 MB

2積分

2下載

在fpga上實現(xiàn)NAND控制器的問題請教

jf_39870250
17小時前

46 閱讀

【ELF 2學習板試用】命令行功能測試-shell腳本進行IO控制-紅綠燈項目

lustao
17小時前

154 閱讀

迅為RK3568開發(fā)板篇OpenHarmony實操HDF驅(qū)動控制LED-編寫應(yīng)用APP

jf_23361246
17小時前

149 閱讀

CS8M320燒錄不進

jf_71751014
17小時前

111 閱讀

【貝啟科技BQ3568HM開源鴻蒙開發(fā)板深度試用報告】3 - 智能家居中控屏連接華為云IoTDA物聯(lián)網(wǎng)平臺

zealsoft
17小時前

196 閱讀

推薦專欄
更多

衡阳派盒市场营销有限公司

搜索歷史

百度最新AI算法就能克隆任何人的聲音！只需 3.7 秒!

評論

2022百度世界大會-百度AI數(shù)字人“希加加”帶你暢游AI世界

seo優(yōu)化的百度算法筆記

百度宣布“百度AI加速器”開營,選擇免費開放AI相關(guān)技能

百度釋出新AI算法可提升腫瘤辨識效率與正確性

百度開發(fā)聲音克隆技術(shù)，通過訓練數(shù)據(jù)便可復制聲音

借助深度學習算法實現(xiàn)5秒內(nèi)克隆你的聲音

AI算法5秒鐘就能克隆你的聲音

百度Create AI開發(fā)者大會：百度大腦位居中國市場第一

2022百度世界大會-百度智慧交管助力AI與交警共同成長

2022百度世界大會—百度AI助力電力安全流淌

2022百度世界大會—百度AI健身鏡成為居家運動新寵

2022百度世界大會-百度攜手眼科專家AI學習 AI護眼

圖為科技聯(lián)合百度飛槳、英偉達共同推出AI軟硬一體快速部署方案

2024百度移動生態(tài)萬象大會:百度新搜索11%內(nèi)容已AI生成

百度世界2024大會發(fā)布創(chuàng)新產(chǎn)品：秒嗒與自由畫布