k7娱乐城怎么样,足球先生打一字,优德老虎机代理(中国)·官方网站

盛夏將至，各條AI賽道也熱烈了起來。如果評選一下，近段時(shí)間哪個(gè)領(lǐng)域的AI應(yīng)用最為火爆，那么AI音樂創(chuàng)作絕對名列前茅。

一個(gè)月之前，海外初創(chuàng)企業(yè)Suno發(fā)布新版AI音樂生成大模型Suno V3，它可以根據(jù)用戶自然語言快速生成相關(guān)風(fēng)格音樂，在全球范圍內(nèi)引發(fā)熱議。而就在不久前，來自前DeepMind團(tuán)隊(duì)成員的Udio音樂大模型發(fā)布。這款模型可以帶來非常逼真的音樂制作效果，并且可以完成多段式、長音樂作品的生成。

AI音樂生成大模型賽道，競爭突然激烈了起來。加上OpenAI的MuseNet、谷歌的MusicLM、Meta的MusicGen等項(xiàng)目，我們似乎在今年迎來了一場全球AI音樂會(huì)。一時(shí)間異彩紛呈，好不熱鬧。

但在這場AI音樂會(huì)中，有一個(gè)現(xiàn)象非常值得重視：這一次，中國科技與全球前沿AI趨勢之間沒有時(shí)差，無縫銜接。我們不再是跟隨者與追趕者，而是第一時(shí)間加入了這場音樂與AI的盛宴，奏響了屬于自己的旋律。

4月2日，由昆侖萬維打造的AI音樂生成大模型“天工SkyMusic”開啟免費(fèi)邀測，4月17日更是正式發(fā)布。

天工SkyMusic是國內(nèi)唯一公開可用的AI音樂生成大模型，也是中國首個(gè)音樂SOTA模型。

它與震撼全球科技與音樂產(chǎn)業(yè)的Suno、Udio保持了時(shí)間線上的高度同步，同時(shí)多個(gè)領(lǐng)域的技術(shù)能力更加出色。在與Suno V3的橫向測評中，天工SkyMusic在人聲&BGM音質(zhì)、人聲自然度、發(fā)音可懂度等領(lǐng)域顯著領(lǐng)先對手，并以6.65分的綜合得分超越Suno V3，成為全球AI音樂最新SOTA模型。

“中國AI不缺席”，是一段我們期待了很久的旋律。究竟是什么讓昆侖萬維能夠完成這次演奏？天工SkyMusic，以及背后的天工3.0有著怎樣的產(chǎn)業(yè)與社會(huì)價(jià)值？

讓我們打開這場全球AI音樂會(huì)，聽懂一首關(guān)于“中國AI不缺席”的盛夏奏鳴曲。

天工SkyMusic：東方的AI音樂會(huì)

不缺席的中國AI音樂大模型，不僅需要第一時(shí)間躋身行業(yè)一線，更需要在能力上拿出足夠有說服力的答案。

天工SkyMusic在發(fā)布之后，獲得了各方非常積極的反饋。來自媒體、音樂人與行業(yè)專家以及廣大用戶的聲音，證明了其具備加入全球AI音樂大模型競逐的底氣。AI音樂會(huì)不僅發(fā)生在歐美，同時(shí)也奏響在東方。

首先，我們可以具體來看一下天工SkyMusic在技術(shù)能力上的特色。

通過采用音樂音頻領(lǐng)域類Sora的DiT模型架構(gòu)，天工SkyMusic在AI音樂大模型的幾個(gè)核心能力指標(biāo)上都有不俗的表現(xiàn)。

其中包括高質(zhì)量的音樂生成能力、高逼真的人聲模擬能力、高豐富度的歌詞段落控制能力、高規(guī)模的音樂風(fēng)格掌握，以及高靈活的音樂表達(dá)。

舉例而言，歐美AI音樂風(fēng)格多以“器”見長，更偏重樂器豐富度參數(shù)，但在人聲擬合方面往往表現(xiàn)一般。

相較而言，昆侖萬維天工SkyMusic則專門在人聲自然度、發(fā)音可懂度上進(jìn)行了模型專門訓(xùn)練，使得AI發(fā)音清晰、無異響，讓大模型生成的音樂足以“以假亂真”。

此外，天工SkyMusic所能夠創(chuàng)作的音樂，展現(xiàn)出了對多種不同音樂風(fēng)格，不同生成訴求的把握。比如神曲改造對流行音樂的把握，古詩詞改編對中國傳統(tǒng)文化與格律的把握等。

透過廣泛的生成案例，我們可以發(fā)現(xiàn)天工SkyMusic具有豐富的使用場景與廣泛的需求人群，例如：

1.音樂從業(yè)者可以借助天工SkyMusic尋找靈感，輔助音樂創(chuàng)作。比如說，創(chuàng)作者可以輸入一些“母題”，包括親情、愛情等。通過天工SkyMusic生成的歌詞與旋律來尋找靈感，探索創(chuàng)作邊界。

2.短視頻創(chuàng)作者和UP主可以通過音樂生成來拓展創(chuàng)作邊界，降低音樂方案的創(chuàng)作門檻。比如說，UP主可以用天工SkyMusic改編“網(wǎng)絡(luò)神曲”，獲得新的視頻BGM。下面這首神曲，天工SkyMusic就可以為你帶來完全不一樣的感受。

3.音樂愛好者與粉絲可以獲得更多樣的音樂樂趣，與自己喜歡的音樂類型、音樂風(fēng)格進(jìn)行更加多樣性、深層次的互動(dòng)。比如我們可以換一個(gè)聲音，把我們喜歡的音樂進(jìn)行重新演繹。

4.在教育教學(xué)場景中，天工SkyMusic可以用來輔助音樂教育，讓學(xué)習(xí)者感受到音樂創(chuàng)作的內(nèi)在邏輯與豐富技巧。同時(shí)還能夠助力傳統(tǒng)文化、樂器演奏等方面的教育教學(xué)。比如說，天工SkyMusic可以基于古詩詞生成音樂，讓學(xué)生更生動(dòng)準(zhǔn)確掌握古典文化的精髓。

在這樣的應(yīng)用價(jià)值基礎(chǔ)上，我們還必須看到天工SkyMusic作為國內(nèi)最早，也是目前唯一的AI音樂大模型，在填補(bǔ)產(chǎn)業(yè)空白方面的價(jià)值是巨大的。它的出現(xiàn)，意味著中國用戶有了更加符合華語音樂創(chuàng)作習(xí)慣的AI模型，對中文有了更好的支持。同時(shí)它完全免費(fèi)，不限使用次數(shù)，無需額外的使用門檻，這都是國外同類AI音樂模型所無法實(shí)現(xiàn)的。

而從技術(shù)角度上看，天工SkyMusic對比MuseNet、MusicLM、MusicGen等項(xiàng)目也具備獨(dú)特的技術(shù)優(yōu)勢。

除了上文提到的人聲合成演唱能力外，在音樂風(fēng)格上天工SkyMusic更加精巧且多元。它能夠通過歌詞控制情緒變化，實(shí)現(xiàn)如顫音、歌劇、吟唱等多種歌唱技巧，并且可以使生成的音樂作品情感更加豐富且貼合情境。在此基礎(chǔ)上，天工SkyMusic支持創(chuàng)作說唱、民謠、放克、古風(fēng)、電子等多種音樂風(fēng)格，用戶可以根據(jù)個(gè)人喜好定制音樂風(fēng)格。

總體來看，天工SkyMusic開創(chuàng)了中國AI音樂大模型的先河，成為中國首個(gè)音樂AIGC SOTA，并且大幅提高了AI大模型音樂生成在人聲領(lǐng)域的技術(shù)表現(xiàn)。

天工 3.0：全球最大規(guī)模的開源MOE大模型

天工SkyMusic能夠與全球AI音樂會(huì)同頻奏響，背后必然離不開兩點(diǎn)：一是戰(zhàn)略方向的敏銳把握，二是技術(shù)底座的基石打造。

而天工SkyMusic背后的技術(shù)基石，則是剛剛發(fā)布的“天工3.0”

天工3.0采用了4000億級參數(shù)MoE混合專家模型，是目前全球模型參數(shù)最大、性能最強(qiáng)的MoE模型之一。相較于上一代天工2.0MoE大模型，其在模型語義理解、邏輯推理，以及通用性、泛化性、不確定性知識、學(xué)習(xí)能力等領(lǐng)域都有著大幅的性能提升，其模型技術(shù)知識能力提升超過20%，數(shù)學(xué)/推理/代碼/文創(chuàng)能力提升超過30%。

具體來看，天工3.0在四個(gè)方向帶來了全面升級：

首次是邏輯推理能力的增強(qiáng)。天工3.0強(qiáng)大的邏輯推理能力使其能夠在實(shí)際應(yīng)用中更加準(zhǔn)確和高效地處理信息。例如，在天工3.0AI搜索的研究模式中，能夠圍繞用戶的某個(gè)簡單指令進(jìn)行相關(guān)問題的延伸，并實(shí)時(shí)判斷該段落信息是否需要聯(lián)網(wǎng)搜索。在分析某個(gè)具體行業(yè)的信息時(shí)，能夠?qū)崿F(xiàn)總結(jié)相關(guān)事件、拆解產(chǎn)業(yè)鏈地圖等復(fù)雜功能，并以結(jié)構(gòu)化或思維導(dǎo)圖的形式進(jìn)行最終展示，讓AIGC能力與行業(yè)應(yīng)用更緊密融合。

其次，是語義理解能力的增強(qiáng)。天工3.0能夠更好地理解和處理用戶自然語言Query中的復(fù)雜語義信息，包括隱喻、多義詞等。比如說，天工3.0可以對用戶Query進(jìn)行拆解、細(xì)化，甚至對用戶進(jìn)行追問，從而在面對不確定知識時(shí)表現(xiàn)更好，能夠滿足用戶多樣化的需求。

此外，天工3.0新增了專項(xiàng)Agent訓(xùn)練能力。天工3.0可以針對模型獨(dú)立規(guī)劃、調(diào)用、組合外部工具及信息的能力進(jìn)行了專項(xiàng)訓(xùn)練，使其能夠獨(dú)立生成并調(diào)用代碼，完成包括產(chǎn)業(yè)研究、產(chǎn)品橫評、信息分析、圖片生成、圖表繪制等多種復(fù)雜用戶需求。

針對B端產(chǎn)業(yè)用戶的需求，天工3.0也在知識庫能力、任意工具調(diào)用能力、復(fù)雜角色指令追尋能力等領(lǐng)域進(jìn)行了升級，企業(yè)用戶可以通過上傳知識文檔構(gòu)建專屬知識庫及Agent，并實(shí)現(xiàn)自動(dòng)調(diào)用制定工具、完成復(fù)雜指令遵循Agent構(gòu)建等實(shí)用能力。

最后，天工3.0的內(nèi)容生成能力也得到了全面升級。對比天工2.0，天工3.0群星了全面的內(nèi)容創(chuàng)作能力增強(qiáng)，能夠完成AI音樂生成、AI語音、AI對話、AI二次元漫畫生成等內(nèi)容創(chuàng)作。還可以通過專項(xiàng)Agent訓(xùn)練實(shí)現(xiàn)在對話中結(jié)合文本需求實(shí)時(shí)生成圖片、結(jié)合文本需求實(shí)時(shí)內(nèi)容分析及圖表構(gòu)建等能力。

總結(jié)天工3.0的技術(shù)特點(diǎn)，最為關(guān)鍵的一點(diǎn)就是：獨(dú)立思考。

天工3.0可以將復(fù)雜任務(wù)進(jìn)行拆解優(yōu)化，并在每一步都獨(dú)立思考，判斷每一步是否需要調(diào)用不同的工具。也是基于獨(dú)立思考能力，天工3.0新增了聯(lián)網(wǎng)能力、文生圖、代碼能力等優(yōu)勢應(yīng)用能力，同時(shí)增強(qiáng)了AI搜索等能力的表現(xiàn)。

更為值得注意的是，性能強(qiáng)大，技術(shù)獨(dú)創(chuàng)性極強(qiáng)的天工3.0，選擇了開源開放的策略。在全球開源大模型極速發(fā)展，基于開源生態(tài)的AI應(yīng)用百花齊放的大背景下，天工3.0的開源無疑是給中國AI開源事業(yè)注入了強(qiáng)心劑。全面提升了中國開源大模型的整體技術(shù)水平與產(chǎn)業(yè)底座厚度。

在選擇開源開放的同時(shí)，天工3.0還搭建了智能體廣場，幫助開發(fā)者定制化打造智能體。更好的中文適配度，也讓天工3.0與中文開發(fā)需求更加契合。

全面增強(qiáng)的能力，更加豐富的功能，以及與開發(fā)者更緊密地契合，讓天工3.0成為一塊基石——“中國AI不缺席”的基石。

這一次，中國AI不缺席

過去AI行業(yè)內(nèi)部總是認(rèn)為，我們與歐美頂級AI企業(yè)之間存在著時(shí)間差。在新模型、新技術(shù)火熱之后，中國AI行業(yè)才開始跟隨和學(xué)習(xí)。

但在AI音樂大模型的熱潮里，情況顯然并非如此。為什么我們這次可以不跟隨，不焦慮，而是第一時(shí)間抵達(dá)這個(gè)舞臺，開始自己的演奏？

事實(shí)上，在AI音樂生成這個(gè)方向上，昆侖萬維一直保持著高度關(guān)注。早在2022年12月昆侖萬維發(fā)布的“昆侖天工”AIGC全系列開源算法與模型中，就包括多模態(tài)音樂內(nèi)容生成大模型。此后，昆侖萬維還打造了多個(gè)基于AI音樂大模型的合作項(xiàng)目，掌握了豐富的實(shí)踐經(jīng)驗(yàn)。昆侖萬維關(guān)注并且重視AI音樂生成，是天工SkyMusic的戰(zhàn)略牽引。

天工3.0與天工SkyMusic的發(fā)布展現(xiàn)出來了這樣一個(gè)價(jià)值邏輯：在AI大模型快速發(fā)展的產(chǎn)業(yè)紀(jì)元里，想要提升創(chuàng)新效率，把握戰(zhàn)略機(jī)遇，需要首先孕育一個(gè)底座。這個(gè)底座可以融合各種先進(jìn)的AI技術(shù)能力。

昆侖萬維集團(tuán)董事長兼CEO方漢認(rèn)為，SOTA指的是當(dāng)前技術(shù)在本領(lǐng)域技術(shù)指標(biāo)全球第一。OpenAI是文本大模型和視頻生成大模型的SOTA，而昆侖萬維目前實(shí)現(xiàn)了音樂AIGC的SOTA。

之所以能夠?qū)崿F(xiàn)這一點(diǎn)，有賴于天工3.0提供了底座級別的AI能力，進(jìn)而實(shí)現(xiàn)發(fā)展效率與發(fā)展質(zhì)量的統(tǒng)一。

昆侖萬維創(chuàng)始人周亞輝認(rèn)為：“未來三十年，人類社會(huì)很大的一個(gè)變化，是人類要從感知線，變成表達(dá)線，整個(gè)人類社會(huì)在自我表達(dá)側(cè)要翻1000倍；創(chuàng)作和自我表達(dá)是未來30年在整個(gè)社交和文化領(lǐng)域增長最快的曲線，會(huì)有越來越多人表達(dá)自我，表達(dá)對世界的理解、對社會(huì)事物的態(tài)度，表達(dá)越來越藝術(shù)化和趣味化；這種表達(dá)在過去很困難，因?yàn)楣ぞ唛T檻高，而未來30年是自我表達(dá)的30年，我們要用AI把人類創(chuàng)作的門檻降得足夠低，讓人們更充分地實(shí)現(xiàn)自我表達(dá)。”

基于昆侖萬維“All in AGI 和 AIGC”的戰(zhàn)略布局，天工3.0成為集自然語言處理、計(jì)算機(jī)視覺、多模態(tài)、AI搜索、AI智能體等多項(xiàng)前沿技術(shù)為一身的AI大模型。基于天工3.0提供的底座能力，昆侖萬維可以敏銳步驟發(fā)展機(jī)會(huì)，抓住諸如AI音樂創(chuàng)作這樣的產(chǎn)業(yè)風(fēng)口。而廣大開發(fā)者則可以獲得多元且豐富的AI能力，將AI帶到千行百業(yè)的每個(gè)角落。

以超級模型蘊(yùn)育種種AI技術(shù)，包容千行百業(yè)，這才是全球AI音樂會(huì)中，那道獨(dú)特且悅耳的東方旋律。

在起步階段的天工SkyMusic，已經(jīng)為用戶帶來了豐厚的音樂創(chuàng)作樂趣。隨著未來的持續(xù)優(yōu)化升級，我們會(huì)得到一個(gè)專業(yè)且易用的音樂創(chuàng)作平臺。圍繞天工SkyMusic，將可能出現(xiàn)AI音樂創(chuàng)作者生態(tài)，新的音樂明星。進(jìn)而影響音樂行業(yè)的發(fā)展。

在全球AI音樂的熱潮背后，我們可以看到從“中國AI不缺席”到“中國AI如何引領(lǐng)”的深刻變革。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
31513

瀏覽量
270323
OpenAI

OpenAI

+關(guān)注

關(guān)注
9

文章
1132

瀏覽量
6694
大模型

大模型

+關(guān)注

關(guān)注
2

文章
2545

瀏覽量
3163

請教ADC12D800RFRB評估板第一次使用問題

ADC12D800RFRB評估板第一次使用問題大家好，我的問題如下： 第一次使用的時(shí)候按照提供的一個(gè)使用手冊，安裝了WV5，連好板子，PC也識別到了。但是手冊上說，第一次使用的時(shí)候

發(fā)表于 01-21 06:50

ADS1256第一次上電的時(shí)候，采集的ADC信號是實(shí)際值的一半，為什么？

最近在用ADS1256這一款A(yù)DC芯片，出現(xiàn)了一個(gè)很怪異的問題。當(dāng)我第一次上電的時(shí)候，采集的ADC信號是實(shí)際值的一半，重新上電后又正常了。但是并不是每次

發(fā)表于 12-13 15:33

DDC264第一次執(zhí)行初始化，DOUT無輸出的原因？怎么解決？

第一次執(zhí)行初始化操作（Figure 30.Configuration register write and read operations）時(shí)，DOUT無輸出。但在第二次及之后執(zhí)行相同的操作，可以

發(fā)表于 11-19 06:32

使用DAC80501ZDQFR在關(guān)閉狀態(tài)下第一次輸出電壓會(huì)有抖動(dòng)，為什么？

使用DAC80501ZDQFR在關(guān)閉狀態(tài)下第一次輸出電壓會(huì)有抖動(dòng)大概在幾十ms后再次輸出后續(xù)電壓就是正常的，DAC輸出沒有加濾波直接輸出到運(yùn)放

發(fā)表于 11-14 08:03

用LM4675D類功放時(shí),第一次一個(gè)焊上后有輸入就是沒有輸出，為什么？

用LM4675D類功放時(shí),第一次一個(gè)焊上后有輸入但是就是沒有輸出,外部電路未發(fā)現(xiàn)異常,后來將板上芯片更換后,可以使用,但用了不久,芯片便又沒有輸出,發(fā)現(xiàn)芯片并未發(fā)熱.怎么回事？謝謝

發(fā)表于 11-01 06:43

TAS2557第一次跟第二次播放的時(shí)候輸出聲音不同, 請問可以從甚么地方下手檢查？

第一次跟第二次播放的時(shí)候, 輸出的聲音不同, 請問可以從甚么地方下手檢查, 謝謝!

發(fā)表于 10-18 06:00

INA381 reset接高電平，Alert第一次沒有鎖住，第二次才鎖住的，這是為什么？

TINA-TI下圖是仿真出的波形 INA381 reset接高電平， Alert第一次沒有鎖住，第二次才鎖住的，這是為什么？

發(fā)表于 08-02 08:01

在例程 ”BLE_GATTS_SPP“中，手機(jī)第一次連接藍(lán)牙服務(wù)時(shí)，怎么添加配對密碼？

在例程 ”BLE_GATTS_SPP“中，手機(jī)第一次連接藍(lán)牙服務(wù)時(shí)，怎么添加配對密碼？

發(fā)表于 07-19 08:28

stm32F407第一次數(shù)據(jù)沒有進(jìn)行接收，第二次數(shù)據(jù)發(fā)送時(shí)才進(jìn)行接，為什么？

stm32F407第一次數(shù)據(jù)沒有進(jìn)行接收，第二次數(shù)據(jù)發(fā)送時(shí)才進(jìn)行接

發(fā)表于 07-05 08:11

鴻蒙OS開發(fā)：【一次開發(fā)，多端部署】（音樂專輯頁面）

基于自適應(yīng)和響應(yīng)式布局，實(shí)現(xiàn)一次開發(fā)、多端部署音樂專輯頁面。

發(fā)表于 05-25 16:21 ?882次閱讀

鴻蒙OS開發(fā)：【<b class='flag-5'>一次</b>開發(fā)，多端部署】（<b class='flag-5'>音樂</b>專輯頁面）

HarmonyOS開發(fā)案例：【一次開發(fā)，多端部署-音樂專輯】

基于自適應(yīng)和響應(yīng)式布局，實(shí)現(xiàn)一次開發(fā)、多端部署音樂專輯頁面。

發(fā)表于 05-13 16:48 ?745次閱讀

HarmonyOS開發(fā)案例：【<b class='flag-5'>一次</b>開發(fā)，多端部署-<b class='flag-5'>音樂</b>專輯】

OpenHarmony項(xiàng)目群生態(tài)委員會(huì)第一次線下會(huì)議成功召開

4月18日，在鴻湖萬聯(lián)（江蘇）科技發(fā)展有限公司支持下， OpenAtom OpenHarmony(簡稱"OpenHarmony")項(xiàng)目群生態(tài)委員會(huì)第一次線下會(huì)議在無錫市國家軟件園召開。

發(fā)表于 04-20 09:42 ?651次閱讀

通過CAN控制電機(jī)啟動(dòng)，第一次發(fā)送start motor后，電機(jī)沒有起來的原因？

各位大神，我通過CAN控制電機(jī)啟動(dòng)，第一次發(fā)送start motor后，電機(jī)沒有起來，然后返回狀態(tài)為ALIGN_CHARGE_BOOT_CAP；再發(fā)一次start motor才可以正常使能。不知道這是什么情況呢？求大神解答，謝謝。

發(fā)表于 04-18 07:47

stm32f767第一次讀取nandflash導(dǎo)致屏幕閃爍的原因？

fmsc總線上同時(shí)掛在sdram做ltdc顯存，nandflash存儲(chǔ)文件圖片，比如我把一張圖片存入nandflash，當(dāng)我第一次從nandflash讀取這張圖片的時(shí)候會(huì)導(dǎo)致屏幕閃爍花屏一

發(fā)表于 04-09 06:02

STM32L4 I2C主從通信，第一次通信成功，第二次只檢測一次中斷就卡住了為什么？

STM32L4 通過I2C方式組成主機(jī)——從機(jī)通信（主機(jī)從機(jī)都是stm32L431），主機(jī)給從機(jī)第一次發(fā)送消息能夠成功，但是從機(jī)返回信息就會(huì)失敗。主機(jī)給從機(jī)第一次發(fā)送消息后，不讓從機(jī)響應(yīng)。主機(jī)

發(fā)表于 03-29 08:32

衡阳派盒市场营销有限公司

搜索歷史

全球AI音樂會(huì)，第一次聽見中國聲音

評論