衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

首例“AI聲音侵權案”,聲音AI化用于短視頻

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2023-12-20 00:28 ? 次閱讀

電子發燒友網報道(文/李彎彎)AI技術的應用,給我們的生活帶來了巨大改變。同時,它的不當使用也帶來了侵權、詐騙等風險。近日,北京互聯網法院首次組成五人合議庭,依法公開審理全國首例“AI聲音侵權案”。

該案中,原告殷某某以配音為職業,曾錄制多部有聲作品。殷某某意外發現,自己的聲音被AI化后,在一款名為“魔音工坊”的APP上以“魔小璇”的名義對外出售。因此,殷某某以被告行為侵害其聲音權為由,將“魔音工坊”的運營主體北京小問智能科技有限公司等五被告起訴到北京互聯網法院。

AI聲音侵權案始末

目前,該案件仍在審理中,五被告均否認侵權。北京小問智能科技有限公司認為,其APP中的聲音產品有合法來源,來自于微軟(中國)有限公司。微軟(中國)有限公司稱其使用的聲音來源于中廣影音(北京)文化傳媒有限公司。

中廣影音(北京)文化傳媒有限公司認為其與原告有過合作,約定經原告錄制形成的作品著作權歸屬其所有。上海藍云網絡科技有限公司和北京信諾時代科技發展有限公司辯稱,其分別為微軟中國的平臺運營商與涉案產品的經銷商,不構成侵權。

原告則認為,他人利用原告聲音的配音作品在抖音、直播吧等APP廣泛流傳,其中抖音用戶“小禾侃劇”自2021年9月7日至今,共發布使用原告聲音的作品119部。經聲音篩選和溯源,發現上述聲音作品中的聲音來自于被告北京小問智能科技有限公司運營的“魔音工坊”APP。

被告中廣影音(北京)文化傳媒有限公司將原告為其錄制的3本書的音頻交給被告微軟(中國)有限公司,被告微軟(中國)有限公司將原告的聲音進行AI化處理,并向被告上海藍云網絡科技有限公司和被告北京信諾時代科技發展有限公司授權對外出售。

但是,原告從未授權過任何第三人將其錄制的聲音進行AI化并對外銷售,上述被告的行為已經嚴重侵犯了原告的聲音權,應承擔停止侵權、賠禮道歉及賠償原告經濟損失、精神損失的侵權責任。

北京小問智能科技有限公司是出門問問旗下公司,魔音工坊是出門問問面向AI配音場景推出的新一代AI配音產品。在大模型技術的加持下,“魔音工坊”是全球首款搭載了大模型AI寫作功能的配音平臺,覆蓋了AI寫作、AI配音和剪輯等多個場景。用戶可以在它的輔助下輕松完成影視解說、有聲書、在線教育、新聞播報等集文案與配音于一體的內容創作。

如今,短視頻、有聲書市場蓬勃發展,這也使得聲音合成技術有了廣泛的應用空間。在應用市場和深度學習技術的發展下,語音合成技術已經非常成熟。可以看到上述情況是,原告給某公司錄過幾本書,它的聲音在沒被授權的情況下通過AI化之后,進行出售。

這其實就是現在大家談到的聲音克隆,也稱為語音合成定制,是一種深度學習算法。平臺方可以通過各種渠道獲得某人的聲音之后,哪怕這個人只是說了幾段話,通過AI技術都可以合成與原說話人非常相似的聲音。

語音合成歷史及應用趨勢

語音合成,又稱文語轉換(Text to Speech)技術,能將任意文字信息實時轉化為標準流暢的語音朗讀出來,相當于給機器裝上了人工嘴巴。它涉及聲學、語言學、數字信號處理、計算機科學等多個學科技術,是中文信息處理領域的一項前沿技術,解決的主要問題就是如何將文字信息轉化為可聽的聲音信息,也即讓機器像人一樣開口說話。

事實上,早在18到19世紀,語音合成技術就已經出現,當時是用機械裝置來模擬人的發聲,那時候科學家們會制作出一些精巧的氣囊和風箱去搭建發聲的系統,可以合成出一些元音和單音。20世紀初,出現了用電子合成器來模擬人發聲的技術,最具代表性的就是貝爾實驗室的Dudley,他在1939年推出了名為“VODER”的電子發聲器,使用電子器件來模擬聲音的諧振。

到了20世紀80年代,隨著集成電路技術的發展,出現了比較復雜的組合型的電子發生器,比較代表性的KLATT在1980年發布的串/并聯混合共振峰合成器。到了20世紀80、90年代隨著PSOLA方法的提出和計算機能力的發展,單元挑選和波形拼接技術逐漸走向成熟,90年代末劉慶峰博士提出聽感量化思想,首次將中文語音合成技術做到了實用化地步。

在20世紀末期,還有另外一種基于HMM的參數合成技術出現。而近些年,隨著AI技術不斷發展,基于深度學習的語音合成技術逐漸被人們所知道,DNN/CNN/RNN等各種神經網絡構型都可以用來做語音合成系統的訓練,深度學習的算法可以更好地模擬人聲變化規律。語音合成技術應用也迎來了高速發展。

當下,AI聲音合成技術的市場需求確實非常明顯。直播、短視頻、有聲書的市場需求空間大,然而未接受過聲音培訓的普通人對于自己的聲音滿意度并不高。而通過AI技術讓配音,或者美化自己的聲音正在成為趨勢。上文提到的魔音工坊正是通過技術手段為用戶提供好聽的聲音。

小結

當前來說,AI技術侵權的問題仍然還未得到解決,就如之前使用圖片所有權人的圖片進行訓練,生成的圖片,這是否構成對圖片所有權人的圖片的侵權。聲音訓練也是如此,使用某人的聲音訓練出了跟這個人類似的聲音,這個合成的聲音所有權算誰的?這些還需要進一步探討出相應的規范才行。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31513

    瀏覽量

    270330
收藏 人收藏

    評論

    相關推薦

    KT148A語音芯片的聲音小,如何讓喇叭聲音變大?聲音影響注意點

    聲音的大小是一個系統的工作,KT148A本身驅動聲音的能力是很大的,達到200mA,通過電流也可以看出來。所以一般8歐姆1w以內的,不需要考慮外掛功放 喇叭的選擇原則上越大越好,視結構而定。 盡量選擇紙盆類型的喇叭【某寶搜搜】,發聲更清晰,更大,也就貴一點點而已
    的頭像 發表于 01-10 09:53 ?114次閱讀
    KT148A語音芯片的<b class='flag-5'>聲音</b>小,如何讓喇叭<b class='flag-5'>聲音</b>變大?<b class='flag-5'>聲音</b>影響注意點

    首例AI機器人致死震驚全球

    AI機器人的安全性、友好性、是否符合積極正面的價值導向一直被質疑,現在在佛羅里達州出現了一例AI聊天機器人對青少年人身安全造成威脅的現實案例。這也是已知的AI技術出現以來第一次對青少年人身安全造成
    的頭像 發表于 10-25 16:32 ?1124次閱讀

    知網狀告AI搜索:搜到我家論文題目和摘要,你侵權了!

    創業團隊秘塔AI搜索,被知網給告了!足足28頁的侵權告知函,總結一句話就是:貴司的AI搜索,能搜到我家的學術文獻題錄及摘要數據,且沒經我司許可,嚴重侵權
    的頭像 發表于 08-16 17:47 ?362次閱讀
    知網狀告<b class='flag-5'>AI</b>搜索:搜到我家論文題目和摘要,你<b class='flag-5'>侵權</b>了!

    云開發AI助手

    AI
    草帽王路飛
    發布于 :2024年07月22日 14:41:54

    視頻3--場景自動化AI助手

    AI
    草帽王路飛
    發布于 :2024年07月22日 11:16:13

    視頻2--場景自動化AI助手

    AI
    草帽王路飛
    發布于 :2024年07月22日 11:15:34

    EPSON公司發布帶有專用于2聲道聲音聲音硬件的32位微控制器

    EPSON愛普生半導體公司已開始出貨S1C31D50的樣品,S1C31D50是一種32位微控制器,帶有專用于2聲道聲音聲音硬件。愛普生計劃每個型號每月生產200,000件。在家用電子產品,家用電器
    的頭像 發表于 07-17 10:30 ?534次閱讀
    EPSON公司發布帶有專<b class='flag-5'>用于</b>2聲道<b class='flag-5'>聲音</b>的<b class='flag-5'>聲音</b>硬件的32位微控制器

    聲音測量的定義和典型應用

    一、什么是聲音測量?聲音測量是聲學測量的一種。聲學測量是研究聲學測量技術的科學,包括測量方法和測量儀器。基本的聲學測量包括聲強測量、聲質點速度測量、波長測量、加速度測量、傳聲器和水聽器絕對校準、通信
    的頭像 發表于 06-29 08:31 ?2107次閱讀
    <b class='flag-5'>聲音</b>測量的定義和典型應用

    AI PC:真正的AI PC,敢于下場

    在過去的半年里,我們無一不在聆聽關于人工智能(AI)PC的種種聲音,然而當步入現實生活時,恐怕仍有眾多讀者對此感到迷茫:這些AI PC究竟具有哪些AI功能呢?誠然,這并非易解之題。毫不
    的頭像 發表于 06-11 15:02 ?775次閱讀

    risc-v多核芯片在AI方面的應用

    RISC-V多核芯片在AI方面的應用主要體現在其低功耗、低成本、靈活可擴展以及能夠更好地適應AI算法的不同需求等特點上。 首先,RISC-V適合用于高效設計實現,其內核面積更小,功耗更低,使得它能
    發表于 04-28 09:20

    微軟與OpenAI聯手打造聲音識別AI技術專利

    這款創新的系統旨在通過辨別環境音響,為使用者提供潛在風險預警,對于公共安全及災害預控領域具有不可估量的價值。它的關鍵技術在于對聲音信號的深度分析與處理。
    的頭像 發表于 04-09 15:55 ?364次閱讀

    [技術干貨]?MoneyPrinterTurbo,利用 AI 大模型,一鍵生成高清短視頻

    開始使用 步驟 1?訪問該促銷活動購買頁面,按照如下配置完成 AI 生成短視頻服務器的部署。 步驟 2?登錄彈性云服務器控制臺。使用 Linux 連接工具登錄服務器,或者在控制臺單擊“遠程登錄
    的頭像 發表于 04-07 15:11 ?1541次閱讀
    [技術干貨]?MoneyPrinterTurbo,利用 <b class='flag-5'>AI</b> 大模型,一鍵生成高清<b class='flag-5'>短視頻</b>

    NanoEdge AI的技術原理、應用場景及優勢

    NanoEdge AI 是一種基于邊緣計算的人工智能技術,旨在將人工智能算法應用于物聯網(IoT)設備和傳感器。這種技術的核心思想是將數據處理和分析從云端轉移到設備本身,從而減少數據傳輸延遲、降低
    發表于 03-12 08:09

    Stability AI與Morph AI共同推出一體化AI視頻創作工具

    近日,業界領先的AI技術公司Stability AI與中國AI創業公司Morph AI達成重要合作。雙方宣布共同推出一款革新性的all-in-one(一體式)
    的頭像 發表于 03-05 10:44 ?936次閱讀

    如何連接Arduino聲音傳感器以控制帶有聲音的LED

    在本教程中,您將學習如何連接Arduino聲音傳感器以控制帶有聲音的LED。在本指南結束時,您將擁有一個可以正常工作的聲控LED!
    的頭像 發表于 02-11 10:21 ?3327次閱讀
    如何連接Arduino<b class='flag-5'>聲音</b>傳感器以控制帶有<b class='flag-5'>聲音</b>的LED
    大发888账号注册| 网络百家乐官网程序| 代理百家乐试玩| 百家乐官网最低投注| 蓝盾百家乐具体玩法技巧| 黄金城百家乐官网游戏| 金矿百家乐的玩法技巧和规则| 广州百家乐官网酒店用品制造有限公司 | 百家乐翻天粤语快播| 百家乐官网网站新全讯网| 茅台百家乐的玩法技巧和规则| 百家乐官网分路单| 申烨太阳城三期| 大丰收百家乐官网的玩法技巧和规则| 大发888亚付宝充值| 百家乐的路怎样看| 百家乐官网打印程序| 网上百家乐公| 百家乐官网套利| 仁寿县| 最好百家乐的玩法技巧和规则| 澳门百家乐官网怎洋赢钱| 德州扑克大师| 网上百家乐如何打水| 百家乐官网打法内容介绍| 大发888 dafa888| 百家乐网站排行| 大发888娱乐场怎么才能赢到钱| 风水97年农历6月24八字| 百家乐官网现金网排名| 太阳城线上娱乐城| 百家乐软件代打| 百家乐官网游戏平台排名| 大发888游戏平台黄埔| 百家乐去哪里玩最好| 网上百家乐官网的打法| 六合彩开奖网站| 百家乐博牌规例| 百家乐官网的玩法技巧和规则| 宁强县| 北京太阳城医院|