衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌研究人員利用3D卷積網絡打造視頻生成新系統

DPVg_AI_era ? 來源:lq ? 2019-06-02 09:30 ? 次閱讀

谷歌研究人員利用3D卷積網絡打造視頻生成新系統,只需要視頻的第一幀和最后一幀,就能生成完整合理的整段視頻,是不是很神奇?

漫畫書秒變動畫片了解一下?

想象一下,現在你的手中有一段視頻的第一幀和最后一幀圖像,讓你負責把中間的圖像填進去,生成完整的視頻,從現有的有限信息中推斷出整個視頻。你能做到嗎?

這可能聽起來像是一項不可能完成的任務,但谷歌人工智能研究部門的研究人員已經開發出一種新系統,可以由視頻第一幀和最后一幀生成“似是而非的”視頻序列,這個過程被稱為“inbetween”。

“想象一下,如果我們能夠教一個智能系統來將漫畫自動變成動畫,會是什么樣子?如果真實現了這一點,無疑將徹底改變動畫產業?!霸撜撐牡墓餐髡邔懙??!半m然這種極其節省勞動力的能力仍然超出目前最先進的水平,但計算機視覺機器學習技術的進步正在使這個目標的實現越來越接近?!?/p>

原理與模型結構

這套AI系統包括一個完全卷積模型,這是是受動物視覺皮層啟發打造的深度神經網絡,最常用于分析視覺圖像。它由三個部分組成:2D卷積圖像解碼器,3D卷積潛在表示生成器,以及視頻生成器。

圖1:視頻生成模型示意圖

圖像解碼器將來自目標視頻的幀映射到潛在空間,潛在表示生成器學習對包含在輸入幀中的信息進行合并。最后,視頻生成器將潛在表示解碼為視頻中的幀。

研究人員表示,將潛在表示生成與視頻解碼分離對于成功實現中間視頻至關重要,直接用開始幀和結束幀的編碼表示生成視頻的結果很差。為了解決這個問題,研究人員設計了潛在表示生成器,對幀的表示進行融合,并逐步增加生成視頻的分辨率。

圖2:模型生成的視頻幀序列圖,對于每個數據集上方的圖表示模型生成的序列,下方為原視頻,其中首幀和尾幀用于生成模型的采樣。

實驗結果

為了驗證該方法,研究人員從三個數據集中獲取視頻 - BAIR機器人推送,KTH動作數據庫和UCF101動作識別數據集 - 并將這些數據下采樣至64 x 64像素的分辨率。每個樣本總共包含16幀,其中的14幀由AI系統負責生成。

研究人員為每對視頻幀運行100次模型,并對每個模型變量和數據集重復10次,在英偉達Tesla V100顯卡平臺上的訓練時間約為5天。結果如下表所示:

表1:我們報告了完整模型和兩個基線的平均FVD,對每個模型和數據集重復10次,每次運行100個epoch,表中FVD值越低,表示對應生成視頻的質量越高。

表2:使用直接3D卷積和基于的替代方法的模型的平均SSIM

RNN(SDVI)或光流(SepConv和SuperSloMo),數值越高越好。

研究人員表示,AI生成的視頻幀序列在風格上與給定的起始幀和結束幀保持一致,而且看上去說得通。“令人驚喜的是,這種方法可以在如此長的時間段內實現視頻生成,”該團隊表示,“這可能給未來的視頻生成技術研究提供了一個有用的替代視角。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1148

    瀏覽量

    40938
  • 谷歌
    +關注

    關注

    27

    文章

    6196

    瀏覽量

    106017
  • 智能系統
    +關注

    關注

    2

    文章

    399

    瀏覽量

    72623

原文標題:谷歌AI動畫接龍:只用頭尾兩幀圖像,片刻生成完整視頻!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    阿里云通義萬相2.1視頻生成模型震撼發布

    近日,阿里云旗下的通義萬相迎來了重要升級,正式推出了全新的萬相2.1視頻生成模型。這一創新成果標志著阿里云在視頻生成技術領域的又一次重大突破。 據悉,萬相2.1視頻生成模型在多個方面實現了顯著提升
    的頭像 發表于 01-13 10:00 ?226次閱讀

    OpenAI開放Sora視頻生成模型

    OpenAI近日宣布,其傾力打造的人工智能視頻生成系統Sora已正式向美國及其他市場的ChatGPT Plus訂閱用戶開放。自去年首次公開預覽以來,Sora歷經約10個月的精心研發與優化,現已全面
    的頭像 發表于 12-10 11:16 ?386次閱讀

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這一舉措標志著火山引擎在視頻內容生成領域邁出了重要一步。豆包模型憑借其獨特的技術優勢,吸引了業界的廣泛關注。
    的頭像 發表于 09-25 14:11 ?369次閱讀

    歡創播報 騰訊元寶首發3D生成應用

    1 騰訊元寶首發3D生成應用 只需一張照片,便能迅速打造獨一無二的3D角色。7月16日,騰訊旗下大模型應用“騰訊元寶”上線了“3D角色夢工廠
    的頭像 發表于 07-18 11:39 ?828次閱讀
    歡創播報 騰訊元寶首發<b class='flag-5'>3D</b><b class='flag-5'>生成</b>應用

    奧比中光3D相機打造高質量、低成本的3D動作捕捉與3D動畫內容生成方案

    ? 在過去幾十年里,動作捕捉(MoCap)技術經歷了顯著的發展,廣泛被應用于電影、游戲、虛擬現實、醫療等多個領域。近期,奧比中光合作客戶Moverse使用Orbbec Femto系列3D相機,打造
    的頭像 發表于 06-25 16:37 ?1146次閱讀

    Runway發布Gen-3 Alpha視頻生成模型

    專為電影和圖像內容創作者提供生成式AI工具的Runway公司近日宣布,其最新的Gen-3 Alpha視頻生成模型已經正式問世。這款模型在多方面均取得了顯著的進步,為創作者們帶來了前所未有的便利和可能性。
    的頭像 發表于 06-19 09:25 ?621次閱讀

    谷歌發布全新視頻生成模型Veo與Imagen文生圖模型

    谷歌近日宣布了兩項重大技術進展,首先是視頻生成模型Veo的正式推出。這款先進的模型能夠支持生成質量更高的視頻內容,讓用戶能夠根據自己的需求設定光照、鏡頭語言、
    的頭像 發表于 05-16 10:46 ?434次閱讀

    阿里云視頻生成技術創新!視頻生成使用了哪些AI技術和算法

    照片就能讓 EMO 合成演戲唱歌視頻。 ? 阿里云在視頻生成領域的創新 ? EMO(Emote Portrait Alive)是一個由阿里巴巴集團智能計算研究院開發的框架,一個音頻驅動的 AI 肖像
    的頭像 發表于 05-08 00:07 ?3459次閱讀

    NVIDIA生成式AI研究實現在1秒內生成3D形狀

    NVIDIA 研究人員使 LATTE3D (一款最新文本轉 3D 生成式 AI 模型)實現雙倍加速。
    的頭像 發表于 03-27 10:28 ?554次閱讀
    NVIDIA<b class='flag-5'>生成</b>式AI<b class='flag-5'>研究</b>實現在1秒內<b class='flag-5'>生成</b><b class='flag-5'>3D</b>形狀

    Stability AI推出Stable Video 3D模型,可制作多視角3D視頻

    SV3D_u是Stable Video 3D的一個版本,僅需單幅圖片即可生成運動軌跡視頻,無須進行相機調整。擴充版本的SV3D_p加入了軌道
    的頭像 發表于 03-21 14:57 ?1097次閱讀

    新火種AI|圍攻光明頂:Sora效應下的AI視頻生成競賽

    Sora的出現,讓AI視頻生成領域真正“活”了起來
    的頭像 發表于 03-16 11:12 ?685次閱讀

    openai發布首個視頻生成模型sora

    美國當地時間2024年2月15日 ,OpenAI正式發布文生視頻模型Sora ,并發布了48個文生視頻案例和技術報告 ,正式入局視頻生成領域 。Sora能夠根據提示詞生成60s的連貫
    的頭像 發表于 02-21 16:45 ?1370次閱讀

    AI視頻年大爆發!2023年AI視頻生成領域的現狀全盤點

    2023年,也是AI視頻元年。過去一年究竟有哪些爆款應用誕生,未來視頻生成領域面臨的難題還有哪些?
    的頭像 發表于 02-20 10:40 ?1391次閱讀
    AI<b class='flag-5'>視頻</b>年大爆發!2023年AI<b class='flag-5'>視頻生成</b>領域的現狀全盤點

    OpenAI發布文生視頻模型Sora,引領AI視頻生成新紀元

    在人工智能(AI)領域掀起新一輪革命浪潮的,正是OpenAI最新推出的文生視頻大模型——Sora。這款被業界廣泛贊譽的模型,以其“逼真”和“富有想象力”的視頻生成能力,徹底顛覆了傳統視頻生成領域的局限,將平均
    的頭像 發表于 02-19 11:03 ?1022次閱讀

    OpenAI發布首個視頻生成模型Sora

    OpenAI近日宣布推出其全新的文本到視頻生成模型——Sora。這一突破性的技術將視頻創作帶入了一個全新的紀元,為用戶提供了前所未有的創作可能性。
    的頭像 發表于 02-18 10:07 ?1117次閱讀
    百家乐官网最新首存优惠| 路劲太阳城金旭园| 百家乐官网麻将牌| 百家乐官网如何投注技巧| 德州扑克发牌顺序| 百家乐赢钱公式冯耕| 百家乐官网赌场信息| 百家乐官网赢得秘诀| 2024一2043风水气位| 百家乐官网必胜密| 百家乐官网注码调整| 大发888游戏平台3403| 巴特百家乐的玩法技巧和规则| 百家乐游戏出售| 百家乐官网等投注网改单| sz全讯网网址xb112| 伯爵百家乐娱乐平台| 百家乐连开6把小| 百家乐官网统计软件| 百家乐官网那里玩| 百家乐官网自动算牌软件| 百家乐官网星级游戏| 一路发| 88娱乐城官方网站| 金臂百家乐| bet365 uo15| 大发888备用网站| 立即博百家乐现金网| 百家乐娱乐城提款| 24楼层风水好吗| 百樂坊百家乐官网的玩法技巧和规则| 百家乐官网不能视频| 怎样看百家乐官网牌| 百家乐官网能赚大钱吗| 网上百家乐官网赌钱| 五峰| 明珠百家乐的玩法技巧和规则| 百家乐体育宝贝| 百家乐官网扑克牌手机壳| 24山的丑方位| 百家乐官网桌布呢布|