衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DragGAN開源效果如何

CVer ? 來源:CVer ? 2023-06-30 10:57 ? 次閱讀

動(dòng)動(dòng)鼠標(biāo),讓圖片變「活」,成為你想要的模樣。

AIGC 的神奇世界里,我們可以在圖像上通過「拖曳」的方式,改變并合成自己想要的圖像。比如讓一頭獅子轉(zhuǎn)頭并張嘴:

bbf71f9a-1696-11ee-962d-dac502259ad0.gif

實(shí)現(xiàn)這一效果的研究出自華人一作領(lǐng)銜的「Drag Your GAN」論文,于上個(gè)月放出并已被 SIGGRAPH 2023 會(huì)議接收。 一個(gè)多月過去了,該研究團(tuán)隊(duì)于近日放出了官方代碼。短短三天時(shí)間,Star 量便已突破了 23k,足可見其火爆程度。 bc050452-1696-11ee-962d-dac502259ad0.png GitHub 地址:https://github.com/XingangPan/DragGAN 無獨(dú)有偶,今日又一項(xiàng)類似的研究 —— DragDiffusion 進(jìn)入了人們的視線。此前的 DragGAN 實(shí)現(xiàn)了基于點(diǎn)的交互式圖像編輯,并取得像素級(jí)精度的編輯效果。但是也有不足,DragGAN 是基于生成對(duì)抗網(wǎng)絡(luò)(GAN),通用性會(huì)受到預(yù)訓(xùn)練 GAN 模型容量的限制。 在新研究中,新加坡國立大學(xué)和字節(jié)跳動(dòng)的幾位研究者將這類編輯框架擴(kuò)展到了擴(kuò)散模型,提出了 DragDiffusion。他們利用大規(guī)模預(yù)訓(xùn)練擴(kuò)散模型,極大提升了基于點(diǎn)的交互式編輯在現(xiàn)實(shí)世界場景中的適用性。 雖然現(xiàn)在大多數(shù)基于擴(kuò)散的圖像編輯方法都適用于文本嵌入,但 DragDiffusion 優(yōu)化了擴(kuò)散潛在表示,實(shí)現(xiàn)了精確的空間控制。 bc712b5a-1696-11ee-962d-dac502259ad0.png

論文地址:https://arxiv.org/abs/2306.14435

項(xiàng)目地址:https://yujun-shi.github.io/projects/dragdiffusion.html

研究者表示,擴(kuò)散模型以迭代方式生成圖像,而「一步」優(yōu)化擴(kuò)散潛在表示足以生成連貫結(jié)果,使 DragDiffusion 高效完成了高質(zhì)量編輯。 他們?cè)诟鞣N具有挑戰(zhàn)性的場景(如多對(duì)象、不同對(duì)象類別)下進(jìn)行了廣泛實(shí)驗(yàn),驗(yàn)證了 DragDiffusion 的可塑性和通用性。相關(guān)代碼也將很快放出、 下面我們看看 DragDiffusion 效果如何。 首先,我們想讓下圖中的小貓咪的頭再抬高一點(diǎn),用戶只需將紅色的點(diǎn)拖拽至藍(lán)色的點(diǎn)就可以了:

接下來,我們想讓山峰變得再高一點(diǎn),也沒有問題,拖拽紅色關(guān)鍵點(diǎn)就可以了:

bca03da0-1696-11ee-962d-dac502259ad0.gif

還想讓雕塑的頭像轉(zhuǎn)個(gè)頭,拖拽一下就能辦到:

bccdd8b4-1696-11ee-962d-dac502259ad0.gif

讓岸邊的花,開的范圍更廣一點(diǎn):

方法介紹 本文提出的 DRAGDIFFUSION 旨在優(yōu)化特定的擴(kuò)散潛變量,以實(shí)現(xiàn)可交互的、基于點(diǎn)的圖像編輯。 為了實(shí)現(xiàn)這一目標(biāo),該研究首先在擴(kuò)散模型的基礎(chǔ)上微調(diào) LoRA,以重建用戶輸入圖像。這樣做可以保證輸入、輸出圖像的風(fēng)格保持一致。 接下來,研究者對(duì)輸入圖像采用 DDIM inversion(這是一種探索擴(kuò)散模型的逆變換和潛在空間操作的方法),以獲得特定步驟的擴(kuò)散潛變量。 在編輯過程中,研究者反復(fù)運(yùn)用動(dòng)作監(jiān)督和點(diǎn)跟蹤,以優(yōu)化先前獲得的第 t 步擴(kuò)散潛變量,從而將處理點(diǎn)的內(nèi)容「拖拽(drag)」到目標(biāo)位置。編輯過程還應(yīng)用了正則化項(xiàng),以確保圖像的未掩碼區(qū)域保持不變。 最后,通過 DDIM 對(duì)優(yōu)化后的第 t 步潛變量進(jìn)行去噪,得到編輯后的結(jié)果。總體概覽圖如下所示: bd0420f4-1696-11ee-962d-dac502259ad0.png實(shí)驗(yàn)結(jié)果 給定一張輸入圖像,DRAGDIFFUSION 將關(guān)鍵點(diǎn)(紅色)的內(nèi)容「拖拽」到相應(yīng)的目標(biāo)點(diǎn)(藍(lán)色)。例如在圖(1)中,將小狗的頭轉(zhuǎn)過來,圖(7)將老虎的嘴巴合上等等。 ? 下面是更多示例演示。如圖(4)將山峰變高,圖(7)將筆頭變大等等。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3408

    瀏覽量

    42714
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3313

    瀏覽量

    49233

原文標(biāo)題:DragGAN重磅開源!擴(kuò)散模型版的DragDiffusion也來了!

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    adxl加速度mems測(cè)量低頻振動(dòng)的效果如何?

    之前選用了adxl372 和adxl345,我想請(qǐng)問一下,這些mems對(duì)低頻振動(dòng)的檢測(cè)效果如何 目前項(xiàng)目需求測(cè)量0.5Hz-1000kHz頻率的振動(dòng),量程大概在±20g 以上兩種mems是否滿足。
    發(fā)表于 12-28 07:09

    如何實(shí)現(xiàn)在圖標(biāo)圖像中實(shí)現(xiàn)一個(gè)點(diǎn),效果如下圖

    如何實(shí)現(xiàn)在圖標(biāo)圖像中實(shí)現(xiàn)一個(gè)點(diǎn),效果如下圖,紅色的點(diǎn)可以動(dòng)。坐標(biāo)為(x°,Y°)
    發(fā)表于 07-13 08:39

    LabVIEW中圖像濾波Vi以及實(shí)現(xiàn)效果如何實(shí)現(xiàn)

    新手求助!??!LabVIEW中圖像濾波Vi以及實(shí)現(xiàn)效果如何實(shí)現(xiàn),能提供子Vi最好先謝謝大神
    發(fā)表于 01-11 22:58

    VL53L1水下使用效果如何?

    我知道舊的vl6180x在水下工作,但我找不到任何有關(guān)VL53L1的信息。有人試過嗎?如果是這樣,它的效果如何?我主要關(guān)注接近檢測(cè)/距離測(cè)量,但有限的手勢(shì)/運(yùn)動(dòng)檢測(cè)將是一個(gè)很好的獎(jiǎng)勵(lì)
    發(fā)表于 04-15 09:23

    請(qǐng)問AT24C64和MX25L6406E效果如何?

    想試試AT24C64,MX25L6406E看看效果如何,不知道是否有人試過
    發(fā)表于 08-06 02:39

    ESP-NOW作為STA連接到WiFi時(shí),在不同信道上的傳輸效果如何?

    ESP-NOW 作為 STA 連接到 WiFi 時(shí),在不同信道上的傳輸效果如何?如果試圖查找/發(fā)現(xiàn)可能在不同頻道上的設(shè)備,它是否必須從 AP 斷開連接()然后 de-init()/重新初始化()或者
    發(fā)表于 02-21 07:26

    CJMCU-115或者GY-33傳感器的效果如何,是否沒有色差?

    CJMCU-115或者GY-33傳感器的效果如何,是否沒有色差?
    發(fā)表于 10-17 06:01

    空調(diào)制熱效果如何?空調(diào)制熱多少度最合適?

    空調(diào)制熱效果如何? 首先,空調(diào)不制熱并不能說明是空調(diào)本身的質(zhì)量出了問題,因?yàn)榭照{(diào)制熱也受到外界低溫條件的影響。陳先
    發(fā)表于 11-22 16:52 ?6726次閱讀

    電銷機(jī)器人的使用效果如何?

    電銷機(jī)器人投入到電銷行業(yè)的使用已經(jīng)有一段時(shí)間了,有些企業(yè)定制的機(jī)器人服務(wù)也已經(jīng)開始進(jìn)入工作流程,使用效果如何也開始得到反饋。那么這些使用了電銷機(jī)器人的企業(yè)的業(yè)績?cè)趺礃恿四??某房地產(chǎn)公司使用了我們的電
    發(fā)表于 07-06 14:01 ?824次閱讀

    i9-9900K開蓋 使用了釬焊散熱后實(shí)際效果如

    2010年的第二代酷睿(Sandy Bridge)之后,高級(jí)釬焊散熱終于在九代酷睿(Coffee Lake-S Refresh)上回歸,首批三款K系列型號(hào)都拋棄了一直備受詬病的普通硅脂散熱,那么實(shí)際效果如何呢?
    發(fā)表于 10-22 11:16 ?3.1w次閱讀

    EE-26:AD184x Sigma Delta轉(zhuǎn)換器:它們使用直流輸入的效果如何?

    EE-26:AD184x Sigma Delta轉(zhuǎn)換器:它們使用直流輸入的效果如何?
    發(fā)表于 04-17 17:21 ?7次下載
    EE-26:AD184x Sigma Delta轉(zhuǎn)換器:它們使用直流輸入的<b class='flag-5'>效果如</b>何?

    Go項(xiàng)目中引入中間件的目的和效果如

    中間件是什么?Go 項(xiàng)目中引入中間件的目的和效果如何?本文詳細(xì)介紹了Golang 中間件。 中間件是一種計(jì)算機(jī) 軟件,可為 操作系統(tǒng) 提供的 軟件應(yīng)用程序 提供服務(wù),以便于各個(gè)軟件之間的溝通,特別是
    的頭像 發(fā)表于 08-14 14:24 ?2088次閱讀

    Catalinbread Formula No 5效果開源

    電子發(fā)燒友網(wǎng)站提供《Catalinbread Formula No 5效果開源.zip》資料免費(fèi)下載
    發(fā)表于 07-26 11:16 ?0次下載
    Catalinbread Formula No 5<b class='flag-5'>效果</b>器<b class='flag-5'>開源</b>

    AI圖像編輯技術(shù)DragGAN開源,拖動(dòng)鼠標(biāo)即可改變?nèi)宋镄θ?/a>

    DragGAN是一個(gè)直觀的圖像編輯工具PM系統(tǒng)(www.multiable.com.cn),用戶只需要控制圖像中的像素點(diǎn)和方向,就可以快速調(diào)整照片主體的位置、姿態(tài)、表情、大小和角度等。
    的頭像 發(fā)表于 06-29 10:34 ?984次閱讀

    你的DragGAN并不需要點(diǎn)跟蹤!中科大和上海AI Lab提出FreeDrag:無需點(diǎn)跟蹤即可穩(wěn)定拖動(dòng)語義內(nèi)容

    這一驚人效果來自于發(fā)表在SIGGRAPH 2023會(huì)議上的 [Drag Your GAN] 論文(簡稱為DragGAN)。并且DragGAN的代碼一經(jīng)發(fā)出就在短短幾周內(nèi)狂攬30K star,引發(fā)廣大
    的頭像 發(fā)表于 07-13 14:36 ?520次閱讀
    永利高百家乐怎样开户| 老虎机遥控器多少钱| 爱玩棋牌下载| 澳门百家乐官网有哪些| 上海玩百家乐算不算违法| 德州扑克概率表| 百家乐官网平点| 正品百家乐的玩法技巧和规则| 中信娱乐城| 狮威百家乐官网娱乐城| 大发888下载安装| 游戏百家乐的玩法技巧和规则| 柬埔寨百家乐官网的玩法技巧和规则 | 新澳门娱乐城官网| 百家乐百博亚洲| 破战百家乐官网的玩法技巧和规则| 五峰| 大发888总结经验| 利高百家乐的玩法技巧和规则| 24山什么来龙是真龙| 百家乐官网赌场详解| 在线百家乐官网赌场| 网球比赛直播| 百乐坊娱乐城噢门| 百家乐官网赌博技巧大全| 大发888真人存款| 百家乐投注玩多少钱| 孟州市| 百家乐赌场牌路分析| E世博百家乐官网娱乐城| 德州扑克大小顺序| 百家乐开户送10彩金| 玩百家乐官网新2娱乐城| 大发888什么赢钱快| 百家乐仿水晶筹码| 宝龙百家乐官网娱乐城| 百家乐筹码片| 博狗百家乐官网的玩法技巧和规则 | 金尊国际娱乐城| 怎样打百家乐的玩法技巧和规则| 粤港澳百家乐官网赌场娱乐网规则 |