衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于文本驅動的三維模型風格化方法

3D視覺工坊 ? 來源:機器之心 ? 作者:機器之心 ? 2022-10-31 16:56 ? 次閱讀

來自華南理工大學、香港理工大學、跨維智能、鵬城實驗室等機構的研究團隊提出了一種基于文本驅動的三維模型風格化方法,該方法可對輸入的三維模型根據文本進行更具真實性和魯棒性的風格化。

根據給定輸入創建 3D 內容(例如,根據文本提示、圖像或 3D 形狀)在計算機視覺和圖形領域具有重要應用。然而這個問題是具有挑戰性的,現實中通常需要專業藝術家(Technical Artist)耗費大量的時間成本去創作 3D 內容。同時,許多網上的三維模型庫中的資源通常是沒有任何材質的裸露三維模型,要想將他們應用到現階段的渲染引擎中,需要 Technical Artist 為它們創作高質量的材質,燈光和法向貼圖。因此,如果有辦法可以實現自動化、多樣化和逼真的三維模型資產生成,將是很有前景的。

因此,華南理工大學、香港理工大學、跨維智能、鵬城實驗室等機構的研究團隊提出了一種基于文本驅動的三維模型風格化方法——TANGO,該方法對于給定的三維模型和文本,可以自動生成更具有真實性的 SVBRDF 材質,法向貼圖和燈光,并且對低質量三維模型有更好的魯棒性。該研究已被 NeurIPS 2022 接收。

模型效果

對于給定的文本輸入和三維模型,TANGO 可以產生精細程度較高的具有照片級真實感的細節,并且不會在三維模型表面產生自交問題。如下圖 1 所示, TANGO 不僅在光滑的材料(如金,銀等材質)上呈現出了逼真的反射效果,而且對于不平整的材質(例如磚塊等)也能通過逐點法線的估計渲染出凹凸不平的效果。

89d58f72-57a8-11ed-a3b6-dac502259ad0.gif

圖 1. TANGO 的風格化結果

TANGO 能夠生成真實渲染結果的關鍵在于能夠精準地把著色模型中的每一個部件(SVBRDF,法向貼圖,燈光)拆分開,并分別學習,最后這些拆分的部件再通過球高斯可微分渲染器輸出圖片,并送到 CLIP 中和輸入文本計算 loss。為了展現解耦部件的合理性,該研究對每個部件都進行了可視化。圖 2 (a)展示了 “一雙磚塊做成的鞋子” 的風格化結果,(b)展示了三維模型原本的法向,(c)是 TANGO 對三維模型上每個點預測的法向,(d)(e)(f)分別表示 SVBRDF 中的漫反射,粗糙度和鏡面反射參數,(g)是 TANGO預測的用球高斯函數表達的環境光。

8a5dff10-57a8-11ed-a3b6-dac502259ad0.gif

圖 2 解耦的渲染部件可視化

同時,該研究也可以對 TANGO 輸出的結果進行編輯。例如在圖 3 中,該研究可以換用其他的光照貼圖對 TANGO 的結果進行重新打光;在圖 4 中,可以對粗糙度和鏡面反射度參數進行編輯,實現對物體表面反射程度的改變。

8acfdd10-57a8-11ed-a3b6-dac502259ad0.png

圖 3 對 TANGO 風格化結果進行重新打光

8ae541b4-57a8-11ed-a3b6-dac502259ad0.png

圖 4 對物體材質進行編輯

另外,由于 TANGO 采用預測法向貼圖的方式增添物體表面細節,因此對于頂點數較少的三維模型也有很好的魯棒性。如圖 5 所示,原始的 lamp 和 alien 模型分別有 41160 和 68430 個面,研究人員對原始模型進行了降采樣,得到了只有 5000 個面的模型。可以看到 TANGO 在原始模型和降采樣模型上的表現基本相似,而 Text2Mesh 則在低質量的模型上出現了較為嚴重的自交現象。

8b01e2b0-57a8-11ed-a3b6-dac502259ad0.png

圖 5 魯棒性測試

原理方法

TANGO 主要關注于由文本指導三維物體風格化的方法。這一領域目前最相關的工作是 Text2Mesh,它使用了預訓練模型 CLIP 作為指導,預測三維模型表面頂點的顏色和位置偏移,從而實現風格化。然而簡單地預測表面頂點顏色通常會產生不真實的渲染效果,且不規則的頂點偏移會造成很嚴重的自交。因此,該研究借鑒傳統的基于物理的渲染管線,將整個渲染過程解耦為 SVBRDF 材質,法向貼圖和燈光的預測過程,并分別用球高斯函數表達解耦的元素。這種基于物理的解耦方式使得 TANGO 可以正確產生具有真實感的渲染效果,并具有很好的魯棒性。

8b21d070-57a8-11ed-a3b6-dac502259ad0.png

圖 6 TANGO 流程圖

圖 6 展示了 TANGO 的工作流程。給定一個三維模型和文本(例如圖中的“一個金子做成的鞋”),該研究先把這個三維模型縮放到一個單位球內,接著在三維模型的附近采樣相機位置,在這個相機位置發射射線找到與三維模型的交點xp和該交點的法線方向np。接下來,xp和np會被送入SVBRDF網絡和 Normal 網絡中,預測該點的材質參數和法線方向,同時,用多個球高斯函數來表達場景中的光照。對于每一次訓練迭代,該研究使用可微分的球高斯渲染器渲染圖像,然后使用 CLIP 模型的圖像編碼器對增強圖像進行編碼,最后 CLIP 模型反向傳播梯度更新所有可學習的參數。

總結

本文提出了 TANGO,一種根據輸入文本對三維模型生成逼真外觀風格,對低質量模型具有魯棒性的新方法。通過將外觀風格解耦 SVBRDF,局部幾何變化(逐點法向)和光照條件,并將這些用球高斯函數表示并渲染,能夠用 CLIP 作為 loss 監督并進行學習。 與現有方法相比,即使對于低質量的三維模型,TANGO 也可以具有很好的魯棒性。然而,逐點法向提供幾何細節的方式在避免產生自交的同時,也會使得能表達的材質表面凹凸程度略微降低,該研究認為 TANGO 和基于頂點偏移的 Text2Mesh 在各自的方向上都進行了很好的初步嘗試,會啟發更多的后續研究。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    2910

    瀏覽量

    107991
  • 計算機視覺
    +關注

    關注

    8

    文章

    1700

    瀏覽量

    46126
  • 三維模型
    +關注

    關注

    0

    文章

    52

    瀏覽量

    13153

原文標題:NeurIPS 2022 | 基于文本驅動的三維模型風格化方法

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于OpenGL 的汽車轉向三維模型設計

    汽車軌跡的誤差。使用OpenGL 設計汽車三維模型,通過估算橫擺角速度得出簡化的轉向軌跡模型。據此設計汽車轉向三維動畫,實驗結果表明汽車軌跡和姿態都取得了較好的可視
    發表于 05-17 11:53

    三維快速建模技術與三維掃描建模的應用

    相關處理,構建其三維模型和對模型進行紋路映射,最終完成物體的三維模型構建。該三維掃描建模流程
    發表于 08-07 11:14

    Altium Designer三維PCB可視引擎

      Altium Limited為 Altium Designer 新增了三維PCB可視引擎,讓所有設計師體驗逼真的板卡設計。通過 Altium Designer 6.8的三維 PCB 可視
    發表于 08-31 11:23

    三維可視的應用和優勢

    ,為此三維可視運維系統登場了?! ?b class='flag-5'>三維可視的應用  宏觀場景可視:在特定的環境中對隨著時間推移而不斷變化的目標實體進行檢測,可以直觀、
    發表于 12-02 11:52

    如何導入機械臂的三維模型

    目的   本文手把手教你如何在 Mathematica 軟件中搭建機械臂的三維仿真環境,包括以下幾部分:   1. 如何導入機械臂的三維模型;   2. 如何進行(正/逆)運動學仿真;   3.
    發表于 09-07 09:25

    Web環境下的三維虛擬人模型研究

    針對用戶有聲、可視獲取網頁文本信息需求,提出嵌入式三維虛擬人方法,以實現Web環境下的可視語音合成。建立連桿結構的
    發表于 01-06 17:17 ?15次下載

    三維模型教材

    三維模型教材
    發表于 11-20 17:44 ?0次下載

    三維模型的空間匹配與拼接

    為獲得敦煌莫高窟第172窟的全景三維模型,實現文化遺產數字保護,提出一種三維模型的空間匹配與拼接方法
    發表于 11-22 16:46 ?0次下載
    <b class='flag-5'>三維</b><b class='flag-5'>模型</b>的空間匹配與拼接

    基于非量測相片的三維模型重建

    隨著地球數字、信息、智能的發展,快速將物體的原態呈現出來,建立物體的三維模型成為當前的研究熱點。目前,已有的
    發表于 02-23 10:30 ?0次下載
    基于非量測相片的<b class='flag-5'>三維</b><b class='flag-5'>模型</b>重建

    三維數字三維激光掃描技術是連接BIM模型和工程現場的有效紐帶

    劇院三維數字三維激光掃描技術是連接BIM模型和工程現場的有效紐帶 三維激光掃描技術是整個三維
    發表于 04-10 17:37 ?1233次閱讀

    三維數字三維激光掃描技術是連接BIM模型和工程現場的有效紐帶

    劇院三維數字三維激光掃描技術是連接BIM模型和工程現場的有效紐帶 三維激光掃描技術是整個三維
    發表于 04-12 09:51 ?1166次閱讀

    劇院三維數字三維激光掃描技術是連接BIM模型和工程現場

    劇院三維數字三維激光掃描技術是連接BIM模型和工程現場的有效紐帶 三維激光掃描技術是整個三維
    發表于 04-24 15:33 ?854次閱讀

    智慧城市_實景三維|物業樓三維掃描案例分享_泰來三維

    三維激光掃描技術是近年來發展的新型測量方法,通過三維掃描獲取大量全面點云數據,形成三維立體模型,實現快速掌握被測目標信息。
    的頭像 發表于 05-16 13:56 ?1108次閱讀
    智慧城市_實景<b class='flag-5'>三維</b>|物業樓<b class='flag-5'>三維</b>掃描案例分享_泰來<b class='flag-5'>三維</b>

    泰來三維|三維掃描助力變電站數字建設

    通過三維激光掃描儀對變電站進行三維掃描,獲取精準三維掃描模型,實現數字孿生精準數據支持。1、數字
    的頭像 發表于 08-22 14:09 ?973次閱讀
    泰來<b class='flag-5'>三維</b>|<b class='flag-5'>三維</b>掃描助力變電站數字<b class='flag-5'>化</b>建設

    泰來三維|文物三維掃描,文物三維模型怎樣制作

    文物三維掃描,文物三維模型怎樣制作:我們都知道文物是不可再生的,要繼續保存傳承,需要文物三維數字保護,所以
    的頭像 發表于 03-12 11:10 ?731次閱讀
    泰來<b class='flag-5'>三維</b>|文物<b class='flag-5'>三維</b>掃描,文物<b class='flag-5'>三維</b><b class='flag-5'>模型</b>怎樣制作
    威尼斯人娱乐下载平台| 百家乐7杀6| 百家乐官网足球投注网哪个平台网址测速最好 | 大发888 充值淘宝| 百家乐桌子北京| 电子百家乐官网假在线哪| 百家乐官网必胜绝技| 大发888娱乐城dmwd| 百家乐平台注册送彩金| 尊龙百家乐官网娱乐网| 长海县| 大发888真坑阿| 百家乐皇室百家乐的玩法技巧和规则| 永利高百家乐开户| 百家乐官网群sun811.com| 太阳城菲律宾官网| 百家乐小音箱| 百家乐官网红桌布| 百家乐官网游戏平台架设| 云鼎娱乐城信誉度| 百家乐有试玩的吗| 赌博百家乐技术| 黄金城百家乐官网苹果版| 百家乐官网赌博论谈| 龙山县| 高额德州扑克视频| 名人百家乐的玩法技巧和规则| 八运24山阴阳| 网上百家乐官网娱乐网| 网络百家乐官网路单图| 菲律宾卡卡湾| 大发888官方 截图| 百家乐线路图分析| 百家乐永利娱乐平台| 博盈百家乐游戏| 金冠百家乐官网的玩法技巧和规则 | 旅百家乐官网赢钱律| 百家乐官网龙虎台布多少钱 | 在线百家乐策| 百家乐路珠价格| 百家乐游戏规则玩法|