摘要??
我們提出了一個用于點云生成的概率模型,它可以被用于多種 3D 視覺任務的基礎,例如形狀補全、上采樣、合成和數據增強。受非平衡熱力學中擴散過程的啟發,我們將點云中的點視為與熱庫(heat bath)接觸的熱力學系統中的粒子,其從原始分布擴散成為噪聲分布。因此,點云生成相當于學習將噪聲分布轉換為所需形狀分布的反向擴散過程。
具體來說,我們提出將點云的反向擴散過程建模為以某種隱式形狀(shape latent)為條件的馬爾可夫鏈。我們推導出訓練時封閉形式的變分邊界,并提供了模型的實現。實驗結果表明,我們的模型在點云生成和自動編碼方面取得了有競爭力的表現。
主要貢獻??
文章受非平衡熱力學中的擴散過程啟發,提出了一種新的點云概率生成模型。 ? 作者從點云基于形狀的條件似然的變分下限推導出一個易于處理的訓練目標。
大量實驗表明我們的模型實現了在點云生成和自動編碼有競爭力的性能
方法概述 ? ????
本文中作者將點云看作是從概率分布中取樣生成的,每一個點都是該概率分布的獨立同分布(i.i.d)采樣。類似于圖像的擴散概率模型,當我們向點云引入噪音時,點云會逐步從與形狀有關的復雜分布變為高斯分布的噪音,這一過程被稱作正向擴散過程。點云的生成模型可以被視作是如圖二所示的逆向擴散過程:根據一個高斯分布取樣作為噪音點云,訓練一個神經網絡以形狀為條件逐步對該噪音點云減噪,直至點云恢復其本來的形狀。 ???
Figure 2 展示了從噪音點云逆擴散生成點云的過程可以由一個馬爾科夫鏈模型表示。點云中的每一個點由 x(T) 開始以轉移概率 p****θ(x(t-1)|x(t),z) 逐步減噪(逆擴散)為目標點云 x(0)。其中 θ 表示可學習的神經網絡參數參數,z 表示與形狀有關的潛變量。
生成點云時,從正態分布取樣w,經先驗flow模型映射為形狀變量z。同時從正態分布取樣噪音點云 x(T)。通過一系列逆向擴散過程,噪音點云以形狀z為條件逐漸減噪為目標點云 x(0)。 ????
訓練時,數據集中的點云經過編碼器 φ 編碼為形狀潛碼 z 正態分布的均值和方差,再使用與變分編碼器(VAE)中的重新參數化技巧相同的方式取樣形狀潛碼 z。如下圖所示,輸入點云隨后經過一系列前向擴散過程逐漸變為噪音點云。訓練目標函數采用條件似然概率的變分下限,以最大化似然訓練數據集的似然概率。
????
需要注意的是,變分自動編碼器VAE的先驗概率選用正態分布,本文應用 Flow 模型將簡單的正態分布映射 p(w) 到更復雜的分布模型 p(z)。訓練時,q(z|x(0) 經過逆向的 Flow 映射回 w, 損失函數包含 w 的先驗概率分布和后驗概率分布之間 KL 散度。
實驗結果
? ????
文章選用 ShapeNet 數據集進行點云生成實驗、點云重建以及點云特征提取實驗。 Table 1 總結了擴散概率模型與包括GAN、Flow模型在內的其他點云生成方法相比在最小匹配距離 (MMD), 覆蓋分數 (COV), 最近鄰分類器準確率(1-NNA)以及 Jenson-Shannon 散度 (JSD) 上可以 SOTA 方法媲美。 ????
下圖展示了一些生成點云的樣例,包含了飛機和椅子兩個分類。 ???
Table 2 列出了擴散概率模型自動編碼重建性能。其重建點云與原始點云之間的 Chamfer 距離(CD) 和 動土距離 (MD) 也可以達到與 SOTA 相近的數值。 ????
下圖給出了幾個點云重構的例子,最左側一列是真實點云,然后依次是擴散模型、ShapeGF 以及 AtlasNet。 ???
Table 3 顯示擴散概率模型與其他模型在表征學習方面的比較。只使用一個線性SVM作為分類器,擴散概率模型學習的表征在ModelNet10和ModelNet40數據集上分別可以達到94.2%和87.6%的準確率,與SOTA方法相近或更好。 ???
Figure 6展示在潛變量空間插值變換獲得相應點云的變化:
總結
文章將擴散概率模型用于點云生成,推理時以形狀采樣為條件將噪音點云逆向擴散為目標點云;訓練時將輸入正向擴散為噪音點云,以從點云似然變分下限推導出的損失函數訓練模型。? 實驗表明這樣的擴散模型實現了在點云生成、自動編碼以及表征學習任務實現了有競爭力的性能。
審核編輯:劉清
-
編碼器
+關注
關注
45文章
3669瀏覽量
135258 -
GaN
+關注
關注
19文章
1966瀏覽量
74244 -
MMD
+關注
關注
0文章
3瀏覽量
6789
原文標題:3D點云生成的擴散概率模型(CVPR 2021)
文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
AN-715::走近IBIS模型:什么是IBIS模型?它們是如何生成的?
![AN-715::走近IBIS<b class='flag-5'>模型</b>:什么是IBIS<b class='flag-5'>模型</b>?它們是如何<b class='flag-5'>生成</b>的?](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
阿里云通義萬相2.1視頻生成模型震撼發布
NVIDIA推出全新生成式AI模型Fugatto
阿里云開源Qwen2.5-Coder代碼模型系列
NVIDIA Nemotron-4 340B模型幫助開發者生成合成訓練數據
![NVIDIA Nemotron-4 340B<b class='flag-5'>模型</b>幫助開發者<b class='flag-5'>生成</b>合成訓練數據](https://file1.elecfans.com/web2/M00/05/86/wKgZombaqFaAYqNYAAEgri7KFqc769.jpg)
北京靈奧科技基于亞馬遜云科技打造大模型中間件
基于stm32h743IIK在cubeai上部署keras模型,模型輸出結果都是同一組概率數組,為什么?
ISEDA首發!大語言模型生成的代碼到底好不好使
![ISEDA首發!大語言<b class='flag-5'>模型</b><b class='flag-5'>生成</b>的代碼到底好不好使](https://file1.elecfans.com/web2/M00/E5/F1/wKgZomZFnOqAHsJHAAAfAF7G0-A393.jpg)
評論