衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Block nerf:可縮放的大型場景神經視圖合成

3D視覺工坊 ? 來源:泡泡機器人SLAM ? 作者:paopaoslam ? 2022-10-19 15:15 ? 次閱讀

摘要

我們提出了 Block-NeRF,一種神經輻射場的變體,可以表示大規模的場景。具體來說,我們發現,當使用 NeRF 渲染跨越多個街區的城市規模場景時,將場景分解為單獨訓練的子 NeRF 至關重要。這種分解將渲染時間與場景大小分離,使渲染能夠擴展到任意大的場景,并允許對環境進行逐塊更新。我們采用了幾項架構更改,以使 NeRF 對在不同環境條件下數月捕獲的數據具有魯棒性。我們為每個單獨的 NeRF 添加了外觀嵌入、可學習的位姿細化和可控曝光,并引入了校準相鄰 NeRF 之間外觀的程序,以便它們可以無縫組合。我們從 280 萬張圖像中構建了一個 Block-NeRF 網格,以創建迄今為止最大的神經場景表示,能夠渲染舊金山的整個社區。

video: (click the picture to view)

cf1514b0-4f63-11ed-a3b6-dac502259ad0.png

主要貢獻

cf0e10b6-4f63-11ed-a3b6-dac502259ad0.png

為了在大場景中應用神經輻射場(NeRF)模型,文章提出將大型場景分解為相互重疊的子場景 (block),每一個子場景分別訓練,在推理時動態結合相鄰 Block-NeRF 的渲染視圖。

文章在 mip-NeRF 的基礎上增加了外觀嵌入、曝光嵌入和位姿細化,以解決訓練數據橫跨數月而導致的環境變化和位姿誤差。

為了保證相鄰 Block-NeRF 的無縫合成,文章提出了在推理時迭代優化這些 Block-NeRF 的輸入外觀嵌入以校準它們的渲染結果。

方法概述

cf0e10b6-4f63-11ed-a3b6-dac502259ad0.png 神經輻射場 (NeRF)是使用神經網絡擬合輻射場,用于視圖渲染的方法。然而,傳統的 NeRF 很難被直接擴展到大場景應用。這是因為擬合大場景所需的神經網絡也會很大,這會導致訓練和推理渲染變得很困難。本文提出將大的場景劃分為數個相互重合的小場景 (block)。如下圖所示的丁字路口被劃分為三個小場景(黃圈),針對每一個小場景單獨訓練一個 Block-NeRF。推理時合并覆蓋目標視圖范圍的 Block-NeRF 渲染生成最終的視圖。

cf5e8866-4f63-11ed-a3b6-dac502259ad0.png

mip-NeRF 拓展

文章基于 mip-NeRF,但是由于訓練視圖在長達數月的時間內采集,不可避免地出現場景光照不同、相機曝光不同、視圖位姿存在誤差等問題。為了解決這些問題,文章在 mip-NeRF 的基礎上增加了外觀嵌入和曝光作為神經網絡的輸入(如下圖所示,其中 fσ 和 fc 分別為預測密度 σ 和顏色 RGB 的神經網絡,x 為場景中的三維坐標點,d 表示視角)。

cfbffd94-4f63-11ed-a3b6-dac502259ad0.png

訓練時使用生成式潛碼優化的方法學習外觀嵌入,消除天氣光照等原因的影響。曝光則直接可以讀取采集記錄,只需對其進行正弦位置編碼即可。

與此同時,訓練視圖的采集跨越了多個駕駛段,這些駕駛軌跡之間不可避免地存在位姿誤差。Block-NeRF 訓練時還同時優化每一個駕駛段的位姿偏移以降低位姿誤差帶來的影響。

街道視圖中存在汽車、行人等瞬時物體,然而場景渲染通常只關注建筑、街道等靜態結構。文章于是使用語義分割網絡對訓練視圖中的動態物體進行掩蔽,這樣神經輻射場就不會學習這些動態物體,而是只關注靜態場景結構。

有時目標視圖的相鄰 Block-NeRF 可能距離上很近,但并不在目標視圖的視野之內,文章在傳統 NeRF 的兩個神經網絡 fσ 和 fc 之外,還增加了一個預測能見度的網絡 fv。給定三維坐標 x 和視角 d , fv 預測該點在給定視角下的能見度。合成多個 Block-NeRF 的渲染時,能見度低于閾值的渲染不會被用于最終的合成。訓練時能見度可以由相應點的透光率作為監督目標。

cfcb833a-4f63-11ed-a3b6-dac502259ad0.png

Block-NeRF 融合

為提高渲染效率,渲染目標視圖時文章僅融合:

中心點在閾值半徑內

且平均能見值高于閾值的 Block-NeRFs

滿足這兩個條件的 Block-NeRFs 以反距離加權的方式融合渲染視圖。這里的距離選擇相機到 Block-NeRFs 的二維空間距離。這樣的融合方法既保證了渲染真實度又能夠滿足時空一致性。

為了保證不同視角下渲染的天氣、光線等外觀的一致性,文章還在推理時引入了外觀嵌入迭代優化。給定一個 Block-NeRF 的外觀嵌入,文章在鎖定神經網絡權重不變的基礎上,優化相鄰 Block-NeRFs 的外觀嵌入,最大化其渲染視圖的一致性。

實驗結果

cf0e10b6-4f63-11ed-a3b6-dac502259ad0.png

文章采集并開源了兩個數據集:San Francisco Alamo Square Dataset 和 San Francisco Mission Bay Dataset,分布包含280萬和1.2萬圖片。Alamo Square Dataset覆蓋大約 0.5km2 ,采集自3個月周期內,包括不同光線條件和天氣的數據。Mission Bay Dataset 涵蓋的地理范圍遠遠小于 Alamo Square Dataset,主要被用來與 NeRF做比較。

Table 2 顯示 Block-NeRF 相較于NeRF 渲染效果更好。并且 block 數量越多越好。即便是保持神經網絡總參數量不變,Block-NeRF 仍然優于 NeRF 并且推理速度在不考慮并行計算的前提下也大大提高。

cff1ac22-4f63-11ed-a3b6-dac502259ad0.png

Table 1 和 Figure 7 分別定量和定性地顯示外觀嵌入、曝光輸入以及位姿優化都對提高渲染效果有幫助。

cffe6ffc-4f63-11ed-a3b6-dac502259ad0.png

d0335f32-4f63-11ed-a3b6-dac502259ad0.png

Figure 6 顯示推理時外觀嵌入優化可以將渲染從白天場景轉換成黑夜場景,從而更好地與基準 Block-NeRF 匹配,增強渲染地時空一致性。

d0bb5392-4f63-11ed-a3b6-dac502259ad0.png

總結

cf0e10b6-4f63-11ed-a3b6-dac502259ad0.png

本文提出了Block-NeRF,采用 divide-and-conquer 的方法使用多個 Block-NeRFs 學習大型場景的不同分塊,最終將這些Block-NeRFs 的渲染合成目標視圖。這樣的方法使得利用 NeRF 模型渲染城市規模的場景成為了可能。

此外 Block-NeRF 還在 mip-NeRF 的基礎上,引入了外觀嵌入優化、曝光輸入和位姿細化等擴展,以解決訓練數據橫跨數月而導致的環境變化和位姿誤差。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4779

    瀏覽量

    101166
  • Block
    +關注

    關注

    0

    文章

    26

    瀏覽量

    14725
收藏 人收藏

    評論

    相關推薦

    倍頻器的技術原理和應用場景

    倍頻器是一種用于將輸入信號的頻率倍增的電子設備,以下是關于倍頻器的技術原理和應用場景的詳細解釋:技術原理倍頻器的技術原理主要基于非線性元件(如二極管、晶體管等)的特性和頻率變換技術。 非線性元件
    發表于 11-29 14:49

    寶馬集團將OpenUSD用于合成數據生成

    通?場景描述,又稱為OpenUSD,是?個開放且擴展的?態系統,?于在 3D 世界中描述、合成、模擬和協作。
    的頭像 發表于 11-20 10:22 ?320次閱讀

    全面總結動態NeRF

    1. 摘要 神經輻射場(NeRF)是一種新穎的隱式方法,可以實現高分辨率的三維重建和表示。在首次提出NeRF的研究之后,NeRF獲得了強大的發展力量,并在三維建模、表示和重建領域蓬勃發
    的頭像 發表于 11-14 16:48 ?487次閱讀
    全面總結動態<b class='flag-5'>NeRF</b>

    使用功率縮放

    電子發燒友網站提供《使用功率縮放庫.pdf》資料免費下載
    發表于 10-18 10:24 ?0次下載
    使用功率<b class='flag-5'>縮放</b>庫

    BP神經網絡和卷積神經網絡的關系

    廣泛應用的神經網絡模型。它們各自具有獨特的特點和優勢,并在不同的應用場景中發揮著重要作用。以下是對BP神經網絡和卷積神經網絡關系的詳細探討,內容將涵蓋兩者的定義、原理、區別、聯系以及應
    的頭像 發表于 07-10 15:24 ?1733次閱讀

    遞歸神經網絡的結構、特點、優缺點及適用場景

    識別、時間序列分析等領域有著廣泛的應用。本文將詳細介紹遞歸神經網絡的結構、特點、優缺點以及適用場景。 一、遞歸神經網絡的結構 基本結構 遞歸神經網絡的基本結構包括輸入層、隱藏層和輸出層
    的頭像 發表于 07-04 14:52 ?1678次閱讀

    循環神經網絡的應用場景有哪些

    循環神經網絡(Recurrent Neural Network,簡稱RNN)是一種具有記憶功能的神經網絡,能夠處理序列數據,廣泛應用于自然語言處理、語音識別、時間序列預測等領域。 自然語言處理
    的頭像 發表于 07-04 14:39 ?1646次閱讀

    bp神經網絡和卷積神經網絡區別是什么

    結構、原理、應用場景等方面都存在一定的差異。以下是對這兩種神經網絡的比較: 基本結構 BP神經網絡是一種多層前饋神經網絡,由輸入層、隱藏層和輸出層組成。每個
    的頭像 發表于 07-03 10:12 ?1356次閱讀

    神經網絡模型的原理、類型、應用場景及優缺點

    網絡模型的原理、類型、應用場景以及優缺點。 神經網絡模型的原理 神經網絡模型的基本原理是模擬人腦神經元的工作方式。人腦由大約860億個神經
    的頭像 發表于 07-02 09:56 ?1766次閱讀

    示波器觀察波形的視圖模式詳解

    觀察波形的三種主要視圖模式:YT模式、滾動模式和XY模式,并深入分析每種模式的原理、特點、優缺點及適用場景,以期為讀者在實際應用中提供有益的參考。
    的頭像 發表于 05-23 17:18 ?3335次閱讀

    利用深度循環神經網絡對心電圖降噪

    曼濾波。因此,通過這種方式訓 練網絡,無法獲得比卡爾曼濾波本身更好的 性能。本文介紹了一種利用深度遞歸神經網絡 (DRNN)對 ECG 信號進行降噪的新方 法。該網絡使用兩個合成數據集和一個真實 數據
    發表于 05-15 14:42

    LiDAR4D:基于時空新穎的LiDAR視角合成框架

    NeRF-LiDAR將圖像和點云模態整合到激光雷達合成中,而諸如LiDAR-NeRF和NFL之類的僅激光雷達的方法探索了在沒有RGB圖像的情況下進行激光雷達重建和生成的可能性。
    發表于 04-10 12:34 ?1352次閱讀
    LiDAR4D:基于時空新穎的LiDAR視角<b class='flag-5'>合成</b>框架

    NanoEdge AI的技術原理、應用場景及優勢

    能耗并提高數據安全性。本文將對 NanoEdge AI 的技術原理、應用場景以及優勢進行綜述。 1、技術原理 NanoEdge AI 的核心技術包括邊緣計算、神經網絡壓縮和低功耗硬件設計。邊緣計算
    發表于 03-12 08:09

    谷歌模型合成工具怎么用

    谷歌模型合成工具主要是指Dreamfusion,這是Google的大型AI圖像模型Imagen與NeRF的3D功能相結合的一種技術。Dreamfusion是Dream Fields的演變,Dream Fields是谷歌于2021
    的頭像 發表于 02-29 17:33 ?851次閱讀

    NeRF入門基礎知識詳解

    deep networks 更傾向于學習低頻的函數,實際場景神經輻射場基本上都是高頻的
    的頭像 發表于 02-21 14:21 ?1610次閱讀
    <b class='flag-5'>NeRF</b>入門基礎知識詳解
    六十甲子24山吉凶| 新时代百家乐官网娱乐城| 利博百家乐官网破解| 百家乐赌缆十三式| 大发888出纳柜台| 大发888下载大发888游戏平台| 德州扑克平台| 博尔国际| 百家乐官网技巧论坛| 下三元八运24山详解| 百家乐官网庄闲规则| 百家乐咨询网址| 博彩百家乐字谜总汇| 大发8881| 百家乐官网台布兄弟| 百家乐有方式赢钱吗| 澳门百家乐玩大小| 网上百家乐做假| 百家乐技巧平注常赢法| 百家乐官网没有必胜| 豪杰百家乐现金网| 大发888移动版| 百家乐官网庄闲当哪个好| 噢门百家乐注码技巧| 皇冠足球网| 百家乐软件稳赚| 真钱博彩网| 属鼠和属虎的人能在一起做生意吗| 棋牌银商| 做生意必须看风水吗| k7娱乐| 做生意怎么看风水| 网络博彩qq群| 网上百家乐开户送现金| 肇源县| 百家乐赌场分析网| 娱乐城百家乐官网论坛| 扑克百家乐赌器| 百人百家乐官网软件供应| 庄闲和百家乐桌布| 老k百家乐官网游戏|