衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

SEDNet:視差和不確定性聯合評估的新方法

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-05-15 15:12 ? 次閱讀

本文提出了一種新的深度立體匹配中用于聯合視差和不確定性估計的損失函數。在神經網絡中加入KL散度項,要求不確定性分布匹配視差誤差分布,以實現精確的不確定性估計。使用可微的軟直方圖技術來近似分布,并在損失函數中使用。該方法在大型數據集上獲得了顯著的改進。作為cvpr2023最新的文章,非常值得閱讀一下。

1 前言

本文提出了SEDNet,一種用于視差和基礎不確定性聯合估計的深度網絡。SEDNet包括一個新穎的、輕量級的不確定性估計子網絡,將不確定度的分布與視差誤差的分布相匹配。為了生成這個新的損失函數的輸入,作者使用可微的軟直方圖技術以可微分的方式近似分布。在具有真實值的大型數據集上對SEDNet的視差估計和不確定度預測的性能進行了廣泛的實驗驗證。SEDNet優于具有相似架構但沒有提出的損失函數的基線。

主要貢獻是:

一個新穎的不確定性估計子網絡,從視差子網絡生成的中間多分辨率視差圖中提取信息

一種可微的軟直方圖技術,用于近似視差誤差和估計不確定性的分布。

一種基于KL散度的損失,應用于使用上述技術獲得的直方圖。

41553bb4-f2ce-11ed-90ce-dac502259ad0.png

2 相關背景

立體匹配網絡在一種稱為成本體積(cost volume)的體積上運行,該體積在每個像素處匯聚每個可能視差處的二維特征,并可以通過相關或串聯來構建。DispNetC、iResNet和SegStereo等基于相關的網絡生成兩個視圖中提取的特征的單通道相關地圖,在各視差層中,利用有效的計算流程犧牲結構和語義信息在特征表示中。GCNet、PSMNet和GANet等基于串聯的網絡在成本體積的對應元素所指定的視差處組裝兩個視圖的特征。這有助于學習上下文特征,但需要更多的參數以及一個后續的聚合網絡。在置信度估計方面,將置信度和不確定度區分開來,包括置信度CNN、PBCP、EFN、LFN和MMC等方法,以及ConfNet、LGC和LAF等利用圖像和視差圖作為輸入的方法。KL散度用于測量變分推斷估計的網絡參數分布的近似和精確后驗分布之間的距離。(需要注意的是,在分配離散度誤差的分布上,作者使用了KL散度來實現完全不同的目的。)

3 方法

本文旨在聯合估計視差和不確定性,通過最小化預測不確定性和實際視差誤差之間的差異來訓練網絡。其中,預測模型的損失函數為KL散度損失,用于匹配誤差分布和不確定性分布。立體匹配網絡通過學習聯合公式預測比單獨的視差估計器更準確的視差。

3.1 Aleatoric Uncertainty Estimation - 隨機不確定性估計

為了預測不確定性并降低噪聲的影響,Kendall和Gal通過最小化模型輸出的負對數似然來實現像素級的預測。模型假設輸出服從高斯分布。Ilg等人的后續工作表明,預測的分布可以分別模擬為拉普拉斯分布或高斯分布,具體取決于是對視差估計采用L1損失還是L2損失。由于作者采用的是前者,因此可以將預測模型表示為:

416b47ce-f2ce-11ed-90ce-dac502259ad0.png

為了模擬算法不確定性,Kendall和Gal引入了像素特定的噪聲參數σ(i)。作者采用了Ilg等人在構建拉普拉斯模型時使用的方法,并獲得了以下像素級損失函數:

419350f2-f2ce-11ed-90ce-dac502259ad0.png

該式可以被視為魯棒損失函數,其中像素的殘差損失受其不確定性的影響而減弱,而第二項則作為正則化項。訓練網絡來預測觀測噪聲標量的對數s,以保證數值穩定性。

3.2 Matching the Distribution of Errors - 誤差分布的匹配

這部分作者討論了調整不確定性分布以匹配誤差分布的問題。采用KL散度作為衡量二者之間差異的度量,但直接最小化KL散度需要兩個分布的歸納公式。為此作者使用直方圖來表示分布,同時采用軟直方圖使其可微分。對于每個批次訓練,基于誤差值的統計量創建一個直方圖。作者對獨立的不確定性采用相同的直方圖參數,并使用反比例權重的softmax函數來計算每個誤差值或不確定性貢獻的直方圖值。最后,該直方圖的KL損失用于網絡的訓練。

3.3 SEDNet

SEDNet是一個包括視差估計和不確定性估計子網絡的網絡體系結構。其中視差估計子網絡采用GwcNet,GwcNet子網絡使用類似ResNet的特征提取器從圖像中提取特征,生成代價體積,并使用soft-argmax運算符為像素分配視差。視差預測器的輸出模塊在不同分辨率下生成K個視差圖。不確定性估計子網絡學習預測每個像素的觀測噪聲標量的對數誤差。為了計算不確定性圖像,作者提出了使用像素對差分向量(PDV)的多分辨率視差預測的新方法。視差估計器輸出的視差圖首先進行上采樣處理,然后進行成對差分以形成PVD。其中,PVD表示像素對之間的視差差異。

41a616b0-f2ce-11ed-90ce-dac502259ad0.png

3.4 Loss Function - 損失函數

本文所使用的損失函數由兩部分組成:對數似然損失和KL散度損失。其中對數似然損失用于優化誤差和不確定性,KL散度損失用于匹配不確定性分布和誤差。總損失將所有視差和不確定性圖像考慮在內,上采樣到最高分辨率,并通過每個分辨率級別的系數對不同分辨率級別的對數似然損失和KL散度損失進行加權計算。

420d0474-f2ce-11ed-90ce-dac502259ad0.png

4 實驗

4.1 數據集和評估指標

這部分作者介紹了多個用于立體圖像深度估計的數據集和評估指標。其中SceneFlow、Virtual KITTI 2和DrivingStereo是當前被廣泛使用的三個數據集。作者使用端點誤差(EPE)和異常值百分數(D1)來評估視差估計的準確度,并使用密度-EPE ROC曲線和曲線下的面積(AUC)來評估不確定性估計。本文還比較了SEDNet和三個基線:原始GwcNet、LAF-Net和僅使用對數似然損失的SEDNet。

4.2 實施細節

作者在PyTorch中實現了所有網絡,并對所有實驗使用了Adam優化器,其中β1 = 0.9,β2 = 0.999。在所有模型過擬合之前停止訓練。

在VK2數據集上的實驗是在兩個NVIDIA RTX A6000 GPU上執行的,每個GPU都帶有48GB的RAM。對于此數據集,使用初始學習率為0.0001從頭訓練了所有模型,在每10個epoch后降低了5個。在訓練過程中,從圖像中隨機裁剪了512×256的補丁。在測試期間,在VK2的完整分辨率上評估。

歡迎關注微信公眾號「3D視覺工坊」,加群/文章投稿/課程主講,請加微信:dddvisiona,添加時請備注:加群/投稿/主講申請

方向主要包括:3D視覺領域各細分方向,比如相機標定|三維點云|三維重建|視覺/激光SLAM|感知|控制規劃|模型部署|3D目標檢測|TOF|多傳感器融合|AR|VR|編程基礎等。

對于DrivingStereo數據集(DS),坐這兒也在兩個NVIDIA RTX A6000 GPU上進行了實驗。對于此數據集,使用在VK2上預訓練的模型進行了兩個實驗:(1)在DS訓練集上進行微調,學習率從0.0001開始,在第10個epoch后每3個epoch降低2次學習率,然后在DS測試集上進行領域內評估;(2)跳過微調步驟,并在DS-Weather子集上進行跨域評估。在訓練期間,作者隨機裁剪了與VK2實驗相同大小的輸入。在測試期間,作者對測試樣本進行了填充,使其分辨率與VK2相同。

在SceneFlow數據集上的實驗是在一臺具有24 GB內存的Nvidia TITAN RTX GPU上進行的。作者從半分辨率圖像中裁剪了256×128的補丁來限制內存消耗,并將初始學習率設置為0.001,在第10個epoch后每2個epoch降低2次學習率。

42399d22-f2ce-11ed-90ce-dac502259ad0.png

4.3 定性和定量結果

作者進行了視差估計和不確定性估計的定量和定性分析,并展示了針對不同實驗設置的SEDNet的性能優于基線結果。使用自適應閾值的內點過濾器使模型在視差和不確定性估計方面表現更好。SEDNet還具有在極端天氣下預測視差的能力,不受糟糕照明和模糊影響。此外,作者還發現使用自適應閾值進行內點過濾可以提高網絡的性能。

4258c314-f2ce-11ed-90ce-dac502259ad0.png

42b9d12c-f2ce-11ed-90ce-dac502259ad0.png

42eb63d6-f2ce-11ed-90ce-dac502259ad0.png

430e5620-f2ce-11ed-90ce-dac502259ad0.png

4.4 匹配誤差分布

作者提出的能夠更好匹配真實分布的視差估計和不確定性估計方法SEDNet,表明其在精度和魯棒性方面具有優勢。在誤差分布匹配方面,通過比較APE的結果,驗證了SEDNet的匹配能力。

4331434c-f2ce-11ed-90ce-dac502259ad0.png

4.5 從合成數據到真實數據的泛化

視差匹配網絡通常在合成數據上進行訓練,并在目標域的少量真實數據上進行微調,因為獲取帶有真實深度信息的真實數據成本高且難度大。在本節中,作者將VK2-S6和DS-Weather的實驗擴展到所有僅在合成數據上進行訓練的方法在看不見的真實域上的泛化性能進行比較。

4350e03a-f2ce-11ed-90ce-dac502259ad0.png

5 總結

本文提出了一種新的視差和不確定性聯合評估的方法,其中關鍵思想是使用基于KLD散度的獨特損失函數來比較視差誤差和不確定性估計的分布情況,通過一種可微的直方圖方案實現,同時引入了僅有190個參數的不確定性估計子網絡。實驗表明,該方法在視差和不確定性預測方面都取得了比較有效的結果。和GwcNet相比,即使基本上具有相同的容量和幾乎相同的架構,SEDNet在視差估計方面表現更好,這歸因于微小的不確定性估計子網絡。未來研究計劃將該方法同樣應用于其他逐像素回歸任務。

該篇論文介紹了一種視差和不確定性聯合評估的方法SEDNet,提出了一種可微的直方圖方案來實現KL散度損失函數,通過匹配視差誤差和不確定性分布來實現精確的不確定性估計。實驗表明,該方法在視差和不確定性預測方面都取得了有效的結果,并且在視差估計方面表現更好,相比于GwcNet,這歸因于微小的不確定性估計子網絡。該文章的主要貢獻是引入了一種新穎的不確定性估計子網絡和使用KL散度的損失函數來對比視差誤差和不確定性估計的分布情況。SEDNet的實現對于視覺和深度學習領域的研究也有一定的參考意義。

437ecb58-f2ce-11ed-90ce-dac502259ad0.png

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 函數
    +關注

    關注

    3

    文章

    4346

    瀏覽量

    62974
  • 數據集
    +關注

    關注

    4

    文章

    1209

    瀏覽量

    24835

原文標題:CVPR2023|SEDNet:視差和不確定性聯合評估的新方法

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    去嵌入和不確定性是否使用了正確的設置

    大家好,所以我遇到的問題是確定用于測試夾具糾錯過程的適配器特征的不確定性。我們將使用適配器及其s2p文件對測試夾具中的所有信號路徑進行路徑表征,然后移除以進行性能測試。這個過程在不確定性計算器中被
    發表于 09-27 15:47

    是否可以使用全雙端口校準中的S11不確定性來覆蓋單端口校準的不確定性?

    我們一直在使用Agilent VNA不確定度計算器電子表格,讓我們了解我們測量的設備的不確定性。有關單端口校準的問題:目前您必須從電子表格中選擇您的VNA(帶寬和平均值),然后選擇校準類型(全雙端口
    發表于 12-29 16:32

    N5531S TRFL不確定性

    我正在嘗試使用N5531S(選擇550傳感器)測量接收器系統測量0到-130dBm的絕對功率水平,然后計算它的不確定性。安捷倫的應用筆記已經提到,不確定度可以使用公式+/-計算(功率計范圍2-4
    發表于 02-19 15:40

    435B-K05輸出不確定性

    以及將435B-K05的輸出結果與UUT功率計的參考輸出進行比較來準確測量輸出。我反對他們的方法的理由是,通過兩次測量,不匹配不確定度和儀表誤差不確定性將加倍,更不用說必須包括435B-K05輸出
    發表于 08-02 14:33

    測試系統不確定性分析

    測試系統不確定性分析
    發表于 09-18 09:19

    傅里葉變換與不確定性看了就知道

    傅里葉變換與不確定性
    發表于 12-30 06:41

    基于RFID技術的供應鏈管理項目存在哪些不確定性

    基于RFID技術的供應鏈管理項目存在哪些不確定性?項目嵌入的實物期權類型有哪幾種?
    發表于 05-28 07:08

    運算放大器的開環電壓增益有哪些不確定性?

    運算放大器的開環電壓增益的值有多大?運算放大器的開環電壓增益有哪些不確定性?如何去解決?
    發表于 07-19 09:11

    考慮模型參數不確定性的航天器姿態機動控制

    考慮模型參數不確定性的航天器姿態機動控制_李隆
    發表于 01-07 18:21 ?0次下載

    一種求解動態及不確定性優化問題的新方法

    一種求解動態及不確定性優化問題的新方法_劉曉
    發表于 01-07 18:56 ?0次下載

    如何用不確定性解決模型問題

    再比如,你想搭建一個模型,要在一系列動物圖片中預測哪種動物會吃掉你。假設你在訓練時給模型提供的都是獅子和長頸鹿的照片,現在模型看到了一張僵尸照片。由于之前它沒有見過僵尸,所以這里的不確定性就非常高。如果在訓練時能提供足夠的僵尸照片,那么模型的不確定性會隨之減少。
    的頭像 發表于 09-07 09:45 ?5329次閱讀

    針對自閉癥輔助的不確定性聯合組稀疏建模方法

    ,提出一種新型的不確定性聯合組稀疏建模方法JGSI-TSK,并將其用于自閉癥的輔助診斷。首先,對原始rs-MRI數據進行預處理和特征提取,得到低維特征數據;然后,基于TSK模糊系統框架,從特征之間的相關性出發,在后件參數學習過程
    發表于 04-07 11:23 ?2次下載
    針對自閉癥輔助的<b class='flag-5'>不確定性</b><b class='flag-5'>聯合</b>組稀疏建模<b class='flag-5'>方法</b>

    深部目標姿態估計的不確定性量化研究

      FastUQ 是一種新的用于深部目標姿態估計的快速不確定性量化方法,具有高效、即插即用的特點,支持一類通用的姿態估計任務。這項研究在自主駕駛和一般自主性方面具有潛在的重大影響,包括更穩健和安全的感知,以及不確定性感知控制和規
    的頭像 發表于 04-26 16:18 ?1221次閱讀

    不確定性感知和姿態回歸結合用于自動駕駛車輛定位

    提出了一種聯合訓練姿態估計和不確定性方法,其具有可靠的不確定性估計和改進的訓練穩定性。
    的頭像 發表于 01-30 11:30 ?1557次閱讀

    科技云報到:數字化轉型,從不確定性確定性的關鍵路徑

    科技云報到:數字化轉型,從不確定性確定性的關鍵路徑
    的頭像 發表于 11-16 16:52 ?398次閱讀
    科技云報到:數字化轉型,從<b class='flag-5'>不確定性</b>到<b class='flag-5'>確定性</b>的關鍵路徑
    百家乐投注之对冲投注| 百家乐官网线上真人游戏| 百家乐是不是有技巧| 台安县| 百家乐怎么玩请指教| 游戏百家乐官网押金| 大发888斗地主| 顶尖百家乐学习| 澳门百家乐官网玩大小| 威尼斯人娱乐场55556| 娱乐城百家乐官网的玩法技巧和规则| 八大胜娱乐场| 百家乐遥控洗牌器| 百家乐官网庄闲局部失| BET365体育在线| 神州百家乐的玩法技巧和规则 | 马牌百家乐官网的玩法技巧和规则 | 黄金城百家乐官网下载| 白山市| 大发8888| 博E百百家乐现金网| 百家乐官网平注常赢法| 一路发| 百家乐网络娱乐场开户注册| 大上海百家乐官网的玩法技巧和规则| 桑日县| 大发888博彩娱乐城| 百家乐庄闲最佳打法| 百家乐官网园游戏77sonci...| 香港六合彩结果| 真人百家乐娱乐场开户注册| 24山向中那个向最好| 百家乐官网试玩全讯网2| bet365虚拟运动| KTV百家乐的玩法技巧和规则| 反赌百家乐官网的玩法技巧和规则| 百家乐官网高手投注法| 百家乐双面数字筹码怎么出千| 百家乐官网好的平台| 德州扑克算牌器| 新西兰百家乐的玩法技巧和规则|