衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

頂刊TPAMI最全綜述!深入自動駕駛BEV感知的魔力!

3D視覺工坊 ? 來源:3D視覺工坊 ? 2024-01-14 09:53 ? 次閱讀

1. 寫在前面

今天筆者為大家推薦一篇BEV感知的最新綜述,分析了BEV感知的核心難點,回顧了關于BEV感知的最新工作,并對不同的解決方案進行了深入分析,還描述了來自工業(yè)界的幾種BEV方法的系統(tǒng)設計。

下面一起來閱讀一下這項工作~

2. 摘要

在鳥瞰圖( bird ' s-eye-view,BEV )中學習強大的表征用于感知任務是一種趨勢,并引起了工業(yè)界和學術界的廣泛關注。大多數(shù)自動駕駛算法的傳統(tǒng)方法在前方或視角視圖中執(zhí)行檢測、分割、跟蹤等。隨著傳感器配置越來越復雜,集成來自不同傳感器的多源信息并在統(tǒng)一視圖中表示特征變得至關重要。BEV感知繼承了幾個優(yōu)點,因為在BEV中表示周圍的場景是直觀的和融合友好的;而在BEV中表示對象是后續(xù)模塊在規(guī)劃和/或控制中最需要的。BEV感知的核心問題在于:( a )如何通過視角到BEV的視角轉(zhuǎn)換來重建丟失的三維信息;( b )如何獲取BEV網(wǎng)格中的真實標注;( c )如何制定管線以納入來自不同來源和視圖的特征;( d )隨著傳感器配置在不同場景中的變化,如何適應和推廣算法。在這項調(diào)查中,我們回顧了關于BEV感知的最新工作,并對不同的解決方案進行了深入分析。此外,還描述了來自工業(yè)界的幾種BEV方法的系統(tǒng)設計。此外,我們還介紹了一套完整的實用指南,以提高BEV感知任務的性能,包括相機、激光雷達和融合輸入。最后,指出了該領域未來的研究方向。我們希望本報告能給社區(qū)帶來一些啟示,并鼓勵更多關于BEV感知的研究工作。

3. 文章結(jié)構(gòu)

BEV感知的任務總結(jié),包括輸入數(shù)據(jù)總結(jié)、底層任務總結(jié),還有核心任務總結(jié)。

3437b824-b22e-11ee-8b88-92fbcf53809c.jpg

BEV感知數(shù)據(jù)集總結(jié)。

3444d4a0-b22e-11ee-8b88-92fbcf53809c.jpg

BEV感知的主要工作。在輸入模態(tài)下," L "為LiDAR," SC "為單相機," MC "為多相機," T "為時間信息。在Task下,' ODet '用于3D目標檢測,' LDet '用于3D車道線檢測,' MapSeg '用于地圖分割,' Plan '用于運動規(guī)劃,' MOT '用于多目標跟蹤。

3462445e-b22e-11ee-8b88-92fbcf53809c.jpg

BEV感知算法在主流基準上的性能比較。

3480e47c-b22e-11ee-8b88-92fbcf53809c.jpg

視覺BEV感知的通用框架。包括2D特征提取器、視圖轉(zhuǎn)換和3D解碼器3個部分。在視圖轉(zhuǎn)換中,有兩種方式對3D信息進行編碼- -一種是從2D特征中預測深度信息;另一種是從3D空間采樣2D特征。

3491a55a-b22e-11ee-8b88-92fbcf53809c.jpg

LiDAR BEV感知的通用框架。將點云數(shù)據(jù)轉(zhuǎn)換為BEV表示主要有兩個分支。上層分支提取三維空間中的點云特征,提供更準確的檢測結(jié)果。下層分支在2D空間中提取BEV特征,提供更高效的網(wǎng)絡

34a2634a-b22e-11ee-8b88-92fbcf53809c.jpg

視覺BEV感知檢測任務。

34b6f382-b22e-11ee-8b88-92fbcf53809c.jpg

LiDAR BEV感知分割任務。

34c8a474-b22e-11ee-8b88-92fbcf53809c.jpg

4. 總結(jié)

這篇綜述對近年來的BEV感知進行了全面的回顧,作者認為未來的發(fā)展趨勢是:( a )如何設計一個更精確的深度估計器;( b )如何在一種新的融合機制中更好地對齊來自多個傳感器的特征表示;( c )如何設計一個無參數(shù)的網(wǎng)絡,使得算法的性能不受姿態(tài)變化或傳感器位置的影響,從而在各種場景中獲得更好的泛化能力;以及( d )如何從基礎模型中整合成功的知識,以促進BEV的感知。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關注

    關注

    2553

    文章

    51407

    瀏覽量

    756629
  • 算法
    +關注

    關注

    23

    文章

    4630

    瀏覽量

    93360
  • 自動駕駛
    +關注

    關注

    785

    文章

    13932

    瀏覽量

    167013

原文標題:頂刊TPAMI最全綜述!深入自動駕駛BEV感知的魔力!

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    康謀方案 | BEV感知技術:多相機數(shù)據(jù)采集與高精度時間同步方案

    隨著自動駕駛技術的快速發(fā)展,車輛準確感知周圍環(huán)境的能力變得至關重要。BEV Camera數(shù)據(jù)采集方案有效解決了多相機同步采集和高精度時間同步的難題,還提供了靈活的相機參數(shù)配置和高效的數(shù)據(jù)傳輸,能夠滿足
    的頭像 發(fā)表于 02-06 13:45 ?238次閱讀
    康謀方案 | <b class='flag-5'>BEV</b><b class='flag-5'>感知</b>技術:多相機數(shù)據(jù)采集與高精度時間同步方案

    2024年自動駕駛行業(yè)熱點技術盤點

    感知輕地圖以及純視覺等。這些技術的出現(xiàn),也代表著自動駕駛正從概念走向現(xiàn)實,今天就給大家來盤點2024年自動駕駛行業(yè)出現(xiàn)的那些技術熱點! ? 城市NOA:邁向精細化駕駛的關鍵路徑 城市N
    的頭像 發(fā)表于 01-14 10:48 ?239次閱讀

    淺析基于自動駕駛的4D-bev標注技術

    4D-bev標注技術是指在3D空間中以時間作為第四個維度進行標注的過程。4D-bev通常在地場景較為復雜的自動駕駛場景中使用,其可以通過精準地跟蹤和記錄動態(tài)對象的運動軌跡、姿勢變化以及速度等信息,全面理解和分析動態(tài)對象在連續(xù)的時
    的頭像 發(fā)表于 12-06 15:01 ?1455次閱讀
    淺析基于<b class='flag-5'>自動駕駛</b>的4D-<b class='flag-5'>bev</b>標注技術

    標貝科技:自動駕駛中的數(shù)據(jù)標注類別分享

    自動駕駛訓練模型的成熟和穩(wěn)定離不開感知技術的成熟和穩(wěn)定,訓練自動駕駛感知模型需要使用大量準確真實的數(shù)據(jù)。據(jù)英特爾計算,L3+級自動駕駛每輛汽
    的頭像 發(fā)表于 11-22 15:07 ?1071次閱讀
    標貝科技:<b class='flag-5'>自動駕駛</b>中的數(shù)據(jù)標注類別分享

    標貝科技:自動駕駛中的數(shù)據(jù)標注類別分享

    自動駕駛訓練模型的成熟和穩(wěn)定離不開感知技術的成熟和穩(wěn)定,訓練自動駕駛感知模型需要使用大量準確真實的數(shù)據(jù)。據(jù)英特爾計算,L3+級自動駕駛每輛汽
    的頭像 發(fā)表于 11-22 14:58 ?1145次閱讀
    標貝科技:<b class='flag-5'>自動駕駛</b>中的數(shù)據(jù)標注類別分享

    自動駕駛中一直說的BEV+Transformer到底是個啥?

    感知、理解和預測方面表現(xiàn)得更為強大,徹底終結(jié)了2D直視圖+CNN時代。BEV+Transformer通過鳥瞰視角與Transformer模型的結(jié)合,顯著提升了自動駕駛
    的頭像 發(fā)表于 11-07 11:19 ?536次閱讀
    <b class='flag-5'>自動駕駛</b>中一直說的<b class='flag-5'>BEV</b>+Transformer到底是個啥?

    聊聊自動駕駛離不開的感知硬件

    自動駕駛飛速發(fā)展,繞不開感知、決策和控制決策的經(jīng)典框架,而感知作為自動駕駛汽車“感官”的重要組成部分,決定了自動駕駛系統(tǒng)對環(huán)境的理解和反應能
    的頭像 發(fā)表于 08-23 10:18 ?652次閱讀

    FPGA在自動駕駛領域有哪些優(yōu)勢?

    FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)在自動駕駛領域具有顯著的優(yōu)勢,這些優(yōu)勢使得FPGA成為自動駕駛技術中不可或缺的一部分。以下是FPGA在自動駕駛
    發(fā)表于 07-29 17:11

    FPGA在自動駕駛領域有哪些應用?

    是FPGA在自動駕駛領域的主要應用: 一、感知算法加速 圖像處理:自動駕駛中需要通過攝像頭獲取并識別道路信息和行駛環(huán)境,這涉及到大量的圖像處理任務。FPGA在處理圖像上的運算速度快,可并行性強,且功耗
    發(fā)表于 07-29 17:09

    自動駕駛識別技術有哪些

    自動駕駛的識別技術是自動駕駛系統(tǒng)中的重要組成部分,它使車輛能夠感知并理解周圍環(huán)境,從而做出智能決策。自動駕駛識別技術主要包括多種傳感器及其融合技術,以及基于這些傳感器數(shù)據(jù)的處理和識別算
    的頭像 發(fā)表于 07-23 16:16 ?830次閱讀

    自動駕駛的傳感器技術介紹

    自動駕駛的傳感器技術是自動駕駛系統(tǒng)的核心組成部分,它使車輛能夠感知并理解周圍環(huán)境,從而做出智能決策。以下是對自動駕駛傳感器技術的詳細介紹,內(nèi)容涵蓋常見類型、工作原理、在
    的頭像 發(fā)表于 07-23 16:08 ?2454次閱讀

    深度學習在自動駕駛中的關鍵技術

    隨著人工智能技術的飛速發(fā)展,自動駕駛技術作為其中的重要分支,正逐漸走向成熟。在自動駕駛系統(tǒng)中,深度學習技術發(fā)揮著至關重要的作用。它通過模擬人腦的學習過程,實現(xiàn)對車輛周圍環(huán)境的感知、理解和決策。本文將
    的頭像 發(fā)表于 07-01 11:40 ?866次閱讀

    未來已來,多傳感器融合感知自動駕駛破局的關鍵

    的架構(gòu),預計未來許多智能駕駛團隊都會引入“占用網(wǎng)絡”來提升系統(tǒng)能力。多維像素的應用前景非常廣闊。昱感微的融合感知技術+BEV +Transformer+占用網(wǎng)格有望成為L3/L4級自動駕駛
    發(fā)表于 04-11 10:26

    黑芝麻智能開發(fā)多重亮點的BEV算法技術 助力車企高階自動駕駛落地

    隨著視覺算法的演進,BEV(Bird's-Eye-View Perception)感知算法成為主機廠和自動駕駛公司發(fā)力城市場景的核心技術之一,BEV
    的頭像 發(fā)表于 03-29 18:18 ?2009次閱讀
    黑芝麻智能開發(fā)多重亮點的<b class='flag-5'>BEV</b>算法技術 助力車企高階<b class='flag-5'>自動駕駛</b>落地

    自動駕駛發(fā)展問題及解決方案淺析

    隨著科技的飛速進步,自動駕駛汽車已經(jīng)從科幻概念逐漸轉(zhuǎn)變?yōu)楝F(xiàn)實。然而,在其蓬勃發(fā)展的背后,自動駕駛汽車仍面臨一系列亟待解決的問題和挑戰(zhàn)。本文將對這些問題進行深入的剖析,并提出相應的解決方案,以期為未來
    的頭像 發(fā)表于 03-14 08:38 ?1236次閱讀
    百家乐真人娱乐平台| 百家乐官网投注规则| 豪门百家乐官网的玩法技巧和规则| 海王星百家乐的玩法技巧和规则| 金城百家乐官网玩法| 至尊百家乐奇热网| 温州牌九| 百家乐官网筹码套装包邮| 大发888-大发娱乐城下载| 金殿百家乐官网的玩法技巧和规则 | 大发888网页版| 百家乐官网是否能赢| 上海二八杠分析仪| 百家乐官网双龙出| 大发888被查| 南京百家乐官网的玩法技巧和规则 | 百家乐官网tt娱乐网| 大发888娱乐城动态| 百家乐官网长龙技巧| 澳门顶级赌场娱乐城| 我的做生意财位| bet365提款| 属虎属鼠合伙做生意吗| 沙龙国际网址| 网络百家乐赌博赢钱| 娱乐城百家乐官网论坛| 黄金城百家乐下载| 二爷百家乐官网的玩法技巧和规则 | 定24山尺寸深浅土色| 白城市| 送58百家乐的玩法技巧和规则 | 威尼斯人娱乐城在线赌博| 罗浮宫百家乐官网的玩法技巧和规则| 波音代理| 迪威百家乐娱乐网| 百家乐官网斗地主| 乐透乐博彩论坛3d| 百家乐色子玩法| 百家乐官网冯耕耘打法| 大发888游戏代充| 百家乐事电影|