衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

特斯拉的圖像識別原理是什么?

深圳市汽車電子行業協會 ? 來源:阿寶1990 ? 作者:阿寶1990 ? 2021-06-26 14:04 ? 次閱讀

特斯拉利用8個攝像頭來識別現實世界中的物體。攝像頭獲取的圖像包括行人、其他車輛、動物或障礙物,這不僅對特斯拉車輛駕駛員的安全很重要,對其他人也很重要。專利稱,重要的是,攝像頭能夠及時準確地識別這些物體。

785551ea-d5b5-11eb-9e57-12bb97331649.png

特斯拉專利框

特斯拉專利演示

算法的代碼層面來說,特斯拉把它們的深度學習網絡稱為HydraNet。其中,基礎算法代碼是共享的,整個HydraNet包含48個不同的神經網絡,通過這48個神經網絡,就能輸出1000個不同的預測張量。理論上來說,特斯拉的這個超級網絡,能同時檢測1000種物體。完成這些運算并不簡單,特斯拉已經耗費了7萬個GPU小時進行深度學習模型訓練。

雖然工作量很大,但由于大部分工作由機器承擔,特斯拉的人工智能團隊僅由幾十人組成,與其他自動駕駛公司數百人甚至數千人的規模相比,確實規模不大。

完成2D的圖像還不算牛掰的,畢竟云端有超級計算機可以去訓練,本地的芯片也是自己開發的,可以很好的匹配算法,特斯拉真正牛掰的地方,通過視覺完成3D的深度信息,并可以通過視覺建立高精度地圖,完成一些底下停車場的附件駕駛場景。

特斯拉全車共配備了8個攝像頭,一個毫米波雷達和12個超聲波雷達,監測外部環境,向自動駕駛電腦實時傳送信息。

特斯拉車外傳感器

簡單來看,特斯拉的攝像頭、毫米波雷達、超聲波雷達以及慣性測量單元記錄下當前車輛所處的環境數據,并將數據發送給特斯拉的自動駕駛電腦。自動駕駛電腦在進行算法的計算之后,將速度和方向信息傳遞給轉向舵以及加速、制動踏板,實現對車輛的控制。

不過,在日常行駛過程中,攝像頭作為傳感器捕捉的內容都是二維圖像,并沒有深度信息。

也就是說,雖然二維圖像已經可以區分公路和路旁的人行道,但并不知道現在車輛距離“馬路牙子”還有多遠。由于缺失這樣一個重要信息,自動駕駛的運算可能并不準確,操作可能出錯。因此,捕捉或者建立一個三維的圖景很有必要。

特斯拉使用三目相機的,它可以通過比較兩個攝像頭圖像的差異判斷物體的遠近,獲得物體的深度信息。通過中央處理器對輸入圖像進行感知、分割、檢測、跟蹤等操作,輸出給導航網絡端進行語義建圖及匹配定位,同時通過目標識別形成相應的ADAS系統目標屬性。

特斯拉還有更厲害的地方,那就是算法可以預測流媒體視頻中每一個像素的深度信息。也就是說,只要算法足夠好,流媒體視頻更加清晰,特斯拉的視覺傳感器所捕捉的深度信息甚至可以超過激光雷達。

在實際的自動駕駛應用中,泊車入位和智能召喚兩個使用場景下就能充分利用這套算法。在停車場行駛時,車輛之間的距離很小,即使是駕駛員駕駛,稍不留神也很容易出現刮蹭事故。對于機器來說,停車場場景的行駛更加困難。在預測到深度信息之后,車輛可以在超聲波雷達的輔助之下,快速完成對周圍環境的識別,車輛泊車就會更加順利。

在完成深度信息的預測之后,這部分信息會顯示在車機上,同時也會直接參與控制轉向、加速、制動等駕駛動作。不過,轉向、加速、制動這些駕駛策略沒有固定的規則,有一定靈活性。因此,自動駕駛的駕駛策略沒有最佳,只有更好。

怎么提高神經網絡的算法效率:

為什么這么多廠家只有百度敢挑戰視覺為主的輔助駕駛方案,不使用激光雷達,其中很大一個原因就是神經網絡算法相當耗費芯片算力和內存資源,本地端的芯片要算力足夠強大,對于神經網絡的算法要有優化。

對于神經網絡來說,其實很多的連接并不是一定要存在的,也就是說我去掉一些連接,可能壓縮后的網絡精度相比壓縮之前并沒有太大的變化。基于這樣的理念,很多剪枝的方案也被提了出來,也確實從壓縮的角度帶來了很大效果提升。

需要特別提出的是,大家從圖中可以看到,深度學習神經網絡包括卷積層和全連接層兩大塊,剪枝對全連接層的壓縮效率是最大的。下面柱狀圖的藍色部分就是壓縮之后的系數占比,從中可以看到剪枝對全連接層的壓縮是最大的,而對卷積層的壓縮效果相比全連接層則差了很多。

所以這也是為什么,在語音的加速上很容易用到剪枝的一些方案,但是在機器視覺等需要大量卷積層的應用中剪枝效果并不理想。

對于整個Deep Learning網絡來說,每個權重系數是不是一定要浮點的,定點是否就能滿足?定點是不是一定要32位的?很多人提出8位甚至1位的定點系數也能達到很不錯的效果,這樣的話從系數壓縮來看就會有非常大的效果。從下面三張人臉識別的紅點和綠點的對比,就可以看到其實8位定點系數在很多情況下已經非常適用了,和32位定點系數相比并沒有太大的變化。所以,從這個角度來說,權重系數的壓縮也會帶來網絡模型的壓縮,從而帶來計算的加速。

這些都需要非常資深的軟件算法團隊去優化,同時需要懂得底層芯片的資源情況,而百度在人工算法這方面非常具有優勢,所以有勇氣去挑戰視覺為主的自動駕駛 Apollo Lite方案。

百度表示,攝像頭是相對成熟的傳感器,除具備輕巧低成本和符合車規的優勢外,高分辨率高幀率(成像頻率)的成像技術發展趨勢意味著圖像內蘊含的環境信息更豐富,同時視頻數據也和人眼感知的真實世界最為相似,但和三維點云數據相比,二維圖像中的信息更難挖掘,需要設計更強大的算法、大量數據的積累和更長期的研發投入。

責任編輯:lq6

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 攝像頭
    +關注

    關注

    60

    文章

    4865

    瀏覽量

    96322
  • 特斯拉
    +關注

    關注

    66

    文章

    6332

    瀏覽量

    126823

原文標題:【行業資訊】自動駕駛傳感器之攝像頭(十二)特斯拉圖像識別原理闡述

文章出處:【微信號:qidianxiehui,微信公眾號:深圳市汽車電子行業協會】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI圖像識別攝像機

    隨著科技的迅猛發展,人工智能(AI)在各個領域的應用越來越廣泛,其中圖像識別技術尤為引人注目。AI圖像識別攝像機作為這一技術的重要應用之一,正在逐步改變我們的生活和工作方式。什么是AI圖像識別攝像機
    的頭像 發表于 11-08 10:38 ?357次閱讀
    AI<b class='flag-5'>圖像識別</b>攝像機

    圖像識別算法有哪幾種

    圖像識別算法是計算機視覺領域的核心技術之一,它通過分析和處理圖像數據,實現對圖像中的目標、場景和物體的識別和分類。 圖像識別算法的發展歷程
    的頭像 發表于 07-16 11:22 ?1370次閱讀

    圖像檢測和圖像識別的原理、方法及應用場景

    圖像檢測和圖像識別是計算機視覺領域的兩個重要概念,它們在許多應用場景中發揮著關鍵作用。 1. 定義 1.1 圖像檢測 圖像檢測(Object Detection)是指在
    的頭像 發表于 07-16 11:19 ?4921次閱讀

    圖像識別算法都有哪些方法

    圖像識別算法是計算機視覺領域的核心任務之一,它涉及到從圖像中提取特征并進行分類、識別和分析的過程。隨著深度學習技術的不斷發展,圖像識別算法已經取得了顯著的進展。本文將介紹
    的頭像 發表于 07-16 11:14 ?6068次閱讀

    圖像識別算法的提升有哪些

    引言 圖像識別是計算機視覺領域的核心任務之一,旨在使計算機能夠自動地識別和理解圖像中的內容。隨著計算機硬件的發展和深度學習技術的突破,圖像識別算法的性能得到了顯著提升。本文將介紹
    的頭像 發表于 07-16 11:12 ?746次閱讀

    圖像識別算法的優缺點有哪些

    圖像識別算法是一種利用計算機視覺技術對圖像進行分析和理解的方法,它在許多領域都有廣泛的應用,如自動駕駛、醫療診斷、安全監控等。然而,圖像識別算法也存在一些優缺點。 一、圖像識別算法的優
    的頭像 發表于 07-16 11:09 ?1907次閱讀

    圖像識別算法的核心技術是什么

    圖像識別算法是計算機視覺領域的一個重要研究方向,其目標是使計算機能夠像人類一樣理解和識別圖像中的內容。圖像識別算法的核心技術包括以下幾個方面: 特征提取 特征提取是
    的頭像 發表于 07-16 11:02 ?746次閱讀

    圖像識別技術包括自然語言處理嗎

    圖像識別技術與自然語言處理是人工智能領域的兩個重要分支,它們在很多方面有著密切的聯系,但也存在一些區別。 一、圖像識別技術與自然語言處理的關系 1.1 圖像識別技術的定義 圖像識別技術
    的頭像 發表于 07-16 10:54 ?946次閱讀

    圖像識別技術在醫療領域的應用

    一、引言 圖像識別技術是一種利用計算機視覺技術對圖像進行分析和處理的技術。隨著計算機技術、人工智能技術、大數據技術等的發展,圖像識別技術在各個領域的應用越來越廣泛。在醫療領域,圖像識別
    的頭像 發表于 07-16 10:48 ?1173次閱讀

    圖像識別技術的原理是什么

    圖像識別技術是一種利用計算機視覺和機器學習技術對圖像進行分析和理解的技術。它可以幫助計算機識別和理解圖像中的對象、場景和活動。 圖像預處理
    的頭像 發表于 07-16 10:46 ?1421次閱讀

    圖像識別屬于人工智能嗎

    屬于。圖像識別是人工智能(Artificial Intelligence, AI)領域的一個重要分支。 一、圖像識別概述 1.1 定義 圖像識別是指利用計算機技術對圖像中的內容進行分析
    的頭像 發表于 07-16 10:44 ?1334次閱讀

    opencv圖像識別有什么算法

    圖像識別算法: 邊緣檢測 :邊緣檢測是圖像識別中的基本步驟之一,用于識別圖像中的邊緣。常見的邊緣檢測算法有Canny邊緣檢測器、Sobel邊緣檢測器和Laplacian邊緣檢測器。 特
    的頭像 發表于 07-16 10:40 ?1212次閱讀

    如何利用CNN實現圖像識別

    卷積神經網絡(CNN)是深度學習領域中一種特別適用于圖像識別任務的神經網絡結構。它通過模擬人類視覺系統的處理方式,利用卷積、池化等操作,自動提取圖像中的特征,進而實現高效的圖像識別。本文將從CNN的基本原理、構建過程、訓練策略以
    的頭像 發表于 07-03 16:16 ?1525次閱讀

    圖像檢測和圖像識別的區別是什么

    圖像檢測和圖像識別是計算機視覺領域的兩個重要研究方向,它們在許多應用場景中都有著廣泛的應用。盡管它們在某些方面有相似之處,但它們之間還是存在一些明顯的區別。本文將從多個角度對圖像檢測和圖像識別
    的頭像 發表于 07-03 14:41 ?1227次閱讀

    神經網絡在圖像識別中的應用

    隨著人工智能技術的飛速發展,神經網絡在圖像識別領域的應用日益廣泛。神經網絡以其強大的特征提取和分類能力,為圖像識別帶來了革命性的進步。本文將詳細介紹神經網絡在圖像識別中的應用案例,包括卷積神經網絡(CNN)在面部
    的頭像 發表于 07-01 14:19 ?823次閱讀
    博彩e族字谜专区| 济州岛百家乐官网的玩法技巧和规则 | 真人百家乐ea平台| 蒙特卡罗娱乐场| 百家乐缆的打法| 皇冠网hg3155| 百家乐平台注册送彩金| 阿尔山市| 百家乐赌博破解| 百家乐官网怎么玩高手| 百家乐下路教学| e世博百家乐官网技巧| 百家乐建材| 温州市百家乐官网鞋业有限公司| 威尼斯人娱乐城信誉lm0| 百家乐官网娱乐网真人娱乐网 | BB百家乐官网HD| 大发888游戏网页版| 金龍百家乐官网的玩法技巧和规则 | 百家乐太阳城小郭| 黄骅市| 免费玩百家乐的玩法技巧和规则 | 伯爵百家乐的玩法技巧和规则| 破解百家乐官网公式| 大发888大发娱乐场| 做生意的风水朝向| A8百家乐官网游戏| 大哥大百家乐的玩法技巧和规则| 百家乐官网庄6点| 太阳城娱乐开户| 百家乐园36bol在线| 百家乐官网赌场赌场网站| 德州扑克 玩法| 永利高百家乐怎样开户| 博彩百家乐官网心得| 大发888娱乐场下载lm0| 百家乐官网游戏种类| 肯博百家乐官网现金网| 大发888娱乐游戏账号| 天天百家乐官网的玩法技巧和规则| 轮盘必胜法|