在自動駕駛的感知領域,行業內分成了立場鮮明的兩派——視覺派和激光雷達派。特斯拉是視覺派最堅定的守護者,甚至不惜用一切最惡毒的形容詞將激光雷達貶到一無是處。但按照埃隆·馬斯克一貫的作風,在“詛咒”某些事情的背后,他一定也在“敬畏”某些事情。
當一個系統想要變得可靠,一個關鍵原則是把這個系統做“冗余”。因此,汽車行業里的多數人,都在為這個極度需要可靠的物件做加法。
但特斯拉恰恰相反,它不斷地在為汽車做減法:大幅降低車輛線束長度、大幅減少車身零部件數量、大幅壓縮生產制造工序。所有這一切都是從技術快速落地的商業化考慮——足夠便宜,用戶才能接受。
如果秉持同樣的出發點,就不難理解埃隆·馬斯克多次在公開場合對激光雷達無下限的貶低:
2015年10月——激光雷達毫無意義,對于自動駕駛汽車來說沒有必要。
2017年4月——激光雷達很差勁,他們會拋棄激光雷達,記住我的話,這是我的預測。
2018年2月——激光雷達昂貴、丑陋、沒有必要。
2019年4月——激光雷達就像人身上長了一堆闌尾,闌尾本身的存在基本是無意義的,如果長了一堆的話,那就太可笑了。任何依賴激光雷達的公司都可能無疾而終。
當然,從事實的結果來講,馬斯克有足夠的資本藐視激光雷達,因為依靠視覺方案的特斯拉是目前公認這個星球上將量產輔助駕駛做到最好的公司。
但是,埃隆·馬斯克真的就將激光雷達踩在腳底了嗎?恰恰相反,他清楚地認識到視覺與激光雷達的優劣勢,同時不斷推動讓視覺方案做到本只能由激光雷達做到的事情。
特斯拉為何不用激光雷達?
理論上說,視覺與激光雷達是完美的互補體。
視覺方案中的圖像傳感器能以高幀率、高分辨率獲取周圍復雜的環境信息,且價格便宜。但圖像傳感器是一種被動式傳感器,其本身并不發光,成像質量受到環境亮度影響較大,在惡劣環境下完成感知任務的難度會大幅提升。
激光雷達是一種主動式傳感器,通過發射脈沖激光并探測目標的散射光特性獲取目標的深度信息,具有精度高、范圍大、抗干擾能力強的特性。但是,激光雷達獲取的數據稀疏無序、難以直接利用,且激光單色的特性讓其無法獲取顏色和紋理信息。
所以,基于可靠性的考慮,行業中多數人在研究的是如何將視覺與激光雷達所獲得的信息進行融合,實現更加精確的環境感知。
但在馬斯克看來,無論是汽車還是道路,都是人類為人類設計的。既然人類可以通過視覺收集信息+大腦處理信息的方式進行安全駕駛,那就意味著自動駕駛也可以通過同樣的方式實現。如果強行加入一個激光雷達作為“超人感官”,就好比人在行走時拿著一根拐杖。
顯然,拐杖不是創新,而是限制創新。
另一方面,激光雷達的高成本,以及因為加入激光雷達后造成電氣系統的復雜,不符合特斯拉一貫做減法的造車理念。
視覺的瓶頸在算法,激光雷達的瓶頸在原理。顯然,視覺具有更大的開發潛力,也擁有理論上更高的上限。做對的事情,不做容易的事情,也是一直以來馬斯克的作風。
至于在公開場合頻繁唱衰激光雷達,就權當是特斯拉及埃隆·馬斯克出色公關水平的一種體現。
特斯拉如何克服視覺劣勢?
從2D平面圖像推斷精確的3D立體實景,實際上是非常困難的。
以下圖中這輛MPV為例,如果只看左側的2D圖像,似乎用視覺和激光雷達標注的形狀都是準確的,但是如果放在3D的場景中,就會發現使用視覺方案標注的形狀不僅偏長、偏窄,而且缺少了汽車的側面。
因為在2D圖像中,很容易找到車輛的左前角和右后角,但是左后角卻沒有明顯的特征,由于車輛尾部的傾斜、向上收窄,就會造成對整體寬度的低估。同時,依靠發動機艙蓋超出車頂的部分估算車長,也會導致在縱深方向上的高估。
而這還僅僅是一個在高亮度環境下相對規則的物體,如果環境變暗,或是加入更多的遮蔽物、障礙物,情況會變得更加極端。比如在黑暗樹蔭中的二輪車,純視覺方案很難分辨。
因此,從根本算法上解決視覺信息的準確處理,就是特斯拉自動駕駛體系的絕對核心技術。
實現自動駕駛功能,更多的是技巧、記憶和經驗,而不只是推理和計算,深度學習的算法就是為了提高自動駕駛的成熟程度。特斯拉完善視覺算法的一大優勢,就是通過海量的車主駕駛數據,進行神經網絡訓練,從而不斷覆蓋更多的工況與場景,達到視覺算法無限接近人類判斷的目的。
這一方面取決于特斯拉自動駕駛硬件的高算力,另一方面是特斯拉在“模式識別模型”領域的絕對領先——超大的數據規模、多樣化的數據覆蓋度、真實的數據場景。歸根到底,全世界超過百萬輛的特斯拉車主,都是特斯拉自動駕駛算法訓練的眾測者。
這里不得不提的就是特斯拉獨有的“影子模式”,這是特斯拉在不影響算法訓練的速度與準確性的基礎上,大幅降低因數據量過大造成訓練成本提升的關鍵。
藏在駕駛員背后的“影子”,始終在觀察外部環境與駕駛員的動作。如果在某個特定場景中駕駛員的操作與“影子”預想的一致,那么數據不會被上報;如果“影子”發現它的判斷與駕駛員操作不相符,那么這次的數據就會被送到特斯拉的服務器中,并對算法進行修正性訓練,達到一定程度后再次下發到車輛中。
這個過程中,駕駛員不會有任何感知,但特斯拉事實上已經完成了“模式識別-算法學習-反饋-升級-應用”的閉環。正是在無數次的訓練后,特斯拉不斷提升視覺方案的精度,克服視覺方案固有的劣勢,并且將算法優勢變成牢不可破的技術門檻。
用視覺替代激光雷達,可能嗎?
特斯拉最終希望達到的目的,是讓其視覺處理能力達到激光雷達的可見性,在行業中被稱為“偽激光雷達”。
激光雷達通過每個激光點的距離,實時還原環境。而特斯拉則是要去預測每個像素的深度,然后將其投射出來,從而復制激光雷達的功能。
分析2D圖像的每個像素,將其還原成真實的3D場景,毫無疑問其中的核心能力,依然是圖像處理的算法以及支持這一算法的高算力硬件,也是特斯拉將其視覺方案進一步升級的體現。
這就不難理解,為何特斯拉一定要將其自動駕駛系統的研發深入到芯片級。
在特斯拉公開展示的通過“偽激光雷達”還原的3D地圖中,明亮環境下已經非常接近于激光雷達的效果,但相信這只是一個階段性成果,更多的場景仍然有待考察。“偽激光雷達”這項從2018年才開始在學術界有可見報道的研究,對特斯拉同樣是一個極具探索挑戰的問題。
但如果特斯拉要依靠純視覺方案解決L4乃至L5級別的完全自動駕駛,通過強大的計算能力解決2D圖像到3D實景的轉換,是必須要攻克的難關。
寫在最后
如果一個人還在使用指南針和地圖,此時你給他一個GPS,意味著只是提供了解決問題的一個極有價值的工具,但卻沒有解決問題。激光雷達是那個解決問題的工具,但是視覺方案也許能從一個新的維度解決問題。
是視覺方案變強大的速度更快,還是激光雷達降價的速度更快?無人能給出答案,所以才會產生今天的行業路線紛爭,每一種路線的踐行者都堅信自己會是最終的勝利者。在無比自信的馬斯克身上,這點體現得尤為明顯。
責任編輯:pj
-
傳感器
+關注
關注
2553文章
51402瀏覽量
756612 -
激光雷達
+關注
關注
968文章
4026瀏覽量
190411 -
自動駕駛
+關注
關注
785文章
13932瀏覽量
167009
發布評論請先 登錄
相關推薦
評論