• 正文
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

自動駕駛中純視覺替代不了激光雷達?

06/11 11:22
482
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

 

隨著自動駕駛技術(shù)的不斷發(fā)展,純視覺和激光雷達(LiDAR)兩種主流環(huán)境感知成為了大家的熱議話題?;?a class="article-link" target="_blank" href="/baike/482292.html">攝像頭的“純視覺”方案在成本、分辨率和語義理解方面取得顯著優(yōu)勢,不少人設(shè)想“移除LiDAR,只用攝像頭+AI”也能實現(xiàn)可靠感知。但現(xiàn)實遠比想象復雜,為什么純視覺難以完全替代LiDAR?

首先要知道,攝像頭與LiDAR的工作原理截然不同。攝像頭通過光學透鏡和圖像傳感器獲取二維彩色圖像,記錄場景的顏色、紋理和光照等信息。LiDAR則發(fā)射激光脈沖,測量光脈沖從發(fā)射到接收的飛行時間(Time-of-Flight),直接計算出與物體間的距離,生成高精度、三維結(jié)構(gòu)的點云。二者獲取的信息維度和性質(zhì)也不同,攝像頭擅長提取紋理與語義,但不具備直接的物理深度測量能力;LiDAR以毫米至厘米級精度測距,但缺乏顏色與細節(jié)紋理信息。

想要實現(xiàn)三維空間重建,攝像頭需要借助雙目立體視覺或深度學習算法來推測深度。雙目視覺通過左右攝像頭之間的視差進行三角測量,短距離內(nèi)準確度尚可,但隨著目標距離加大,視差越來越小,深度誤差迅速放大。此外,紋理稀少的平面、強光直射或陰影區(qū)域,都會導致特征匹配失敗,使深度誤差進一步增大。而基于單目深度估計的深度學習模型雖然在某些公開數(shù)據(jù)集上表現(xiàn)不錯,但本質(zhì)上依賴于統(tǒng)計推斷,一旦訓練數(shù)據(jù)與實際駕駛場景存在分歧,就會出現(xiàn)誤判;而且單目網(wǎng)絡只能輸出相對尺度深度,需要結(jié)合里程計等其他信息才能還原絕對距離,這些外部信息自身也會引入額外誤差。

同時,攝像頭對光照條件極其敏感。在夜間、隧道口或迎光行駛時,圖像容易出現(xiàn)噪點或過曝,嚴重影響目標檢測和跟蹤算法的準確性。即使加裝紅外補光或高感光度傳感器,也會增加系統(tǒng)成本和功耗。相比之下,LiDAR幾乎不受外界可見光影響,可以在弱光甚至全黑環(huán)境下正常工作,保證夜間的距離測量精度。再有,惡劣天氣對攝像頭的影響也尤為顯著,大霧會散射可見光,使圖像對比度驟減,輪廓模糊;大雨時,雨滴附著在鏡頭上會造成圖像畸變;積雪則可能遮擋車道線和障礙物。雖然可以用去霧、去雨等圖像恢復算法在一定程度上緩解問題,但要恢復到無瑕影響的狀態(tài),在真實高速行駛環(huán)境下非常困難。LiDAR在雨雪天氣下也會受到水滴和雪花的影響,但LiDAR可以通過多脈沖濾波、強度抑制和硬件優(yōu)化,能在一定程度上濾除雜波并保持測距穩(wěn)定性。

不可否認,攝像頭具有顏色和紋理優(yōu)勢,可用于像素級的語義分割、交通標志識別、車道線檢測等任務?;谏疃葘W習的語義分割網(wǎng)絡,能夠準確區(qū)分行人、車輛、建筑物等不同類別信息,為自動駕駛決策提供豐富上下文。而LiDAR僅提供稀疏點云,缺乏顏色信息,需要通過點云深度學習算法進行分類和分割,不如圖像直觀,但近年來,點云深度學習技術(shù)取得了顯著進展,使LiDAR在語義分割領(lǐng)域性能不斷提升。

現(xiàn)如今,自動駕駛系統(tǒng)往往采用多傳感器融合,將LiDAR與攝像頭數(shù)據(jù)進行緊耦合,使二者優(yōu)勢互補。如將點云投影到圖像平面,用深度學習網(wǎng)絡對圖像進行語義分割后,再與LiDAR點云進行配準,可同時獲得高精度的三維幾何信息與豐富的語義標簽。這樣,即便在夜間視線差時,LiDAR也能補充深度信息;在交通標志識別場景中,攝像頭的彩色高分辨率畫面更易于識別標志細節(jié)。若僅憑純視覺進行三維測距與語義理解,一旦遭遇突發(fā)光照變化或遮擋情況,就可能導致感知系統(tǒng)失靈,進而危及行車安全。

為什么大家會研究純視覺,其實這是從成本方面在考慮,攝像頭價格僅為幾百至幾千元人民幣,而高精度的多線束LiDAR動輒數(shù)萬元甚至十幾萬元。很多車企都試圖通過純視覺方案降低傳感器成本,但想要滿足自動駕駛系統(tǒng)的安全冗余與法規(guī)合規(guī),就不得不選配更高分辨率、更高靈敏度的工業(yè)級相機,或者增加紅外輔助設(shè)備,其成本已經(jīng)接近或超過低端LiDAR。為了提取和推斷深度信息以及運行復雜的圖像算法,還需要更強大的算力平臺,使得算力成本和功耗大幅提升。相比之下,LiDAR輸出的點云數(shù)據(jù)本身就是幾何化的物理量,后端處理鏈路相對簡單,對算力需求更低,綜合來看,LiDAR或許并非想象中那么難以承受。

在可靠性與冗余設(shè)計上,LiDAR表現(xiàn)也更勝一籌。知名LiDAR廠商如Velodyne、Innoviz、Ouster等,通過不斷優(yōu)化硬件與散熱結(jié)構(gòu),使設(shè)備在高溫、低溫、震動、雨雪等惡劣環(huán)境下保持穩(wěn)定性能。攝像頭在極端溫度或劇烈顛簸時,鏡頭可能出現(xiàn)對焦漂移、圖像模糊或傳感器噪聲,影響圖像質(zhì)量與算法輸出。一旦攝像頭失效或性能大幅下降,就需依賴其他傳感器保證冗余,而最可靠的備份傳感器正是LiDAR。若放棄LiDAR,僅靠攝像頭與毫米波雷達的組合,在探測遠距離小目標(如行人、騎行者)時依舊存在盲區(qū);毫米波雷達分辨率較低,無法準確區(qū)分近距離障礙物的精細輪廓,更談不上生成高精度三維地圖。

在高精度地圖構(gòu)建與實時定位方面,LiDAR也具備顯著優(yōu)勢。稠密的三維點云可直接用于構(gòu)建高精度地圖,記錄道路兩側(cè)護欄、路緣、建筑物等靜態(tài)環(huán)境特征,為車輛定位提供可靠參考。視覺SLAM(同時定位與地圖構(gòu)建)技術(shù)不斷進步,但在光照變化劇烈、重復紋理或者弱光場景時,特征點提取與跟蹤易失敗,導致定位漂移。LiDAR SLAM則基于高精度距離測量,即使在夜間或灰暗環(huán)境下也能穩(wěn)定定位,整體魯棒性更高。要想用純視覺方案構(gòu)建與LiDAR相媲美的高精度地圖,必須投入海量標定、手動修正和算法開發(fā),成本與復雜度極大增加。

當然,在部分如倉庫自動搬運、校園巡檢或低速Robotaxi低速、場景可控的應用中,純視覺方案結(jié)合毫米波雷達或超聲波傳感器,也能實現(xiàn)較為穩(wěn)健的感知效果且成本較低。但一旦涉及高速公路、高密度城市道路或多變天氣場景,僅靠攝像頭就難以確保足夠的安全。LiDAR提供的高精度、高幀率三維點云,能夠降低測速測距誤差,給系統(tǒng)留出更寬裕的反應時間,顯著提高行駛安全性。

隨著技術(shù)發(fā)展,LiDAR正朝著更小型化、低成本、高精度方向快速迭代。固態(tài)LiDAR(Static LiDAR)通過硅光子或MEMS微鏡實現(xiàn)無需機械旋轉(zhuǎn)的光束掃描,成本與尺寸不斷下降,可靠性日益提高。隨著生產(chǎn)規(guī)模擴大,LiDAR價格有望逐漸逼近平民價位,使其與攝像頭在成本上的差距進一步縮小。而想要讓純視覺在所有行駛場景下達到LiDAR級別的測距與魯棒性能,需要在算法和硬件層面實現(xiàn)跨越式突破,短期內(nèi)難以實現(xiàn)。

從算法角度考慮,深度學習可以通過海量數(shù)據(jù)訓練網(wǎng)絡提取圖像特征,并基于視覺內(nèi)容進行深度推斷,但這始終是一種經(jīng)驗性感知,缺乏物理測量的可解釋性與確定性。一旦遇到如某條陌生道路、特殊建筑物外觀、不同天氣條件下的新型障礙物訓練數(shù)據(jù)覆蓋不到的場景,純視覺系統(tǒng)就可能發(fā)生盲區(qū)或誤判。LiDAR輸出的點云代表真實的幾何距離,噪聲與誤差可以在濾波階段進行定量處理,可解釋性更強,能為決策模塊提供更穩(wěn)定的輸入。

對于很多消費者來說,LiDAR的存在證明該自動駕駛汽車更加安全。當用戶看到車頂或車窗旁安裝著LiDAR時,更容易相信車輛的感知能力。純視覺方案盡管在演示中表現(xiàn)良好,但用戶對“僅靠相機來測距”的擔憂依然存在。在短期商業(yè)化推廣中,LiDAR不僅是技術(shù)選型,更是品牌與安全承諾的象征。

綜上所述,盡管純視覺感知技術(shù)在目標檢測、語義分割和深度估計等方面取得了顯著進展,并且在成本層面具備一定優(yōu)勢,但由于其先天無法獲得高精度物理距離、對光照和天氣條件敏感、算法對算力依賴高以及可解釋性不足等多重局限,純視覺難以完全取代LiDAR。LiDAR憑借高精度、高魯棒性和良好環(huán)境適應性,依舊是自動駕駛感知系統(tǒng)中的核心傳感器。未來的最優(yōu)方案,仍是通過攝像頭與LiDAR、毫米波雷達等多種傳感器的跨模態(tài)融合,構(gòu)建多冗余、多維度的全場景感知體系,為自動駕駛提供更高水平的安全保障與智能駕駛體驗。

相關(guān)推薦