感知系統(tǒng)作為自動(dòng)駕駛汽車(chē)的“眼睛”和“神經(jīng)中樞”,扮演著至關(guān)重要的角色,自動(dòng)駕駛車(chē)輛需要依靠傳感器獲取外部環(huán)境信息,以便在瞬息萬(wàn)變的道路上準(zhǔn)確而及時(shí)地做出決策。激光雷達(dá)(Lidar)作為一種高精度傳感器,一直被視為構(gòu)建精確三維地圖和實(shí)時(shí)環(huán)境重構(gòu)的關(guān)鍵設(shè)備,而特斯拉CEO埃隆·馬斯克卻反復(fù)表示,激光雷達(dá)是“錯(cuò)誤的解決方案”,他認(rèn)為人類(lèi)駕駛完全依靠視覺(jué)及大腦神經(jīng)網(wǎng)絡(luò),自動(dòng)駕駛同樣應(yīng)該模仿這一生物學(xué)原理,采用純視覺(jué)方案。
純視覺(jué)和激光雷達(dá),各有何優(yōu)勢(shì)?
其實(shí)在自動(dòng)駕駛技術(shù)初期,激光雷達(dá)因其能以極高的精度獲取三維點(diǎn)云數(shù)據(jù),迅速成為眾多研發(fā)團(tuán)隊(duì)的首選傳感器。激光雷達(dá)利用激光脈沖掃描周?chē)h(huán)境,經(jīng)過(guò)時(shí)間飛行法(Time-of-Flight)計(jì)算出各個(gè)目標(biāo)物體的距離,從而構(gòu)建出精細(xì)的空間模型。其在距離測(cè)量、物體識(shí)別以及場(chǎng)景重構(gòu)方面具備無(wú)可比擬的優(yōu)勢(shì),尤其在較低光照條件下和復(fù)雜城市環(huán)境中,激光雷達(dá)的數(shù)據(jù)能夠提供可靠的定位信息和障礙物檢測(cè)。但正是因?yàn)槠涓呔群途軆x器的特性,激光雷達(dá)的制造成本、設(shè)備體積以及能耗等問(wèn)題使得它在大規(guī)模商業(yè)化時(shí)面臨不小的挑戰(zhàn)。此外,由于激光雷達(dá)只能輸出點(diǎn)云數(shù)據(jù),其缺乏色彩、紋理等語(yǔ)義信息,在復(fù)雜場(chǎng)景中對(duì)于物體的細(xì)粒度分類(lèi)和語(yǔ)義理解仍存在局限性。
與激光雷達(dá)相比,純視覺(jué)方案則是依靠車(chē)載攝像頭采集高分辨率的圖像數(shù)據(jù),再利用深度學(xué)習(xí)算法進(jìn)行目標(biāo)檢測(cè)、語(yǔ)義分割和三維重建。這種技術(shù)路線(xiàn)試圖直接模擬人類(lèi)駕駛員利用眼睛和大腦對(duì)環(huán)境進(jìn)行感知與判斷的過(guò)程。通過(guò)神經(jīng)網(wǎng)絡(luò)對(duì)圖像數(shù)據(jù)進(jìn)行特征提取,純視覺(jué)系統(tǒng)能夠獲得如交通標(biāo)志、車(chē)道線(xiàn)、行人和其他車(chē)輛等豐富的場(chǎng)景信息,從而構(gòu)建出一個(gè)語(yǔ)義化的環(huán)境模型。近年來(lái),隨著卷積神經(jīng)網(wǎng)絡(luò)(CNN)、Transformer等深度學(xué)習(xí)模型的不斷進(jìn)步以及端到端學(xué)習(xí)方法的發(fā)展,純視覺(jué)系統(tǒng)在目標(biāo)檢測(cè)和場(chǎng)景理解上取得了顯著突破,不僅降低了硬件成本,而且極大地提升了數(shù)據(jù)處理的靈活性和實(shí)時(shí)性。
馬斯克曾強(qiáng)調(diào):“人類(lèi)開(kāi)車(chē)時(shí)不會(huì)用眼睛發(fā)射激光”,他認(rèn)為,既然生物進(jìn)化出的是依靠視覺(jué)和大腦進(jìn)行環(huán)境判斷的系統(tǒng),那么自動(dòng)駕駛汽車(chē)也應(yīng)當(dāng)模擬這一過(guò)程,使用攝像頭和人工智能來(lái)完成感知任務(wù)。特斯拉早在幾年之前就開(kāi)始了純視覺(jué)系統(tǒng)的研發(fā),并逐步放棄了激光雷達(dá)和超聲波傳感器的依賴(lài),轉(zhuǎn)而利用全車(chē)布置的車(chē)載攝像頭獲取全景圖像數(shù)據(jù),再通過(guò)大規(guī)模數(shù)據(jù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)對(duì)道路、交通標(biāo)志、障礙物的識(shí)別和追蹤。特斯拉的這種方法不僅簡(jiǎn)化了傳感器融合的過(guò)程,而且利用端到端學(xué)習(xí)架構(gòu),能夠在數(shù)據(jù)閉環(huán)中不斷自我迭代、提升系統(tǒng)魯棒性。純視覺(jué)方案并非萬(wàn)能。雖然其在日常駕駛環(huán)境中能展現(xiàn)出極高的識(shí)別精度,但在如大雨、濃霧或夜間低光環(huán)境等極端天氣下,攝像頭獲取的圖像質(zhì)量會(huì)受到嚴(yán)重影響,可能導(dǎo)致識(shí)別錯(cuò)誤或漏檢。此外,純視覺(jué)系統(tǒng)在面對(duì)突發(fā)情況或邊緣案例時(shí),其系統(tǒng)的泛化能力和魯棒性也面臨巨大挑戰(zhàn)。為了應(yīng)對(duì)這些問(wèn)題,研究人員不斷引入高動(dòng)態(tài)范圍成像(HDR)、圖像增強(qiáng)以及多尺度特征融合等技術(shù)手段,以期提高純視覺(jué)系統(tǒng)在惡劣環(huán)境下的適應(yīng)性和穩(wěn)定性。未來(lái)隨著深度學(xué)習(xí)算法的不斷優(yōu)化和算力的持續(xù)提升,純視覺(jué)系統(tǒng)的缺陷將逐步被克服,其在自動(dòng)駕駛領(lǐng)域的應(yīng)用前景十分廣闊。
傳感器融合的必要性
現(xiàn)階段自動(dòng)駕駛車(chē)輛的感知系統(tǒng)通常采用多傳感器融合的策略,以期在各種場(chǎng)景下都能獲得較高的安全性和魯棒性。在許多商業(yè)化項(xiàng)目中,激光雷達(dá)、攝像頭、毫米波雷達(dá)和超聲波傳感器往往會(huì)組合使用,通過(guò)數(shù)據(jù)融合技術(shù)將不同傳感器的數(shù)據(jù)進(jìn)行對(duì)齊和整合。這樣一來(lái),即使單一傳感器在某些情況下出現(xiàn)性能下降,其他傳感器依然可以提供必要的冗余保障。如在雨天或霧霾天氣中,攝像頭可能失效,但毫米波雷達(dá)憑借其抗干擾能力和全天候工作特性,仍可提供較為準(zhǔn)確的距離信息;而在光線(xiàn)充足、交通密集的城市環(huán)境中,高精度的激光雷達(dá)數(shù)據(jù)則能夠幫助系統(tǒng)實(shí)現(xiàn)精細(xì)的三維建模。
多傳感器融合雖然增加了系統(tǒng)復(fù)雜性和成本,但在當(dāng)前自動(dòng)駕駛安全性要求極高的背景下,仍然是確保駕駛安全的重要手段。業(yè)內(nèi)一些廠(chǎng)商認(rèn)為,盡管純視覺(jué)方案在理論上更接近人類(lèi)駕駛方式,但在現(xiàn)階段,激光雷達(dá)作為一種精密且可靠的傳感器,仍具有不可替代的地位,特別是在處理那些極端場(chǎng)景和“邊緣案例”時(shí),激光雷達(dá)的數(shù)據(jù)可以作為安全兜底,提供額外保障。技術(shù)路線(xiàn)的選擇不僅僅是一個(gè)單純的硬件問(wèn)題,更是涉及整個(gè)自動(dòng)駕駛系統(tǒng)架構(gòu)的設(shè)計(jì)、數(shù)據(jù)處理和實(shí)時(shí)決策等多方面的綜合考量。傳統(tǒng)的自動(dòng)駕駛系統(tǒng)往往采用模塊化設(shè)計(jì),將環(huán)境感知、路徑規(guī)劃、決策控制等各個(gè)環(huán)節(jié)分開(kāi)獨(dú)立開(kāi)發(fā),隨后通過(guò)數(shù)據(jù)接口進(jìn)行傳遞和融合。這種設(shè)計(jì)雖然便于分工和優(yōu)化,但也容易導(dǎo)致信息在各個(gè)模塊之間的傳遞過(guò)程中發(fā)生誤差累積,從而影響整體系統(tǒng)的性能。相比之下,端到端學(xué)習(xí)方法則試圖將整個(gè)駕駛過(guò)程放在一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)中,通過(guò)大規(guī)模數(shù)據(jù)訓(xùn)練實(shí)現(xiàn)從傳感器輸入到?jīng)Q策輸出的直接映射。這種方法不僅簡(jiǎn)化了系統(tǒng)架構(gòu),而且在數(shù)據(jù)閉環(huán)中可以不斷迭代優(yōu)化,提高系統(tǒng)對(duì)復(fù)雜場(chǎng)景的理解和預(yù)測(cè)能力。特斯拉正是借助這種端到端學(xué)習(xí)方法,力圖構(gòu)建一個(gè)更加高效和智能的駕駛系統(tǒng)。端到端系統(tǒng)的“黑箱”特性也引發(fā)了關(guān)于可解釋性和安全性的討論,如何在追求高性能的同時(shí)確保系統(tǒng)對(duì)異常情況具有足夠的魯棒性,依然是當(dāng)前自動(dòng)駕駛研發(fā)中的重大挑戰(zhàn)。
選擇激光雷達(dá),還是車(chē)載攝像頭?
各大廠(chǎng)商在自動(dòng)駕駛感知技術(shù)上的選擇各有側(cè)重。以特斯拉為代表的企業(yè)堅(jiān)持純視覺(jué)方案,他們相信依靠攝像頭和神經(jīng)網(wǎng)絡(luò)能夠全面模擬人類(lèi)駕駛員的視覺(jué)處理過(guò)程,并且在成本和擴(kuò)展性上具有明顯優(yōu)勢(shì)。特斯拉的純視覺(jué)系統(tǒng)不僅依賴(lài)車(chē)載攝像頭采集360度全景圖像,而且通過(guò)大規(guī)模數(shù)據(jù)采集和端到端學(xué)習(xí),不斷優(yōu)化其自動(dòng)駕駛算法。埃隆·馬斯克曾在公司財(cái)報(bào)電話(huà)會(huì)議上明確表示,“人類(lèi)開(kāi)車(chē)時(shí)用的是眼睛和大腦”,而非依賴(lài)某種“發(fā)射激光”的設(shè)備;這表明他對(duì)模擬生物系統(tǒng)的信心,以及對(duì)純視覺(jué)技術(shù)在未來(lái)自動(dòng)駕駛中的應(yīng)用前景充滿(mǎn)期待。
與此形成鮮明對(duì)比的是,還有許多國(guó)內(nèi)外的自動(dòng)駕駛項(xiàng)目仍然采用多傳感器融合方案,認(rèn)為激光雷達(dá)在高精度地圖構(gòu)建和障礙物檢測(cè)方面具有不可替代的作用。一些國(guó)內(nèi)知名企業(yè)和供應(yīng)商在其系統(tǒng)中依然大量使用激光雷達(dá),以保證在各種復(fù)雜環(huán)境下都能獲得足夠的冗余和安全保障。對(duì)于這些廠(chǎng)商來(lái)說(shuō),激光雷達(dá)作為一種成熟的技術(shù),其穩(wěn)定性和精度經(jīng)過(guò)多年驗(yàn)證,雖然成本較高,但在安全性至上的自動(dòng)駕駛系統(tǒng)中,這些不足可以通過(guò)規(guī)?;a(chǎn)和系統(tǒng)優(yōu)化逐步改善。實(shí)際上,激光雷達(dá)與攝像頭、毫米波雷達(dá)等多傳感器的融合,不僅可以提高感知系統(tǒng)在極端環(huán)境下的可靠性,還能在數(shù)據(jù)層面實(shí)現(xiàn)互補(bǔ),從而構(gòu)建出更加完善的環(huán)境模型。技術(shù)的發(fā)展必然是一個(gè)漸進(jìn)而非一蹴而就的過(guò)程。當(dāng)前,純視覺(jué)方案已經(jīng)在許多測(cè)試和實(shí)際場(chǎng)景中展現(xiàn)出優(yōu)異的性能,特別是在城市道路、交通繁忙區(qū)域和標(biāo)準(zhǔn)環(huán)境下,其成本效益和數(shù)據(jù)處理能力使其成為未來(lái)自動(dòng)駕駛的一大趨勢(shì)。我們也必須認(rèn)識(shí)到,每種技術(shù)都有其適用的場(chǎng)景和局限性。在未來(lái)幾年內(nèi),自動(dòng)駕駛系統(tǒng)的研發(fā)很可能不會(huì)完全摒棄激光雷達(dá),而是會(huì)在技術(shù)成熟度和市場(chǎng)需求的驅(qū)動(dòng)下,逐步實(shí)現(xiàn)傳感器功能的動(dòng)態(tài)整合。也就是說(shuō),在部分場(chǎng)景下,激光雷達(dá)作為高精度和安全兜底的設(shè)備,仍然會(huì)存在;而在其他多數(shù)常規(guī)場(chǎng)景下,純視覺(jué)系統(tǒng)則會(huì)成為主流解決方案。這樣的技術(shù)路徑既體現(xiàn)了安全性與成本之間的平衡,也符合技術(shù)演進(jìn)中不斷優(yōu)化、取長(zhǎng)補(bǔ)短的基本規(guī)律。從宏觀(guān)趨勢(shì)來(lái)看,自動(dòng)駕駛技術(shù)的發(fā)展不僅關(guān)乎單一傳感器的性能,更涉及到整個(gè)生態(tài)系統(tǒng)的構(gòu)建。車(chē)聯(lián)網(wǎng)、5G通信、云計(jì)算和大數(shù)據(jù)分析等技術(shù)的快速發(fā)展,將為自動(dòng)駕駛感知系統(tǒng)提供更為強(qiáng)大的外部支持。通過(guò)車(chē)路協(xié)同、邊緣計(jì)算和云端數(shù)據(jù)整合,未來(lái)的自動(dòng)駕駛車(chē)輛可以在實(shí)時(shí)性和安全性上取得更大突破,從而實(shí)現(xiàn)更加高效和智能的交通管理體系。在這一過(guò)程中,激光雷達(dá)可能會(huì)逐步退出部分主流應(yīng)用場(chǎng)景,但作為安全冗余和高精度測(cè)量的工具,其在中高端市場(chǎng)和特殊場(chǎng)景下仍然具有不可替代的價(jià)值。換句話(huà)說(shuō),激光雷達(dá)并非完全是一段彎路,而是在技術(shù)演進(jìn)的不同階段中承擔(dān)了不同的角色和使命。