自動(dòng)駕駛技術(shù)的發(fā)展在路徑選擇上呈現(xiàn)出多樣化的趨勢(shì),在2020年左右,業(yè)內(nèi)還是非常看好車路協(xié)同的方向,但隨著技術(shù)的逐漸成熟和落地,單車智能成為主要選擇。在自動(dòng)駕駛架構(gòu)的選擇上,也經(jīng)歷了從感知、決策控制、執(zhí)行的三段式架構(gòu)到現(xiàn)在火熱的端到端大模型,尤其是在2024年特斯拉推出FSD V12后,各車企更是陸續(xù)推出自家的端到端大模型,這一概念也成為各車企發(fā)布會(huì)的重頭戲。
但很多小伙伴在面對(duì)這兩項(xiàng)技術(shù)時(shí),一直無法厘清他們的區(qū)別,尤其是端到端大模型,更是鮮有清晰的認(rèn)知,只知道端到端是會(huì)讓自動(dòng)駕駛更加“人”性化。今天智駕最前沿就用一個(gè)生動(dòng)有趣的例子帶大家理解這兩個(gè)概念。
基于規(guī)則的決策
顧名思義,基于規(guī)則的感知就是依賴于專家制定的算法和明確的邏輯規(guī)則,通常采用模塊化設(shè)計(jì)。感知系統(tǒng)將如圖像預(yù)處理、目標(biāo)檢測(cè)、跟蹤、決策等復(fù)雜的任務(wù)劃分為多個(gè)子任務(wù),每個(gè)模塊獨(dú)立完成特定功能。這種方法的主要優(yōu)勢(shì)在于可解釋性強(qiáng)和調(diào)試方便。當(dāng)系統(tǒng)出現(xiàn)錯(cuò)誤時(shí),工程師可以根據(jù)模塊劃分和預(yù)設(shè)規(guī)則快速定位問題,并通過更新規(guī)則或算法參數(shù)進(jìn)行修正。此外,模塊化設(shè)計(jì)便于驗(yàn)證和監(jiān)管,因?yàn)楦鱾€(gè)獨(dú)立組件的行為比較明確,符合目前許多安全標(biāo)準(zhǔn)和行業(yè)規(guī)范。
基于規(guī)則的方法也存在局限。其規(guī)則往往基于先驗(yàn)知識(shí)和經(jīng)驗(yàn)總結(jié),雖然在標(biāo)準(zhǔn)化道路環(huán)境中表現(xiàn)出穩(wěn)定性,但在面對(duì)復(fù)雜、多變或者長(zhǎng)尾情況時(shí),現(xiàn)有規(guī)則難以覆蓋所有異常場(chǎng)景。這種模式使得系統(tǒng)在遭遇非典型、稀有事件時(shí)可能反應(yīng)遲鈍,安全邊界也較為模糊,從而限制了系統(tǒng)整體的魯棒性和泛化能力。
以一個(gè)簡(jiǎn)單的故事來理解這個(gè)概念。在一個(gè)小島上,有兩個(gè)村莊,這兩個(gè)村莊的名字分別為感知村和執(zhí)行村,感知村一直有給執(zhí)行村送信的需求,有位名叫“決策”的快遞員就一直承擔(dān)著這個(gè)任務(wù)。
“決策”這位快遞員在剛開始工作時(shí),領(lǐng)導(dǎo)告訴他執(zhí)行村一共有多少戶人家,在拿到感知村送的信件后,一定要到執(zhí)行村的這幾戶人家一家一家地確認(rèn)(給決策系統(tǒng)列出的規(guī)則),以便可以更好地將信件送到對(duì)應(yīng)的執(zhí)行村居民。
在工作中,“決策”這位快遞員非常守規(guī)則,在感知村拿到標(biāo)有執(zhí)行村村民名字的信件后(感知到交通環(huán)境),都會(huì)到執(zhí)行村從村頭到村尾挨家挨戶地敲門,并將信件封面交給對(duì)應(yīng)村民看,以確定是否為收件人。
由于需要挨家挨戶地敲門并確認(rèn)(確認(rèn)對(duì)應(yīng)的規(guī)則),這期間需要花費(fèi)較多的時(shí)間,且由于信件被很多執(zhí)行村村民都看過,因此會(huì)出現(xiàn)信件丟失的情況(信息丟失)。若在執(zhí)行村新搬進(jìn)來一戶居民,并有感知村村民給其送信(邊緣場(chǎng)景),由于“決策”這位快遞員沒有得到領(lǐng)導(dǎo)新增居民的指令(對(duì)應(yīng)規(guī)則),因此在送對(duì)應(yīng)信件時(shí),不會(huì)去敲新居民的門,信件也無法送到。
端到端大模型
端到端則是利用大規(guī)模數(shù)據(jù)直接訓(xùn)練神經(jīng)網(wǎng)絡(luò),讓模型從原始傳感器數(shù)據(jù)(如攝像頭圖像或激光雷達(dá)點(diǎn)云)直接獲得控制決策或中間特征。這種方法充分利用深度學(xué)習(xí)在模式識(shí)別和特征提取上的優(yōu)勢(shì),能夠自動(dòng)捕捉復(fù)雜場(chǎng)景下的隱含關(guān)聯(lián),并具有較強(qiáng)的泛化能力。在數(shù)據(jù)充足且質(zhì)量較高的前提下,端到端模型在學(xué)習(xí)異常情況和細(xì)微特征時(shí)可能比基于規(guī)則的方法更為靈活,尤其在應(yīng)對(duì)復(fù)雜城市交通環(huán)境、應(yīng)急場(chǎng)景以及多傳感器數(shù)據(jù)融合上表現(xiàn)突出。
其主要缺點(diǎn)在于模型的“黑箱性”——決策過程難以解釋,缺乏明確的邏輯鏈條使得問題排查變得非常復(fù)雜。當(dāng)系統(tǒng)出現(xiàn)失誤或意外情況時(shí),難以依據(jù)具體模塊快速定位錯(cuò)誤,同時(shí)對(duì)訓(xùn)練數(shù)據(jù)的依賴性過高也可能導(dǎo)致數(shù)據(jù)偏差引發(fā)系統(tǒng)泛化能力下降,從而影響整體安全性。
繼續(xù)以之前的例子舉例,隨著“決策”這位快遞員送信經(jīng)驗(yàn)越來越豐富,他發(fā)現(xiàn)原來的工作邏輯存在很多問題,耗費(fèi)時(shí)間也太長(zhǎng),因此他開始思考如何更快更好地將信件送到位(端到端大模型思考特性)。
在給執(zhí)行村送信時(shí),他開始記住對(duì)應(yīng)執(zhí)行村居民的名字,在拿到信件后,不會(huì)再?gòu)拇孱^到村尾一家一戶地敲門,而是看對(duì)應(yīng)的信件名字,直接將信件送到對(duì)應(yīng)住戶(端到端),這一改變使得送信效率得到快速提升。
在遇到執(zhí)行村有新居民搬來后(邊緣場(chǎng)景),“決策”一開始也會(huì)送信失誤,但他會(huì)主動(dòng)去記住新搬來居民的名字(思考過程),并在后面拿到對(duì)應(yīng)的信件后,快速將信件送到位。
這一方法的確是有效提升了送信效率,但由于不再遵守領(lǐng)導(dǎo)要求的挨家挨戶敲門的指令(不基于規(guī)則),若出現(xiàn)送信失誤(出現(xiàn)事故),領(lǐng)導(dǎo)無法確定“決策”走的是哪條路線,因此也無法問責(zé)(端到端“黑箱”特性)。
寫在最后
以上舉的例子僅簡(jiǎn)單概述了基于規(guī)則的決策和端到端,以便大家簡(jiǎn)單了解這兩個(gè)概念,實(shí)際的技術(shù)一定會(huì)更為復(fù)雜。綜上所述,我們可以看到基于規(guī)則的感知系統(tǒng)的優(yōu)勢(shì)在于整體架構(gòu)清晰、調(diào)試方便、驗(yàn)證容易,適用于已有經(jīng)驗(yàn)積累較多、要求安全可控的應(yīng)用場(chǎng)景;而端到端感知系統(tǒng)則具備更強(qiáng)的自適應(yīng)能力和復(fù)雜場(chǎng)景的處理潛力,能夠自動(dòng)發(fā)現(xiàn)數(shù)據(jù)中的潛在模式,但同時(shí)在可解釋性和安全驗(yàn)證方面存在較大挑戰(zhàn)。
未來的研發(fā)重點(diǎn)應(yīng)更多集中在如何融合兩種方法的優(yōu)勢(shì),而不是選擇其中一個(gè),通過融合,既能保證系統(tǒng)的實(shí)時(shí)、準(zhǔn)確與安全,又可以提高整體系統(tǒng)對(duì)多變路況的容錯(cuò)及適應(yīng)能力。隨著數(shù)據(jù)積累與算力提升,混合型設(shè)計(jì)有望成為自動(dòng)駕駛系統(tǒng)的新趨勢(shì),推動(dòng)自動(dòng)駕駛朝著更加智能、可靠和普及的方向發(fā)展。