• 正文
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

自動(dòng)駕駛中常說的“決策”“規(guī)劃”有區(qū)分嗎?

05/28 16:00
428
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

 

自動(dòng)駕駛系統(tǒng)的整體架構(gòu)中,“決策”與“規(guī)劃”雖然常常并列出現(xiàn),卻承擔(dān)著各自獨(dú)特而又緊密關(guān)聯(lián)的職責(zé)。把它們比作一輛駛向目的地的汽車,決策就像司機(jī)根據(jù)道路狀況、交通規(guī)則和出行需求做出“要去哪里”“何時(shí)變道”“是否超車”等選擇,而規(guī)劃則是按照這些指令算出最佳路線與行駛方式,確保車輛平穩(wěn)、安全地到達(dá)目標(biāo)。要想讓自動(dòng)駕駛既聰明又可靠,就必須讓這兩大模塊各司其職、相互配合。

先從概念上說,決策(Decision Making)回答的是“做什么”的問題。在感知模塊識(shí)別出周圍環(huán)境后,決策模塊會(huì)綜合高精度地圖信息、道路交通規(guī)則、周圍車輛和行人的動(dòng)態(tài)狀態(tài),以及乘客的出行意圖,決定車輛接下來要執(zhí)行的行為——比如繼續(xù)直行、進(jìn)入左轉(zhuǎn)車道、跟隨前車、超車或停車避讓等。決策過程既要考慮安全,也要顧及效率和舒適度,它需要在各種可能性中權(quán)衡利弊,選擇最合適的操作。

而規(guī)劃(Planning)則是回答“怎么做”的問題。它分為路徑規(guī)劃和運(yùn)動(dòng)規(guī)劃兩個(gè)層次,路徑規(guī)劃會(huì)在二維道路幾何空間內(nèi)畫出滿足交通規(guī)則的可行軌跡,避開固定障礙、遵循車道線;運(yùn)動(dòng)規(guī)劃則在此基礎(chǔ)上注入時(shí)間維度,根據(jù)車輛的動(dòng)力學(xué)模型與舒適度指標(biāo)計(jì)算速度、加速度和轉(zhuǎn)向角度,以生成連貫的時(shí)空曲線,并實(shí)時(shí)調(diào)整以應(yīng)對(duì)突發(fā)情況。簡(jiǎn)單地說,決策告訴車輛“我要到這里去”,規(guī)劃則畫出一條既安全又平順的道路,讓車輛知道“如何駛過這段路”。

之所以要將決策與規(guī)劃分開設(shè)計(jì),第一是為了模塊化管理,決策可以專注于戰(zhàn)術(shù)層面和策略選擇,而規(guī)劃則聚焦于最優(yōu)化算法與車輛運(yùn)動(dòng)學(xué),兩者各自獨(dú)立地優(yōu)化與測(cè)試;第二是因?yàn)檫@種分層也方便算法靈活迭代。工程實(shí)踐中,大多數(shù)廠商都采用感知→決策→規(guī)劃→控制的典型流水線,讓每個(gè)環(huán)節(jié)在相對(duì)清晰的接口下運(yùn)行,這樣在感知升級(jí)或算法改進(jìn)時(shí),其他模塊的改動(dòng)影響更小,也更便于問題定位與性能調(diào)優(yōu)。

決策模塊如果給出了一個(gè)難以實(shí)現(xiàn)或安全邊際過低的指令,規(guī)劃往往無法生成合格的軌跡;而規(guī)劃層若在細(xì)節(jié)上過于保守,又可能錯(cuò)失良好的行駛機(jī)會(huì),導(dǎo)致整體效率下降。如決策下達(dá)“在前方200米處超車”時(shí),如果規(guī)劃算法在考慮到鄰道車輛速度差或道路寬度不足后合情合理地放棄,系統(tǒng)就需要有反饋機(jī)制,將該信息傳回決策層,讓它重新評(píng)估或調(diào)整策略。只有這樣,上下游才能形成閉環(huán)協(xié)同。

隨著算力和算法的進(jìn)步,業(yè)界已經(jīng)在探索更緊密的決策—規(guī)劃融合方式。端到端學(xué)習(xí)(End-to-End Learning)將感知、決策和規(guī)劃融為一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò),從原始傳感器數(shù)據(jù)直接輸出控制指令,這種方案在部分封閉測(cè)試場(chǎng)景中表現(xiàn)出色,但在可解釋性和安全驗(yàn)證方面還難以滿足高等級(jí)自動(dòng)駕駛的苛刻要求。還有一種思路是分層強(qiáng)化學(xué)習(xí),將高層行為決策和低層運(yùn)動(dòng)規(guī)劃分別視作不同層次的子任務(wù),通過強(qiáng)化學(xué)習(xí)框架共同優(yōu)化,但在樣本效率和線上安全性方面依然存在諸多挑戰(zhàn)。

還有一種更可行的做法,那就是是在傳統(tǒng)方案中加入“可行性反饋”與“動(dòng)態(tài)復(fù)盤”機(jī)制。仔細(xì)來說,就是當(dāng)規(guī)劃發(fā)現(xiàn)當(dāng)前決策目標(biāo)有較高風(fēng)險(xiǎn)或難以執(zhí)行時(shí),會(huì)自動(dòng)回饋給決策模塊,促使其對(duì)行為目標(biāo)進(jìn)行重新評(píng)估,甚至觸發(fā)備用策略。這樣,系統(tǒng)就不再是被動(dòng)執(zhí)行單向指令,而是在決策與規(guī)劃之間形成彈性閉環(huán),顯著提升對(duì)復(fù)雜環(huán)境的適應(yīng)能力。

對(duì)于自動(dòng)駕駛系統(tǒng)來說,決策的質(zhì)量決定了車輛能否做出合理、及時(shí)的戰(zhàn)術(shù)選擇,而規(guī)劃的優(yōu)劣則影響行駛的平順性和能耗效率。一個(gè)反應(yīng)遲緩的決策會(huì)錯(cuò)失超車或并道時(shí)機(jī);一個(gè)過度保守的規(guī)劃會(huì)導(dǎo)致頻繁減速、轉(zhuǎn)向突兀,影響乘客舒適感并浪費(fèi)能源。只有讓這兩者通力合作,才能在保證安全的前提下,實(shí)現(xiàn)道路通行效率與乘坐體驗(yàn)的雙重提升。

隨著自動(dòng)駕駛技術(shù)加速落地,決策與規(guī)劃模塊化融合的邊界將更加模糊。端到端與分層混合的架構(gòu)會(huì)日益成熟,把更多“經(jīng)驗(yàn)式知識(shí)”融入神經(jīng)網(wǎng)絡(luò);此外,為了滿足法規(guī)和行業(yè)規(guī)范的可追溯性,必要的規(guī)則化組件和冗余安全機(jī)制仍不可或缺。理想的解決方案或?qū)⑹恰盎旌现悄堋?,也就是說在常見、可預(yù)測(cè)場(chǎng)景下啟用高效的學(xué)習(xí)型網(wǎng)絡(luò),在極端或新奇場(chǎng)景下切換回基于規(guī)則與優(yōu)化的傳統(tǒng)模塊,并讓兩者在共享數(shù)據(jù)與接口的基礎(chǔ)上,實(shí)時(shí)切換與互為補(bǔ)充。

總之,決策與規(guī)劃雖為不同概念,卻是自動(dòng)駕駛大廈的兩根支柱。只有在設(shè)計(jì)時(shí)充分考慮它們的協(xié)同與反饋,讓決策指令切實(shí)可執(zhí)行、讓規(guī)劃結(jié)果不斷反哺決策,才能在變幻莫測(cè)的道路環(huán)境中保障安全、提升效率,進(jìn)而推動(dòng)自動(dòng)駕駛技術(shù)邁向真正成熟與普及的時(shí)代。

相關(guān)推薦