• 正文
    • 自動駕駛中的決策難題
    • ChatGPT能給自動駕駛帶來什么?
    • ChatGPT帶來的困難與挑戰(zhàn)
    • 總結
  • 相關推薦
申請入駐 產(chǎn)業(yè)圖譜

大火的ChatGPT能為自動駕駛帶來什么?

2023/02/14
503
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

最近的科技圈,大家都被微軟推出的ChatGPT刷屏,作為工智能公司OpenAI于2022年11月推出的聊天機器人,其能夠通過學習和理解人類的語言來進行對話,還能根據(jù)聊天的上下文進行互動,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼等任務,并且智能性遠超當下所有的人機交互模型。而ChatGPT的轟動也讓谷歌、百度等以搜索為主要業(yè)務的大廠感受到了前所未有的壓力,也隨即推出了自研的類ChatGPT模型,然而實際的使用效果還得打個問號。

那么,如果對于文本的學習已經(jīng)能夠達到如此智能的地步,對于自動駕駛行業(yè),ChatGPT能夠為其帶來什么呢?是否能夠對困擾從業(yè)者多年的決策難題做出突破呢?

自動駕駛中的決策難題

在自動駕駛行業(yè)中,決策規(guī)劃作為整體系統(tǒng)的大腦,處于算法中的核心模塊,對于自動駕駛功能的實現(xiàn)以及安全性的保障起著重要的作用。目前包括輔助駕駛及自動駕駛功能的決策實現(xiàn)上,大多數(shù)企業(yè)都采用了基于規(guī)則的方式,這種方式能夠極大程度地保障在應對不同場景時的決策的安全性。不同于強化學習,強化學習具有致命的弱點,那就是出了問題很難去追溯到原因,只能不停的迭代更新模型,以針對當前場景獲得期望的輸出結果。

另一方面,強化學習需要進行大規(guī)模的訓練,這樣對其執(zhí)行結果的評價也是難點之一,如果不能合理地評價模型給出的結果,那么決策的智能性則無法進步,甚至在極端場景下給出錯誤的決定,讓車輛處于危險之中。以上種種原因,使得在自動駕駛行業(yè)中,基于強化學習的決策規(guī)劃系統(tǒng)還遠遠未達到成熟,而基于規(guī)則的系統(tǒng)也難以應對極端的Corner case,這也使得從業(yè)者們普遍認為L4甚至L5級別的成熟自動駕駛難以實現(xiàn)的根本原因。

ChatGPT能給自動駕駛帶來什么?

那么就以上的決策難題,ChatGPT能夠為自動駕駛帶來什么樣的突破呢?首先,我們先回答 ChatGPT 到底是什么?它是個基于上千億超大語料參數(shù)組成的 GPT3.0 架構訓練出來的一個自然語言處理聊天工具。ChatGPT 的算法采用了 Transformer 神經(jīng)網(wǎng)絡架構,具有很好的時序數(shù)據(jù)處理能力。

Transformer 對于自動駕駛行業(yè)的人員來說并不陌生,它是一種結構簡單的編解碼器,幾乎可以無限堆疊,從而形成一種大規(guī)模的預訓練語言模型。基于 Transformer 模型構成的 GPT 架構可以很好地完成多種語言處理任務,填空、造句、分段、翻譯等等。另外,ChatGPT 還需要使用監(jiān)督學習和強化學習來實現(xiàn)。具體來說,ChatGPT 使用了一種叫「人類反饋強化學習(RLHF)」的訓練方法,在訓練中可以根據(jù)人類反饋,保證對無益、失真或偏見信息的最小化輸出。

從對ChatGPT的分析我們可以看出,其是利用人類反饋進行強化學習的產(chǎn)物,并且其強大的識錯能力能夠對錯誤的信息進行判別與糾正。那么回想自動駕駛的決策難題,其核心技術將可以為自動駕駛帶來前所未有的突破。那么具體怎么實施呢?

首先,自動駕駛決策算法中有一類叫做模仿學習,利用人類駕駛員針對不同場景的執(zhí)行策略讓機器進行學習,遇到類似的場景便可以采用模仿人類的駕駛策略。

其次,要想獲得一個經(jīng)驗老道的老司機的決策能力,必須看得多,學得多。因此需要引入大量的人類駕駛數(shù)據(jù),并灌輸?shù)?a class="article-link" target="_blank" href="/tag/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/">機器學習的模型之中。在這一步,由于牽涉到大量的數(shù)據(jù)訓練,采取人工標注顯然是不現(xiàn)實的。而ChatGPT的成功證明了,機器對于數(shù)據(jù)判別的好壞是能夠學習成功到如此地步的,那么采用人類反饋強化學習的思想,可以訓練出模型來驗證、評價機器模型的輸出,使其不斷進步,最終達到人類的駕駛水平。

最后,便是引入人類駕駛的真實接管數(shù)據(jù),在其中嘗試使用「人類反饋強化學習(RLHF)」。一般來說,人類司機的每一次接管,都是對自動駕駛策略的一次人為反饋;這個接管數(shù)據(jù)可以被簡單當成一個負樣本來使用,就是自動駕駛決策被糾正的一次記錄。同時也可以被當作改進認知決策的正樣本來學習。

除此之外,ChatGPT也可以用來分析大量的駕駛日志數(shù)據(jù),以找出駕駛員在特定情境下的行為規(guī)律,并用這些信息來訓練自動駕駛控制系統(tǒng),從而提高它們在復雜情境下的決策能力。總的來說,ChatGPT的分析能力可以為改善自動駕駛技術的情景判斷能力提供有力的支持。

ChatGPT帶來的困難與挑戰(zhàn)

盡管ChatGPT十分具有顛覆性,但亞馬遜卻對其充滿了警惕,甚至警告員工不要與ChatGPT分享機密信息。微軟高級工程師也表示“請不要將敏感數(shù)據(jù)發(fā)送給OpenAI終端,因為他們可能會將其用于訓練未來的模型?!?/p>

原因就是我們老生常談的話題:數(shù)據(jù)隱私。

以ChatGPT的數(shù)據(jù)體量,人類在ChatGPT面前沒有秘密可言,任何人類留存在網(wǎng)絡的信息,ChatGPT應該都搜索得到,包括我們的隱私。從ChatGPT的表現(xiàn)來看,小到人類個人都可能成為其受害者,個人或企業(yè)肖像、名譽等人格和財產(chǎn)權益可能受到損害,大到ChatGPT會給社會秩序、國家政治穩(wěn)定和安全造成巨大威脅。自動駕駛領域也不例外,并且直接關系到人類的出行安全,其使用更應該得到謹慎處理及關注。

所幸的是,ChatGPT現(xiàn)在還屬于人類管控,而且應該是被凍結了找出隱私的功能。因此,不管是汽車行業(yè)還是其他行業(yè),在使用ChatGPT上,并不是只管用就行,還存在著技術上的挑戰(zhàn)。除了數(shù)據(jù)安全外,還需要大量的專業(yè)知識和高質量的訓練數(shù)據(jù),以及專業(yè)的技術支持,以解決技術上的問題和難題。

總結

ChatGPT的橫空出世對于自動駕駛行業(yè)的從業(yè)者們來說無疑是感到激動興奮的,其成功證明了機器可以學習到人類的知識到何種地步,也證明了類人駕駛在未來的可行性。在未來,ChatGPT將對自動駕駛行業(yè)產(chǎn)生重要的影響,將改善包括車載語言識別、智能座艙、導航系統(tǒng)等等智能化設備,為消費者提供更加高效和便捷的駕駛體驗。在自動駕駛行業(yè)不斷發(fā)展的過程中,ChatGPT將成為一把利器,推動行業(yè)技術的提升和創(chuàng)新。

相關推薦