• 正文
    • 01、機器怎么像人開車:城市領航輔助開辟 100 城、開發(fā) Drive GPT
    • 02、機器怎么形成與人互通的駕乘空間?用 Space GPT 把定義座艙變成生成式座艙
    • 03、怎樣用 AI 定義車企?所有組織都將是 AI 組織
  • 推薦器件
  • 相關推薦
申請入駐 產業(yè)圖譜

長城汽車“再創(chuàng)業(yè)”:成立AI Lab,投入超400人,掀起范式變革

2023/09/22
2251
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者 / 白雪編輯 / 葉方

「長途開車請勿疲勞駕駛,助手已經為您開啟車內冷風?!?/p>

這是語音助手對車內駕駛員的一則溫馨提示。

這背后的技術原理是,車輛通過攝像頭檢測到駕駛員眼瞼開合度低,認為駕駛員很可能正在打瞌睡所做出的反應。
然而一切都有限定條件。

比如,車內駕駛員其實并沒有打瞌睡,而是因為眼睛太小意外觸發(fā)車內 DMS(疲勞/分神預警系統(tǒng))。

這并不是假設,而是真實發(fā)生在汽車媒體人常巖身上的故事。

因為他的眼睛比較小,所以被系統(tǒng)判定為「開車睡著了」,從而多次被系統(tǒng)扣減了智駕分,由此他在微博發(fā)出質疑:眼睛小的難道不配使用智能駕駛?

當問題反饋至車企,幾乎所有車企都想第一時間拿到常巖的面部圖像,開始調整算法策略。

但除了他之外,特例可能還有更多。

「這不是正確的解題思路?!?/p>

9 月 12 日,在長城汽車大模型交流會上,長城 AI Lab 負責人楊繼峰的回答十分斬釘截鐵。

他認為,一味地補充數(shù)據、寫代碼遲早有一天會崩盤,但規(guī)則并非如此——真正的解題思路是從單一任務變成多模態(tài)。

比如如何定義疲勞?需要用多種數(shù)據定義疲勞,既要考慮眼瞼開合度等 DMS 狀態(tài),同時也要考慮駕駛員與車機的互動情況、駕駛情況、行駛車速等。

比如眼睛再小,車輛也能通過穩(wěn)健的駕駛風格判斷出駕駛員正在安全駕駛。

一切的底層邏輯還是要回到 AI。

以前自動駕駛是最大的 AI 問題,現(xiàn)在隨著智能汽車滲透率逐漸增大,中國消費者市場對于車輛作為第三空間的依賴在增加——智能座艙的體驗,也成為亟需攻克的問題。

在楊繼峰看來,圍繞 AI 時代的汽車命題無非三點:

機器如何像人一樣開車;

機器如何形成人開車的駕乘空間;

以及在 AI 時代,如何定義車企。

當這三個問題落地,剩下的只是抽絲剝繭解決技術問題。

AI Lab(智能空間實驗室)就是在這一背景下成立的,以此掀起一場范式變革,推動長城汽車快速適應 AI 時代。

目前 AI Lab?已經超過 400 人。這個新組織的定位,是梳理長城汽車的數(shù)據結構,充當數(shù)據能力、計算能力、體系能力和模塊化能力的 AI 技術前臺與中臺。

長城的這次亮牌,似乎已經準備好在 AI 時代的戰(zhàn)場上攻城略地。

01、機器怎么像人開車:城市領航輔助開辟 100 城、開發(fā) Drive GPT

自動駕駛對長城而言,并非做不做的問題,而是進展多少、有沒有取得領先地位的問題。

過去兩年,長城對于智能化進展的信息披露,一直保持著某種克制,讓外界一度以為這只能算是踩著新能源浪潮的老牌車企。

一場溝通會,讓我們重新審視了長城的智能化進展。

如果將自動駕駛在中國的發(fā)展分為二個階段:

第一個階段是從 2015 年開始,誕生了一批自動駕駛解決方案,傳統(tǒng)的模塊化自動駕駛分為環(huán)境感知層、決策規(guī)劃層和控制執(zhí)行層三層。

這種模塊化的技術缺點是:系統(tǒng)復雜龐大,往往需要人工設計成百上千個模塊。

第二個階段是 2017 年后,自動駕駛領域開始嘗試引入 Tranformer 這種基于注意力機制的神經網絡模型,進一步實現(xiàn)端到端自動駕駛。

這帶來的好處是沒有人工設計的繁復規(guī)則,只需要極少的來自人類的訓練數(shù)據,深度學習神經網絡就能學會駕駛。

與外界認知不同,長城旗下的自動駕駛公司毫末智行是國內第一家引入 Transformer 的企業(yè)。

其實,長城發(fā)力自動駕駛至少可以追溯到六年前。

成立于 2019 年的毫末智行,前身是長城汽車智能駕駛前瞻部。

這約等于往前再推數(shù)年,長城就在內部啟動自動駕駛技術開發(fā)。

直到 2019 年,為了保證毫末智行發(fā)揮出最高效率,才從長城內部拆分出來獨立運營。

長城在自動駕駛領域的決心,在今年上半年已現(xiàn)端倪,長城主要做了三件事——圍繞 Drive GPT 發(fā)布了感知大模型認知大模型以及 3D 場景構建大模型。

據汽車之心了解,最開始長城是用 Drive GPT 在內部的初始形態(tài)是 Dencoder,只用于解決路徑規(guī)劃的問題,后來才變成了用與 GPT 一樣的 Dencoder knowledge 算法架構去解決預測和路徑規(guī)劃。

現(xiàn)在,長城開始極致釋放 GPT 的性能,開始用 GPT 最大的壓縮和推理能力去解決概率預測的問題。

「所有視覺信息壓縮到 4D 智能空間里,再加入 3D 網絡結構以及 4D 深度策略。我們用了 400 萬個 Clips 訓練,2021 年之后我們就用 Clips 去衡量數(shù)據,總性能提升了 20%。」楊繼峰解釋道。

通過 Drive GPT 大模型可以預測自車未來軌跡、同時生成多個「平行宇宙」來展現(xiàn)未來可能發(fā)生的駕駛情況,并最終完成邏輯嚴密的輸出決策推理鏈。

據汽車之心了解,目前認知大模型的認知算法通過率已經提升了 30% 以上。

另一個重要進展則是 3D 場景構建大模型的誕生。

從自動駕駛誕生那一天起,行業(yè)就有一個經典命題:自動駕駛訓練到底要用實車數(shù)據更好還是虛擬數(shù)據更好?

用實車數(shù)據成本高、效率低但效果好,用虛擬數(shù)據成本低了,但數(shù)據真實度難以保證、也無法解決交互性的問題。甚至有行業(yè)人士表示,很長一段時間,用虛擬數(shù)據做仿真帶來的問題多過帶來的收益。

至少,按照傳統(tǒng)的方式,全物理級的建模需要把傳感器表現(xiàn)都用數(shù)學模型構建出來,這個過程難度極大,不僅因為成本高,這些底層數(shù)據也并不透明。

3D 場景構建大模型,某種程度上是解決這個問題的思路。

通過 3D 重構加上自動插入目標物范式,重建精度可以達到 10cm,這也使得場景還原度、重建效率更高,面對 Coner case 的構造成本也降低了百倍以上。

自動駕駛技術層面的三張王牌,長城已經有了。

面對已經展開的車企城市 NOA 開城之戰(zhàn),長城也第一次有了回應:

長城預計在 2024 年將城市 NOH 拓展至百城。

2024 年第一季度,城市 NOH 會先在魏牌藍山的車型上量產落地。

NOH 首批開放的城市包括北京、上海、保定,后續(xù)會陸續(xù)拓展到其他一線城市。

就在前天(9 月 19?日),小鵬宣布將城市 NGP 在 2023 年底拓展至 50 城,2024 年擴增至 200 城。更早之前,華為宣布今年 12 月城市領航輔助駕駛「全國都能開」。

對比之下,長城 2024 年 100 城的目標,給人的感覺并不亮眼。

但只卷數(shù)量、卷速度,就像智能汽車卷價格一樣,維度十分單薄。

根據長城向外界釋放的信息,長城對于城市 NOH 的規(guī)劃有貼合自身實際的步調。

長城把全面鋪開城市 NOH 分成了三步:

第一步采用低算力平臺達到高速/快速 NOH(無圖);

第二步采用中算力平臺,達到高速 NOH(無圖)、記憶行車、自動泊車等功能;

第三步則是在以上基礎上實現(xiàn)城市 NOH(無圖)、跨層記憶泊車。

顯然,對一個擁有 5 大品牌的超級車企來說,長城的智能駕駛必須要分場景來實現(xiàn)。

長城汽車智能駕駛高級總監(jiān)姜海鵬解釋,魏牌將搭載最高級智駕平臺做城市 NOH,很大程度上是因為魏牌的定位能覆蓋平臺成本。其次是坦克、哈弗和歐拉,將實現(xiàn)高速、自動泊車等基本功能。

自動駕駛的地已經耕好了,長城究竟能種出怎樣的莊稼還有待觀察。

02、機器怎么形成與人互通的駕乘空間?用 Space GPT 把定義座艙變成生成式座艙

億歐智庫調研顯示:年齡位于 25-35 歲的年輕人,有 51% 的人表示將座艙的智能化水平作為其購車的重要參考因素, 甚至有 28% 的人將座艙的智能化水平視為其購車時的首要參考因素。

當天下午,我體驗了哈弗梟龍的座艙系統(tǒng),這款車內座艙系統(tǒng)搭載了長城 2021 年發(fā)布的 Coffee OS 2.0 版本。
兩個最直觀的感受:

Coffee OS 2.0 版本支持「一語十意」功能,筆者在車內一次性給出了「空調溫度調低打開視頻打開座椅通風打開車窗」,系統(tǒng)仍然能快速識別,時延被降到了難以感受的程度。據悉,Coffee OS 2.O 最多可以一次性實現(xiàn) 10 個指令。

另一個直觀感受是界面「所見即所得」。我試著對話小哈查詢明天保定飛往深圳的機票,車機提供航班結果的同時,還能通過語音實現(xiàn)上下翻頁,讓人頗感驚喜。

但缺點仍然存在。

比如,在遇到無法識別的指令時,車機有時不會為人類駕駛員提供反饋,往往導致駕駛員「蒙圈」狀態(tài)。

同時,盡管 Coffee OS 2.0 可以支持多音區(qū)識別,但對較為混亂的車內場景,仍需要較長反應時間。

不過這些問題將會在 Coffee OS 3.0 上車后得到解決。

據了解,Coffee OS 3.0 將會在今年第四季度上車部分車型。

在展開智能座艙之前,可能要先思考智能座艙是不是一個 AI 問題?

過去智能座艙的測評標準,往往是時延,各大汽車媒體圍著車機測試反應快不快、交互靈敏不靈敏。
但今天似乎變了。

開始有更多消費者好奇:「如果我今天對車機說『我心情不好』,我的車會干什么?」

到了這個層面,智能座艙絕對是 AI 問題。

有行業(yè)人士認為,大模型對智能座艙至少有三個層面的影響:

第一層:大模型上下文理解能力可增強語音助手對于乘客的語音語義理解能力、響應能力,實現(xiàn)連續(xù)對話等功能;

第二層:大模型賦能車載助手多模態(tài)理解能力、感知能力,以減輕駕駛員交互壓力;

第三層:大模型提升車載導航對路線優(yōu)化與判斷的準確性。

AI 大模型加持下,智能座艙悄然起了變化。

楊繼峰認為,過去的智能座艙可能是產品經理定義出來的,在此階段智能座艙不是 AI 問題,但未來的智能座艙要從定義座艙走到生成式座艙。
他向我們舉了一個簡單的例子:

過去,大多數(shù)智能座艙會針對某一類群體的顯性特征來定義一個專屬模式,比如針對女性用戶來設計女王座椅、化妝鏡的互動等,但用 AI 來定義智能座艙,不止跟群體相關,還跟每個人的年齡、狀態(tài)、心情、性格相關。

「一個好的交互,不是用戶坐在車上了才提醒今天降溫,要多穿衣服,而是坐在車上的時候,車機壁紙、外觀堆上了小雪人?!?/p>

而實現(xiàn)智能座艙從定義走向生成式的核心算法在于,把交互變成多模態(tài)的輸入+多任務的輸出。

長城這一次做了 Space GPT 的三種模型:感知大模型、認知大模型和 AIGC 生成式大模型。

回到文章開頭常巖的案例,這三種大模型在座艙內的應用可能會徹底解決他的困擾。

感知大模型:首先通過多模感知(包含 DMS 檢測眼瞼開合度,同時加入車輛動力學參數(shù)、車機交互輸入、用戶語音輸入等)一同評估駕駛者的駕駛狀態(tài),然后進行任務輸出(包括疲勞監(jiān)測任務、心情預測任務、用戶行為任務等),最終為其進行交互行為推薦、生態(tài)內容推薦等。

認知大模型:認知模型則是讓 AI 理解駕駛者,將生態(tài)內容喜好、交互行為預測、導航出行需求認知等等與用戶進行匹配,久而久之標簽與標簽對齊,AI 能夠變得越來越像用戶。

AIGC 生成大模型:則是結合文生文、文生圖、大模型+知識庫組成的一系列應用功能。這種大模型+插件的模式,將會變成擅長不同技巧的用車助手。

楊繼峰認為,智能座艙的變革本質上就是范式變革,要將多模態(tài)+認知+各種用戶推薦平臺融合在一起才能完成范式創(chuàng)新,達到數(shù)據閉環(huán)的狀態(tài)。

這其中要經歷小模型變成多模態(tài)的算法范式創(chuàng)新,要做到刷新落后底層架構,最后才能有顛覆性的產品形態(tài)和交互形態(tài)。

今天出現(xiàn)了這樣的產品形態(tài)嗎?

可能還沒有。

在與長城談論智能座艙的過程中,理想是一個常被討論和提及的對手。

理想幾乎定義了一個家庭出行需要的智能座艙,第一個提出了 Mind GPT,將其進化為主動式座艙。

異曲同工,長城也以 Space GPT 為內核研發(fā)生成式智能座艙。據汽車之心了解,長城目前也是唯一一個座艙算法團隊超過百人的團隊。

「很有意思的是,當現(xiàn)在很多人玩 ChatGPT,跟 GPT 對話的時候甚至還會用『請』字,這本質是相信它擁有平等對話能力的表現(xiàn)?!刮磥碛袉幔?br /> 應該會有——當座艙日活量、主動交互率高起來,這樣的產品就誕生了。

03、怎樣用 AI 定義車企?所有組織都將是 AI 組織

智能駕駛、智能座艙的關鍵部分滲透完了,此時的車是車嗎?

對于這個問題,每家車企的思考都不一樣。

有的認為是汽車機器人,有的認為是電腦+四個輪子,有的認為車還得是車。

長城內部習慣先思考一下:「這個問題究竟是不是 AI 問題」。

這個習慣顯然是最近長城成立的 AI Lab 帶起來的風潮。

據了解,目前長城 AI Lab 已經超過 400 人。

在汽車之心看來,AI Lab 很像長城內部的一次「再創(chuàng)業(yè)」,嘗試用 AI 激活智能汽車的更多可能性。

而這一舉動,也與許多新勢力不謀而合,蔚來創(chuàng)始人李斌在 2023 蔚來創(chuàng)新科技日上也大膽斷言:AI 將會成為智能電動汽車企業(yè)的核心基礎能力。
AI Lab 怎么掀起組織變革?

長城內部這樣解釋組織變革三個時代:

以產品交付為目的的開發(fā)時代:汽車產品 SOP后,它 95% 的開發(fā)工作就結束了,這一階段最典型的組織架構就是每個產品擁有一個開發(fā)團隊和項目團隊。

服務多產品時代:隨著 OTA 升級的實現(xiàn),就進入到第二個階段,這一階段交付并不是結束,而是新的開始。組織架構也從單個團隊僅服務一款產品,到服務多款產品。

數(shù)據驅動整車時代:這一階段該思考整車的數(shù)據采集、數(shù)據清洗數(shù)據挖掘、數(shù)據標注如何支撐駕艙一體化,車云一體化等架構。

AI Lab 的成立讓長城進入智能汽車第三個時代。據了解 AI Lab 新組織的定位,正是梳理長城汽車的數(shù)據結構,充當數(shù)據能力、計算能力、體系能力和模塊化能力的 AI 技術前臺+中臺。

這個新組織的定位,是梳理長城汽車的數(shù)據結構,充當數(shù)據能力、計算能力、體系能力和模塊化能力的 AI 技術前臺+中臺。

楊繼峰認為,長城做的每個問題都是 AI 問題,每個要素都是 AI 要素,每個組織都是 AI 組織。

那怎么判斷一個東西是不是 AI 問題?

楊繼峰表示:「考慮有沒有更好的思考邏輯或者數(shù)據幫助我們做開發(fā)。這種開發(fā)可以是算法團隊和設計團隊一起做整車設計,讓機器也能像人一樣設計出來足夠好的圖,也可以是面向整個公司的 AI 化調整?!?/p>

他坦言,盡管從設計師、工程師再到品牌、客服、工廠,每個人都在 AI 化,但車企還是很焦慮,「沒有人能拍著胸脯保證下一代的數(shù)據架構、計算架構甚至車型就是規(guī)劃當中的那個樣子?!?/p>

尤其是對于長城這種超級主機廠而言,并不乏挑戰(zhàn)。

挑戰(zhàn)之一是品牌,挑戰(zhàn)之二是模式泛化之后,是否真的能呈現(xiàn)出用戶滿意的產品。

每個人的駕駛風格和駕駛習慣不同,長城也在根據這些特點做品牌區(qū)別,但目前來說效果還不是很明顯,至少各個品牌在智能座艙風格的區(qū)分上并不明顯。

姜海鵬表示,在這一代量產車里,長城的發(fā)力點是平臺化以及 AI 能力打磨。但在下一代車型中,長城智能化的品牌區(qū)隔將會越發(fā)明顯。
姜海鵬拿歐拉、坦克舉了兩個例子。

歐拉為女性量身打造,主要解決女性開車中的痛點問題。第一個是泊車,歐拉未來會更強調自動泊車屬性,把一鍵泊車打造成標桿產品。第二是通過記憶路線來保證智能駕駛過程中不會出現(xiàn)激進決策,為女性提供充足的安全感。

坦克圍繞城市越野而生,針對越野場景,開發(fā)類似魔毯模式的特色功能,同時還針對非鋪裝道路的地盤調整,另一方面開坦克的消費者可能會更偏向激進駕駛的風格,所以在加減速上的反應更加強烈、靈敏。

據汽車之心了解,明年魏牌車型將會優(yōu)先落地城市?NOH,并逐漸覆蓋歐拉、坦克等品牌。

5 大品牌對于長城是幸福的煩惱,大模型的加持或許能夠讓 5 大品牌的智能化風格變得各有千秋。是否真的能利用大模型打造出讓用戶滿意的產品,還是一個未知數(shù)。

楊繼峰認為,在今年內,長城可以讓用戶感受到 AI 到底是什么,但本質上這個技術還沒有形成產品。到今天,大模型應用仍處于早期過程,今天能想到的所有模型輕量化范式、模型 SMT,不過也就 6 個月而已。

行業(yè)處于早期,并不意味著就可以等待成熟再下場。

「你也可以仍舊維持現(xiàn)有的體驗,停留在數(shù)字化座艙,但多模態(tài)已經開始產生了很強的產品壁壘。多模態(tài)這件事情明年不做,基本上就沒機會了?!顾f道。

特斯拉 FSD V12 呈現(xiàn)出令人驚艷的表現(xiàn),大洋彼岸的中國玩家早已蠢蠢欲動,城市 NOA 借著 AI 大模型東風不斷開城,各家新勢力圍繞大模型不斷提出各類座艙功能。

造車三十年,長城被不少人貼上了「傳統(tǒng)」的標簽。

在這次交流中,他們彼此有時也打趣道,「長城對智能化相關的內容發(fā)布實在是太低調了,這鍋給品牌部來背。」

話是這么說,實際上長城內部早就已經起了變化。

活動當天,長城汽車董事長魏建軍沒有參加,但第二天早上 7 點不到,魏建軍從離長城哈弗技術中心不遠的一家普通商務酒店出門跑步,59 歲的魏建軍仍十分自律。

內部交流中,許多人評價他面對 AI 的態(tài)度是「投入了很多精力」,而 AI Lab 的誕生或許已經是無聲證明。

可以確定的是,相較于長城當年「此誠危急存亡」地重注 SUV,用現(xiàn)象級爆款哈弗 H6 打遍天下,如今的長城,有著更殷實的家底和更充沛的人才儲備來跨越更加漫長的 AI 時代。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據手冊 ECAD模型 風險等級 參考價格 更多信息
FNB33060T 1 onsemi Intelligent Power Module, 600 V, 30A, 60-TUBE

ECAD模型

下載ECAD模型
$18.57 查看
A3987SLPTR-T 1 Allegro MicroSystems LLC Stepper Motor Controller, 1.5A, NMOS, PDSO24, MO-153ADT, TSSOP-24

ECAD模型

下載ECAD模型
$5.27 查看
AD22293Z-RL7 1 Analog Devices Inc Precision ±1.7 g, ±5 g, ±18 g Dual-Axis iMEMS® Accelerometer
暫無數(shù)據 查看

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄