作者 | 朱世耘,編輯 | 章漣漪
“我們內(nèi)部一直有爭(zhēng)議:是有一點(diǎn)就拿出來(lái)一點(diǎn),還是做到爆款的水平之后再拿出來(lái)。因?yàn)橹馗兄⑤p地圖的方案是更難的。” 毫末智行董事長(zhǎng)張凱表示。
如今,毫末終于亮出了自己的“爆款”產(chǎn)品,并將于今明兩年先后上車(chē)。
10月11日,毫末AI DAY上發(fā)布了三款第二代HPilot高階智駕預(yù)控產(chǎn)品:HP170、HP370、HP570價(jià)格分別在3000、5000和8000元,可實(shí)現(xiàn)高速無(wú)圖NOH、城市記憶行車(chē)+記憶泊車(chē),城市全場(chǎng)景無(wú)圖NOH等功能。相比之下,如今已量產(chǎn)的同功能預(yù)控產(chǎn)品成本大多在5000-10000元,城市領(lǐng)航則在3萬(wàn)元左右。
毫末此舉,意味著可適配車(chē)型價(jià)格從25-30萬(wàn)元級(jí)及以上,下探到了20萬(wàn)元以下,甚至更低。“價(jià)格打下來(lái),性能打上去。讓中階智駕便宜更好用,讓高階智駕好用更便宜?!睆垊P表示。
01、物盡其用,把L2+的價(jià)格打下來(lái)
“第二代平臺(tái)主打性?xún)r(jià)比,對(duì)芯片和硬件的優(yōu)化壓榨,都做到了極致?!睆垊P向《賽博汽車(chē)》表示。
智駕市場(chǎng)的風(fēng)向正在發(fā)生根本性的改變。
2020年時(shí),以Mobileye為核心的ADAS供應(yīng)商L2級(jí)系統(tǒng)價(jià)格為250美元(約1700元,匯率按6.8計(jì)算)以上;L2+級(jí)為2380元;L2++級(jí)為2.04-2.72萬(wàn)元。
但如今,中國(guó)車(chē)規(guī)級(jí)ADAS系統(tǒng)的供應(yīng)體系正變得“品類(lèi)豐富、豐儉由人”。在《電動(dòng)汽車(chē)觀察家》2022年年底的調(diào)查中,已有定點(diǎn)的高速NOA+記憶泊車(chē)產(chǎn)品價(jià)格在3000-5000元不等,城市NOA等點(diǎn)到點(diǎn)的智駕域控系統(tǒng)價(jià)格在5000元以上。
單從價(jià)格來(lái)看,毫末第二代HPilot基本與行業(yè)定點(diǎn)情況持平。但從上車(chē)落地的實(shí)際情況來(lái)看,HP170、370和570確實(shí)將”物盡其用“推向了新的高度。
賽博汽車(chē)制圖
同樣是基于地平線征程3的產(chǎn)品,第三代榮威RX5(2022年6月上市)基于3顆征程3和26個(gè)傳感器(不含兩個(gè)駕駛員監(jiān)測(cè)傳感器),實(shí)現(xiàn)高速領(lǐng)航和全場(chǎng)景泊車(chē)功能;
今年3月問(wèn)世的深藍(lán)SL03應(yīng)用雙征程3+27顆傳感器(含1個(gè)前視800萬(wàn)像素攝像頭、1顆4D毫米波雷達(dá))的高配智駕方案,能夠?qū)崿F(xiàn)高速領(lǐng)航功能。標(biāo)配的單征程3方案,則僅支持L2級(jí)輔助駕駛功能;
將于2024年年初上車(chē)的毫末HP170基于單征程3+20個(gè)傳感器實(shí)現(xiàn)高速領(lǐng)航和泊車(chē)功能。
在中階方案上,德州儀器的TDA4-H還屬于新產(chǎn)品,目前大疆在五菱云朵上車(chē)的方案采用32TOPS+19顆傳感器(含1個(gè)慣導(dǎo)雙?攝像頭),實(shí)現(xiàn)高速領(lǐng)航和記憶泊車(chē)等功能,將高階智駕功能的上車(chē)價(jià)打到了15萬(wàn)元以下。
將于2024年內(nèi)上車(chē)的毫末HP370在傳感器配置上更加豐富一些,32Tops+24顆傳感器,將功能從高速拓展到了城市中的記憶行車(chē)。
高階方案上,高通5nm制程的8255/8295作為智駕芯片上車(chē)的方案仍非常新,也非常少。奔馳剛發(fā)布的新一代E級(jí)車(chē)采用8295實(shí)現(xiàn)高速領(lǐng)航;零跑的方案中,8295+恩智浦S32G高配芯片實(shí)現(xiàn)L2+級(jí)智能駕駛輔助能力,將于2024年上車(chē)。
毫末HP570的方案則將功能上限從高速?gòu)氐淄卣沟搅顺鞘新窙r。對(duì)于高通的方案,張凱告訴《賽博汽車(chē)》,算力為360Tops的HP550方案將于首先搭載于魏牌藍(lán)山DHT-PHEV車(chē)型上,于明年一季度正式量產(chǎn)。HP570車(chē)型采用QC8650,算力72/100Tops將在藍(lán)山之后的改款車(chē)型上上車(chē)應(yīng)用。
至少?gòu)募埫鎸?duì)比來(lái)看,計(jì)劃于2024年先后落地的毫末第二代HPilot產(chǎn)品,將更低硬件需求、更高性能上限的智駕性?xún)r(jià)比競(jìng)爭(zhēng)激烈度進(jìn)一步推高。
其中當(dāng)然有后發(fā)優(yōu)勢(shì)。張凱表示,近幾年快速的技術(shù)迭代和模型輕量化特征,使之前需要在大算力平臺(tái)上布置的算法得以在中平臺(tái)上布置。而大算力芯片的單位算力價(jià)格也在下行。
此外,毫末自身的工程化能力也是其拉低價(jià)格的重要原因。
三款產(chǎn)品,三個(gè)計(jì)算平臺(tái),意味著大量的模型遷移和適配工作,也使很多團(tuán)隊(duì)望而卻步。但毫末在HP1.0平臺(tái)的上車(chē)應(yīng)用過(guò)程中,積累了大量的工程化能力,使其能否完成這樣困難的工作。
《賽博汽車(chē)》了解到,今年上半年,除特斯拉的代工廠外,德賽西威、知行科技和毫末智行是量產(chǎn)量前三的智駕域控商。
”我們還是要做平臺(tái)的系列化,把系列化做好,以滿(mǎn)足高中低不同價(jià)位車(chē)型的需求?!皬垊P表示。
02、識(shí)別萬(wàn)物,云端能力提上來(lái)
終端價(jià)格打下去的另一面,是云端的能力進(jìn)一步提升,以更加簡(jiǎn)潔、高效的算法模型為終端降本服務(wù)。如特斯拉FSD V12版通過(guò)采用完全的神經(jīng)網(wǎng)絡(luò),端側(cè)系統(tǒng)減少了30萬(wàn)行代碼,運(yùn)行速度快了10倍。
目前國(guó)內(nèi)尚未有明確的自動(dòng)駕駛端到端的模型范式,但此次AI DAY上,毫末向業(yè)內(nèi)展示了自動(dòng)駕駛生成式大模型DriveGPT雪湖·海若在云端實(shí)現(xiàn)端到端運(yùn)行的方式。
毫末發(fā)布的行業(yè)首個(gè)自動(dòng)駕駛生成式大模型DriveGPT在云端分為感知和認(rèn)知兩個(gè)大模型。
其中,感知大模型通過(guò)感知數(shù)據(jù)輸入,建立包含時(shí)序信息的4D向量空間后,引入開(kāi)源的圖文多模態(tài)大模型,從而形成含有視覺(jué)圖像中語(yǔ)義信息的“5D”空間。
從而,將"前方有一個(gè)離地兩米,一米多長(zhǎng),靜止不動(dòng)的障礙物",翻譯為“綠色的柳條”,使自動(dòng)駕駛系統(tǒng)的識(shí)別能力從障礙物提升到萬(wàn)物。
在認(rèn)知大模型中,基于5D的感知結(jié)果,DriveGPT通過(guò)構(gòu)建駕駛語(yǔ)言(Drive Language)來(lái)描述駕駛環(huán)境和駕駛意圖,再結(jié)合導(dǎo)航引導(dǎo)信息以及自車(chē)歷史動(dòng)作,并借助外部大語(yǔ)言模型LLM的海量知識(shí)來(lái)輔助給出駕駛決策。
例如將”綠色的柳條“這一文本解釋為”柔軟“,從而成為車(chē)輛可忽略該障礙物,正常通行的決策依據(jù)。
值得注意的是,雖然仍分為感知和認(rèn)知模塊,并且存在引入外部開(kāi)源的多模態(tài)和大語(yǔ)言模型,而非一個(gè)完整的神經(jīng)網(wǎng)絡(luò)系統(tǒng)。但從數(shù)據(jù)的層面來(lái)看,由于引入外部大模型,從輸入到最后輸出決策策略的過(guò)程中,不再存在數(shù)據(jù)量消減的問(wèn)題。
由此,模型獲得世界知識(shí),從而提升自動(dòng)駕駛策略的可解釋性和泛化性。
毫末智行數(shù)據(jù)智能科學(xué)家賀翔向《賽博汽車(chē)》表示:多模態(tài)和大語(yǔ)言模型將此前不宜存儲(chǔ)傳輸?shù)膱D片信息,提煉為文本信息組成隱式場(chǎng),供感知和決策模型希望進(jìn)一步完善信息時(shí)調(diào)用查閱,由此保證了數(shù)據(jù)從輸出到輸出端的完整性。
截止2023年10月DriveGPT雪湖·海若共計(jì)篩選出超過(guò)100億幀互聯(lián)網(wǎng)圖片數(shù)據(jù)集和480萬(wàn)段包含人駕行為的自動(dòng)駕駛4D Clips數(shù)據(jù)。
目前,DriveGPT還是在云上的大模型,但已在數(shù)據(jù)生產(chǎn)和端側(cè)模型訓(xùn)練上發(fā)揮作用。
毫末智行CEO顧維灝在演講中表示,DriveGPT的駕駛場(chǎng)景理解可以對(duì)海量駕駛場(chǎng)景數(shù)據(jù)進(jìn)行秒級(jí)特征搜索,從而實(shí)現(xiàn)更高效的數(shù)據(jù)篩選,為大模型挖掘海量高質(zhì)量訓(xùn)練數(shù)據(jù);駕駛場(chǎng)景標(biāo)注是采用了開(kāi)集(Open-set)場(chǎng)景下的Zero-Shot自動(dòng)標(biāo)注,可實(shí)現(xiàn)對(duì)任意物體既快速又精準(zhǔn)的標(biāo)注,預(yù)標(biāo)注準(zhǔn)召達(dá)到80%以上。
此外,駕駛場(chǎng)景生成,可以基于駕駛場(chǎng)景的文生圖模型,通過(guò)文字描述批量生成平時(shí)難以獲取的Hardcase數(shù)據(jù),實(shí)現(xiàn)無(wú)中生有的可控生成;對(duì)于駕駛場(chǎng)景遷移,基于AIGC生成能力,可實(shí)現(xiàn)多目標(biāo)場(chǎng)景生成,能將采集到的一個(gè)場(chǎng)景,遷移到該場(chǎng)景的不同時(shí)間、不同天氣、不同光照等各類(lèi)新場(chǎng)景下,可同時(shí)獲取全天候駕駛數(shù)據(jù),實(shí)現(xiàn)瞬息萬(wàn)變的高效場(chǎng)景遷移。
車(chē)端模型開(kāi)發(fā)模式變革方面,毫末正在嘗試用蒸餾的方法,也就是用大模型輸出的偽標(biāo)簽作為監(jiān)督信號(hào),讓車(chē)端小模型來(lái)學(xué)習(xí)云端大模型的預(yù)測(cè)結(jié)果,或者通過(guò)對(duì)齊Feature Map的方式,讓車(chē)端小模型直接學(xué)習(xí)并對(duì)齊云端的Feature Map,從而提升車(chē)端小模型的能力。基于蒸餾的方式,可以讓車(chē)端的感知效果提升五個(gè)百分點(diǎn)。
顧維灝認(rèn)為,未來(lái)的自動(dòng)駕駛系統(tǒng)一定是跟人類(lèi)駕駛員一樣,不但具備對(duì)三維空間的精確感知測(cè)量能力,而且能夠像人類(lèi)一樣理解萬(wàn)物之間的聯(lián)系、事件發(fā)生的邏輯和背后的常識(shí),并且能基于這些人類(lèi)社會(huì)的經(jīng)驗(yàn)來(lái)做出更好的駕駛策略,真正實(shí)現(xiàn)完全無(wú)人駕駛。