• 正文
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

曉鶯說(shuō):供應(yīng)鏈同源加速智車(chē)與具身智能產(chǎn)業(yè)融合(下)

3小時(shí)前
131
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

硬件共生進(jìn)化

 

在全球科技競(jìng)爭(zhēng)白熱化、產(chǎn)業(yè)融合加速的當(dāng)下,智能科技產(chǎn)業(yè)尋求降本增效與技術(shù)突破多重新路徑幾乎成為跨行業(yè)共識(shí)。

 

在此趨勢(shì)下,智能電動(dòng)汽車(chē)(Smart EV)與具身智能機(jī)器人作為前沿賽道,看似分屬不同領(lǐng)域,實(shí)則在技術(shù)架構(gòu)與產(chǎn)業(yè)生態(tài)等多維度存在深度耦合。蓋世汽車(chē)研究發(fā)現(xiàn),整體來(lái)看,二者在包括芯片、傳感器動(dòng)力系統(tǒng)的硬件技術(shù)方面,在包括自動(dòng)駕駛算法、智能互聯(lián)的軟件技術(shù)方面,和在供應(yīng)鏈需求、制造供應(yīng)鏈環(huán)節(jié)的能力都具備復(fù)用潛力,不僅能加速各自領(lǐng)域的創(chuàng)新迭代,更將為智能科技產(chǎn)業(yè)開(kāi)辟協(xié)同發(fā)展的新藍(lán)海。

 

此外,在市場(chǎng)應(yīng)用方面,人形機(jī)器人還可以提升汽車(chē)制造效率,拓展至生活服務(wù)等場(chǎng)景,形成“出行+服務(wù)”的生態(tài)閉環(huán),實(shí)現(xiàn)商業(yè)模式的多樣化探索。

 

特斯拉開(kāi)發(fā)的人形機(jī)器人——擎天柱(Optimus)就是較為典型的例證。特斯拉把汽車(chē)的一些技術(shù)運(yùn)用到了人形機(jī)器人擎天柱上,例如電池組、冷卻系統(tǒng)等,還使用與汽車(chē)測(cè)試類(lèi)似的技術(shù)來(lái)進(jìn)行擎天柱的運(yùn)動(dòng)和對(duì)外部碰撞模擬。此外,特斯拉的全自動(dòng)駕駛系統(tǒng)FSD直接被應(yīng)用在擎天柱身上,機(jī)器人采用了與汽車(chē)一樣的視覺(jué)感知,使用攝像頭輸入數(shù)據(jù),以神經(jīng)網(wǎng)絡(luò)進(jìn)行計(jì)算。

 

去年4月,特斯拉已在工廠(chǎng)部署兩個(gè)Optimus機(jī)器人。特斯拉將在今年開(kāi)始“限量生產(chǎn)”擎天柱機(jī)器人,未來(lái)可能會(huì)有數(shù)千個(gè)擎天柱機(jī)器人在特斯拉工作。

 

·硬件傳感器領(lǐng)域

 

智能汽車(chē)領(lǐng)域,攝像頭、雷達(dá)等傳感器早已成為車(chē)輛的“眼睛”和“耳朵”,它們能夠?qū)崟r(shí)監(jiān)測(cè)車(chē)輛周?chē)h(huán)境,為自動(dòng)駕駛提供關(guān)鍵數(shù)據(jù)支持。具身智能機(jī)器人同樣需要對(duì)外部環(huán)境進(jìn)行感知,以實(shí)現(xiàn)自主行動(dòng)。智能汽車(chē)中廣泛應(yīng)用的多傳感器融合技術(shù),如將攝像頭的視覺(jué)信息與毫米波雷達(dá)、激光雷達(dá)的距離探測(cè)信息相結(jié)合,能夠精準(zhǔn)識(shí)別障礙物和目標(biāo)物體,這種技術(shù)完全可以遷移至具身智能機(jī)器人。

 

例如,在復(fù)雜的室內(nèi)外環(huán)境中,機(jī)器人通過(guò)復(fù)用此類(lèi)傳感器技術(shù),能夠?qū)崟r(shí)感知周?chē)h(huán)境的動(dòng)態(tài)變化,實(shí)現(xiàn)對(duì)障礙物的規(guī)避和對(duì)目標(biāo)物體的抓取,從而在物流搬運(yùn)、家庭服務(wù)等場(chǎng)景中發(fā)揮重要作用。小米汽車(chē)在其人形機(jī)器人產(chǎn)品CyberOne的傳感器中,搭載了小米自研的Mi-Sense深度視覺(jué)模組,可以對(duì)人臉、肢體動(dòng)作等外界環(huán)境進(jìn)行感知,該款機(jī)器人計(jì)劃2025年量產(chǎn)發(fā)售。

 

·硬件芯片領(lǐng)域

 

智能汽車(chē)的計(jì)算芯片在處理能力和功耗管理方面具有顯著優(yōu)勢(shì)。為了滿(mǎn)足自動(dòng)駕駛對(duì)海量數(shù)據(jù)實(shí)時(shí)處理的需求,智能汽車(chē)芯片不斷提升計(jì)算能力,同時(shí)優(yōu)化功耗,以保證車(chē)輛長(zhǎng)時(shí)間運(yùn)行。這些芯片具備強(qiáng)大的并行計(jì)算能力,能夠快速處理傳感器采集的大量數(shù)據(jù),并進(jìn)行復(fù)雜的算法運(yùn)算,為自動(dòng)駕駛決策提供支持。

 

在具身智能機(jī)器人中,同樣面臨著數(shù)據(jù)處理和決策控制的挑戰(zhàn),將智能汽車(chē)的計(jì)算芯片適配到機(jī)器人中,能夠?yàn)闄C(jī)器人提供強(qiáng)大的運(yùn)算支持,使其快速處理視覺(jué)、觸覺(jué)等多源信息,做出準(zhǔn)確的決策,從而實(shí)現(xiàn)更靈活、智能的動(dòng)作控制。此外,芯片的低功耗特性還能延長(zhǎng)機(jī)器人的工作時(shí)間,降低能源消耗。

 

小鵬汽車(chē)就將車(chē)端AI鷹眼視覺(jué)系統(tǒng)、自研圖靈芯片、端到端大模型以及強(qiáng)化學(xué)習(xí)算法移植至IRON人形機(jī)器人上,當(dāng)前,IRON已在小鵬廣州工廠(chǎng)投入使用,計(jì)劃2026年實(shí)現(xiàn)量產(chǎn)。

 

·動(dòng)力系統(tǒng)領(lǐng)域

 

智能汽車(chē)的電池技術(shù)電機(jī)驅(qū)動(dòng)技術(shù)也為具身智能機(jī)器人的動(dòng)力供應(yīng)和運(yùn)動(dòng)執(zhí)行帶來(lái)了新的可能。長(zhǎng)續(xù)航電池能夠?yàn)闄C(jī)器人提供更持久的工作時(shí)間,使其無(wú)需頻繁充電,提高工作效率。同時(shí),高效電機(jī)驅(qū)動(dòng)技術(shù)能夠?qū)崿F(xiàn)機(jī)器人更精準(zhǔn)的動(dòng)作控制,使機(jī)器人在抓取物體、攀爬等動(dòng)作中更加靈活、穩(wěn)定。智能汽車(chē)電機(jī)的高精度控制算法,經(jīng)過(guò)優(yōu)化后應(yīng)用于機(jī)器人電機(jī),能夠?qū)崿F(xiàn)對(duì)機(jī)器人關(guān)節(jié)的精確控制,提升機(jī)器人的運(yùn)動(dòng)性能。

 

比如,廣汽人形機(jī)器人GoMate,搭載全固態(tài)電池,續(xù)航達(dá)到6小時(shí),并采用軸向磁通電機(jī),最大輸出力矩達(dá)到1000N·m,該款機(jī)器人將會(huì)率先進(jìn)入廣汽傳祺、埃安等生產(chǎn)線(xiàn)和園區(qū)率先示范應(yīng)用,計(jì)劃2025年實(shí)現(xiàn)自研零部件批量生產(chǎn),2026年整機(jī)小批量生產(chǎn)。

 

智駕軟技跨域賦能

 

 

·軟件技術(shù)復(fù)用

 

在自動(dòng)駕駛算法方面,智能汽車(chē)的自動(dòng)駕駛算法,如路徑規(guī)劃算法、目標(biāo)識(shí)別與跟蹤算法等,經(jīng)過(guò)多年的研發(fā)和實(shí)踐,已經(jīng)相對(duì)成熟。在具身智能機(jī)器人的自主導(dǎo)航和操作任務(wù)中,這些算法經(jīng)過(guò)優(yōu)化后能夠發(fā)揮重要作用。

 

比如特斯拉的人形機(jī)器人產(chǎn)品Optimus Gen2,安裝無(wú)人駕駛系統(tǒng)FSD,接入和特斯拉汽車(chē)同樣的神經(jīng)網(wǎng)絡(luò),可以全面識(shí)別周邊環(huán)境,并通過(guò)AI算法識(shí)別和學(xué)習(xí)人類(lèi)動(dòng)作。Optimus Gen2目前已實(shí)現(xiàn)小批量生產(chǎn),計(jì)劃2025年生產(chǎn)數(shù)千臺(tái),2026年目標(biāo)提升至5-10萬(wàn)臺(tái)。

 

此外,奇瑞汽車(chē)Mornine,與AI公司Aimoga共同研發(fā),配備大型語(yǔ)言模型 (LLM),該款機(jī)器人將在優(yōu)先在在汽車(chē)銷(xiāo)售中心擔(dān)任服務(wù)人員,逐步向家庭服務(wù)場(chǎng)景拓展。

 

·智能互聯(lián)技術(shù)

 

智能汽車(chē)的車(chē)聯(lián)網(wǎng)技術(shù)能夠?qū)崿F(xiàn)車(chē)輛與云端、其他車(chē)輛以及基礎(chǔ)設(shè)施之間的數(shù)據(jù)交互和遠(yuǎn)程控制。這種技術(shù)在具身智能機(jī)器人中同樣具有廣闊的應(yīng)用前景。通過(guò)復(fù)用車(chē)聯(lián)網(wǎng)技術(shù),機(jī)器人可以與云端服務(wù)器進(jìn)行實(shí)時(shí)數(shù)據(jù)交互,上傳自身的工作狀態(tài)和環(huán)境信息,同時(shí)下載最新的任務(wù)指令和算法更新。此外,機(jī)器人還能與其他設(shè)備進(jìn)行互聯(lián)互通,實(shí)現(xiàn)協(xié)同工作。例如,在智慧城市的建設(shè)中,多個(gè)清潔機(jī)器人可以通過(guò)智能互聯(lián)技術(shù)進(jìn)行信息共享和任務(wù)分配,提高清潔效率,拓展機(jī)器人的應(yīng)用場(chǎng)景和功能。

 

供應(yīng)鏈的共生密碼

 

 

·供應(yīng)鏈需求的高度復(fù)用

 

在零部件采購(gòu)方面,智能汽車(chē)和具身智能機(jī)器人存在著大量的重疊部分。傳感器、芯片、電機(jī)等零部件是兩者不可或缺的關(guān)鍵組件,這使得它們?cè)诠?yīng)商選擇上具有較高的重合度。通過(guò)共享零部件供應(yīng)商,兩者可以形成規(guī)模效應(yīng),降低采購(gòu)成本。例如,大量采購(gòu)?fù)?lèi)型的傳感器和芯片,能夠增強(qiáng)企業(yè)與供應(yīng)商的議價(jià)能力,獲得更優(yōu)惠的價(jià)格。

 

·智能制造產(chǎn)線(xiàn)及能力復(fù)用

 

智能汽車(chē)的整車(chē)制造流程和生產(chǎn)線(xiàn)布局在自動(dòng)化生產(chǎn)、組裝工藝等方面具有諸多優(yōu)勢(shì),這些經(jīng)驗(yàn)可以借鑒到具身智能機(jī)器人的制造過(guò)程中。智能汽車(chē)生產(chǎn)線(xiàn)采用的自動(dòng)化裝配技術(shù),如機(jī)器人焊接、自動(dòng)化噴涂等,能夠提高生產(chǎn)效率和產(chǎn)品質(zhì)量的一致性。在具身智能機(jī)器人的制造中,引入類(lèi)似的自動(dòng)化生產(chǎn)設(shè)備和工藝,可以減少人工操作的誤差,提高機(jī)器人的生產(chǎn)效率,降低生產(chǎn)成本。

 

同時(shí),智能汽車(chē)制造過(guò)程中成熟的質(zhì)量控制體系和供應(yīng)鏈管理模式,也能夠?yàn)榫呱碇悄軝C(jī)器人的制造提供有益的參考,幫助企業(yè)建立完善的質(zhì)量管理和供應(yīng)鏈協(xié)同機(jī)制,確保機(jī)器人產(chǎn)品的質(zhì)量和交付周期。

 

破界全場(chǎng)景生態(tài)

 

 

人工智能技術(shù)飛速發(fā)展的當(dāng)下,具身智能作為融合機(jī)器人實(shí)體與智能算法的前沿領(lǐng)域,正以前所未有的態(tài)勢(shì)重塑人類(lèi)生產(chǎn)生活格局。從工業(yè)車(chē)間的精密裝配,到家庭空間的智能服務(wù);從物流倉(cāng)庫(kù)的高效搬運(yùn),到醫(yī)療養(yǎng)老的貼心守護(hù),具身智能憑借其獨(dú)特的物理交互能力,在多領(lǐng)域開(kāi)辟出全新應(yīng)用場(chǎng)景,開(kāi)啟了智能生態(tài)網(wǎng)絡(luò)構(gòu)建的新紀(jì)元。

 

在人形機(jī)器人眾多應(yīng)用場(chǎng)景中,工業(yè)制造場(chǎng)景率先落地,具身智能機(jī)器人正成為提升生產(chǎn)效率與質(zhì)量的關(guān)鍵力量。

 

優(yōu)必選推出的工業(yè)人形機(jī)器人Walker S系列,憑借高度靈活的機(jī)械臂與精準(zhǔn)的動(dòng)作控制能力,成功進(jìn)駐比亞迪、吉利汽車(chē)、富士康等許多大型車(chē)廠(chǎng)進(jìn)行實(shí)訓(xùn)。目前,優(yōu)必選已與東風(fēng)柳汽、吉利汽車(chē)、一汽紅旗等多家知名汽車(chē)企業(yè)建立了合作關(guān)系,并在富士康、順豐等領(lǐng)軍企業(yè)的支持下,成功構(gòu)建了多場(chǎng)景的人形機(jī)器人應(yīng)用生態(tài)。值得一提的是,優(yōu)必選是全球唯一一家能與多家車(chē)企宣布合作的人形機(jī)器人公司,其Walker S系列機(jī)器人也因此在全球車(chē)廠(chǎng)實(shí)訓(xùn)中脫穎而出。

 

另外,在工業(yè)領(lǐng)域,宇樹(shù)科技機(jī)器人也已經(jīng)在工廠(chǎng)巡檢、物流搬運(yùn)等場(chǎng)景中得到應(yīng)用,幫助企業(yè)提高生產(chǎn)效率,降低人力成本;在教育領(lǐng)域,宇樹(shù)科技的機(jī)器人憑借其高性?xún)r(jià)比和開(kāi)放的SDK,吸引了眾多教育機(jī)構(gòu)和學(xué)校的關(guān)注,成為培養(yǎng)學(xué)生科技興趣和創(chuàng)新能力的重要工具。

 

宇樹(shù)科技機(jī)器人的跨場(chǎng)景服務(wù)也正在說(shuō)明,具身智能產(chǎn)業(yè)鏈下游應(yīng)用場(chǎng)景的拓展,正呈現(xiàn)出從工業(yè)制造的剛性需求向服務(wù)業(yè)柔性創(chuàng)新延伸的顯著趨勢(shì)。

 

在工業(yè)制造領(lǐng)域,具身智能機(jī)器人的應(yīng)用最初是為了滿(mǎn)足企業(yè)對(duì)生產(chǎn)效率提升、人力成本降低等剛性需求,解決重復(fù)性、高強(qiáng)度的體力勞動(dòng)與高精度操作難題。隨著技術(shù)的不斷成熟與發(fā)展,具身智能逐漸將應(yīng)用范圍拓展至多元化服務(wù)業(yè)領(lǐng)域。

 

比如,追覓科技推出X50 Ultra掃地機(jī);九號(hào)公司推出Navimow X3割草機(jī)器人;新加坡企業(yè)Primech AI推出Hytron衛(wèi)生間清潔機(jī)器人;美國(guó)企業(yè)OpenDroids 推出R2D3家庭助理機(jī)器人;銀河通用推出的商業(yè)服務(wù)Galbot機(jī)器人;法國(guó)企業(yè)Capsix Robotics推出IYU按摩機(jī)器人。

 

值得注意的是,盡管具身智能應(yīng)用前景廣闊,但因場(chǎng)景及技術(shù)成熟度不同,其商業(yè)化落地進(jìn)程存在顯著差異。

 

在工業(yè)制造領(lǐng)域,由于生產(chǎn)流程相對(duì)標(biāo)準(zhǔn)化,對(duì)機(jī)器人的功能需求明確,且企業(yè)具備較強(qiáng)的資金與技術(shù)實(shí)力,能夠承擔(dān)具身智能機(jī)器人的研發(fā)、采購(gòu)與部署成本,因此商業(yè)化落地速度相對(duì)較快,部分頭部企業(yè)已實(shí)現(xiàn)規(guī)?;瘧?yīng)用。

 

然而,在家庭服務(wù)、醫(yī)療養(yǎng)老等場(chǎng)景,商業(yè)化落地面臨諸多挑戰(zhàn)。家庭服務(wù)場(chǎng)景需求分散且個(gè)性化強(qiáng),用戶(hù)對(duì)機(jī)器人的功能、價(jià)格、外觀(guān)等方面要求多樣,同時(shí)家庭環(huán)境復(fù)雜多變,對(duì)機(jī)器人的環(huán)境感知、自主決策能力提出了更高要求,目前技術(shù)尚未完全成熟,導(dǎo)致產(chǎn)品難以滿(mǎn)足用戶(hù)多樣化需求,市場(chǎng)推廣難度較大。

 

尤其在醫(yī)療養(yǎng)老領(lǐng)域,涉及嚴(yán)格的法規(guī)監(jiān)管、專(zhuān)業(yè)的醫(yī)療知識(shí)與倫理問(wèn)題,對(duì)具身智能機(jī)器人的安全性、可靠性、精準(zhǔn)性要求極高,技術(shù)研發(fā)與驗(yàn)證周期長(zhǎng),使得商業(yè)化落地進(jìn)程相對(duì)緩慢。

 

換言之,具身智能正以多元化的應(yīng)用場(chǎng)景為基石,構(gòu)建起龐大的智能生態(tài)網(wǎng)絡(luò),從工業(yè)制造的剛性需求到服務(wù)業(yè)的柔性創(chuàng)新,其發(fā)展趨勢(shì)不可阻擋。盡管商業(yè)化落地受場(chǎng)景與技術(shù)因素制約存在差異,但隨著技術(shù)的持續(xù)突破與應(yīng)用模式的不斷創(chuàng)新,具身智能必將在更多領(lǐng)域?qū)崿F(xiàn)深度滲透,為人類(lèi)社會(huì)帶來(lái)更高效、便捷、智能的生活與生產(chǎn)方式。

 

產(chǎn)業(yè)融合搶灘戰(zhàn)

 

 

在科技飛速發(fā)展的當(dāng)下,智能汽車(chē)與具身智能產(chǎn)業(yè)的融合已成為行業(yè)發(fā)展的重要趨勢(shì)。這種融合不僅源于技術(shù)層面的共通性,更受到企業(yè)戰(zhàn)略需求和商業(yè)前景的驅(qū)動(dòng),正從企業(yè)布局和技術(shù)創(chuàng)新兩個(gè)維度,重塑著未來(lái)出行與智能機(jī)器人領(lǐng)域的格局。

 

企業(yè)層面:戰(zhàn)略布局搶占融合高地

 

在智能汽車(chē)與具身智能產(chǎn)業(yè)融合的賽道上,車(chē)企正以積極的姿態(tài)加速布局。為了在這場(chǎng)競(jìng)爭(zhēng)中占得先機(jī),眾多車(chē)企紛紛成立專(zhuān)門(mén)的研發(fā)團(tuán)隊(duì),將具身智能技術(shù)的研究與產(chǎn)品開(kāi)發(fā)提上日程。

 

其中,特斯拉持續(xù)加大AI人才投入。在2025年第一季度全員大會(huì)上,馬斯克宣布將于年內(nèi)完成首批5000臺(tái)Optimus人形機(jī)器人的生產(chǎn)目標(biāo)。這一戰(zhàn)略部署伴隨著大規(guī)模人才儲(chǔ)備計(jì)劃,特斯拉官方招聘頁(yè)面顯示,Optimus項(xiàng)目團(tuán)隊(duì)正在美國(guó)四大生產(chǎn)基地展開(kāi)人才招募,涉及機(jī)械設(shè)計(jì)、軟件開(kāi)發(fā)、系統(tǒng)集成、生產(chǎn)制造等關(guān)鍵領(lǐng)域的80個(gè)新增崗位。崗位分布數(shù)據(jù)顯示,研發(fā)類(lèi)職位占比達(dá)65%,制造工程類(lèi)占30%,驗(yàn)證測(cè)試類(lèi)占5%,形成金字塔型人才結(jié)構(gòu)。

 

公開(kāi)信息顯示,小鵬汽車(chē)從2020年起開(kāi)始布局人形機(jī)器人產(chǎn)業(yè)。其研發(fā)團(tuán)隊(duì)已深耕該領(lǐng)域5年,并于2024年11月推出首款A(yù)I人形機(jī)器人IRON。基于L3級(jí)自動(dòng)駕駛技術(shù)積累,小鵬汽車(chē)計(jì)劃2026年量產(chǎn)面向工業(yè)場(chǎng)景的L3級(jí)人形機(jī)器人,實(shí)現(xiàn)手、腳、眼、腦全向協(xié)同能力。

 

何小鵬表示:“小鵬汽車(chē)已在人形機(jī)器人產(chǎn)業(yè)深耕5年,未來(lái)可能還要做20年,再花500億,甚至投入上千億?!?/p>

 

此外,經(jīng)濟(jì)觀(guān)察報(bào)援引業(yè)內(nèi)消息稱(chēng),國(guó)內(nèi)某頭部新能源車(chē)企已啟動(dòng)人形機(jī)器人項(xiàng)目,內(nèi)部代號(hào)為“堯舜禹”;蔚來(lái)汽車(chē)也已組建約20人的團(tuán)隊(duì),專(zhuān)注于機(jī)器狗項(xiàng)目的調(diào)研。理想汽車(chē)創(chuàng)始人李想表示,公司100%將涉足人形機(jī)器人領(lǐng)域。

 

不只是車(chē)企,多家輔助駕駛廠(chǎng)商也在積極布局具身智能業(yè)務(wù)。

 

2024年1月,芯片公司地平線(xiàn)宣布將分拆AIoT團(tuán)隊(duì),成立全資控股子公司——地瓜機(jī)器人。2024年9月,地瓜機(jī)器人推出面向“機(jī)器人+”時(shí)代的軟硬件產(chǎn)品全家桶,包括專(zhuān)為新一代通用機(jī)器人而生的旭日5智能計(jì)算芯片、易用全能開(kāi)發(fā)首選RDK X5機(jī)器人開(kāi)發(fā)者套件、具身智能全場(chǎng)景算力核心RDK S100等。

 

另外,速騰聚創(chuàng)將自己定位為智能機(jī)器人增量零部件及解決方案供應(yīng)商,立足整機(jī)開(kāi)發(fā)通用的機(jī)器人移動(dòng)及操作解決方案,并推出適用于各類(lèi)場(chǎng)景的智能機(jī)器人增量零部件。面向智能機(jī)器人市場(chǎng),速騰聚創(chuàng)推出全球首款機(jī)器人全固態(tài)數(shù)字化激光雷達(dá)E1R和192線(xiàn)半球形數(shù)字化激光雷達(dá)Airy。

 

VLA破界融合

 

 

技術(shù)層面:端到端技術(shù)引領(lǐng)融合趨勢(shì)

 

在技術(shù)層面,智能汽車(chē)與具身智能的融合也取得了顯著進(jìn)展。

 

蓋世汽車(chē)研究院報(bào)告顯示,多數(shù)企業(yè)正加速自動(dòng)駕駛端到端技術(shù)的量產(chǎn)上車(chē)。無(wú)論是自動(dòng)駕駛還是機(jī)器人領(lǐng)域,使用的模型從技術(shù)類(lèi)別上,由小模型→大模型→端到端大模型發(fā)展。這種演變不僅提升了模型的處理能力和智能水平,還實(shí)現(xiàn)了從感知到?jīng)Q策的一體化,大大提高了系統(tǒng)的響應(yīng)速度和準(zhǔn)確性。

 

圖源:蓋世汽車(chē)研究院報(bào)告

 

VLA(Vision-Language-Action)模型被認(rèn)為可能是“端到端+VLM”技術(shù)框架的終局形態(tài)。VLA是融合了視覺(jué)、語(yǔ)言和動(dòng)作的多模態(tài)大模型范式,VLA模型通過(guò)結(jié)合視覺(jué)和語(yǔ)言處理,可以解釋復(fù)雜的指令并在物理世界中執(zhí)行動(dòng)作,可進(jìn)行視覺(jué)理解與空間推理、綜合感知與預(yù)測(cè)。 比如谷歌DeepMind推出的RT-2,由MIT等機(jī)構(gòu)的研究人員開(kāi)發(fā)的開(kāi)源視覺(jué)-語(yǔ)言-動(dòng)作(Vision-Language-Action, VLA)模型Open VLA等等。

 

在智能汽車(chē)領(lǐng)域,VLA模型可以幫助車(chē)輛更好地理解復(fù)雜的交通場(chǎng)景,做出更合理的駕駛決策;在具身智能機(jī)器人領(lǐng)域,它則能讓機(jī)器人更準(zhǔn)確地理解人類(lèi)指令,并完成相應(yīng)任務(wù)。這種技術(shù)上的共通性,為智能汽車(chē)與具身智能產(chǎn)業(yè)的深度融合奠定了堅(jiān)實(shí)基礎(chǔ)。

 

理想VLA(Vision-Language-Action Model,視覺(jué)語(yǔ)言行動(dòng)模型)是理想研發(fā)的司機(jī)AI大模型

 

2024年10月,理想汽車(chē)推送的端到端+VLM功能,真正意義上實(shí)現(xiàn)了One Model一體化端到端模型的大規(guī)模實(shí)踐應(yīng)用,并首次將大模型部署至車(chē)端量產(chǎn)芯片。這一突破性進(jìn)展不僅體現(xiàn)了理想在AI算法上的深厚積累,更展示了其在車(chē)規(guī)級(jí)硬件與大模型融合方面的獨(dú)特優(yōu)勢(shì)。

 

2025年3月,理想汽車(chē)正式發(fā)布下一代自動(dòng)駕駛架構(gòu)VLA。也就是說(shuō),理想汽車(chē)的智能駕駛技術(shù)經(jīng)歷了從規(guī)則算法、到無(wú)圖NOA、再到端到端+VLM,最終邁向VLA司機(jī)大模型的“三段”進(jìn)化。

 

李想認(rèn)為,人工智能走向生產(chǎn)力的關(guān)鍵在于Agent能力的釋放,即AI不再只是輔助人類(lèi)思考和判斷,而是能夠獨(dú)立完成專(zhuān)業(yè)工作,承擔(dān)“替代性”的角色。理想汽車(chē)當(dāng)前的VLA戰(zhàn)略,正是對(duì)這一目標(biāo)的路徑設(shè)計(jì)。VLA是李想眼中“類(lèi)人智能”的起點(diǎn),在他看來(lái),VLA能夠解決全自動(dòng)駕駛,將成為現(xiàn)階段能力最強(qiáng)的架構(gòu),甚至有機(jī)會(huì)超越人類(lèi)開(kāi)車(chē)的能力。

 

當(dāng)前,智能汽車(chē)與具身智能產(chǎn)業(yè)的融合已進(jìn)入快速發(fā)展階段,企業(yè)的積極布局和技術(shù)的持續(xù)創(chuàng)新,正推動(dòng)著這一融合向更深層次、更廣領(lǐng)域拓展。未來(lái),隨著技術(shù)的不斷成熟和應(yīng)用場(chǎng)景的進(jìn)一步豐富,智能汽車(chē)與具身智能產(chǎn)業(yè)的融合必將帶來(lái)更多驚喜,重塑人們的出行方式和生活體驗(yàn)。

 

四大趨勢(shì)領(lǐng)航

 

 

在人工智能的浪潮中,具身智能正以驚人的速度重塑人機(jī)交互的邊界。具身智能的每一次進(jìn)步都引發(fā)行業(yè)對(duì)其未來(lái)的深度思考,結(jié)合當(dāng)前技術(shù)演進(jìn)與產(chǎn)業(yè)動(dòng)態(tài),蓋世汽車(chē)研究院認(rèn)為,四大趨勢(shì)正成為具身智能邁向新階段的關(guān)鍵路標(biāo)。

 

一、世界模型:具身智能的認(rèn)知革命

 

世界模型(World Model)的崛起,標(biāo)志著具身智能從“感知 - 執(zhí)行”的簡(jiǎn)單模式向“理解 - 預(yù)測(cè)”的高階形態(tài)跨越。傳統(tǒng)機(jī)器人依賴(lài)預(yù)設(shè)程序或即時(shí)傳感器數(shù)據(jù)完成任務(wù),而引入世界模型的具身智能體,能夠基于過(guò)往經(jīng)驗(yàn)構(gòu)建虛擬環(huán)境,通過(guò)模擬推演制定最優(yōu)行動(dòng)策略。

 

隨著谷歌Deepmind - Genie 2、英偉達(dá)Cosmos等模型發(fā)布,大模型開(kāi)始展現(xiàn)出對(duì)世界常識(shí)的潛在理解能力。

 

其中,谷歌Deepmind - Genie能夠通過(guò)單張圖片或文字描述生成720p清晰度的交互式3D場(chǎng)景,并支持長(zhǎng)達(dá)一分鐘的沉浸式探索,生成可交互、可玩的3D環(huán)境,可用于具身智能體訓(xùn)練。

 

英偉達(dá)Cosmos通過(guò)多模態(tài)生成與物理規(guī)律建模、高保真仿真環(huán)境構(gòu)建、高效合成數(shù)據(jù)生成與訓(xùn)練優(yōu)化、多版本適配與低延遲響應(yīng),解決了真實(shí)數(shù)據(jù)稀缺與訓(xùn)練成本高昂的行業(yè)痛點(diǎn)。該模型通過(guò)模擬真實(shí)交通場(chǎng)景(如多智能體協(xié)作、極端天氣應(yīng)對(duì)),優(yōu)化自動(dòng)駕駛系統(tǒng)的路徑規(guī)劃和動(dòng)態(tài)決策能力,并支持復(fù)雜環(huán)境導(dǎo)航,結(jié)合物理規(guī)律模擬提升動(dòng)作協(xié)調(diào)性,實(shí)現(xiàn)機(jī)器人智能升級(jí)。

 

二、數(shù)據(jù)采集:從單一到多元的范式轉(zhuǎn)換

 

數(shù)據(jù)作為具身智能的“燃料”,其采集方式正經(jīng)歷前所未有的變革。傳統(tǒng)依賴(lài)真實(shí)場(chǎng)景采集數(shù)據(jù)的模式,逐漸向人工示教(遙操、動(dòng)捕)、仿真合成數(shù)據(jù)、自主探索等多元化數(shù)據(jù)采集方式演進(jìn)。其中,真實(shí)世界人工采集、虛擬環(huán)境仿真與合成都是當(dāng)前主流的數(shù)據(jù)采集方式。

 

比如,上海人工智能實(shí)驗(yàn)室在研究工作EmbodiedScan中提出更大、更真實(shí)的數(shù)據(jù)集、更多樣的場(chǎng)景和更詳盡的標(biāo)注可以顯著提升具身智能的3D感知能力;北京大學(xué)構(gòu)建了涵蓋132萬(wàn)條的靈巧機(jī)械手抓取數(shù)據(jù)集DexGraspNet,在規(guī)模、穩(wěn)定性和多樣性上明顯優(yōu)于現(xiàn)有數(shù)據(jù)集,已有算法訓(xùn)練后能提升抓取成功率,最高可達(dá)10%;谷歌聯(lián)合全球機(jī)構(gòu)匯集了22種不同機(jī)器人類(lèi)型的數(shù)據(jù),構(gòu)建了最全面的具身智能數(shù)據(jù)集Open X-Embodiment,并用于訓(xùn)練通用具身智能大模型RTX,RTX可以在無(wú)需任何訓(xùn)練數(shù)據(jù)或極少訓(xùn)練的情況下,泛化到特定任務(wù)上。

 

三、合成數(shù)據(jù):破解高質(zhì)量數(shù)據(jù)的供給困局

 

盡管數(shù)據(jù)采集方式日益多元,但高質(zhì)量數(shù)據(jù)的稀缺性仍是行業(yè)發(fā)展的瓶頸。據(jù)業(yè)內(nèi)預(yù)測(cè),到2026年大模型將消耗盡所有高質(zhì)量數(shù)據(jù),低質(zhì)量數(shù)據(jù)將在2030~2050年消耗殆盡。

 

蓋世汽車(chē)研究院認(rèn)為,合成數(shù)據(jù)通過(guò)算法或模型生成人工數(shù)據(jù),模擬真實(shí)數(shù)據(jù)的統(tǒng)計(jì)特性和分布規(guī)律,將成為具身智能訓(xùn)練的重要數(shù)據(jù)來(lái)源。

 

圖源:蓋世汽車(chē)研究院報(bào)告

 

現(xiàn)如今,以英偉達(dá)為代表的科技企業(yè)加快合成數(shù)據(jù)技術(shù)的迭代與應(yīng)用,為具身智能帶來(lái)了豐富、可控且經(jīng)濟(jì)的訓(xùn)練與學(xué)習(xí)材料。據(jù)了解,英偉達(dá)與德克薩斯大學(xué)奧斯汀分校于2023年聯(lián)合提出了MimicGen合成數(shù)據(jù)生成系統(tǒng),通過(guò)對(duì)人類(lèi)演示進(jìn)行處理,自動(dòng)生成不同場(chǎng)景下的大規(guī)模合成數(shù)據(jù)集,用于機(jī)器人的模仿學(xué)習(xí)。在Square等18個(gè)任務(wù)中,只用175個(gè)人類(lèi)示例就生成超過(guò)5萬(wàn)個(gè)訓(xùn)練數(shù)據(jù)集,并在Square任務(wù)中將成功率從人類(lèi)示例數(shù)據(jù)集的11.3%提升至90.7%。

 

在2025年CES,英偉達(dá)推出構(gòu)建三種類(lèi)型機(jī)器人的平臺(tái),旨在推動(dòng)人工智能和機(jī)器人領(lǐng)域的革新。這三類(lèi)機(jī)器人分別是:

 

知識(shí)型機(jī)器人(Knowledge Robots):也被稱(chēng)為代理型人工智能(Agentic AI),主要用于知識(shí)處理和數(shù)字化任務(wù)。例如,可作為虛擬助手處理復(fù)雜信息,為用戶(hù)提供智能化服務(wù)。

 

通才型機(jī)器人(Generalist Robots):即人形機(jī)器人(Humanoid Robots),設(shè)計(jì)用于多功能場(chǎng)景下的任務(wù)執(zhí)行,模仿人類(lèi)的行為和交互方式,適應(yīng)家庭、服務(wù)和制造業(yè)等多元場(chǎng)景。

 

運(yùn)輸型機(jī)器人(Transportation Robots):即自動(dòng)駕駛汽車(chē),通過(guò)結(jié)合AI模型和物理AI技術(shù),能夠自主完成運(yùn)輸任務(wù),推動(dòng)物流、出行和交通領(lǐng)域的智能化發(fā)展。

 

四、具身智能將在2030年迎來(lái)規(guī)?;拯c(diǎn)

 

具身智能的商業(yè)化進(jìn)程正遵循“技術(shù)突破 - 成本下降 - 規(guī)模擴(kuò)張” 的經(jīng)典路徑。

 

圖源:蓋世汽車(chē)研究院報(bào)告

 

當(dāng)前,具身智能產(chǎn)業(yè)成本問(wèn)題限制了其大規(guī)模應(yīng)用,以人形機(jī)器人為例。

 

人形機(jī)器人的成本因多種因素存在較大差異,目前市場(chǎng)上大部分人形機(jī)器人的成本在數(shù)十萬(wàn)元左右 。蓋世汽車(chē)研究院認(rèn)為,隨著Tesla、宇樹(shù)等企業(yè)公布人形機(jī)器人量產(chǎn)計(jì)劃,疊加DeepSeek技術(shù)突破,將推動(dòng)行業(yè)進(jìn)入“硬件規(guī)?;?軟件開(kāi)源化”雙輪驅(qū)動(dòng)階段。隨著技術(shù)的進(jìn)步、供應(yīng)鏈的成熟以及量產(chǎn)規(guī)模的擴(kuò)大,人形機(jī)器人的成本正在逐漸下降,比如宇樹(shù)科技的第二代人形機(jī)器人 G1 起售價(jià)為 9.9 萬(wàn)元,眾擎機(jī)器人的人形機(jī)器人 PM01 售價(jià)為 8.8 萬(wàn)元。 隨著價(jià)格持續(xù)下探,具身智能產(chǎn)業(yè)的大規(guī)模應(yīng)用指日可待。

 

具身智能的未來(lái),既是技術(shù)創(chuàng)新的前沿戰(zhàn)場(chǎng),也是產(chǎn)業(yè)變革的戰(zhàn)略高地。世界模型的認(rèn)知突破、多元化的數(shù)據(jù)采集、合成數(shù)據(jù)的技術(shù)賦能,以及即將到來(lái)的規(guī)模化拐點(diǎn),共同勾勒出一幅人機(jī)協(xié)同的新圖景。隨著這些趨勢(shì)的加速演進(jìn),具身智能有望從實(shí)驗(yàn)室走向日常生活,成為重塑人類(lèi)生產(chǎn)生活方式的核心力量。

相關(guān)推薦