VLA

加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

VLA,vision language action。VLA模型是在 VLM 基礎(chǔ)上利用機器人或者汽車運動軌跡數(shù)據(jù),進(jìn)一步訓(xùn)練現(xiàn)有的 VLM,以輸出可用于機器人或者汽車控制的文本編碼動作。

VLA,vision language action。VLA模型是在 VLM 基礎(chǔ)上利用機器人或者汽車運動軌跡數(shù)據(jù),進(jìn)一步訓(xùn)練現(xiàn)有的 VLM,以輸出可用于機器人或者汽車控制的文本編碼動作。收起

查看更多
  • 理想智駕的VLA模型及其結(jié)構(gòu)
    我們之前文章《2025年,自動駕駛即將開“卷”的端到端大模型 2.0 - VLA (Vision Language Action)》分享過VLA,現(xiàn)在,不少公司已經(jīng)宣稱會在2025年下半年都會推出此類模型結(jié)構(gòu)。所以,本文將通過理想相關(guān)信息來拆解分享理想智駕VLA算法。理想VLA模型架構(gòu)的四大核心模塊:
    565
    04/25 14:33
    理想智駕的VLA模型及其結(jié)構(gòu)
  • 特斯拉全局端到端走不通,理想與地平線VLA加入diffusion policy再進(jìn)化
    【觀點:全局端到端除了太消耗運算和存儲資源外,還很難添加輔助模塊,如應(yīng)對交通規(guī)則的地圖模塊,特斯拉就是因此幾乎完全無法適應(yīng)中國的交通規(guī)則。模塊化端到端將是主流,至少在違反交通規(guī)則處罰力度和廣度都很強的中國如此,某種意義上講還是快慢雙系統(tǒng),快系統(tǒng)是diffusion planner或policy,慢系統(tǒng)是LLM或VLM?!?/div>
    特斯拉全局端到端走不通,理想與地平線VLA加入diffusion policy再進(jìn)化
  • VLA,是不是自動駕駛的下一站?
    中國農(nóng)歷新年結(jié)束沒多久,馬斯克就給中國的特斯拉車主送上一份大禮——2月26日,在毫無征兆的情況下特斯拉向中國區(qū)購買了FSD的HW4.0車主開啟了功能推送。此前一度傳言FSD因為數(shù)據(jù)問題入華時間將推遲,而且這次推送的是和美國相同的V13版本,對于它在中國的表現(xiàn)大家非常好奇,隨后各大媒體和大V都對FSD進(jìn)行了詳細(xì)的測試。
    VLA,是不是自動駕駛的下一站?
  • 智駕平權(quán)“最大公約數(shù)”地平線:2024年營收23.84億元創(chuàng)新高,同比大增53.6%
    地平線機器人-W(09660.HK,以下簡稱“地平線”)發(fā)布2024年業(yè)績公告。截至2024年12月31日止,地平線全年營收23.84億元,同比增長53.6%;毛利潤18.41億元,同比增長68.3%;現(xiàn)金及現(xiàn)金等價物儲備同比增加,流動性維持充足。公司營收與毛利潤表現(xiàn)亮眼,增長勢頭強勁。 量產(chǎn)規(guī)模加速擴(kuò)大,穩(wěn)居智駕市場領(lǐng)導(dǎo)地位 地平線成立于2015年,是市場領(lǐng)先的乘用車高級輔助駕駛(ADAS)和高
    智駕平權(quán)“最大公約數(shù)”地平線:2024年營收23.84億元創(chuàng)新高,同比大增53.6%
  • Figure AI發(fā)布VLA模型Helix,人形機器人商業(yè)化元年正在來臨
    北美時間2月20日,人形機器人公司Figure AI發(fā)布新型通用人形機器人VLA模型Helix。本次Figure發(fā)布的視頻當(dāng)中能看到,有兩臺搭載了Helix模型的Figure機器人共同協(xié)作,完成了拾取任意物品并分類的任務(wù)操作。VLA模型是指視覺(Vision)-語言(Language)-動作(Action)模型,機器人可以將感知、語言等多模態(tài)的信息和學(xué)習(xí)到的控制能力結(jié)合,從而輸出執(zhí)行命令的動作。
    Figure AI發(fā)布VLA模型Helix,人形機器人商業(yè)化元年正在來臨