對(duì)話 | 蓋世汽車CEO、蓋世汽車資訊總編?周曉鶯
撰文 | 蓋世汽車編輯 宋凡
當(dāng)人工智能與汽車工業(yè)的齒輪緊密咬合,自動(dòng)駕駛技術(shù)正以顛覆性的姿態(tài)重塑人類出行的未來。在這場(chǎng)全球化的技術(shù)競(jìng)逐中,Mobileye——這家由計(jì)算機(jī)科學(xué)家Amnon Shashua教授掌舵的企業(yè),始終以“高性能”的引擎驅(qū)動(dòng)行業(yè)邊界。從早期基于視覺感知的ADAS系統(tǒng),到即將量產(chǎn)的“可脫眼”自動(dòng)駕駛方案“Chauffeur”,Mobileye用25年的技術(shù)積淀證明:真正的變革,不僅需要算法的突破,更在于成本、安全與全球化落地之間的極致平衡。
在接受蓋世汽車的C Talk高端系列訪談時(shí),Amnon Shashua教授以學(xué)者與企業(yè)家交織的視角,勾勒出Mobileye的野心與務(wù)實(shí)。其核心武器——EyeQ系列芯片,通過“每秒幀數(shù)”這一實(shí)戰(zhàn)效率標(biāo)尺,打破了傳統(tǒng)TOPS指標(biāo)的桎梏,將算力競(jìng)爭(zhēng)從紙面參數(shù)拉回真實(shí)場(chǎng)景。新一代EyeQ6芯片實(shí)現(xiàn)了十倍性能躍升,為第二代SuperVision多攝像頭系統(tǒng)的量產(chǎn)提供了堅(jiān)實(shí)支撐。而面向?qū)⒂?027年發(fā)布的Chauffeur方案,Mobileye則試圖以較低的成本,實(shí)現(xiàn)高速公路場(chǎng)景下L3-L4級(jí)“合法可脫眼”駕駛。這背后,是Mobileye獨(dú)創(chuàng)的“冗余哲學(xué)”:通過成像雷達(dá)、路網(wǎng)智能技術(shù)與多子系統(tǒng)融合,壓縮故障率,構(gòu)筑自動(dòng)駕駛的安全壁壘。
當(dāng)行業(yè)陷入“端到端”的技術(shù)內(nèi)卷時(shí),Mobileye以復(fù)合人工智能系統(tǒng)(Compound AI System)的實(shí)踐站穩(wěn)腳跟。Amnon Shashua教授明確指出:“消費(fèi)級(jí)汽車的整個(gè)系統(tǒng)成本應(yīng)該控制在幾千美元,否則沒有商業(yè)意義。”而自動(dòng)駕駛的未來,終將回歸到成本與規(guī)?;涞氐睦硇愿?jìng)爭(zhēng)之中。交通出行領(lǐng)域的變革不是一輛酷炫的演示車,而是讓數(shù)千萬(wàn)普通消費(fèi)者用得起、敢信賴的技術(shù)。Mobileye的變革不僅預(yù)示著自動(dòng)駕駛初級(jí)躍遷,更指向從“可脫眼”駕駛邁向全域無(wú)人駕駛的遠(yuǎn)景——一個(gè)由技術(shù)進(jìn)步驅(qū)動(dòng)、共享出行理念重構(gòu)的新時(shí)代。
面對(duì)中國(guó)市場(chǎng)的蓬勃生機(jī),Amnon Shashua教授毫不掩飾對(duì)其的重視。他表示,Mobileye已與極氪等品牌展開深度合作,實(shí)現(xiàn)技術(shù)方案在量產(chǎn)車型中的廣泛應(yīng)用,并致力于為中國(guó)車企的全球化戰(zhàn)略提供無(wú)縫對(duì)接。未來,Mobileye將繼續(xù)為中國(guó)車企提供全球化的技術(shù)支持,成為中國(guó)車企出海的“隱形橋梁”。
站在AI與物理世界交融的臨界點(diǎn),這位身兼多家前沿AI公司創(chuàng)始人的教授,將Mobileye的未來錨定在“Physical AI”的疆域。“人工智能真的是刻進(jìn)了Mobileye的DNA里。” 隨著AI在現(xiàn)實(shí)世界中更廣泛的應(yīng)用和擴(kuò)展,未來,Mobileye的業(yè)務(wù)發(fā)展可能從汽車領(lǐng)域拓展至如機(jī)器人等其他領(lǐng)域,從單一場(chǎng)景進(jìn)化到全域無(wú)人駕駛?;蛟S正如他預(yù)言的那般:當(dāng)“可脫眼”駕駛未來十年內(nèi)走進(jìn)現(xiàn)實(shí),人類與機(jī)器的協(xié)作范式將迎來新一輪重構(gòu)。而這場(chǎng)變革的密碼,早已深埋在Mobileye的基因里:用教授的深度思考,與企業(yè)家的廣袤視野,書寫技術(shù)普惠的真正答案。
在這場(chǎng)交通領(lǐng)域的變革中,Mobileye憑借其深厚的技術(shù)積累和全球化布局,正穩(wěn)步邁向自動(dòng)駕駛的未來。接下來,讓我們通過Amnon Shashua教授的詳細(xì)解讀,深入了解Mobileye如何通過技術(shù)創(chuàng)新與戰(zhàn)略布局,推動(dòng)自動(dòng)駕駛的普及與變革。
以下為訪談實(shí)錄,對(duì)話
周曉鶯:您覺得您自己更偏向是企業(yè)家還是教授?
Prof. Amnon Shashua:兩個(gè)都是。
周曉鶯:那您更喜歡哪個(gè)身份?
Prof. Amnon Shashua:我都喜歡。
周曉鶯:但這兩個(gè)身份很不一樣。
Prof. Amnon Shashua:的確不同。作為教授需要專注于一個(gè)細(xì)分的領(lǐng)域然后深入研究。所以,這能產(chǎn)生的影響是有限的。作為企業(yè)家既能深入又能拓寬領(lǐng)域。因此,可以對(duì)社會(huì)產(chǎn)生更大的影響。而將兩者結(jié)合起來才是真正令人興奮的。既能深入研究,又能產(chǎn)生更廣的社會(huì)影響。
感知革新:Mobileye重塑出行新生態(tài)
周曉鶯:是的,我注意到,您創(chuàng)立了很多公司,Mobileye是其中之一。您能簡(jiǎn)要介紹一下Mobileye的核心業(yè)務(wù)嗎?
Prof. Amnon Shashua:Mobileye最初是一家專注于視覺感知和攝像頭數(shù)據(jù)處理的公司,這是我們的DNA。能夠利用攝像頭輸入、視頻輸入,并以此詮釋交通場(chǎng)景,進(jìn)而發(fā)展出高級(jí)駕駛輔助功能。這些駕駛輔助功能會(huì)警示你注意避免道路碰撞、在碰撞發(fā)生前及時(shí)剎車、提醒你注意路上行人、交通標(biāo)志或紅綠燈信號(hào)等。理解場(chǎng)景并采取行動(dòng)來減輕或避免碰撞事故的發(fā)生。這就是Mobileye成立的最初愿景,這也是我們收入的重要組成部分。
我們?cè)O(shè)計(jì)了一款非常高效的芯片——我們稱之為 “EyeQ”系列,現(xiàn)在已經(jīng)迭代到第六代。隨著時(shí)間的推移,我們開始業(yè)務(wù)擴(kuò)張。在原有業(yè)務(wù)基礎(chǔ)上,我們開發(fā)出一套多攝像頭系統(tǒng)——我們稱之為 “SuperVision”。這套解決方案的首次推出是在中國(guó)市場(chǎng)。搭載它的是極氪 001 和 009 車型、以及極星4車型。它可以360度解讀交通道路場(chǎng)景,并支持在特定運(yùn)行設(shè)計(jì)域內(nèi)實(shí)現(xiàn)可脫手駕駛。但駕駛員仍然需要對(duì)駕駛負(fù)責(zé)。駕駛員需要專注于路況,不能做其他事情。不過汽車本身已經(jīng)具備了可脫手駕駛的能力這就是目前我們所處的階段。
第一代SuperVision方案是在中國(guó)推出的,其搭載量超過了30萬(wàn)輛汽車,為我們將復(fù)雜技術(shù)應(yīng)用到量產(chǎn)車型中帶來了大量實(shí)踐經(jīng)驗(yàn)。
我們第二代SuperVision方案將于明年推出,搭載到奧迪、保時(shí)捷、以及整個(gè)大眾汽車集團(tuán)的車型上,使用的是我們的EyeQ6芯片。新的方案計(jì)算能力提升了十倍。我們可以將更多AI技術(shù)融入系統(tǒng)中,提供的是功能更加強(qiáng)大、同時(shí)具備更高可用性的系統(tǒng)。
我們的愿景遠(yuǎn)不止于此。我們相信,為了實(shí)現(xiàn)在交通出行領(lǐng)域的變革,必須從“需注視”的系統(tǒng)——即駕駛員駕駛時(shí)需專注路況,進(jìn)化到“可脫眼”的系統(tǒng)——即駕駛員可以在駕駛中合法的做其他事情,無(wú)需專注路況。
我們將這樣的方案稱之為“Chauffeur”。首款Chauffeur方案將于2027年初在奧迪車型上實(shí)現(xiàn)量產(chǎn)搭載。它將先在特定設(shè)計(jì)運(yùn)行域的高速公路上應(yīng)用。這套系統(tǒng)非常實(shí)用,可以以最高130 km/h的速度行駛、能夠?qū)崿F(xiàn)自動(dòng)變道、自動(dòng)跟隨路線、并允許駕駛員在行駛中合法做其他事情。
周曉鶯:這已經(jīng)是 L3 或接近 L4 的系統(tǒng)了。
Prof. Amnon Shashua:是的,這是 L3-L4 的系統(tǒng)。駕駛員仍需坐在駕駛位上,但同時(shí)可以在做其他事情,不需要專注路況。比如,你可以使用手機(jī),實(shí)現(xiàn)“可脫手”、“可脫眼”的駕駛。
為什么說這是一次變革呢?因?yàn)橐坏{駛員在長(zhǎng)時(shí)間駕駛中可以“脫眼”… 實(shí)際上,我們大部分駕駛是在高速公路上完成的。比如在美國(guó),駕駛車輛從舊金山開到洛杉磯總共五小時(shí)車程,其中一小時(shí)是在市區(qū)道路,剩下四小時(shí)是在高速公路。假設(shè)這五小時(shí)中,你可以用四小時(shí)進(jìn)行工作。
周曉鶯:對(duì)的,這樣可以節(jié)省很多時(shí)間。
Prof. Amnon Shashua:這是一種巨大的價(jià)值體現(xiàn)。因此,這顯然是一種顛覆性的變革。問題是,目前還沒有公司成功構(gòu)建出這樣的技術(shù)。原因是什么?
目前的成功經(jīng)驗(yàn),比如Waymo的Robotaxi。他們的技術(shù)路線是投入大量傳感器。如果你去他們展臺(tái)參觀一下他們的車輛,你會(huì)看到車上安裝了很多傳感器。這些傳感設(shè)備的成本加起來大概是幾萬(wàn)美元,而這對(duì)于消費(fèi)級(jí)汽車而言并不適用。消費(fèi)級(jí)汽車的整個(gè)系統(tǒng)成本應(yīng)該控制在幾千美元,否則沒有商業(yè)意義。所以,還沒有人展示過如何用幾千美元的成本,實(shí)現(xiàn)既經(jīng)濟(jì)實(shí)惠、又能達(dá)到“可脫眼”駕駛系統(tǒng)所需的精確度。
與現(xiàn)有系統(tǒng)相比,這種精確度是質(zhì)的飛躍。
現(xiàn)有的“可脫手”駕駛系統(tǒng),即使是最好的系統(tǒng),平均干預(yù)間隔時(shí)間也只有幾個(gè)小時(shí),5個(gè)小時(shí)、10個(gè)小時(shí)。而“可脫眼”駕駛系統(tǒng)要求的平均干預(yù)間隔時(shí)間需要在數(shù)萬(wàn)小時(shí)到數(shù)百萬(wàn)小時(shí)之間。因此,需要跨越如此巨大的障礙,才能實(shí)現(xiàn)從“需注視”駕駛到“可脫眼”駕駛的過渡。
不是一個(gè)平穩(wěn)的過渡,而是一個(gè)飛躍性的進(jìn)步。這正是 Mobileye 的目標(biāo)所在,也是 Mobileye 90% 的精力所在。我們致力于構(gòu)建這類技術(shù),因?yàn)樗鼘硪粓?chǎng)出行變革。
我們是從“Chauffeur”方案開始。同時(shí),我們也在研發(fā)無(wú)人駕駛出租車(Robotaxi)。等會(huì)兒我們參觀展臺(tái)時(shí),我會(huì)向您介紹基于大眾汽車旗下ID Buzz平臺(tái)打造的Robotaxi。
因此,“Chauffeur”方案是創(chuàng)造出行變革的第一步。Mobileye 95% 的精力都用在構(gòu)建實(shí)現(xiàn)這一目標(biāo)的技術(shù)。
AI定義競(jìng)爭(zhēng)新格局
周曉鶯:立足起點(diǎn),展望未來,我們看到了人工智能的崛起。人工智能現(xiàn)在成為一個(gè)熱門話題,它改變了很多行業(yè)的工作和生活方式。那么 Mobileye是如何將 AI 技術(shù)融入到實(shí)際應(yīng)用中的?
Prof. Amnon Shashua:過去十年的人工智能變革極其重要,它改變了一切。
這一切始于 2012 年的深度神經(jīng)網(wǎng)絡(luò)。深度神經(jīng)網(wǎng)絡(luò)使開發(fā)者能夠?qū)⒃紙D像和視頻輸入到神經(jīng)網(wǎng)絡(luò)中,從中找到場(chǎng)景中的物體,例如車輛。在深度神經(jīng)網(wǎng)絡(luò)出現(xiàn)之前,開發(fā)者需要通過其他方式提取圖像中的特征,然后用機(jī)器學(xué)習(xí)從特征中識(shí)別物體。有了深度神經(jīng)網(wǎng)絡(luò),輸入原始圖像和視頻就能進(jìn)行檢測(cè)。但這需要一些創(chuàng)新能力,將二維圖像中的感知數(shù)據(jù)提升到三維,并整合來自多個(gè)攝像頭的信息。
隨著Transformer模型的問世,下一個(gè)飛躍出現(xiàn)在2017年。它也是ChatGPT等語(yǔ)言模型構(gòu)建的基石。
其突破在于能夠在不同領(lǐng)域之間建立協(xié)同性。在Transformer出現(xiàn)之前,計(jì)算機(jī)視覺需要專門的知識(shí)體系、自然語(yǔ)言處理也需要一套專門知識(shí)、語(yǔ)音或聲學(xué)處理又需要另一套專業(yè)知識(shí)。而Transformer出現(xiàn)后,這一切趨于統(tǒng)一。
為什么呢?因?yàn)門ransformer可以將輸入源轉(zhuǎn)化為詞元,也就是“tokens”。然后有一套模型逐一處理這些tokens,這種方法叫做“自回歸”。輸入一些tokens,然后預(yù)測(cè)下一個(gè)token。接著,把輸出內(nèi)容也轉(zhuǎn)換為tokens。然后,這個(gè)模型從輸入tokens轉(zhuǎn)換到輸出tokens。
它并不在意這些tokens是否來自圖像、是否來自語(yǔ)言、或是聲音、或是其他來源。于是,所有這些不同的學(xué)科融合為一體。這是一個(gè)重大突破。它為我們這個(gè)領(lǐng)域帶來了從原始圖像中提取多攝像頭的圖像,直接生成三維感知的能力。
可以將車輛直接放置在三維空間中,而不再需要先經(jīng)過二維的處理,然后拼接各部分,再構(gòu)建三維感知。這極大加速了圖像處理能力。這是一個(gè)巨大的變革。
在Mobileye,我們正所做的是,利用所有這些Transformer技術(shù)以及即將發(fā)布的下一代芯片EyeQ6,以非常高效的方式賦能我們達(dá)到非常高的精確度。
我的意思是,看一下現(xiàn)在的AI 系統(tǒng),比如ChatGPT。它們的優(yōu)化并不在精確度上,它們的優(yōu)化側(cè)重于可用性上。如果把 GPT-3、GPT-o1 等進(jìn)行對(duì)比,會(huì)有什么變化?
語(yǔ)言模型能解決越來越多的問題,但精確度提升并不大。精確度是指——你問一個(gè)問題,它是否給出了正確答案?它可能會(huì)產(chǎn)生“幻覺”,可能會(huì)給出錯(cuò)誤的答案。所以,它們的優(yōu)化側(cè)重于可用性,而不是精確度。
如果你想開發(fā)出“可脫眼”駕駛的自動(dòng)駕駛汽車,你要優(yōu)化的就是精確度。而這正是僅僅依靠數(shù)據(jù)驅(qū)動(dòng)引擎會(huì)遇到的問題。比如說,以攝像頭為例,如果只是通過不斷輸入數(shù)據(jù)來訓(xùn)練,是否可以達(dá)到如此高的精確度?目前還沒有人能夠給出答案。
機(jī)器學(xué)習(xí)系統(tǒng)并未優(yōu)化精確度,它們的優(yōu)化側(cè)重于可用性。因此,你需要做些不同的事情。我們正在做的這件與眾不同的事的靈感來自航空領(lǐng)域,就是飛機(jī)。飛機(jī)恰恰是一個(gè)需要極高精度的機(jī)器。飛機(jī)不會(huì)突然從天上掉下來。
周曉鶯:的確,這絕對(duì)無(wú)法接受。
Prof. Amnon Shashua:那么它們是怎么做到的呢?它們通過創(chuàng)建冗余機(jī)制,每個(gè)功能都由多個(gè)子系統(tǒng)來實(shí)現(xiàn)。這些子系統(tǒng)執(zhí)行相同的任務(wù),從而形成倍增效應(yīng)。假設(shè)一個(gè)系統(tǒng)有一定的故障率,如果再增加一個(gè)故障率相同的系統(tǒng),故障率將會(huì)呈現(xiàn)平方關(guān)系,實(shí)際上達(dá)到了故障率相乘的效果。也就是說,通過多子系統(tǒng)的配置,可以非??焖俚剡_(dá)到極高精度。
我們?cè)贛obileye面臨的問題是——如何設(shè)計(jì)這些子系統(tǒng)才能提高精確度?
除了攝像頭之外,我們需要開發(fā)另一種傳感器。它的性能要求與攝像頭相當(dāng),但其工作原理則與攝像頭完全不同。于是,我們開始研發(fā)成像雷達(dá)。
這些雷達(dá)是高清的,分辨率非常高。它們的輸出與攝像頭相似,但原理完全不同。它們能夠在任何天氣條件下工作。但它們的故障點(diǎn)與攝像頭完全不同,從而實(shí)現(xiàn)了另一套獨(dú)立的系統(tǒng)。那現(xiàn)在就有了兩套子系統(tǒng)——一套來自成像雷達(dá),一套來自攝像頭。
此外,我們也開始在軟件中設(shè)計(jì)更多子系統(tǒng)。例如,可以把地圖看作一種傳感器,將攝像頭看到的視圖看作另一種傳感器?,F(xiàn)在,你擁有兩套獨(dú)立的信息,可以將它們?nèi)诤显谝黄?、結(jié)合起來,這就形成了冗余。
核心在于,如何將一個(gè)問題分解為多個(gè)子系統(tǒng)從而提升精確度。因?yàn)檫@就是關(guān)鍵所在。如果無(wú)法達(dá)到如此高的精確度,就無(wú)法構(gòu)建“可脫眼”的自動(dòng)駕駛系統(tǒng)。你只能停留在“需注視”駕駛階段。雖然這也是一個(gè)不錯(cuò)的產(chǎn)品,但它并不是革命性的。
革命性的變化指的是,具備讓駕駛員“可脫眼”駕駛,去合法做其他事情的能力。例如,使用智能手機(jī),或者小憩,但無(wú)需專注路況。這是最大的挑戰(zhàn)。
周曉鶯:當(dāng)行業(yè)邁入AI時(shí)代,競(jìng)爭(zhēng)難度是增加了還是減少了?
Prof. Amnon Shashua:要想回答這個(gè)問題,我們要回到關(guān)于語(yǔ)言模型的討論。
有很多公司都在構(gòu)建語(yǔ)言模型,比如名列前茅的OpenAI和Anthropic、還有Google的Gemini。目前這條賽道擠進(jìn)了超過 100 家公司,這些公司構(gòu)成了一個(gè)長(zhǎng)尾效應(yīng)。
現(xiàn)在有一個(gè)網(wǎng)站叫Chatbot Arena。這個(gè)網(wǎng)站會(huì)對(duì)市面上所有語(yǔ)言模型進(jìn)行排名。但他們的排名方式不是通過基準(zhǔn)測(cè)試,因?yàn)槿缃竦幕鶞?zhǔn)測(cè)試都存在偏差。那些聲稱自己通過了基準(zhǔn)測(cè)試的說法不夠可信。因?yàn)檫@些系統(tǒng)是在整個(gè)互聯(lián)網(wǎng)環(huán)境下訓(xùn)練的,這也就包括了這些基準(zhǔn)測(cè)試的數(shù)據(jù),所以就很難準(zhǔn)確評(píng)估。
所以他們采用了眾源方式——當(dāng)一個(gè)人提問時(shí),他會(huì)收到來自兩個(gè)不同語(yǔ)言模型的答案,然后需要評(píng)估哪個(gè)答案更合適。通過這種方式,他們就能對(duì)所有語(yǔ)言模型進(jìn)行排名。當(dāng)然,OpenAI和Anthropic排在了最前列,后面則是一個(gè)巨大的長(zhǎng)尾市場(chǎng)。
所以,現(xiàn)如今想處于行業(yè)中游位置比五年前容易得多。但處于中游位置并沒有多大意義,因?yàn)?9% 的使用量都來自前兩家公司。
我們所在領(lǐng)域的情況也類似。如今想打造一輛性能不錯(cuò)的演示車比五年前容易很多。但要從一輛演示車到覆蓋多款車型、多家主機(jī)廠的規(guī)?;慨a(chǎn),就是一個(gè)巨大的飛躍。再比如,打造一輛可以連續(xù)自動(dòng)駕駛半小時(shí)或一小時(shí)而無(wú)需人工接管的車是一回事,但要打造一輛100 萬(wàn)小時(shí)才需要人工接管一次的車則完全是另一回事了。
所以,想要躋身行業(yè)頂尖仍然非常困難,而處于行業(yè)中游位置現(xiàn)在比五年前容易得多,但這毫無(wú)意義。
周曉鶯:我認(rèn)為處于中游或中游以下毫無(wú)價(jià)值。
Prof. Amnon Shashua:沒錯(cuò),這毫無(wú)價(jià)值。
技術(shù)與執(zhí)行力鑄就未來基石
周曉鶯:那么,Mobileye的優(yōu)勢(shì)是什么?是如何保持行業(yè)領(lǐng)先的?
Prof. Amnon Shashua:這涉及的方面很廣,并不是只靠人工智能或軟件,遠(yuǎn)不止這些。
首先是芯片。我們的芯片非常高效且成本很低,這使我們能夠以非常實(shí)惠的價(jià)格構(gòu)建系統(tǒng)。同時(shí),我們的芯片還專為運(yùn)行我們構(gòu)建的人工智能堆棧而設(shè)計(jì),這是我們的一大優(yōu)勢(shì)。
第二個(gè)優(yōu)勢(shì)是,我們暫時(shí)把人工智能放一邊,談?wù)勅斯ぶ悄苤獾氖虑?。另一個(gè)優(yōu)勢(shì)是我們可以通過智能路網(wǎng)技術(shù)來構(gòu)建高精地圖。例如,歐洲大部分地區(qū)、美國(guó)大部分地區(qū)已經(jīng)通過我們的技術(shù)完成了繪制。
第三個(gè)優(yōu)勢(shì)是數(shù)據(jù)。我們擁有650PB的數(shù)據(jù)。這是一個(gè)巨大的數(shù)據(jù)量,其中有300PB是視頻數(shù)據(jù)。換而言之,我們擁有數(shù)千萬(wàn)小時(shí)的錄制視頻數(shù)據(jù),遍布全球。“遍布全球”非常重要。因?yàn)椋绻阒辉谀硞€(gè)地區(qū)擁有大量數(shù)據(jù),那么當(dāng)你在另一個(gè)地區(qū)駕駛時(shí),系統(tǒng)表現(xiàn)是否一樣呢?它也許并不能正常運(yùn)作,它可能屬于分布外的數(shù)據(jù)。因此,你需要覆蓋全球的數(shù)據(jù),這也是Mobileye的優(yōu)勢(shì)之一。在過去的25年里,我們積累了大量數(shù)據(jù)。
其次,我們還擁有龐大的基礎(chǔ)設(shè)施以及便捷的數(shù)據(jù)訪問方式。比如說,你碰到一個(gè)邊緣情況,即使你只是口頭描述它——例如,路上有一輛車翻車了。我們的技術(shù)和搜索引擎在你口頭描述一輛車在路上翻倒時(shí),它就在650PB的數(shù)據(jù)庫(kù)中搜索并反饋給你翻倒在路上的車的相關(guān)圖片。
我們利用這些數(shù)據(jù)不斷完善和優(yōu)化系統(tǒng)。我們擁有龐大的模擬器、豐富的硬件環(huán)路,使得系統(tǒng)可以在一夜之間運(yùn)行數(shù)萬(wàn)小時(shí)的數(shù)據(jù)。一夜之間,也就是成千上萬(wàn)的系統(tǒng)共同運(yùn)行,就是一個(gè)巨大的執(zhí)行機(jī)器。
Mobileye至今已銷售并交付了超過1.9億顆芯片。也就是說,全球有超過1.9億輛車正在使用Mobileye的技術(shù),差不多占全球所有汽車總量的15% 左右。這非常了不起。有超過1200款車型正在使用Mobileye芯片。這一切都為我們提供了大量的經(jīng)驗(yàn)和技術(shù)積累。
在人工智能之前,Mobileye強(qiáng)在執(zhí)行。
執(zhí)行力強(qiáng)意味著你可以以最優(yōu)的成本帶來最好的技術(shù),因?yàn)槌杀竞苤匾?。如果你只有非常?yōu)秀的技術(shù),但成本很高,那么你在量產(chǎn)上會(huì)受限。如果你能做到低成本,但技術(shù)不夠先進(jìn),那你同樣會(huì)受到限制,并且使用場(chǎng)景也會(huì)受限。Mobileye做到了兩全其美——既有高質(zhì)量的產(chǎn)品,同時(shí)又將成本壓到很低。
那說到人工智能,更是我們的專長(zhǎng)所在了。
我本人是一名計(jì)算機(jī)科學(xué)教授,我的專長(zhǎng)就是人工智能。我擔(dān)任教授已經(jīng)有20年了。我的同事Shai Shalev-Shwartz 是Mobileye的首席技術(shù)官(CTO),同樣是一名計(jì)算機(jī)科學(xué)和人工智能領(lǐng)域的教授。
我是數(shù)家人工智能公司的聯(lián)合創(chuàng)始人,包括機(jī)器人領(lǐng)域的Mentee Robotics公司、人形機(jī)器人和語(yǔ)言模型領(lǐng)域的AI21 Labs公司。我最近又創(chuàng)立了一家新公司名叫Double AI,致力于研發(fā)下一代人工智能,一種可以取代如牛頓和愛因斯坦這個(gè)層級(jí)專家的人工智能。如何才能創(chuàng)造出能夠解決只有愛因斯坦才能解決的問題的人工智能呢?這是我正在研究的另一個(gè)領(lǐng)域。
所以人工智能真的是刻進(jìn)了Mobileye的DNA里。當(dāng)把所有元素結(jié)合起來,你會(huì)發(fā)現(xiàn)Mobileye是一家非常獨(dú)特的公司。
Mobileye的宏遠(yuǎn)藍(lán)圖與未來航向
周曉鶯:是的。我們可以看到,在我們這個(gè)時(shí)代,新技術(shù)正源源不斷地涌現(xiàn)。展望未來,十年之期,您認(rèn)為Mobileye的未來會(huì)是什么樣的?
Prof. Amnon Shashua:Mobileye的愿景首先是——以實(shí)惠的價(jià)格實(shí)現(xiàn)“可脫眼“的自動(dòng)駕駛技術(shù),成本幾千美元左右。
從高速公路開始,然后逐步拓展到更多類型的道路,最終在消費(fèi)級(jí)汽車層面實(shí)現(xiàn)完全無(wú)人駕駛。不是在無(wú)人駕駛出租車層面,而是消費(fèi)級(jí)汽車層面。所以第一次革命是實(shí)現(xiàn)“可脫眼”的駕駛。
第二次革命是實(shí)現(xiàn)車內(nèi)無(wú)需駕駛員的駕駛。這意味著什么呢?這意味著,一個(gè)家庭只需一臺(tái)車。我開車上班然后讓車自己開回家,因?yàn)檐噧?nèi)不需要司機(jī)。
周曉鶯:是自動(dòng)駕駛。
Prof. Amnon Shashua:這將會(huì)是又一場(chǎng)變革。因?yàn)樗淖兞宋覀兘裉鞂?duì)車輛的所有權(quán)和使用方式。我們所需的車輛的數(shù)量將大幅減少,而出行的保障依然不變。我認(rèn)為這是在我們的十年規(guī)劃末期可能實(shí)現(xiàn)的愿景,也就是從現(xiàn)在起至少六七年之后的事情。
那在近兩三年之內(nèi),從“可脫眼”的自動(dòng)駕駛技術(shù)開始,逐年進(jìn)步,提供越來越多的應(yīng)用場(chǎng)景,直到可以在消費(fèi)級(jí)汽車層面做到完全無(wú)人駕駛。
周曉鶯:大概五年后?
Prof. Amnon Shashua:差不多五到七年,八年的樣子。
周曉鶯:很快就會(huì)實(shí)現(xiàn)。
Prof. Amnon Shashua:在我們這個(gè)行業(yè),十年內(nèi)都可以稱為是“不久的將來”。
另外,我認(rèn)為未來Mobileye的業(yè)務(wù)會(huì)隨著人工智能在現(xiàn)實(shí)世界中更廣泛的應(yīng)用而擴(kuò)展,比如到機(jī)器人領(lǐng)域。我認(rèn)為,Mobileye將會(huì)成為在現(xiàn)實(shí)世界中運(yùn)用AI技術(shù)的公司。我聽過一個(gè)很不錯(cuò)的名字,是黃仁勛在一次演講中提到的“Physical AI”。我預(yù)期中的Mobileye就是一家可以量產(chǎn)“Physical AI”技術(shù)的公司。
周曉鶯:不僅僅是在汽車領(lǐng)域?
Prof. Amnon Shashua:是的,不局限于汽車領(lǐng)域。首先攻克汽車行業(yè),然后再向其他領(lǐng)域拓展。
自動(dòng)駕駛的終局不止端到端
周曉鶯:談及智能駕駛領(lǐng)域,目前,我們看到有很多公司都在應(yīng)用端到端技術(shù),您對(duì)此有什么見解?
Prof. Amnon Shashua:關(guān)于端到端技術(shù)討論有很多,我認(rèn)為這些議論沒有太大意義。即使某個(gè)公司聲稱 “我們正在做端到端” ,實(shí)際上他們做的不止是 “端到端”。
到底什么是“端到端”?
“端到端”就是,比如說,以攝像頭為例,你拿視頻信息作為輸入,那輸出將是控制指令。Mobileye也在做“端到端”。在我CES新聞發(fā)布會(huì)的演講中,我展示了一段Mobileye的視頻。那就是一個(gè)端到端——從圖像輸入到控制輸出。
Mobileye與其他做“端到端”的公司的不同在于,他們主張,只要有端到端就可以解決所有問題,但Mobileye認(rèn)為,還需要冗余。僅僅有“端到端”是不夠的,你需要額外的路徑來創(chuàng)建子系統(tǒng)。不僅涉及傳感器的多樣化,還需要有不同的算法。所以,端到端只是其中一條路徑,還有需要其他額外的路徑——我們稱之為復(fù)合人工智能系統(tǒng)。
因此,Mobileye的方法是,端到端是復(fù)合人工智能系統(tǒng)中的一個(gè)組成部分。
周曉鶯:好的,這是一個(gè)不同的洞見。你們認(rèn)為,“端到端”并不是全部。
Prof. Amnon Shashua:是的,端到端是一個(gè)元素,一個(gè)部分,然后還有其他部分。
算力衡量新視角
周曉鶯:當(dāng)下的自動(dòng)駕駛領(lǐng)域,我們看到很多公司都在算力上展開競(jìng)爭(zhēng)。您認(rèn)為,算力越高越好嗎?還是其實(shí)有其他途徑來解決問題?
Prof. Amnon Shashua:算力確實(shí)是一個(gè)必要條件。因?yàn)槿缃竦腁I技術(shù)需要越來越強(qiáng)的算力來支撐。問題是,如何衡量算力?標(biāo)準(zhǔn)的衡量方法是每秒萬(wàn)億次操作,也就是所謂的TOPS。Mobileye認(rèn)為這是錯(cuò)誤的衡量標(biāo)準(zhǔn)。
周曉鶯:錯(cuò)誤的?
Prof. Amnon Shashua:我們認(rèn)為,應(yīng)該有其他指標(biāo)來科學(xué)地衡量芯片的效率。所以Mobileye衡量的是每秒幀數(shù)。拿一個(gè)算法,看看這顆芯片運(yùn)行起這個(gè)算法來每秒可以處理多少幀畫面?
例如,我們展示了EyeQ5和EyeQ6的差異。用TOPS衡量的話,差異只是兩倍。但用每秒幀數(shù)衡量,差距是10倍。
周曉鶯:居然有10倍的差距。
Prof. Amnon Shashua:這意味著在使用TOPS和每秒幀數(shù)衡量之間,會(huì)產(chǎn)生巨大的差異。所以我們認(rèn)為,每秒幀數(shù)這個(gè)數(shù)值才真正有意義,因?yàn)樗苯臃从沉诵酒軌蜉敵龅膶?shí)際性能。
打個(gè)比方,有一個(gè)算法,我更關(guān)心的是運(yùn)行這個(gè)算法的速度到底有多快。至于TOPS,并不十分重要。因?yàn)樾酒瑑?nèi)部通常集成了多個(gè)加速器,它不僅僅是CPU,還有其他專用硬件加速器。而且,這些額外的加速器,即使我們競(jìng)爭(zhēng)對(duì)手的芯片,比如英偉達(dá)的,也有多種類型的加速器,而不僅僅是GPU。
因此,用TOPS衡量等于把所有東西都放在一個(gè)籃子里。但每個(gè)加速器都有其最合適的工作負(fù)載,所以每秒幀數(shù)才是衡量效率的最佳標(biāo)準(zhǔn)。這也是Mobileye衡量芯片效率的方法。
我們的EyeQ6芯片性能足夠強(qiáng)大,通過合理芯片配置,可以支持我們所需的全部自動(dòng)駕駛功能。我們的系統(tǒng)配置是從單顆EyeQ6芯片開始,我們稱之為環(huán)視ADAS——包括前置攝像頭、四個(gè)泊車攝像頭和環(huán)繞式雷達(dá),僅需一顆EyeQ6芯片即可。
SuperVision方案配備了兩顆EyeQ6芯片,包括車身的11個(gè)攝像頭和若干雷達(dá)作為可選項(xiàng)。
“可脫手”的Chauffeur方案則用了三顆EyeQ6芯片;Robotaxi方案配備了四顆EyeQ6芯片。
到2027年,EyeQ6將被EyeQ7迭代替換掉。EyeQ7將會(huì)具備更強(qiáng)勁的性能。也就是說,原來需要兩顆EyeQ6的系統(tǒng)未來只需一顆EyeQ7芯片。原來需要四顆EyeQ6的系統(tǒng)將被兩顆EyeQ7芯片取代。這樣一來,進(jìn)一步實(shí)現(xiàn)了成本優(yōu)化。
周曉鶯:成本的降低,是客戶最期待的結(jié)果。
Prof. Amnon Shashua:歸根究底,一切都是對(duì)成本和性能的優(yōu)化。你需要兩者兼俱。當(dāng)前的大環(huán)境下,只抓其中一頭是遠(yuǎn)遠(yuǎn)不夠的。
全球視野賦能中國(guó)車企走向世界
周曉鶯:您在去年到訪了中國(guó),您有沒有親自體驗(yàn)過中國(guó)的電動(dòng)車?
Prof. Amnon Shashua:中國(guó)的“可脫手,需注視”的智能駕駛功能令人印象深刻,極其令人印象深刻。它們成本更高一些、需要更強(qiáng)的算力支撐、搭載了更多的傳感器,但在性能方面表現(xiàn)確實(shí)非常非常出色。
周曉鶯:現(xiàn)在,越來越多的中國(guó)車企都在希望走向全球市場(chǎng),您認(rèn)為它們將面臨哪些挑戰(zhàn)?有什么建議嗎?或者M(jìn)obileye可以在海外市場(chǎng)為它們提供哪些幫助?
Prof. Amnon Shashua:我們?cè)谥袊?guó)的大多數(shù)客戶都是具備全球化雄心的中國(guó)車企。事實(shí)上,今年,我們預(yù)計(jì)ADAS產(chǎn)品將會(huì)在中國(guó)市場(chǎng)增長(zhǎng)約40%。這正是得益于這些有全球化拓展計(jì)劃的中國(guó)車企,比如奇瑞、吉利等。
Mobileye的優(yōu)勢(shì)在于,我們的系統(tǒng)可以在全球范圍內(nèi)無(wú)縫適配。車企不需要為每個(gè)目標(biāo)市場(chǎng)單獨(dú)收集數(shù)據(jù)。與這些有全球拓展計(jì)劃的中國(guó)車企合作,為我們帶來了在中國(guó)市場(chǎng)可持續(xù)發(fā)展的機(jī)會(huì),且還將不斷增長(zhǎng)。
地域差異中鋪就自動(dòng)駕駛之路
周曉鶯:談到自動(dòng)駕駛的發(fā)展,不同國(guó)家和地區(qū)的開發(fā)進(jìn)程和實(shí)際應(yīng)用場(chǎng)景存在明顯差異。從您的角度看,真正意義上的自動(dòng)駕駛將如何在部分地區(qū)實(shí)現(xiàn)?哪個(gè)地區(qū)會(huì)是率先實(shí)現(xiàn)自動(dòng)駕駛的呢?
Prof. Amnon Shashua:這正是地圖變得至關(guān)重要的地方,也就是高精地圖。
因?yàn)槿绻训貓D看作記憶的話,當(dāng)你開車經(jīng)過一個(gè)你曾經(jīng)到過的地方,你會(huì)感覺更加自在從容。而當(dāng)你開車進(jìn)入一個(gè)陌生的區(qū)域時(shí),你會(huì)更加專注,因?yàn)檫@個(gè)地方對(duì)你來說是未知的。所以把地圖看作記憶的話,有了這些“記憶”,你就能更輕松實(shí)現(xiàn)全球范圍的拓展,比起你第一次進(jìn)入一個(gè)未知的地方要輕松許多。
初次接觸一個(gè)地方時(shí),會(huì)遇到全新的駕駛文化、交通規(guī)則等。但這些挑戰(zhàn)都可以通過“記憶”被化解。因此,地理拓展的關(guān)鍵因素之一,就是能夠獲取全球范圍內(nèi)的地圖支持。
AI時(shí)代:挑戰(zhàn)與機(jī)遇并存
周曉鶯:好的,最后一個(gè)問題。我想請(qǐng)問教授關(guān)于教育和人工智能的問題。由于人工智能發(fā)展迅猛,我常常思考未來教育會(huì)怎樣?尤其是對(duì)于孩子們來說,他們應(yīng)該學(xué)些什么來才能更好的應(yīng)對(duì)將來?
Prof. Amnon Shashua:首先,我們聊一下谷歌的搜索革命。二十年前,那些有大量事實(shí)知識(shí)的人,常常被奉為非常聰明,非常有才智的人。但現(xiàn)在,人們會(huì)覺得記住這么多事有必要嗎?谷歌一下就什么都知道了。
我認(rèn)為這個(gè)現(xiàn)象在未來會(huì)被進(jìn)一步放大。當(dāng)你擁有人工智能時(shí),那些重復(fù)性任務(wù)——像是把文章主旨提煉出來、或是把多篇文章結(jié)合起來寫一篇綜合總結(jié)、甚至創(chuàng)建計(jì)劃之類的事情,都可以通過AI自動(dòng)完成。所以,現(xiàn)在人類需要思考哪些是機(jī)器做不到的?這就是將來能區(qū)分成功的人類與不太成功的人類的關(guān)鍵所在。
從今天來看,成功的人類不再是那些有大量事實(shí)知識(shí)的人,因?yàn)橐磺卸伎梢运阉鳙@取。而且AI也會(huì)有它的局限性。我認(rèn)為AI會(huì)是人類一個(gè)非常有用的工具,來幫助人類提高生產(chǎn)力。而那些不懂得如何使用AI的人將會(huì)被時(shí)代拋在后面。
所以,在教育層面,學(xué)習(xí)如何使用AI是至關(guān)重要的。這意味著老師們需要更加努力。因?yàn)槟阈枰軌蛟O(shè)計(jì)出就算學(xué)生使用了AI工具,做起來難度也比較高的作業(yè)。不能假設(shè)他們不會(huì)使用AI工具。所以你需要給他們?cè)O(shè)計(jì)一些就算他們拿AI工具去完成,依然很有挑戰(zhàn)性的作業(yè)去做,讓他們必須付出努力才能完成。
因此,教育的挑戰(zhàn)在于老師需要布置比現(xiàn)在更有難度的作業(yè)。
周曉鶯:這很難。
Prof. Amnon Shashua:這是一項(xiàng)巨大挑戰(zhàn)。