是的,Rabbit,那個一度聲名鵲起的第一代 AI 硬件公司,下場做 AI Agent 了。
4月3日,Rabbit 發(fā)布 RabbitOS Intern。這是一個通用 AI Agent 產(chǎn)品,也是最近井噴式涌現(xiàn)的通用 AI Agent 陣營里最新的一員。毫無疑問,它將與此前引發(fā)廣泛討論的 Manus,以及同日發(fā)布的 Genspark Super Agent 等產(chǎn)品直接競爭。
顧名思義,RabbitOS Intern 是一個 AI “實習生”,旨在自主完成用戶提出需求的復雜任務。在社交媒體 X 上和Discord 上,都已經(jīng)有不少使用案例。有人用它建立了各種網(wǎng)站,有人通過prompt 輸入開發(fā)出了飛機戰(zhàn)斗游戲,還有人開發(fā)了乒乓球游戲,并用 r1的“開發(fā)者模式”把它裝進了r1 的硬件里。目前,RabbitOS Intern 提供了限時免費體驗,r1 硬件用戶每天可用9次,非 r1 用戶每天可用3次。
Rabbit 在去年發(fā)布的 r1 是目前銷量最高的AI硬件,在發(fā)布后的三個月便賣出10萬臺。這也讓外界把這家由前智能音箱公司渡鴉 CEO 呂騁創(chuàng)辦的公司理解為了一家AI硬件公司。但在呂騁看來,r1的爆火是意料之外的事,在他的規(guī)劃里,Rabbit不是一家硬件公司,甚至不會因為RabbitOS Intern 的發(fā)布而成為一家通用 AI Agent 公司,而是像“RabbitOS” 這個名字一樣,成為一家追逐 AI 時代全新操作系統(tǒng)的公司。
而業(yè)界熱衷討論的通用 AI Agent,是 Rabbit 試圖構建的這個全新 AI 操作系統(tǒng)的基礎設施。Rabbit OS Intern是通往最終目標的一部分,按呂騁的說法,這些 Agent 第一次有機會打破目前人機交互界面和操作系統(tǒng)格局,它能用新的、自然語言的方式操控和去實現(xiàn)機器底層運行,這也要求它必須是跨平臺的多 Agents 系統(tǒng)。
我們在最近與呂騁做了一次深度的交流,和他聊了聊Rabbit OS Intern背后的思考。
以下為對話實錄。
Rabbit不是一個硬件公司:以 APP 為基礎的 OS 過時了,跨平臺的“多 Agents” 將成為新的操作系統(tǒng)
硅星人:講講過去這 12 個月吧。從Rabbit r1一年前亮相到現(xiàn)在發(fā)布 RabbitOS Intern 這個 AI Agent產(chǎn)品,能不能講講 Rabbit r1 和 Agent 這兩個之間的關系?
呂騁:我覺得是這樣,第一個,外界尤其是美國很多人對我們其實會有不同的觀點,認為我們是專注硬件的公司。但我從創(chuàng)辦上一家公司渡鴉開始到現(xiàn)在,一直的觀點就是:硬件只是個載體。如果你把一個 V12 的引擎放在馬背上,這肯定是不行的,你不會指望它比一個真正的車快。
所以我其實從渡鴉開始看到的機會,并不是在說一個新的硬件長成這個樣子,而是說以 APP 為基礎的OS(操作系統(tǒng))過時了,這個是核心。
作為一個創(chuàng)業(yè)公司,我們自己不是Google,不是Apple,也不是華為或小米——我們不是既有操作系統(tǒng)又有自己的生態(tài)。作為一個創(chuàng)業(yè)公司,你只能去提交一個 APP 或者做一個網(wǎng)頁,對吧?那我們需要去思考的是,在操作系統(tǒng)的架構上是不是現(xiàn)在的 iOS 或者安卓就都可以承載(我們要做的事)?
我得出的結(jié)論是:不行,沒辦法。所以我們必須要做一個硬件。
不是說我們?yōu)榱巳ベu硬件而做硬件,或者我覺得硬件有多大的市場而去做硬件,而是說我們把 r1 設計成一個非常便宜的產(chǎn)品,它也不是用最新的芯片,用的也不是最好的屏幕,它是最小的成本,對創(chuàng)業(yè)公司來說最小的成本,但你有感應器和芯片層、數(shù)據(jù)層完全的控制權。
然后,我們的聚焦就可以是在云端的 AI gent。
所以這次 RabbitOS Intern?發(fā)布,也并不是說我們重新做了一件事,或者發(fā)布了一個新的功能,而就是我們按照我們的計劃,把整個 Agent 的部分,慢慢地放在一起。
所以你如果看我們?nèi)ツ?,我們先做了Playground,這是一個 Web Agent,比 Anthropic 的 Computer Use 其實早好幾個月;后面 OpenAI 的Operator出來,我也做了橫向?qū)Ρ?;然后我們做?teach mode, 現(xiàn)在市場上還沒有對應的產(chǎn)品,你可以 one shot,給它示范一下,它就直接有了一個Agent;然后我們又放出了基于安卓的Android Research Preview。
接下來,我們觀察到Manus發(fā)布。因為我跟季逸超(Manus聯(lián)合創(chuàng)始人)在我做渡鴉的時候(就認識),真格基金投了我們倆,我其實對他的vision 是很認可的,看到他們有這么大的一個splash(聲勢),我們覺得哎,其實我們這部分也已經(jīng) ready了,?那把它加上。
所以我們并不是說我們要轉(zhuǎn)型,或者我們在硬件和軟件中沒想明白,或者在 Internally debate(內(nèi)部爭論),或者說我們一定要卡這個節(jié)點發(fā)。反而都不是,這個是嚴格在我們自己的路線圖的計劃上。所以今年我們的重心其實就是把各種各樣的 Agent 全部都放在一起。
硅星人:為什么是各種各樣的Agent?
呂騁:因為如果你看整個 AI Agent market,絕大多數(shù)都是創(chuàng)業(yè)公司,它其實就沒有資源,或者沒有勇氣去做一個generic case(通用案例),對吧?大多數(shù)創(chuàng)業(yè)公司會說我做一個垂直的 Agent,我把垂直做得很深,那很快可以產(chǎn)生很多 ARR (年預期收入)。
硅星人:在硅谷這是特別通行的做法。
呂騁:對,這跟創(chuàng)始人的心態(tài)關系很大。我們很不一樣,因為我公司賣掉過一次,我做這個東西當然是希望說為自己想象的愿景去做,所以我們其實承擔了一個非常高的風險和非常大的壓力去做通用 Agent。
其實我們看到 Manus 自己也說他自己是一個通用Agent,對吧。而我們從去年公司對外發(fā)布之前到現(xiàn)在,我一直在內(nèi)部強調(diào)說我們要做?cross platform general Agent(跨平臺的通用代理)。跨平臺是非常重要的。也就是說你不能只做網(wǎng)頁,只做一個手機應用,不能只做一個桌面應用,對吧?
但現(xiàn)在很多時候要做一個case,可能要用四五六七八個不同平臺的產(chǎn)品,又回到了傳統(tǒng) APP 的底層邏輯的缺陷,也就是說:解決一件事,為什么要用好多工具?
大家在這個階段討論商業(yè)策略的執(zhí)行,我覺得其實走的比較慢,因為我們要看到 AI 真正顛覆了什么事情的速度?如果你看 command line(命令行) 到 Graphic Interface(圖形界面),為什么它是一個很大的 OS 的代際革命?核心是因為它改變的是:你不需要明白電腦編程語言就可以抓起手用鼠標畫個圓。這導致了一大波的操作系統(tǒng)和計算機這么多年的輝煌。
那么我們看 AI 這一次,我們定義的 Cross Platform Generic Agent (跨平臺通用代理)真正改變的是什么?我認為它的影響等同于從 command line (命令行)到 Graphic Interface(圖形界面)。為什么?你去思考一下現(xiàn)代軟件,它的設計邏輯,也就是圖形交互界面這一代操作系統(tǒng)設計邏輯,電腦并不知道你要干嘛,對不對?你有麥克風,你也有語音識別,你所有的能力,從程序執(zhí)行的能力都有,但是當我說我要分享個屏幕的話,你的電腦會幫你嗎?不會。
現(xiàn)在的邏輯是,所有軟件通過 UI (用戶界面)來呈現(xiàn),然后這些 UI 設計成人眼可以輕易識別,人腦可以輕易理解,然后把所有的 按鈕全部都展現(xiàn)在你面前,等待著你去點擊或拖拽。
那我們看看我們 Intern (Rabbit OS Intern)這個層級,當你讓 Intern 生成一個PPT,它是不用 Microsoft的軟件,而是直接在 code level (代碼層面)幫你執(zhí)行,這是很了不起的事情。為什么?因為它整個跳過了Interface (界面)這一層。
所以2022、2023 年初的時候,我跟設計團隊說,?UI?is dead,UI design is dead,不要做UI了,這個已經(jīng)沒有意義了。
然后我們在 r1上推了?Generative?UI,讓你一個Prompt可以改變整個interface,你要這樣想,雖然我們是個非常小的公司,但是它確實是人類歷史上第一個整個設備的 UI 都是通過用Prompt可以生成的。我認為這是一個很偉大的事。
這個背后意味著什么?意味著現(xiàn)在我們定義的 Agent,真正重要的不是幫你做一件事,而是在哲學層面上把傳統(tǒng)操作系統(tǒng),就人機交互這層操作系統(tǒng)又顛覆了。也就是說我們認為最關鍵的點是它殺死了Interface 這層,那如果Interface都殺死了,那么application(應用) 這個殼還重要么,其實也沒必要了。
硅星人:它殺死的是Graphic Interface(圖形界面)。
呂騁:對, 是 Graphic Interface 這層。也就是說電腦并不需要用眼睛去看人眼看的東西,這也是我其實挺反對人形機器人。人形機器人這幫公司的邏輯是現(xiàn)在世界的Infra(架構),就是物理的Infra,全都是為人類這個形態(tài)設計,所以我把它設計成人形。但你仔細想,這跟我做 Agent 我先做垂類一樣。我的觀點比較激進,真的已經(jīng)做成機器了,為什么要受限于人類形態(tài)的限制?
所以很多我的觀點可能跟商業(yè)的一些正常邏輯會有沖突,這是我們自己為什么會有不同的主要原因,因為在很多觀點上我們其實非常激進。
這一次我們看到最大的機會,其實并不是技術的革新,而是因為技術的成熟導致的產(chǎn)品的人機交互層面,甚至是哲學層面上的一些突破。你必須要思考說你做的這個東西是不是還是最優(yōu)解,對吧?我一直會思考這個問題,你會發(fā)現(xiàn)很多甚至 80% 的以前的最優(yōu)解,現(xiàn)在都不是最優(yōu)解,那這是一件很可怕的事情,對吧?
在這個過程中你怎么去調(diào)整?也就是說把人做的事情跟機器做的事情的比例怎么去分配?這件事是我一直在思考的,昨天我還跟團隊說,做完這個 Intern, 我自己用了很久以后,我發(fā)現(xiàn)了一個問題,就原來我們以為人類很喜歡做計劃的,思路計劃得我們?nèi)祟悂矶?,對吧?/p>
硅星人:人的計劃能力其實不行。
呂騁:后來發(fā)現(xiàn),第一,人類計劃能力根本不行,第二其實人類根本不喜歡做計劃。我現(xiàn)在思考,人類就是喜歡 todo list,你就告訴他幾件事去,甚至說連 todo list 都不喜歡,人類喜歡的什么?人類喜歡是你發(fā)表一個觀點,我去 diss 你。其實就是 proof reading (閱讀校正),這是我覺得人類最喜歡的事。我跟郭帆導演經(jīng)常聊,聊到流浪地球接下來該怎么拍,我覺得就兩個主題,第一個就是 whats natural reality,對吧?真實到底是什么?第二個我建議他拍當技術已經(jīng)完全到 AGI,甚至 beyond AGI (超越AGI)以后,人類該怎么自己調(diào)整心態(tài)?我說你的主題應該是人類在 AGI 時代里面僅剩的尊嚴是什么。你看人類在這么長的歷史長河中時間里,因為我們技術的局限性,找不到更高級的外星人,在本身地球上的這個副本也比較簡單,導致人類的印象是我們是全世界最聰明的物種?,F(xiàn)在這個事兒在接下來的 20 年要變化了。那么究竟有多少人能適應這種心理的變化?如果我們變成了我們現(xiàn)在眼里的小動物,變成不那么聰明的 second tier (第二鏈條)里,那么有多少人受得了這個?這是我們做完這個一系列的 Agent,至少在我個人里面,迅速發(fā)酵的一系列的自我的想法。
人機交互徹底變了:“人類對機器的控制,在 Agent 我覺得是完全歸零了”
硅星人:如果我們回到產(chǎn)品本身,你對于 Agent 的理解,是一種打破了目前人機交互界面的、新的、通過自然語言操控和實現(xiàn)這個機器底層邏輯的方式。
呂騁:我可能會補充一點,就是說 Agent跟傳統(tǒng)的 API 比,還是一個代際的革新。其實你看計算機超越人類是很早以前的事兒,自從發(fā)明那一刻開始,計算能力就比人類強。這么多年我們都OK about it。那為什么這一次 AI 有這么大的討論呢?是因為在之前的這種程序運行中,你對結(jié)果是可控的。結(jié)果沒有隨機性,你對這個結(jié)果的預期是固定的。那 AI 的這些產(chǎn)品出來以后,其實早就從智能音箱時代開始,從 NLP (自然語言處理)時代開始,你對這個結(jié)果的控制力已經(jīng)減弱了。直到你失去控制。我讓他去給我做一個報表,我根本不知道他找的是哪些數(shù)據(jù),我根本不知道他覺得哪重要。我甚至不知道他有多少個角度。
人類對機器的控制,在 Agent 我覺得是完全歸零了。
所以 Agent 跟傳統(tǒng)的 API 或者傳統(tǒng)工具對比,最重要的一點,是除了它理解自然語言以外,你把planning(規(guī)劃)、 reasoning(推理)和 execution (執(zhí)行)的控制權全部都放掉了。
我們這個產(chǎn)品(RabbitOS Intern)跟單一的 Agent 相比不同的地方,就是當你去試我們產(chǎn)品的時候,你會看到旁邊它會有不同的一個 task (任務),會有細節(jié),你點開可以看到后臺在干什么。你可以理解成:我們架構很簡單,當你說一件事的時候,我們直接給你原地招一個團隊,這個團隊里面有一個人是CEO,他來做 planning(規(guī)劃),他寫了一個這個做這件事的 plan, markdown 發(fā)布,然后把這個文件傳遞給所有的招來的 intern (實習生),然后 independent intern 自動領任務。比如說有一個 intern 他叫A,他說好,我來負責設計網(wǎng)頁,另外一個人說我來負責做 research,另外一個說我來負責網(wǎng)頁的這個UI。
那這些控制權其實完全都下放,所以我們認為我們這個系統(tǒng)更像是一個 multiAgent coordinating system(多代理協(xié)作系統(tǒng))。
Rabbit 的路線圖:“像Manus這樣的產(chǎn)品,對我們來說就是附加了一個功能而已”
硅星人:你剛才提到 Multi-Agents 的協(xié)調(diào),這是你們很重要的能力差異點。那么你怎么去評價我們的同行在 Multi Agent 的成果?包括像 Manus 這樣新進出來的公司,也包括像 Operator 和 Computer Use 等,為什么你覺得你們的 Multi-Agents 做得最好?
呂騁:嗯,第一個我不認為這是個技術壁壘。我還要說這句話,我從渡鴉剛開始就說,世界上就沒有技術壁壘。什么叫技術?技術的核心就是分享。所以我特別討厭那種論調(diào),就說,唉,我們有個啥絕活。你們有個啥絕活?技術的本身它就是共享。在商業(yè)上,作為一個商業(yè)公司你不能重復造輪子。
所以說我認為真正的壁壘在哪?就是兩個層面,第一個層面是因為這個東西對我們來說并不是一個單一產(chǎn)品,它是我們自己加的一個功能,當然我們也寫了一大堆專利,但是這個Agent的performance上真正重要的是什么?是一些我認為的臟活累活。這些臟活累活其實會做出差異的。
舉個例子,我不認為 OpenAI ,Anthropic 或者 Gemini的產(chǎn)品在 consumer level (消費者層面)有多大的優(yōu)勢。因為你去看他們的工作重心,其實大多數(shù)是科研 research。在 research 層面上,我如果說我有一個這么小的問題,你去解決,在那樣的公司文化里,你很難找到人愿意下場去解決這些臟活累活,他們會說你再等三個月,下一個模型自動解決。這是一個商業(yè)邏輯競爭的這個區(qū)別。對我們來說,我們做了很多非常細節(jié)的事。
最早為什么 r1 比 AI Pin 快那么多?就是我們把整個的 voice dictation (語音聽寫)到大語言模型的 token 做了streaming,我們寫的第一個專利。這件事兒其實你給任何一個非常厲害的 researcher,他都可以說 I understand how it works(我知道它該怎么實現(xiàn))。但我們到底是在這兒競爭菲爾茨獎,還是我們在這兒 offer 用戶體驗呢?
這也是為什么我們不跑 benchmark ( AI 基準評測) 。因為這就是個開卷考試,你可以無限優(yōu)化,那它的意義是什么?為了融資,那融資也是融到的不懂的投資人。我就講一個非常簡單的例子:無論你benchmark領先其他人多少,對于終端用戶,它就是兩極分化,他不關心你為什么失敗,結(jié)果就是成了和失敗。所以從數(shù)學上理解?benchmark 逐漸接近100%。當然overall performance?(整體表現(xiàn))會增高,但并不意味著直接提升用戶體驗。
我的觀點還是 build car not engine(造車而不是發(fā)動機),不能變成一輛發(fā)動機引擎等核心都很炫酷,但拆開后各個細節(jié)都不過關的車。這是一個 complex?question(復合性問題),并不是解決一點就一定能立竿見影。
我們今年的目的是,把所有的用戶的記錄所有這些關聯(lián)的 Agent,所有的用戶的偏好全部都 merge(糅合) 起來。到那個時候我覺得大多數(shù)人就會意識到為什么你要有個硬件設備。
我再舉個最簡單的例子,就是 Agent 處理驗證碼,目前的機制設計初衷是防止惡意的機器人,但現(xiàn)在我們有數(shù)百萬的 Agent 都是善意的(機器人),對吧?那整個驗證機制要重寫。但對我們來說,我們能做到的就是,當我們的 Agent 訪問一個網(wǎng)站的時候,網(wǎng)站在背后看到的不是一個?AWS?Server host in middle of nowhere(偏離角落里的亞馬遜云服務器主機)。它與是 r1的終端用戶,跟用戶真人是在同一個位置。為了這件事我們解決了可能 60% 的 pattern,另外我們現(xiàn)在在寫自己的control driver,那我們認為就可以解決 99% 的場景了。
很多時候為什么我們能 work,或者體驗稍微更好一點,并不是什么大道理,是非常細節(jié)的。這些東西你加起來可能有 1000 個、10000個甚至 10 萬個,就看哪個團隊愿意讓自己的手變臟,去真正解決這些問題。最后你發(fā)現(xiàn)其實并不是所有的公司都有這樣的文化。
另外,我覺得長期看來我們一定是領先者。因為我覺得 vertical (垂類)的 Agent 在所有 Agent 背后的模型能力變得 general (通用)以后都沒有意義,沒有價值。在模型變得 general 以后,最大的坎其實并不是你做一個像Manus或像我們的?Intern這樣的功能,而是說你怎么徹底的解決把整個人機交互這一層全部干掉。那這一點要求什么?就是 cross?platform(跨平臺)。
我們沒走一點彎路,像Manus這樣的產(chǎn)品,對我們來說就是附加了一個功能而已。我們明天就可以把它扔出去,但這件事還遠未做完。
把跨平臺的能力全部都建立起來,我們會面臨OpenAI也自我辯論的問題——我到底要變成 Oracle 還是我要變成蘋果,對吧?這也是我跟投資人講的。我認為 OpenAI是Oracle。就是每個公司都要用它,但它永遠不會比蘋果的市值高。因為它們之間的競爭遠比在終端消費者這兒的競爭激烈。所有的模型的 token 成本一定會逐漸變成商品,還要和開源的比拼。
這些公司也在嘗試終端用戶的產(chǎn)品。但你會發(fā)現(xiàn)它競爭不過甚至我們這么小的一個公司,我們只融了7000多萬美金。他們的關注點根本不在我們這個東西,我們這的 focus 對他來說太小,但是對用戶來說太大。
這是我們在過去年中學到的一些生存之道,我們作為一個這么小的公司,在這個舞臺上競爭肯定是非常艱難,而且受到非常多的誤解。但是從結(jié)果上來講,如果你去拉一條時間線,我們什么時候說了什么,以及我們什么時候放了什么,你看整個行業(yè)基本上是在跟隨狀態(tài)。
硅星人:其實我們是把 Agent 當成一個 operating system (操作系統(tǒng))在做的,而這個 operating system 其實是一個非 GUI(圖形界面)的操作系統(tǒng)。所以我們能不能定義:你們的 Agent,也就是操作系統(tǒng),實際上是一個 large action model(大行動模型)。
呂騁:我們第一個提出 LAM 的。
硅星人:但是你們沒有做模型。
呂騁:事情會慢慢地走到一起。為什么這次我們在 RabbitOS 上加了“Intern”這個名字,就是我們第一次認為它在邏輯上,在哲學邏輯上變成以人的方式思考。因為之前都不是,之前我們是調(diào)模型,這次是第一次把我剛說的幾層能力都下放。你可以理解成這個員工也會升職,他明年會變成rabbit OS junior(初級員工)、 senior(高級員工),VP(副總裁)之類。所以反過來講,為什么我們不著急推出硬件的 R2、R3、R4、R5,其實我們也有很多原型在這里,我還是希望把整個新的代際的變革,從GUI 轉(zhuǎn)變?yōu)樾碌?Agent 原生的 OS 做完。
把這件事做完以后,其實最早就跟我在渡鴉講的操作系統(tǒng) Flow 一樣,未來應該只有一個操作系統(tǒng)在云端,它可以流到任何設備里面。然后我對硬件的判斷就是當我們把這件事做好以后,我們出什么都 make sense,我們出耳機也跑的是一套代碼,手表也是一套代碼,眼鏡也是一套代碼,所有的東西都是一套代碼,都是用語言控制或者自然語言控制。
最關鍵的是整個系統(tǒng)的后臺,最根本的邏輯升級了。因為今天即使像蘋果,iPad OS、 iOS 和 MacOS 也是三個東西,在人類歷史上我們沒辦法把這個東西掌控,這次是第一次我們可以做到。我個人的角度,就是渡鴉這件事沒做完,這也是為什么我又來做這件事。
硅星人:它是一個持續(xù)的事,所以就是說在你的這個布局里邊,其實它首先是要用自然語言去改變?nèi)藱C交互的基本的方式,瓦解掉其實已經(jīng)存在了大概四五十年的圖形界面。
呂騁:對。
硅星人:然后把它做成一個 Multi Agents 驅(qū)動的操作系統(tǒng)。這個操作系統(tǒng)背后是集成了很多個模型能力的。而這些模型可能就是我們看到的 MySQL 和 Oracle 這樣的角色。然后在上邊你必須要再做一層,能夠去讓這套多 Agent 組合能流暢地跑起來的硬件。而這個硬件本身可能是一個很“空”的東西。
呂騁:是這個意思,這個硬件就是個載體。就是個shell(殼),看它長什么樣無所謂。嗯,他甚至都不需要最好的specs(規(guī)格),因為絕大多數(shù)的東西都在云。
并非所有人都理解的野心:“我做好的是這個公司可能都會死的準備”
硅星人:OK,所以外界現(xiàn)在對你這套想法怎么看,包括是你聊過的一些同行,投資人等等。他們現(xiàn)在對你這個想法,你覺得最大的誤解是什么?
呂騁:其實我覺得第一不是所有人都能認同,認同的人相對來說比較少,甚至大多數(shù)人不認同。為什么不認同,他有一萬種理由,那我就不揣測了。但是我覺得最大的一個原因就是這件事很難,或者說大家認為這件事很遠。他其實并不是對我觀點不認同,他是對這個事誰能做出來不確定。
硅星人:嗯,他覺得可能是 OpenAI ,Apple 和 Anthropic 能做出來。
呂騁:對,那這個是一個很好理解的事情。當時 Apple 要發(fā) Apple intelligence 的時候,一大堆人在推特說“RIP Rabbit” 。所以我說的人類最擅長的是什么?人類最擅長就是 diss,我從做 AI 里面我悟出來的。
當然,對我個人的野心來說,并不是說別人說我說的對,或者說別人認可我這個觀點,而是說我在這條路上我自己能往前走。我第一個發(fā)現(xiàn)其實對我來說是我的 luxury(寶藏),任何一個人能第一個看到一個趨勢,對他來說都是他的 luxury。那在執(zhí)行過程中如果你能保持速度,那最后你就會把這事做出來。
所以說我是很小心的在保護這個東西的,我的目標其實并不是讓所有人都同意,所有人同意不一定是好事,任何東西所有人同意馬上就會產(chǎn)生更多的競爭者。反而是那些不太被同意的人反而就有機會。
我經(jīng)常開玩笑,我說你看我們看我們受了這么多罵,你去想想早期特斯拉受到多少罵。它證明了自己相信的趨勢是對的但它可能需要提前 10 年時間, 20 年、 30 年準備。那我在這個趨勢上,我自己卯了十四五年,我認為我是很幸運的,10 年前我要的技術沒有人有,現(xiàn)在反過來我要的技術很多人都有。那我就把它實現(xiàn)。
我有一個獨木橋理論,就是你把事情做成就相當于過個獨木橋。你會發(fā)現(xiàn) 10 個人要過,你只要踩上第一步,就已經(jīng)是第五。因為有五個人想了但沒走。然后會有一個哥們走反了,你就第四了,然后會發(fā)現(xiàn)總有一個哥們踩不穩(wěn),踩兩步掉下去,這時候你已經(jīng)第三名,然后這三個人里面總有一個哥們走的比你和另外一個哥們走的慢,你已經(jīng)第二名。當你是前兩名的時候,有一個東西就出來了,叫運氣。會 randomly take?(隨機給予)?一個人。這是我的理論。
反過來就把這個理論印證到我們公司的發(fā)展,我們第一個踩上橋,然后在這個橋上面我們堅持沒有走反,我們走正確的方向,速度上面我們走的也不慢,也沒有掉下去,我們還活著。那這個就是我認為就是我們現(xiàn)在能拿到最好的結(jié)果,繼續(xù)往前走就好。
從我看到其他產(chǎn)品,比如說景鯤這兩天發(fā)的(指 Genspark 發(fā)布的 Super Agent),然后Manus也發(fā)了,這很有意思。當一個東西它非常成熟,以至于每個人都可以做以后,用戶你知道最后會挑什么?會挑顏色。這是一個很小眾的理論,我給你舉個例子,就是全世界的競爭產(chǎn)品到最后一定會剩下 2 ~ 3 個,然后一定是一個紅色,一個藍色;或者說一個黃色,一個紅色。你仔細想,沃爾瑪和Target,共和黨和民主黨。當一個東西你這兒也能買,那也能買的時候,我為什么我買?因為我覺得它 logo 長得好。
所以說當Manus和我們和新的產(chǎn)品或者未來的產(chǎn)品競爭的時候,差別會越來越小。一個到兩個點。
硅星人:這個點一定是顏色嗎?有沒有可能是一個特別讓你去讓用戶覺得就這個體驗我覺得最驚艷、最amazing的東西?
呂騁:對,我說到顏色是所有該競爭都競爭完以后,最后是一定是顏色。因為這里面我有觀點,就是人只對一些非常簡單的東西感興趣。光明和黑暗,對光感興趣,有個地方亮著,你一定要看看什么東西在亮,人對色彩感興趣,人對 extreme(極致) 感興趣。極大的東西,極小的東西,極快的東西,極慢的東西。人對重復感興趣,人對 1234,2234,再來一次感興趣。為什么人類對音樂感興趣?因為它是節(jié)奏的重復。
所以說你把這個東西歸根結(jié)底大家在功能上都滿足以后,最核心的部分其實是非常哲學的這些幾個判斷標準。
硅星人:那比如像我們的產(chǎn)品就是我們的一個硬件配上我們的 RabbitOS,嗯。其實帶給大家的這個最 extreme(極致) 的東西可能是什么?
呂騁:嗯,那就是到了end of the day,人類必須要做不得不做,但沒必要做的事情全部解放。嗯,這是我覺得最大的一個社會價值。這是一個需要非常謹慎去考慮的事情,我們推一行代碼,到底要不要推,以后有什么樣的影響?
我們 Intern出來之前,有一個用戶就在我們 Discord 社區(qū)上說你們r1就是一大堆 gimmick(花招),什么 use case 都做不了啊。我們也沒回復。但昨天我們把 Intern 發(fā)出去之后,這個人其實是一個美國的婚禮策劃,然后他就說 holy shit! 這個取代了他所有的工作。我說三天之前你可不是這么說的。
這就是這幾行代碼產(chǎn)生的效果,所以我們都得自己去思考這個東西背后的影響。當然說從短期來講,或者說未來五年來講,我覺得是一個漫長的過渡期。 5 年之后我覺得所有該解決的 Infra level (架構層)的東西都解決。我認為現(xiàn)在真正影響體驗的其實是 Infra level,并不是技術 level。我并不認為這件事是一個單純 AI 技術的突破就會導致商業(yè)結(jié)果。大多數(shù)情況下,相反是周圍的一些東西先瓦解,是人類整體歷史計算機架構的革新,所以這次要把周邊的東西全部都推翻,它代價非常高。
硅星人:尤其是操作系統(tǒng)這一層,其實它是所有 Agent 工作的核心,其實是一個新一代硬件的新 OS。
呂騁:對。然后在這一點上你去看大公司就沒有優(yōu)勢,因為就拿蘋果來說,它70% 的錢都是 APP store 賺來的,怎么可能把 APP store 干掉?你去革新,革到最后你周圍的那一套推不掉。
硅星人:這里邊也很有意思啊。你頻繁提到蘋果,它也正是 GUI (圖形界面)的推動者。
呂騁:對,你去思考的話,蘋果其實也不是發(fā)明GUI的。但他們厲害的地方是產(chǎn)品化。蘋果厲害地方有兩點,第一個就是所有人都認為你要做計算機,你當然去做 business company,你別做 to C,你做 toB,對吧?因為 IBM 那會兒只做 to be?那個時候都是銀行要用,政府要用,是你為什么要做 to C?to C 賺不到錢,誰會買個電腦?這是最早的觀點,他們第一個厲害的地方是:他們認為應該做 to C。第二個厲害的地方,是他們認為我們不需要依賴于現(xiàn)有成熟的架構,也就是當時的 BASIC 語言,當時的一大套的這個商用的計算機的核心的操作系統(tǒng)。
所以他們把兩件事都做了,所以厲害。你去看現(xiàn)在的創(chuàng)業(yè)公司有哪些公司一開始把這兩件事都想明白的?很少。但是你不把這兩件事都做了,你就卡在人家的生態(tài)里面出不來。我可以做一個 APP,用戶評價會更好,少挨很多罵。但它在 APP 的這個局限性上也實現(xiàn)不了更多的功能。所以說我為什么講到特斯拉的例子,就是他一開始一定會被罵,而且會被罵得很慘,對吧?
你能活下來算你有本事,但大概率你不行。這個覺悟我是自己做好的。
硅星人:你做好的是 r1 死掉的準備,但不是說你整個的藍圖做不成的準備。
呂騁:我做好的是這個公司可能都會死的準備。但是我堅定的認為這個思想的路線和這個應該做的事情是沒錯的。所以說,是我們能做成不一定,但是如果讓我去選擇一個正確的道路,肯定得這樣。
硅星人:所以當時你跟Vinod Khosla也是這么講的么?(注:Vinod Khosla 是美國著名科技富豪、風險投資家,OpenAI的首位風險投資人。Rabbit創(chuàng)辦后獲得 Khosla連續(xù)投資。)
呂騁:我跟Khosla講的核心,是因為他是一個特別特殊的VC。他跟比爾蓋茨差不多大。他做的SUNMicrosystem,正好是舊時代被干掉的。所以他的個人體會是非常深的。我跟他說,你看現(xiàn)在這層軟件的底層的核心邏輯都發(fā)生變化了,他馬上就get了,所以這是一個非常特殊的例子。但這件事?lián)Q成其他的 VC 他不一定認。
硅星人:我也觀察到,他甚至包括 Eric Schimidt (施密特,SUN 聯(lián)合創(chuàng)始人、曾任Google CEO)這撥人對于 AI 的反應特別敏感,而這撥人今年都已經(jīng) 70 歲了。一個非常重要的原因,就是因為他們是上一波這個通用計算和個人計算崛起的親歷者。他們是從計算的底層邏輯,而不是從不是 “Web to Mobile,then to AI ”這樣的邏輯去理解?AI 帶來的變化。
呂騁:對,用戶的角度上來了解的話,體會不到那么遠,那么并不是說一件事在遠方正確,它在近處就是正確,很多程度上在遠方正確,近處是錯誤的。但你要做的并不是說你去在第一站去證明你是正確的,而是說你盡快的從第一站到第五站,到第八站、到第十站,第十站它是正確就行。所以這個算是我個人的風格,如果不這樣想的話,我很多策略也不會這樣做。
我就是一個比較自己跟自己較真兒的人,當然很幸運,我有很強的團隊跟我一起較真。風險絕對大。那這個我沒話說。這也是當年渡鴉的故事,到那個節(jié)點我作了決定,當時如果我們不賣掉,我們肯定死。我說的這個死不是說我們當時缺錢了,我當時真正決定我要賣的核心是因為整個 Flow 那一代系統(tǒng)基于API。但 API 被大公司控制了以后,小公司沒有機會。但 large action model (LAM)它是一個不需要 API 的東西。我第一天我就告訴大家不能用任何的API。
硅星人:那你們跟其他的這些基座模型的靠的是?
呂騁:對, Model 的連接這些是API,但是 action 一定不能是API,所以這是我自己從上一段經(jīng)歷學到的。所以像是景鯤發(fā)布的那個工具(Genspark Super Agent),他還是在連接很多的API,我可以負責任的告訴你,他那個東西規(guī)?;饋砜隙ú恍?。Manus 跟我們一樣,是在 code level(代碼層) 去做 execution(執(zhí)行),它的問題在于它是不是能突破單一的平臺。
硅星人:這個單一的平臺是指的是他對于某一個基座模型的過度綁定和依賴嗎?
呂騁:我說的是他現(xiàn)在能做的是 computer task(計算機任務)對吧?他能不能做 mobile 上的 task?因為今天我們每天在用的 90% 的應用事實上在手機上。這是為什么安卓這邊我們也用同樣的 Agent 在做。聊到最后你可以看到一些決策上的區(qū)分和區(qū)別。其實背后的思考就是非常簡單,我們認為它應該是個 cross platform(跨平臺),這個也是從渡鴉那段經(jīng)歷里面學到的。
把這個事更簡化一點,現(xiàn)在這一代的 AI 真正的魅力在general(通用),不管你的目的是個什么,它都能執(zhí)行,這才是它真正的厲害之處。
r1爆火不是好事:“但我把它變成另外一個事情——我說OK既然都這樣了,那我們就把Humane干死”
硅星人:剛才聊了不少哲學層面,我有一個感受是,你對把握住趨勢很在意,剛才聊到過去12個月,大體上趨勢在按照你的預測走,但事實上在幾個關鍵節(jié)點上,其實節(jié)奏看起來可能會被打亂,比如r1最初的爆火你提到過,是意料之外。
呂騁:這件事不是我裝的。我跟同事說只要能賣出 3000 臺我就高興。這個是事與愿違的事情,我真的不想讓他火的。你想誰會想到一個 45 分鐘 Keynote 有 1100萬的播放量,誰會想到這件事?我當時是我們完全沒有做好準備說要賣這么多。我就是澄清一下。
硅星人:我感覺比如 r1 最初爆火這樣的事,外界可能會在那個時候認為是一個好事,但從我們觀察,你如果是對一個趨勢非常在意的創(chuàng)業(yè)者,像是r1爆火,以及后面關于安卓的爭議,這些要么本身就是以一個負面形態(tài)出現(xiàn),要么是意外的情況,其實都會影響你的具體的節(jié)奏,而你應該不是一個喜歡被打亂節(jié)奏的人。所以作為一家商業(yè)化的公司的創(chuàng)始人,連續(xù)創(chuàng)業(yè)的老兵,你需要去處理這些日常挑戰(zhàn)。我很好奇你怎么去平衡這兩者?
呂騁:這個點是任何一個媒體沒有問過的。它非常重要的一個邏輯就是說,你認為的好事不一定是真正的好事,外界和內(nèi)部的觀點是特別不同的。第一,我們確實沒想好,我認為火對我們來說不是好事。第二,在這個過程中,這個團隊在接受到一個一個挑戰(zhàn),我不認為這是壞處,這挑戰(zhàn)你能不能 overcome?因為人不能只是說做一件事然后另外一件事,你要你團隊和團隊之間變強,它是一個綜合的變強,我需要讓團隊能夠應對到各個挑戰(zhàn),而非只是我們預想好的挑戰(zhàn)。
你看我們怎么處理的?從我們計劃的3000臺到 10 萬臺的logistic(物流),包括所有的生產(chǎn)、關稅亂七八糟,包括眾多國家,我們在三個月中全部解決。而且那個時候我就跟大家講,意外來了是好事,因為我們有收入,我們 r1 的這個 margin(利潤率)?很高。那我就把它convert?(轉(zhuǎn)化)成另外一個觀點——我說OK既然都這樣了,那我們就把Humane干死。我一定要看這個公司“死”。哎那這樣一說這就不是挑戰(zhàn)了,就變成一個目標了。
在管理過程中其實我需要經(jīng)常評估,但是我又跟團隊說,我說在4月底正式發(fā)售的時候,要維持每周一次的 OTA(軟件后臺升級),我們真正做到了。r1 出了 30 多個OTA,哪一家公司能每周給個 OTA ?我說在這段時間我們就fix,fix,fix。但是在4月底以后,我們把該 fix 的fix完以后,一定不要在主線上變慢。我需要在盡快的時間內(nèi)搞出 teach mode,Android LAM,Agent,搞出現(xiàn)在這個Intern,所以我經(jīng)歷過幾次創(chuàng)業(yè)以后,我自己是越來越明白該怎么處理這些事。
再把這個話說簡單點,那你如果遇到意外情況,你少睡幾個小時唄。在這里,圣誕節(jié)多么重要,但我們沒有一個人回去,你就拼命嘛。但你如果看硅谷很多的創(chuàng)業(yè)者,他其實并不是這樣子,為什么?這個團隊背后的這個邏輯判斷導致了他做產(chǎn)品不一樣。
大家拍腦門兒都會覺得做 vertical (垂直領域 Agent)來錢快了,但這個事情在你已經(jīng)為你的理想追求了十年以后,你看的其實已經(jīng)不是短期的 ARR 了。這一次創(chuàng)業(yè)來說,對我來說就把這個事鉚出來,鉚釘?shù)絻蓚€結(jié)果,一個是我做出來了,一個是我死掉了。都可以。
硅星人:所以 ARR 其實是一個對做通用產(chǎn)品的創(chuàng)業(yè)者來說,沒有價值的一個衡量標準。
呂騁:我覺得是它是一個負資產(chǎn)。它當然有價值,因為你要融資,對吧?但你不能把它當作唯一的目標。這個就談到了另外一件事,就是定價。我們也想看 Manus 怎么定價。那我們看到了。
再次創(chuàng)業(yè),成熟了:“我真正成熟的點,是很多東西我以前認為是大事,但現(xiàn)在認為是小事;很多東西以前認為是小事,現(xiàn)在認為是特別大的事,比如定價”
硅星人:你怎么看 Manus 的定價?
呂騁:我們最近有很多討論。先不討論他們具體的定價。我怎么去看定價這件事呢?第一我希望讓它變得簡單點。像Manus 定價我付了月費,我還要算1萬個 token,每一個 prompt 運行多少 token,然后我還并不知道我這個 prompt 到底會花多少 token。這個過程中給我內(nèi)心創(chuàng)造的這個不安定感和未知感,我覺得這個體驗就不好。第二,確實現(xiàn)在這跑這樣類型的 task 它不便宜,它不會是一個便宜的探索。
我們自己最近在討論的是,第一,買了 r1(你再用Intern) 一定更便宜,一定更優(yōu)惠。沒買 r1,我們會在讓你覺得在某個節(jié)點,買了我們的設備更優(yōu)惠。我們并不是要著急把我們設備賣出去,而是說有了設備以后你綜合體驗可能更好。這在后面有很多可以結(jié)合的東西去做。
而且,這類的產(chǎn)品在越高頻的用戶上一定是虧錢,在沒有那么高頻的用戶上反而是有利潤可賺。所以這是我們最近思考,但是我們沒有宣布我們的定價。所以我倒反而認為這類產(chǎn)品不一定是最終大的deal不一定來自于toC,而應該是來自于?toB。就是,如果我是個人來說,我可能就做一些小游戲自己玩一玩,或者我做一些random search。但是你想,如果這個東西把真正的一個公司里面的一個 Intern 取代,那這個公司永遠愿意為他買單,而且更便宜。所以我認為可能有點像 Slack 或者 Figma,它可能更大的利潤會來自于機構而非個人。這是我現(xiàn)在的想法。
那么反過來想,我查了一下我現(xiàn)在在的 Santa Monica 這個地區(qū)平均真人實習生的工資,時薪大概是 17 ~ 25 塊錢一個小時,美金啊,25 美金。如果你按一個全職實習生一周工作 5 天 8 個小時的話,他一個月差不多是 2780 美金到 3500 美金。如果這個 Agent Intern perform 的跟真人一樣,而且他不用休息,他在 24 小時跑的話,我相信用戶付 1/ 10 的價格應該不過分。
硅星人:其實如果按 1/ 10 的價格算,它就是 Manus最初的那個定價279美金就對了啊。然后他覺得不能比 OpenAI 高,就調(diào)到了199。
呂騁:我認為在這個上面我們應該還會 charge more(收更多的錢)。為什么呢?因為我們最終要看是不是可以多個 Agent 并行。也就是一次招 100 個Agent,對應真人每一次招 100 個Intern,每個 Intern 一個月可是要付 3,000 塊錢。所以說為什么我們叫Intern,我們就想把這件事點明了,你千萬不要跟 Netflix 19塊9毛9 一個月來比,你千萬不要跟 Spotify9塊9一個月來比。他是個人,對吧?你要去思考的是你看一下這個月的財報,你給你的實習生付了多少錢?
所以我們希望把這個東西點明,如果把這件事不說明白了,大家會很煩的,因為會覺得 Spotify才收我這么點你怎么收這么多。所以說定價在這種產(chǎn)品上來說是個大哲學,我們沒有那么快去得出一個結(jié)論,但是我可以告訴你我的核心的思考,第一你必須要跟真人的 labor(勞動力)?來比較,都參照,嗯,這件事必非常重要。第二就是你不能讓用戶有一個復雜的計算系統(tǒng),就我付了每個月我還要再算token。嗯,這件事本身從交互就是從用戶體驗上來說就是復雜的。
定價在這個上面確實是重要的。而且我可以告訴你,如果定價定不好,任何類似的產(chǎn)品都不會成功。
硅星人:聽你這么仔細聊定價,很有意思。你自己剛才其實也簡單提到了兩次創(chuàng)業(yè)心態(tài)的一些變化。你之前最開始創(chuàng)業(yè)的時候,大家給貼的標簽還是意氣風發(fā)的天才,然后你自己也曾經(jīng)去對標像喬布斯,蓋茨在同年齡的時候在做一些什么樣的事情。似乎你當時更多在追求自己喜歡的事情,只要對內(nèi)證明自己就行,然后現(xiàn)在好像給自己立了很多外部的競爭對手,有了更多爭勝欲。
呂騁:我今年五月份就 35 了啊。人的 20 多歲和 30 歲心態(tài)一定是不一樣啊。我經(jīng)常跟別人開玩笑,Once You're 30, then 50,because nothing happens in between(笑)這個是不一樣的。
這一次我覺得我真正成熟的點,是很多東西我以前認為是大事,但現(xiàn)在認為是小事;很多東西我以前認為是小事,現(xiàn)在認為是特別大的事。就 定價這個東西,我認為在 10 年前我不會認為它是個多大的事。我會認為我們算一下多少錢可能回本多少錢就行。但這一次我認為是個特別大的事,是至關重要的事,我們當時的定價我相信我們絕對是給Humane這個公司捅上了最致命的一刀。在1月 9 號的時候他再也沒有爬起來。
所以在什么事情重要這件事上,我過去這 10 年發(fā)生了很多思考的變化。
“當我第一個看到那個寶藏在哪,但最后被別人打開,你說如果發(fā)生這種事,你是會depressed(沮喪)”
硅星人:個人風格上呢。
呂騁:個人風格上面我倒并不覺得我變了。個人風格上面我如果說簡單點,我根本就說白了,兄弟,我根本不想創(chuàng)業(yè)。你26歲賣了公司,你為什么又義無反顧的又自己在這折磨自己這么多年?沒必要。
我核心還是因為,當我能夠第一個看到的時候,我第一個看到那個寶藏在哪或者盒子在哪的時候,最后被別人打開,你說如果發(fā)生這種事,你是會depressed(沮喪),對吧?
所以這本質(zhì)上還是一個跟自己較勁的一個一個過程啊。只不過說我們在商業(yè)的決策上這一次考慮的更多元,可能層次更復雜一些。
但是反過來,很多人不知道渡鴉當時怎么做出來的,很多誤解和偏差。我給你舉個簡單的例子,當時跟渡鴉同時還在做的另外一家公司叫出門問問,你要看李志飛的團隊是谷歌 NLP 實驗室,谷歌撤了以后代碼原封不動都留給他們,而我當時是一個 23 歲的畢業(yè)生,如果我們渡鴉不講設計、不講藝術,不講這些亂七八糟東西,我們?nèi)タ此焯欤热缯f誰在頂會上發(fā)了多少文章,你說我們活得下去么。
如果我們當時不去租芳草地那個非常 fancy 的 office,我們怎么吸引能力上突出的人才。如果從這個角度去思考,你覺得這些東西是我愚蠢的個人偏好,絕對不是,它全是策略,而且是唯一的策略。如果當時不這樣去做,沒戲,死的更快。
硅星人:你看你這一輪就不講那些花里胡哨的東西了。
呂騁:這輪這些東西不用講出來,事情發(fā)生以后我再講出來,對吧?很多人問為什么定價199?那我現(xiàn)在給你講出來,因為我要“弄死”Humane,而且我最快、最簡單的速度弄死他,對吧?現(xiàn)在可以講出來,那很多我們針對接下來的 競爭的東西我們還在醞釀。所以這可能是另外一個誤解,我可以把我們的策略包裝成很好,包裝成我的個人意志或者我的個人風,到最后讓大家來罵我,看不懂的話我最喜歡,最好是事后看懂的問題當下最好別看懂,對吧?
我們?yōu)槭裁匆恢辈话l(fā)Intern?我們就等著誰第一個發(fā),而且我們能做到他第一個發(fā),我們第二天就發(fā),我第二周就發(fā),三周就發(fā)。對,這就是我們,而為什么我們在景鯤的 Genspark Agent 同一天發(fā),對吧?這些東西你說是我個人偏好,沒問題,但反過來講背后有很多策略在。
大混戰(zhàn)的時代來了:“現(xiàn)在任何人都是任何人的競爭對手”,“如果我有一點比別人稍微厲害一點,就是我覺得我跟狗一樣,我的鼻子比較靈”
硅星人:你提到了競對,所以 RabbitOS Intern的競爭對手其實是哪些?畢竟你剛才其實提了太多次的Manus。
呂騁:競爭對手絕對不是Manus,肯定不是,絕對不是。我覺得現(xiàn)在任何人都是任何人的競爭對手。就是以前你說美團和點評是競爭對手,你絕對不會認為美團和滴滴是競爭對手。這觀點我沒有見任何人把他點明過,今天在 AI 時代,任何人是任何人的競爭對手。因為核心邏輯為什么導致這一點?因為 AI 是通用的,嗯,他能做這個,他也能做那個,對吧?真正的競爭對手,你要看你自己怎么定義你的公司,你把你自己定成一個Oracle,那 Salesforce 應該就是對手,如果你要把你定義成 consumer product(消費者公司),那理論上來說 Apple 這樣的公司就應該是對手。但是你要把自己定義的是又想做這個又想做那個,那你就會被董事會投出去,比如說OpenAI。(笑)
所以這是很有意思的事情,怎么定義你的競爭?因為你看我們當時跟Perplexity合作,給我們API,免費一年,我們是很好的朋友。但現(xiàn)在我還沒把他們當對手,他們把我們當對手了。
硅星人:這是怎么發(fā)生的?就是Perplexity 發(fā)現(xiàn)了你們在后邊做的 Agent?
呂騁:因為它最早做的是搜索,它的競爭對手是 Google,它現(xiàn)在對外宣稱的競爭對手還是 Google。但是用戶在上面搜一個最新的喬丹鞋,搜出來還想不想買?你想不想讓他在里邊買?你想不想讓他完成 action?他只要一想完成 follow up action 的話,完了,我們成了它對手。
硅星人:任何人是任何人的競爭對手,這也就意味著就是其實很多定義現(xiàn)在是沒法明確的。
呂騁:對,以及,你再想你把這個東西做出來以后你放在人家的平臺上跑。如果你這個東西特別牛x,人家會不會做。 iPhone 手機和 Google 手機在本質(zhì)上不可能允許一個更聰明的Gemini和Siri出現(xiàn)在它那兒,對吧?那這個時候,反過來你自己的一畝三分田,哪怕只是一個 199 的一個小盒子就有價值。
所以說很多很多東西換個角度就是完全不一樣,我覺得我的狀態(tài)并不是想去證明什么,這個事情你回看 track record(歷史記錄),從我渡鴉到現(xiàn)在都對,所以我們極其有自信。
這個自信怎么講,并不是說我這個人比較狂。我經(jīng)常跟別人說,如果我有一點比別人稍微厲害一點,我一直不覺得是我的智商,而是我覺得我跟狗一樣,我的鼻子比較靈。
我自己都這樣自己說的。我說我鼻子比較靈敏,我說會發(fā)生的事情是會發(fā)生的,我就跟團隊說,你們就記住這一點就行。
硅星人:鼻子比較靈作為一個創(chuàng)業(yè)者的能力,在不同的創(chuàng)業(yè)周期和創(chuàng)業(yè)時代里,對結(jié)局的決定性其實也不一樣?,F(xiàn)在可能更關鍵。
呂騁:我認為是更關鍵,真的是這樣子。因為本質(zhì)上就是因為,每個人都是每個人的競爭對手。你以前你辛辛苦苦 build 一個應用程序,那現(xiàn)在一個 14 歲的小孩用 Gemini 來 build 一個應用程序,他自己用就不用你的了。這是很可怕的一件事情。這也是為什么反過來講,傳統(tǒng)的老公司它沒有優(yōu)勢,沒有優(yōu)勢的原因不是技術,沒有優(yōu)勢的原因是現(xiàn)有的地盤需要去保護,保護這個地盤的代價就是不能做任何新的東西。
硅星人:在你這個預判里,剛才提到你們在市場上還沒有同類對手的是teach mode在這個功能。
呂騁:Teach mode我們現(xiàn)在只支持網(wǎng)頁,我們?nèi)ツ臧凑瘴覀兂兄Z的上了,然后我們一個月內(nèi)用戶 build 了超過1萬個Agent,這是一個很厲害的數(shù)據(jù)。但是它的系統(tǒng)還沒有完成,所以我們現(xiàn)在還叫Beta,因為我們最終是希望它是 cross platform。
說到這一點,我不認為 2025 年或者 2026 年應該去做手機,但是我非常堅信 2026 年底到 2027 年,全世界會有第一個 fundamentally native AI Agent powered phone(徹底的原生AI Agent 驅(qū)動的手機),也就是沒有APP。
我們覺得這個事情相對來說發(fā)生的會比較快,應該是在未來的一兩年。
硅星人:誰是這里面的玩家?
呂騁:我們肯定會想在這里面嘗試的,但是我們沒必要做第一個。反過來講就是為什么我們把這個東西(r1)做成這樣。我們就是特別怕你把它理解成買了以后不用 iPhone,我特別怕這個事情。所以我們一開始都沒有說這個東西是替代iPhone,這是個玩具。
硅星人:就是你想做成手機的形態(tài),但不是這個時候做。
呂騁:不是這個時候做。其實,你如果做硬件你就知道,我們做手機比做這個費的勁要小很多?,F(xiàn)在高度模塊化。對吧?我們做這個的挑戰(zhàn)要比做手機還大,但現(xiàn)在不是時候。
第三種結(jié)局?“我去年一年見了除了Tim Cook以外所有頂級公司的CEO”
硅星人:最后再問個問題,你剛才講的這個公司的結(jié)局兩種,要么做成可能像?Apple那樣的成功,要不然就是死。有沒有第三種可能性?比如在某一個階段,可能就是面對了一個新的像?2018 年那樣的百度的潛在買家,它可能是誰?
呂騁:這個問題問的好,因為我去年一年見了除了Tim Cook以外所有頂級公司的CEO,OK,就是對于大公司的邏輯來講,他們會算一筆賬,如果這個事情他一定要做,買這家公司劃算,還是我自己招 50 個人劃算,就這么簡單。
在公司應對收購上面,不光我的事,更是買家決定的。我們能做的是接到 offer 以后評估它是不是 make sense。
那有兩種情況下是 make sense,一種情況下是你不接你就死掉。那他當然 make sense,對吧?絕大多數(shù)收購包括Humane 賣給 HP,絕大多數(shù)收購的結(jié)果不是好的。其實很多人不理解渡鴉當時談了多好的一個deal,我們沒虧,我們沒讓投資人虧錢,創(chuàng)始人還賺到了錢,團隊還賺到了錢,然后我們還保留了我們的辦公室、團隊,甚至品牌。在百度2017 年的時候發(fā)的是渡鴉的產(chǎn)品,這對百度這家公司的文化是多么不可思議。所以如果當時那些條件不滿足我也不會賣,但是這就是運氣了。所以說在收購這件事上,即使我想賣或者我不想賣,最終決定權都不在我在買家那兒。
我們當然希望能夠自己做大,因為對我個人來說,一個商業(yè)公司的結(jié)局有兩個,要么IPO,要么被善意收購。也就是游戲的好結(jié)局有兩個,其中一個好結(jié)局我打過一次,我想打通另外一個好結(jié)局,另外一個隱藏結(jié)局看能不能打通,但是好結(jié)局和壞結(jié)局里面肯定要需要好結(jié)局,不管它是什么樣的好結(jié)局。
硅星人:OK,最后問一個,我們接下來能期待你們比較大的一個動作是什么?
呂騁:其實我們說的比較公開了,就是今年的目標是把所有的 Agent 放在一起。
你看我們現(xiàn)在Intern的部分加進來了,我們還有安卓的部分,我們還有Playground。我們今年的 focus 就是在接下來時間把所有的部分都加進來。
那個時候加進來以后你會突然發(fā)現(xiàn)世界上沒有任何一個同類產(chǎn)品了。