• 正文
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

火山引擎想做Token“熔爐”

2小時(shí)前
150
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

撰文?| 郝 ? 鑫

編輯?| 吳先之

 

大模型爆發(fā)后,逐漸形成了幾個(gè)AI重地,北京、上海和杭州。經(jīng)常穿梭這幾個(gè)城市之間的人,都有一個(gè)直觀的感受:機(jī)場如戰(zhàn)場,大屏輪番轟炸,撕開了看似平靜的偽裝。

 

云廠商是絕對的主角。北京首都機(jī)場出發(fā)大廳,阿里云掛出了“通義千問”模型的橫幅,正對面打擂臺的是百度云,主題是智能體和超級應(yīng)用。再走幾百米,不遠(yuǎn)處赫然立著的是火山引擎的廣告牌,“火山引擎,你的AI云”。

 

作為后起之秀,火山引擎把“野心”刻在了基因里,2021年便制定了千億營收的目標(biāo)。在缺乏先手優(yōu)勢的情況下,火山引擎前期增長較緩慢,直到遇到了大模型的機(jī)會。

 

同樣的情況也發(fā)生在百度云身上,國內(nèi)首發(fā)大模型,先一步拿到了AI的船票。

 

據(jù)劃重點(diǎn)報(bào)道,火山引擎2024年?duì)I收規(guī)模超120億,2025年?duì)I收目標(biāo)超250億元。若數(shù)據(jù)屬實(shí),200億這個(gè)數(shù)字將成為關(guān)鍵。財(cái)報(bào)顯示,百度云2024年?duì)I收為218億元,這意味著云計(jì)算的洗牌時(shí)刻正在進(jìn)行時(shí)。

 

不過,單純談營收數(shù)字沒有太大意義。比起阿里云這種“老前輩”,百度云和火山引擎仍處于高速增長和擴(kuò)張時(shí)期,首要目標(biāo)是把自己云收入的盤子做大。

 

據(jù)多位行業(yè)人士反饋,火山引擎目前是表現(xiàn)最激進(jìn)、不計(jì)較投入的云廠商。

 

外界最直觀的感受可能是豆包App,前期靠投流成為AI應(yīng)用界“頂流”。即使遭遇DeepSeek突襲,豆包仍在繼續(xù)投入。

 

一份內(nèi)部調(diào)研紀(jì)要數(shù)據(jù)顯示,其日均DAU1600萬,MAU在7000-8000萬,次日留存30%,七日留存23%。每天對話輪次在7-8輪,Token消耗量2500-3000。今年豆包App端的目標(biāo)為,DAU破5000萬。

 

此外,高薪挖人、搞價(jià)格戰(zhàn)、擴(kuò)列朋友圈等動作,再次體現(xiàn)出字節(jié)“大力出奇跡”的業(yè)務(wù)精神。

 

在今天,只談OKR,不講ROI的火山引擎,能否憑借新敘事模式坐穩(wěn)“第四朵云”的交椅?

 

Token化

 

“發(fā)布會上吹的牛,大概就是他們的KPI?!?/p>

 

穿梭在云廠商之間的創(chuàng)業(yè)者們調(diào)侃,“各家的發(fā)布會像是文字游戲,只講對自己有利的部分”。我們也注意到,各廠商所出具的模型評分指標(biāo)和體系存在出入,唯一統(tǒng)一的參考對象是DeepSeek-R1,甚至出現(xiàn)了只有圖沒有數(shù)字的情況。

 

阿里云講模型影響力,看開源下載量、引用量,火山引擎更加簡單粗暴,統(tǒng)一看Token調(diào)用量。

 

有接近火山引擎人士向我們表示,火山引擎正在自上而下推動“Token”文化,“譚待(火山引擎總裁)的邏輯很簡單,銷售身上都背上指標(biāo),今年賣多少產(chǎn)品,賣的這些產(chǎn)品能消耗多少數(shù)量的Token”。

 

此外,火山引擎對內(nèi)的大模型轉(zhuǎn)化,也一律以Token調(diào)用量級來衡量?!八麄儍?nèi)部瘋狂地推豆包、扣子等產(chǎn)品,要求每個(gè)人都要用,創(chuàng)建自己的智能體”。

 

截至目前,火山引擎公布了兩組數(shù)據(jù):包含內(nèi)部產(chǎn)品下,豆包大模型日均Token處理量達(dá)16.4萬億。據(jù)IDC統(tǒng)計(jì),在不包含內(nèi)部產(chǎn)品條件下,去年國內(nèi)大模型調(diào)用總量中,火山引擎占比46.4%,相當(dāng)于百度與阿里之和。

 

與之形成對比的是另一組數(shù)據(jù),2024下半年,中國公有云服務(wù)整體市場規(guī)模(IaaS/PaaS/SaaS)為241.1億美元。公有云IaaS廠商市場份額,阿里以30.2%占比,位居第一;PaaS廠商市場份額,阿里以24.4%占比位居第二名,字節(jié)火山引擎則榜上無名。

 

火山引擎在市場競爭中處于下風(fēng),一方面說明頭部廠商長期壟斷,通過早期布局和生態(tài)整合已經(jīng)建立了較高的壁壘。另一方面也證明,火山引擎IaaS-PaaS協(xié)同效應(yīng)不夠,PaaS層倒流效果較弱,同時(shí)IaaS層尚未形成規(guī)模效應(yīng)。

 

這也是為什么火山引擎要繞過傳統(tǒng)IaaS/PaaS/SaaS分層模式,轉(zhuǎn)而把資源押注在新興的MaaS行業(yè)和Agent。MaaS直接與模型調(diào)用量掛鉤,這也解釋了其全面Token化的原因。對于阿里云老牌玩家來說,仍在利用基建層規(guī)模化優(yōu)勢,堅(jiān)持消耗云計(jì)算資源路線。

 

有一部分AI應(yīng)用產(chǎn)品開發(fā)者認(rèn)為,在大模型時(shí)代,傳統(tǒng)的DAU、MAU等產(chǎn)品指標(biāo)已經(jīng)過時(shí),應(yīng)該用消耗的Token量來衡量一款A(yù)I產(chǎn)品。在一些企業(yè)內(nèi)部,也把消耗Token量視為考察智能化進(jìn)度的其中一項(xiàng)。

 

值得注意的是,Token消耗量大不絕對等于賺錢,甚至免費(fèi)額度部分也被計(jì)入到總消費(fèi)量中。我們觀察發(fā)現(xiàn),企業(yè)級用戶對火山引擎的“低價(jià)策略”有一定認(rèn)知。一些客戶能靈活地運(yùn)用“免費(fèi)”策略,不斷地在各個(gè)模型間切換。

 

Token消耗能展現(xiàn)中間態(tài),但不能表明結(jié)果。在大模型智能成本越來越低的背景下,企業(yè)要么選擇開源模型自主構(gòu)建,要么對價(jià)格已經(jīng)脫敏。比起看Token調(diào)用和價(jià)格,他們更想要的是解決問題。

 

大力出奇跡?

 

為了拉動Token消耗量,火山引擎采用了“飽和”營銷的攻勢。

 

要超越,從模仿開始,模仿的第一步是挖人。近些年,云計(jì)算市場上演了“冰與火之歌”,一邊是接連不斷的人員優(yōu)化,一邊是不斷吸納新人。

 

官方招聘網(wǎng)站顯示,火山引擎在招崗位將近有六百多個(gè)。近些年來,火山引擎吸納大量原阿里云人員,有人粗略估計(jì)目前其人數(shù)占比約在30%-40%。

 

大模型人才競爭同樣激烈,知情人透露,字節(jié)不僅花高價(jià)挖來了原通義千問技術(shù)負(fù)責(zé)人周暢及其團(tuán)隊(duì),還把阿里語音研究方向的人員“基本挖空”。于同在競爭桌上的阿里云而言,無異于一記重?fù)簟?/p>

 

綜合多個(gè)渠道消息,字節(jié)目前是AI人才儲備最充沛的大廠,吸收了競對大廠、AI明星創(chuàng)業(yè)公司等不同背景人士。arxiv顯示,2025年一篇關(guān)于利用強(qiáng)化學(xué)習(xí)提升推理模型性能的論文中,Seed團(tuán)隊(duì)署名作者人數(shù)高達(dá)270多人。

 

4月份的一份內(nèi)部調(diào)研紀(jì)要顯示,Seed模型團(tuán)隊(duì)主帶隊(duì)人是吳永輝,原谷歌DeepMind副總裁和Gemini核心貢獻(xiàn)者,帶隊(duì)人數(shù)約1200人。團(tuán)隊(duì)人員構(gòu)成上,30%-40%為原有團(tuán)隊(duì)轉(zhuǎn)型而來,40%是集中擴(kuò)容的新增社招和校招,20%是從外部挖來的大牛。

 

憑借“鈔能力”,字節(jié)和火山引擎內(nèi)部上演了“神仙打架”的戲碼,但能否實(shí)現(xiàn)一加一大于二的效果尚未可知。近期或許已經(jīng)初露征兆,吳永輝加入后,字節(jié)大模型團(tuán)隊(duì)開始頻繁傳出離職和崗位變動消息,而這可能會影響到字節(jié)大模型未來的發(fā)展走向。

 

按照字節(jié)Seed團(tuán)隊(duì)已發(fā)布的論文來看,之前的研究方向集中在大模型、多模態(tài)、視覺生成、音頻和推薦系統(tǒng)等方向。在此基礎(chǔ)上,豆包大模型團(tuán)隊(duì)正在朝著“多模態(tài)世界模型”方向繼續(xù)進(jìn)行。

 

字節(jié)官網(wǎng)招聘頁介紹里,有兩項(xiàng)值得關(guān)注的點(diǎn):探索突破包括而不限于多模態(tài)RAG,視覺CoT與Agent等在內(nèi)的多模態(tài)模型、世界模型進(jìn)階能力,構(gòu)建GUI/游戲等虛擬世界的通用多模態(tài)Agent;利用預(yù)訓(xùn)練、仿真等技術(shù)對虛擬/現(xiàn)實(shí)世界的各類環(huán)境進(jìn)行建模,提供多模態(tài)交互探索的基本能力,推動應(yīng)用落地。這說明字節(jié)大模型研究,不僅服務(wù)B端云業(yè)務(wù),也將用于創(chuàng)建新的C端產(chǎn)品。

 

同時(shí),我們發(fā)現(xiàn)近期字節(jié)正在組建名為“BandAI”新團(tuán)隊(duì)。據(jù)介紹,該團(tuán)隊(duì)主要探索大模型、多模態(tài)、Agent等智能技術(shù)在交易場景的可能性,涉及抖音電商、生活服務(wù)、廣告等場景。如此看來,改造舊業(yè)務(wù),降本增效依然是大廠的關(guān)鍵課題。

 

寞落的豆包

 

譚待經(jīng)常開玩笑說,“企業(yè)AI轉(zhuǎn)型第一步,就是董事長先下載一個(gè)豆包App”。

 

豆包被字節(jié)內(nèi)部人稱之為“明星項(xiàng)目”,主要的業(yè)務(wù)分為PC端和移動端。在拉新增長的目標(biāo)驅(qū)動下,豆包應(yīng)用團(tuán)隊(duì)長期處于擴(kuò)張狀態(tài)。截至目前,豆包應(yīng)用的研發(fā)團(tuán)隊(duì)近百人,總團(tuán)隊(duì)人數(shù)在一百余人。

 

得益于字節(jié)系流量扶持,豆包應(yīng)用前期增長非常迅速,成為了2024年用戶量最大的AI應(yīng)用,直到DeepSeek的出現(xiàn)。DeepSeek的迅速破圈,一度讓字節(jié)陷入了沉思,包括豆包應(yīng)用團(tuán)隊(duì)的一些人。有人告訴我們,“在DeepSeek大火前,大家對于AI團(tuán)隊(duì)人數(shù)規(guī)模沒有明確標(biāo)準(zhǔn),而在差不多規(guī)模下,DeepSeek研發(fā)出了R1,順便上線了一款應(yīng)用”。

 

豆包應(yīng)用團(tuán)隊(duì)的人員配置在大廠是常態(tài),可跟DeepSeek一比,似乎略顯“冗余”。

 

作為火山引擎的“門面”,豆包正在逐漸向一款獨(dú)立應(yīng)用靠攏。一位曾在豆包任職的研發(fā)人員表示,日常功能迭代過程中,豆包團(tuán)隊(duì)一般不會跟模型層打交道。即便模型層升級,應(yīng)用層也不會有太大感知,他們只會在內(nèi)部基于用戶反饋和需求上線新功能。

 

一個(gè)細(xì)節(jié)是,豆包內(nèi)部人士多次否認(rèn)存在競品,但毫不吝嗇對DeepSeek的夸獎。

 

DeepSeek式反思過后,字節(jié)聲稱弱化投流,專注探索智能無上限。但光子星球了解到,豆包應(yīng)用的移動端和PC端均有與DAU相關(guān)的KPI,并且一個(gè)季度一總結(jié)、一制定,“Q2仍有一些指標(biāo)尚未完成”。

 

有AI產(chǎn)品經(jīng)理告訴我們,AI應(yīng)用現(xiàn)在看DAU有一定參考性,但更重要的是要評估用戶的有效對話輪次。如果只是用戶進(jìn)來提問,沒有多大意義,只有他們完成了有效問答,才能對產(chǎn)品迭代產(chǎn)生意義。

 

相比去年,豆包的營銷投放雖然放緩,卻還在繼續(xù)。內(nèi)部調(diào)研紀(jì)要估算,豆包一個(gè)月投放預(yù)算約在6000-7000萬,40%投放在內(nèi)部渠道,60%投放在外部渠道。

 

至此,人才、模型和應(yīng)用均已到位,字節(jié)“大力出奇跡”的故事,能否在火山引擎身上實(shí)現(xiàn)?

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計(jì)資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄