• 正文
    • Qwen與DeepSeek的距離
    • 云廠商“收割”DS流量
    • 短期熱度與長(zhǎng)期價(jià)值
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

DeepSeek播種,阿里云“收割”?

02/24 10:30
1057
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

撰文?| 郝 ? 鑫,編輯?| 吳先之

DeepSeek沖擊影響下,云和AI正在成為重估阿里的標(biāo)尺。

2月20日,阿里發(fā)布2025財(cái)年第三季度業(yè)績(jī)報(bào)告(截至2024年12月31日止)。報(bào)告期內(nèi),阿里云實(shí)現(xiàn)營(yíng)收317.42億元,同比增長(zhǎng)13%,相比上一季度7%的增速接近翻倍。整體收入(不計(jì)來(lái)自阿里巴巴并表業(yè)務(wù)的收入)實(shí)現(xiàn)雙位數(shù)同比增長(zhǎng)11%。調(diào)整后EBITA增長(zhǎng)33%至31.38億。

財(cái)報(bào)顯示,該增長(zhǎng)得益于AI相關(guān)產(chǎn)品推動(dòng)的公共云收入增長(zhǎng),阿里云AI收入已連續(xù)六個(gè)季度三位數(shù)增長(zhǎng)。

受云業(yè)務(wù)增長(zhǎng)表現(xiàn),阿里在美股盤前交易中上漲10%。相關(guān)數(shù)據(jù)顯示,今年以來(lái),阿里港股股價(jià)上漲了48.7%,一度創(chuàng)下了接近60%的漲幅。

而這背后都離不開AI和云的影子。李飛飛利用開源大模型Qwen,以不到50美元的成本復(fù)刻DeepSeek-R1模型性能。蘋果選擇與阿里通義合作,為蘋果國(guó)內(nèi)手機(jī)提供AI服務(wù),一連串消息都獲得了市場(chǎng)的認(rèn)可。

春節(jié)期間,DeepSeek給世界拋下了一枚重磅炸彈,也重新點(diǎn)燃了行業(yè)對(duì)大模型的熱情。似乎每個(gè)人都想抓住這波流量,并試圖將流量商業(yè)化變現(xiàn)。

從結(jié)果來(lái)看,在由DeepSeek引發(fā)的流量大戰(zhàn)中,贏面較大的仍是以阿里云為代表的云廠商。一方面是有穩(wěn)健的基礎(chǔ)設(shè)施和維護(hù)能力來(lái)接納DeepSeek-R1“難民”,另一方面也通過(guò)接入DeepSeek推理模型,完成了留存拉新的階段性任務(wù)。特別在開源領(lǐng)域,Qwen系列大模型仍具備競(jìng)爭(zhēng)力,是國(guó)內(nèi)不少中小企業(yè)決策和部署模型選項(xiàng)。

不可否認(rèn)的是DeepSeek已經(jīng)對(duì)國(guó)內(nèi)大模型行業(yè)產(chǎn)生了影響:開源的價(jià)值被肯定,大模型技術(shù)的護(hù)城河被擊,玩家加速分化和優(yōu)勝劣汰。但短期熱度過(guò)后,仍需思考“推理”模型落地場(chǎng)景產(chǎn)生的實(shí)用價(jià)值。

Qwen與DeepSeek的距離

阿里財(cái)報(bào)會(huì)上提到,“春節(jié)以來(lái),推理需求呈爆炸性增長(zhǎng)”,客戶對(duì)AI相關(guān)產(chǎn)品的新需求約有60%-70%用于推理。

未來(lái)式智能CEO楊勁松對(duì)上面的數(shù)字有著清晰的感知,他回憶在春節(jié)期間,至少有一半的老客戶咨詢?cè)贒eepSeek,潛在和尚在溝通的新客戶也有二三十個(gè)。此前,這些人大部分是Qwen或智譜的客戶。

楊勁松介紹來(lái)咨詢的客戶大致分為兩類,一類是之前就在使用大模型的客戶,他們比較關(guān)注新模型的性能有哪些提升,以及自身能否部署和應(yīng)用。第二類是尚未下決策的群體,開源正在改變他們的認(rèn)知,意味著未來(lái)或許不需要花錢去找模型廠商采購(gòu)。

盡管去年閉源大模型打到了“骨折價(jià)”,但動(dòng)輒百萬(wàn)元級(jí)別的大模型對(duì)許多中小企業(yè)來(lái)說(shuō),仍是奢望。受困于預(yù)算,大模型決策鏈條十分長(zhǎng),涉及了選擇哪家大模型,配套何種資源以及怎么去驗(yàn)證大模型價(jià)值等。

開源的優(yōu)勢(shì)凸顯出來(lái),能夠以輕便的模式跑模型,體驗(yàn)性能的同時(shí)得到結(jié)果。目前,在開發(fā)者和To B客戶中,通義千問(wèn)的32B和72B最受歡迎。開源版的Qwen同樣在海外得到了認(rèn)可,官方數(shù)據(jù)顯示,海內(nèi)外開源社區(qū)中Qwen的衍生模型數(shù)量已突破9萬(wàn),超越Llama系列衍生模型,通義千問(wèn)Qwen成長(zhǎng)為世界最大的生成式語(yǔ)言模型族群。

簡(jiǎn)單算一筆賬,假設(shè)使用開源版的通義千問(wèn)模型搭建一個(gè)AI應(yīng)用項(xiàng)目。模型是免費(fèi)的,大頭支出就變成了硬件,剩下少部分是使用MaaS平臺(tái)工具和構(gòu)建應(yīng)用的服務(wù)費(fèi)用。預(yù)估下來(lái),總體成本預(yù)算能控制在百萬(wàn)以內(nèi)。

DeepSeek帶著新推理模型殺回了開源領(lǐng)域,風(fēng)頭一下子蓋過(guò)了Qwen和Llama。截至目前,DeepSeek相繼開源了671B參數(shù)的MoE模型“DeepSeek-V3”,對(duì)標(biāo)OpenAI o1的“DeepSeek-R1”和代碼模型“DeepSeek Coder”等幾款重要的模型。

當(dāng)在開源的戰(zhàn)場(chǎng)狹路相逢,Qwen和DeepSeek能否構(gòu)成直接競(jìng)爭(zhēng)?

楊勁松認(rèn)為“暫時(shí)影響不太大”,Qwen在開源生態(tài)的優(yōu)勢(shì)仍十分明顯。

目前,通義千問(wèn)就像是阿里“全家桶”,實(shí)現(xiàn)了“全尺寸、全模態(tài)、多場(chǎng)景”開源。包含了長(zhǎng)文本、代碼生成、多模態(tài)、推理等多款模型,尺寸上也從3B跨越到72B,覆蓋了企業(yè)日常知識(shí)問(wèn)答、客服對(duì)話、代碼生成、數(shù)據(jù)分析等常用場(chǎng)景。據(jù)悉,基于Qwen2.5-Max的深度推理模型也即將上線。正是這種“全”,給了用戶更多靈活的選擇。

國(guó)內(nèi)阿里是較早選擇開源的,Qwen系列模型就是以開源起家。當(dāng)前,基于模型底座已經(jīng)積累起了很多開發(fā)者用戶、工具,生長(zhǎng)出了一些應(yīng)用產(chǎn)品。成熟的生態(tài)會(huì)給予用戶便利性,促使其繼續(xù)使用千問(wèn)模型。

“一定程度上要取決于DeepSeek后期資源分配,在團(tuán)隊(duì)規(guī)模有限的情況下,是專注模型研發(fā)還是花費(fèi)一定精力去維護(hù)開源生態(tài)”,行業(yè)中有部分人認(rèn)為DeepSeek的重心依然在AGI研究上。

如果DeepSeek在開源上一直能保持領(lǐng)先,不排除將演變?yōu)樯鷳B(tài)系統(tǒng)之爭(zhēng)。不過(guò),DeepSeek和Qwen現(xiàn)在更偏向互為補(bǔ)充。一部分小尺寸DeepSeek-R1開源版本,就是基于Qwen模型蒸餾而來(lái)。

云廠商“收割”DS流量

高漲的情緒摻雜著些許沖動(dòng),一夜之間,比DeepSeek更火的是“接入DeepSeek”。

“不管怎么樣,本地來(lái)一套DeepSeek,讓我們能夠向上匯報(bào)”,大到國(guó)央企和政府部分,小到大廠、中小企業(yè)和個(gè)人開發(fā)者都想做第一批“吃螃蟹的人”。

現(xiàn)實(shí)的問(wèn)題是,在開源社區(qū)只能部署和跑得通R1蒸餾后的小模型,32B、70B小尺寸模型效果并不是很驚艷。

“接入”DeepSeek看上去很熱鬧,好像每家都在宣傳,但其實(shí)大部分還是量化后的版本。要部署“滿血版”6710億參數(shù)的DeepSeek V3/R1,既要求得有硬件層面做推理優(yōu)化的能力,還得扛得住經(jīng)濟(jì)成本。

以往一個(gè)新模型出來(lái),因?yàn)闀r(shí)間差的原因,總會(huì)誕生一批賣API的人,但這回屬實(shí)讓一批人望而卻步。有人大致推算,要把6710B拉滿,至少需要1000G內(nèi)存的卡,16臺(tái)八卡A100的機(jī)器,即使定價(jià)與DeepSeek漲價(jià)后價(jià)格持平,也是虧錢的狀態(tài)。與此同時(shí),還得承受流量涌進(jìn)后服務(wù)器的壓力和用戶消耗成本。

沒(méi)有誰(shuí)比云廠商更熟悉這套玩法,嗅到流量味道的云廠商們伺機(jī)而動(dòng)了起來(lái),相繼官宣MaaS平臺(tái)接入“滿血版”的R1。送token還限時(shí)免費(fèi),恢復(fù)原價(jià)后的模型輸入、輸出價(jià)格也低于DeepSeek官方價(jià)格。

云廠商不靠賣API賺錢,最終獲益的還是整套云計(jì)算基建規(guī)?;笮б妗?duì)阿里云們來(lái)說(shuō),搶奪AI時(shí)代流量入口才更重要,云上多模調(diào)用已經(jīng)是大趨勢(shì),以更開放的心態(tài)才能吸引來(lái)更多用戶。一旦調(diào)用R1的API鎖定在一家云上,后期服務(wù)器、存儲(chǔ)、構(gòu)建應(yīng)用等持續(xù)消費(fèi)也將留在該廠商上。

對(duì)開發(fā)者和企業(yè)來(lái)說(shuō),調(diào)用哪家的API沒(méi)有差別,最終還是要落到價(jià)格上。在沒(méi)有明顯效果差距下,傾向于哪家價(jià)格便宜用哪家。于是,大廠的價(jià)格優(yōu)勢(shì)就很明顯。

結(jié)果也是顯而易見,阿里云們接住了這波流量,token調(diào)用量、股價(jià)和市值隨之上漲。

DeepSeek或許讓阿里云等廠商愈發(fā)明確了生態(tài)站位。也許未來(lái),國(guó)內(nèi)外還將會(huì)出現(xiàn)性能優(yōu)越的模型。這其中不變的是對(duì)云基礎(chǔ)設(shè)施、釋放模型能力和普惠的需求。

財(cái)報(bào)會(huì)上,阿里也明確了AI未來(lái)三年內(nèi)的投資方向,強(qiáng)調(diào)“重投入”。

投資AI基礎(chǔ)設(shè)施,計(jì)劃在未來(lái)三年內(nèi)對(duì)云和AI基礎(chǔ)設(shè)施的投資將超過(guò)過(guò)去十年的總和;大幅增加對(duì)AI基礎(chǔ)模型的研發(fā)投入,以保持技術(shù)領(lǐng)先地位,并推動(dòng)AI原生應(yīng)用的發(fā)展;增加對(duì)AI應(yīng)用研發(fā)和計(jì)算能力的投資,并將AI深度整合到電商和互聯(lián)網(wǎng)平臺(tái)業(yè)務(wù)中,抓住AI時(shí)代的新增長(zhǎng)機(jī)會(huì)。

短期熱度與長(zhǎng)期價(jià)值

短期的熱度屬于云廠商,風(fēng)暴中心的DeepSeek已經(jīng)move on,下周將陸續(xù)開源五個(gè)代碼庫(kù)。

把視線拉遠(yuǎn),DeepSeek的長(zhǎng)期價(jià)值應(yīng)當(dāng)回歸到,推理模型究竟能解決什么問(wèn)題。“幾百家接入DeepSeek公司,可能自己也沒(méi)想明白到底能干什么”。

楊勁松觀察到,整個(gè)行業(yè)仍處于技術(shù)亢奮狀態(tài),還未達(dá)到R1大規(guī)模應(yīng)用落地的階段。結(jié)合國(guó)外的發(fā)展,還是有幾個(gè)方向值得探索。

行業(yè)普遍看好的方向之一是AI Coding。海外Cursor等AI編程產(chǎn)品大火,基本確立了Claude 3.5 Sonnet加上o1的組合,即Claude 3.5 Sonnet負(fù)責(zé)生成代碼,再用o1思維鏈去推理證明使用方式。這套組合之前在國(guó)內(nèi)沒(méi)有平替,現(xiàn)在DeepSeek有了自己代碼+推理組合。這意味著有了構(gòu)建一套Coding Agent的可能性。

“基于R1基座,通過(guò)強(qiáng)化學(xué)習(xí)的方式在垂直領(lǐng)域達(dá)到媲美人或超越人的能力,這是我覺(jué)得未來(lái)應(yīng)用方向”,楊勁松表示道。

之前模型應(yīng)用的路徑是,先有基模,然后收集數(shù)據(jù),再通過(guò)微調(diào)訓(xùn)練調(diào)整模型,來(lái)預(yù)測(cè)下一個(gè)token能力。但在實(shí)際業(yè)務(wù)場(chǎng)景中,采用行業(yè)數(shù)據(jù)和機(jī)器學(xué)習(xí)訓(xùn)練出的通用模型能力效果差強(qiáng)人意。

現(xiàn)在有了推理模型以后,就可以把行業(yè)專家在特定領(lǐng)域和工作流的最佳實(shí)踐,通過(guò)強(qiáng)化學(xué)習(xí)方式喂給推理模型。這樣一來(lái),它就可以熟悉企業(yè)內(nèi)部流程,掌握業(yè)務(wù)邏輯,做到像一位專家一樣去工作。楊勁松認(rèn)為,R1真正的價(jià)值在于,可以上升到?jīng)Q策層面,完成垂直領(lǐng)域的任務(wù),且達(dá)到不錯(cuò)的效果。

例如在電力場(chǎng)景,日常存在許多分析電網(wǎng)圖譜的工作。它要基于內(nèi)部規(guī)則做推導(dǎo),再去進(jìn)行決策。現(xiàn)在接入R1推理模型,并配備一些行業(yè)知識(shí)后,一定程度上就可以模擬電力專家完成電網(wǎng)調(diào)度、專改公等非常專業(yè)的任務(wù)。

OpenAI已經(jīng)在探索把推理功能落地到場(chǎng)景中。其由o3大模型支持的“Deep Research”功能,可以從互聯(lián)網(wǎng)上收集信息,并將其合成為簡(jiǎn)明的報(bào)告。OpenAI聲稱,“只需數(shù)十分鐘就能完成人類需要數(shù)小時(shí)才能完成的工作”。

這本質(zhì)上是復(fù)制行業(yè)分析師和咨詢顧問(wèn)的思考鏈條。使用模型還原分析過(guò)程,過(guò)程中調(diào)用搜索引擎、圖表等工具。圍繞一個(gè)研究主題,先推理、檢索再進(jìn)行深度分析,其生成的報(bào)告基本可以達(dá)到中級(jí)行業(yè)分析師的水平。

目前,國(guó)內(nèi)大廠已經(jīng)開始逐漸上線類似的“深度搜索”功能。要大規(guī)模地落地生產(chǎn)力場(chǎng)景,仍需時(shí)間驗(yàn)證。

阿里巴巴

阿里巴巴

阿里巴巴集團(tuán)經(jīng)營(yíng)多項(xiàng)業(yè)務(wù),另外也從關(guān)聯(lián)公司的業(yè)務(wù)和服務(wù)中取得經(jīng)營(yíng)商業(yè)生態(tài)系統(tǒng)上的支援。業(yè)務(wù)和關(guān)聯(lián)公司的業(yè)務(wù)包括:淘寶網(wǎng)、天貓、聚劃算、全球速賣通、阿里巴巴國(guó)際交易市場(chǎng)、1688、阿里媽媽、阿里云、螞蟻金服、菜鳥網(wǎng)絡(luò)等。

阿里巴巴集團(tuán)經(jīng)營(yíng)多項(xiàng)業(yè)務(wù),另外也從關(guān)聯(lián)公司的業(yè)務(wù)和服務(wù)中取得經(jīng)營(yíng)商業(yè)生態(tài)系統(tǒng)上的支援。業(yè)務(wù)和關(guān)聯(lián)公司的業(yè)務(wù)包括:淘寶網(wǎng)、天貓、聚劃算、全球速賣通、阿里巴巴國(guó)際交易市場(chǎng)、1688、阿里媽媽、阿里云、螞蟻金服、菜鳥網(wǎng)絡(luò)等。收起

查看更多

相關(guān)推薦