2025 年大模型技術在應用側的新趨勢是什么?哪些新的技術方向值得關注?企業(yè)在規(guī)劃? 2025 年數(shù)字化項目時有哪些核心關注點?本文將基于愛分析與企業(yè)用戶、模型廠商的調研交流中,抽象和總結出 2025 年的趨勢和洞察,供大家參考。
分享嘉賓|張揚?愛分析 聯(lián)合創(chuàng)始人兼首席分析師
01、2025 年大模型如何賦能企業(yè)數(shù)字化建設?
從數(shù)字化的核心主導方針來看,2025 年已經(jīng)明確圍繞價值創(chuàng)造展開。
宏觀環(huán)境方面,在今年四季度初時,大家對于政策有良好的預期,但從實際落地的角度來看,很多企業(yè)用戶、廠商用戶從政府側回款的周期還是比較緩慢,盡管已經(jīng)有 10 萬億的投放預期,但實際的業(yè)務變化以及經(jīng)營狀況的變化,在 2025 年還是緩慢恢復的過程。
所以在 2025 年大家做數(shù)字化規(guī)劃時,應該以創(chuàng)造價值為核心導向,更多的關注業(yè)務收益,以及重點關注技術對于業(yè)務收益創(chuàng)造有哪些核心點。
大模型2025 年技術趨勢
上圖左邊的技術架構是大模型完整的全鏈路技術架構,從上層的戰(zhàn)略域,到下轄的應用域和管理域,再到基礎的框架域、能力域,和與框架域、能力域并行的上下文域,以及最底下的基礎設施的計算域。從中我們總結了幾點核心的技術趨勢。
第一是戰(zhàn)略域,是從整個大模型的技術架構探索的一個新方向。
所謂的快思考和慢思考主要映射的是人體大腦的兩個系統(tǒng),一個是靠直覺,一個是靠推理。直覺系統(tǒng)可以理解為快思考的系統(tǒng),推理系統(tǒng)可以理解為慢思考的系統(tǒng)。過去大模型的生成能力基本是圍繞快思考的方向展開的,類似于利用人腦系統(tǒng)里面的直覺去做。對于要求響應速度快,或者業(yè)務場景沒有太復雜的企業(yè)應用,快思考會比較適合。例如大家現(xiàn)在用的知識庫、內容生成、營銷素材生成、視頻生成等,都適用直覺的快思考的方式。而對于復雜的業(yè)務場景,一方面需要有大量的業(yè)務 KnowHow 和業(yè)務知識,另外一方面也需要有比較完整的思考邏輯,也就是推理邏輯。在過去的大模型應用落地時有很大的欠缺,很多企業(yè)也在通過做預訓練或者微調嘗試彌補專業(yè)知識的差距,都屬于從框架域和能力域的角度來解決問題。如果以更高維度的戰(zhàn)略域角度出發(fā),更多是企業(yè)內在邏輯推理過程的理解。不管是用思維鏈的方式,還是把整個思考推理的邏輯訓練到模型里,要遠比純粹的知識訓練維度更高。這也就是從ChatGPT 4-o 提出的慢思考過程,在整個企業(yè)的大模型技術架構里,不只有直接的推理,還有很多思維鏈的邏輯推理,這就更適合復雜的業(yè)務場景,例如可以用大模型做數(shù)據(jù)分析背后更加深入的下鉆、歸因、根因分析,包括潛在的應對解決方案的分析。所以從模型推理的場景角度來看,會因為慢思考的加入,2025 年大模型的應用將逐步深入到企業(yè)更加復雜的業(yè)務場景里。
第二是框架域,框架域的兩個核心點,一個是Agent,一個是RAG
RAG 在 2025 年核心趨勢的判斷是 RAG 的工程化會越來越成熟,幻覺的消除更多是時間長短的問題。從消除幻覺的理論基礎上是比較容易理解和成熟的,本質是當有理有據(jù)的專家知識輸入時,模型的幻覺會自然消失。所以在實踐落地的過程中, RAG 具體的工程化策略中,消除幻覺是需要長時間且逐步成熟的過程。今年我們看到基于傳統(tǒng) RAG 已經(jīng)提升到 RAG 2.0,還有 Graph RAG 和新提出來的雙層信息過濾框架,這些不同的 RAG 路線,可以理解為不同的工程化策略和手段,這些工程化的策略和手段目前已經(jīng)很豐富,而且依然不停地有新的工程化路線出來,也意味著這些工程化手段的落地門檻,或者落地工具也會越來越成熟。所以預計在 2025 年末,隨著工程化手段的增加和工程化本身的能力提升,基本消除幻覺問題是可以做到的。以及企業(yè)用戶對于準確性的關注度將會降低,不再是第一位考慮的問題,因為在一些復雜場景里是無法 100% 解決幻覺的,但可能在絕大部分場景里,幻覺將不再是一個問題。
第三是能力域,包括多模態(tài)的視頻模態(tài)和端側大模型。
多模態(tài)的視頻模態(tài)肯定是 2025 年最核心最大的能力突破。一些大模型廠商、基模廠商的下一步將重點做這個方向,以及 2025 年一些 To C 的新場景迸發(fā)出來,基本也是在多模態(tài)領域。舉個例子,短視頻核心的組成元素包括背景音樂、文本腳本、真人表演。目前文本生成已經(jīng)不成問題,背景音樂從技術能力角度來看,大模型生成的音樂不管是從音樂多樣性的風格,還是音樂的成熟度,都已經(jīng)比較高了,只不過是欠缺一個爆款音樂的出現(xiàn),所以核心要解決的是自動化生成視頻。從 C 端的應用角度來看,一些成熟的視頻大廠,以及基模廠商,都將會在 2025 年重點突破和關注這個方向。
2025 年消費級AI手機逐步成熟,端側大模型向企業(yè)場景滲透
當前端側大模型的場景出現(xiàn)的比較少,但是從未來的角度來說,尤其是在 2025 年,端側大模型的滲透會呈現(xiàn)比較明顯的增長趨勢。原因之一:隨著消費場景的變化,2025 年發(fā)售的手機將變成 AI 手機。端側的大模型會成為AI手機的標配,模型量化技術的成熟度在 2025 年會越來越高,尤其是在手機的端側模型中。原因之二:芯片廠商有足夠強的芯片設計適配,目前模型廠商和芯片廠商也有一些比較好的組合方式,正在向手機廠商做端側模型的輸出。
端側模型在企業(yè)場景中也滲透了三個核心場景。
第一是一線人員的作業(yè)場景。過去人員作業(yè)是紙質的,有了手機之后變成移動終端,現(xiàn)在是從移動終端再一次升級成智能終端。
第二是在設備作業(yè)場景。一線有大量的設備作業(yè)場景,跟人員作業(yè)的場景邏輯類似,面對設備自身的生產(chǎn)控制、設備自身的維修時,設備自身的智能化能力越強,便可以預見性的提前發(fā)現(xiàn)問題,包括生產(chǎn)過程中生產(chǎn)質量的自檢,也可以成為端側模型應用的方向之一。
第三是圍繞端側的決策分析。典型的是設備能耗管理,或者車機端的輔助駕駛,或者人工交互展開的角色分析場景,也是比較好的應用方向??偟膩碚f,從人員作業(yè)、設備作業(yè)和角色分析場景都是 2025 年比較好的應用和突破方向,同時降本的效果也會比較明顯。
02、2025 年,企業(yè)大模型落地趨勢
首先是對企業(yè)模型支出方面的影響。2025 年會因為大環(huán)境的影響,企業(yè)IT預算會呈現(xiàn)微降的趨勢。但從實際預算的投入項拆分來看,第一個傳統(tǒng)的業(yè)務系統(tǒng)改造和升級依然是最大的支出項,第二個是國家要求的信創(chuàng)部分也是一大支出,第三個是大模型,也是唯一一個 it 預算正增長的方向。預估 2025 年實際支出的增速能夠接近 100% ,做到 238 億元的級別。
從企業(yè)點角度會更加看重業(yè)務的短期收益,會在大模型軟件和服務上占更高比例的投入,而在硬件層面投入會趨于平緩。同時一部分已經(jīng)完成規(guī)劃的企業(yè),在大模型支出部分會維持在 5% ~ 10% 的it支出比例,這也可以給到正在做規(guī)劃的企業(yè)一個參考。接下來重點分析大模型落地部分的調研。
首先是落地的階段,在 2025 年處于觀望學習的企業(yè)不足30%,有 20% 的企業(yè)會到試點速贏的階段,也就是從早期的探索可研到試點速贏的過程中。所以明年將是大模型產(chǎn)品跨越鴻溝的一年,也是比較關鍵的一年。其次是落地手段,沒有太大的變化,大部分企業(yè)采取私有化部署開源模型+應用定制開發(fā)的落地手段。再從落地目的來看,圍繞創(chuàng)造價值展開的增收還是比較困難的,所以最核心的創(chuàng)造價值還是圍繞降本和提升利潤展開。
最后是大模型落地的風險點,當前準確性/幻覺是第一位,但也看到數(shù)據(jù)和知識質量的關注度有在迅速上升。這些是調研中定性層面的總結,從落地的實際業(yè)務場景中,我們核心看到產(chǎn)研和科研場景的價值已得到企業(yè)用戶認可。產(chǎn)研和科研本來就是企業(yè)重點投入的方向,屬于知識密集型和資金密集型的典型應用場景,與大語言模型的相關性和適應程度比較高,所以產(chǎn)研和科研是值得企業(yè)用戶 2025 年重點嘗試的場景。企業(yè)用戶對大模型預期收益會在 2025 年會回歸理性。
我們調研中,對于已經(jīng)落地大模型的企業(yè),了解到項目預期收益達成情況中,少部分實現(xiàn)和完全未實現(xiàn)的占比28%,近 1/ 3。這其中可以看到大模型落地的實際價值,與企業(yè)用戶的預期之間還是有一定差距的,在 2025 年時,這個差距會是比較良性的。同時在 2025 年也會出現(xiàn)一些大模型實際收益沒有達到預期的場景案例,這其實對于整個行業(yè)的發(fā)展還是比較正向和健康的。
主要有兩個核心的原因:
第一個核心原因是 ROI 的問題,即投入太高以及對應產(chǎn)出太低。例如 10 倍算力的投入支出只帶來了 KPI 提升的 10% ,這個就是典型的 ROI 太低的情況。而在 2025 年基本上已經(jīng)能很穩(wěn)健地去解決這個問題了,因為基礎硬件設施的投入會縮減,企業(yè)用戶會更注重些能看到立竿見影效果的場景應用,對于大規(guī)模、長周期見效的技術設施投入接受度會比較低,所以這是能自然而然隨著企業(yè)用戶對于 IT 預算分布和 IT 預算投項變化而直接能解決的問題。
第二個是本地化部署和模型能力之間的掣肘與制約問題。比較典型的是測試的時候,用公有云的模型測試效果不錯,但是本地化部署上線的手段會導致模型能力的下降,下降的比例或者下降的程度根據(jù)不同的項目有所區(qū)別,這是不及企業(yè)用戶預期的另一個核心原因。而且本地化部署的落地手段不會因為效果不及預期從而發(fā)生任何變化,明年以及未來幾年都會以本地化部署為導向。從完整的模型效果來講,30%-40% 是由基礎模型決定的,30%-40% 是由 RAG 決定的,剩下的 20%-30% 是由微調決定的。
所以隨著 RAG 的逐漸成熟,想要改善模型效果,一方面可以利用微調做一些補充,需要等待微調工具鏈的進一步成熟,這也是改善本地化部署與模型能力掣肘的有效方式。另外一方面是應用工程化的成熟度,隨著企業(yè)搭建越來越多的應用,通用性會越來越強,可以將模型能力轉移到應用中解決,不一定全部依托于模型能力,應用的工程化的、成熟度的提高也能解決預期收益達成的問題,但這個問題可能需要兩年甚至三年的時間來長期解決。總的來看,大模型的預期收益會在 2025 年逐漸回歸理性。以上就是此次分享的內容。
畢業(yè)于清華大學及香港中文大學,杭州市金融科技創(chuàng)新項目應用案例專家評委,原投中集團副總裁。十余年金融行業(yè)從業(yè)經(jīng)驗,在愛分析媒體平臺發(fā)文超過 500 篇,有很深的行業(yè)影響力。