• 正文
    • 如何甄別真假AI Agent?
    • 不是所有業(yè)務(wù)場景都需要AI Agent
    • 應(yīng)從野蠻生長邁向規(guī)范化發(fā)展
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

真假AI Agent

6小時前
424
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

伴隨AI人工智能)技術(shù)快速迭代,AI Agent(智能體)成為業(yè)內(nèi)炙手可熱的概念。一時間,很多企業(yè)都在推出相關(guān)產(chǎn)品或服務(wù)。然而,如果仔細(xì)觀察大家就會發(fā)現(xiàn),有些產(chǎn)品其實(shí)是“新瓶裝舊酒”,也有些產(chǎn)品是“形似神不似”,整個市場呈現(xiàn)出一種野蠻生長的趨勢。在這場真假AI Agent迷局之中,究竟是誰在借著集體狂歡收割紅利?又是誰在負(fù)重前行,探路AI Agent的商業(yè)化落地?

如何甄別真假AI Agent?

2025年,大模型比拼逐漸進(jìn)入“白熱化”。相較之下,蓄勢待發(fā)的AI Agent之爭似乎更加吸引眼球。伴隨市場熱度持續(xù)攀升、明星大廠蜂擁而至、資本空前投入,AI Agent相關(guān)字樣鋪天蓋地地出現(xiàn)在各種產(chǎn)品介紹、企業(yè)宣傳語,甚至是公司戰(zhàn)略之中。然而喧囂之下,真正能夠?yàn)橛脩魟?chuàng)造核心價(jià)值的AI Agent實(shí)際上寥寥無幾。

“AI Agent的核心特質(zhì)在于超越傳統(tǒng)自動化工具的自主性與適應(yīng)性。它并非簡單響應(yīng)指令的程序,而更像一個具備自主感知、理解、規(guī)劃、執(zhí)行與學(xué)習(xí)能力的‘決策者’?!本盘熘悄荏w算法團(tuán)隊(duì)負(fù)責(zé)人袁博在接受《中國電子報(bào)》采訪時表示。

以差旅預(yù)訂為例,真正的AI Agent不僅僅是執(zhí)行“預(yù)訂周一去上海的機(jī)票”,而是能夠綜合理解用戶的偏好(如航空公司、座位等級、時間窗口)、預(yù)算限制、歷史出行數(shù)據(jù),乃至實(shí)時天氣與交通狀況,自主完成信息搜集、方案比選、風(fēng)險(xiǎn)評估、預(yù)訂執(zhí)行,甚至在遇到航班延誤等突發(fā)情況時主動調(diào)整行程并通知用戶。這種從“被動應(yīng)答與執(zhí)行固定流程”到“主動理解與適應(yīng)性決策辦事”的躍遷,是區(qū)分其與普通自動化腳本或聊天機(jī)器人的重要標(biāo)志。

“真正的AI Agent應(yīng)當(dāng)具備記憶、規(guī)劃、工具使用以及行為記憶四大核心能力?!迸d業(yè)證券TMT研究中心傳媒行業(yè)首席分析師李陽對《中國電子報(bào)》記者說道。他認(rèn)為,相較于L2階段,AI實(shí)現(xiàn)了從被動進(jìn)行“信息處理/推理”到主動開展“與外部世界交互和執(zhí)行”的轉(zhuǎn)變。它可以調(diào)用諸如瀏覽器、API等工具,還能操作軟件界面,進(jìn)而形成一個“指令-?思考-?交互-?觀察-再思考......”的閉環(huán)系統(tǒng)。具備上述特征的智能體,才稱得上是真正意義上的AI Agent。

根據(jù)興業(yè)證券的觀察,市面上“偽Agent”主要是以下幾類:一是交互模式固化,局限于固定模板的問答模式,缺乏動態(tài)交互能力;二是“換皮”,僅通過界面優(yōu)化包裝基礎(chǔ)API調(diào)用,無實(shí)質(zhì)技術(shù)突破;三是處理能力薄弱,對模型輸出僅做基礎(chǔ)格式化處理,缺乏深度加工能力;四是功能創(chuàng)新缺失,未實(shí)現(xiàn)工作流整合與數(shù)據(jù)深度應(yīng)用。這些“偽Agent”產(chǎn)品本質(zhì)上屬于大模型能力的簡單封裝形態(tài),不僅沒有提供顯著附加價(jià)值,還在一定程度上造成了業(yè)內(nèi)價(jià)值認(rèn)知上的混亂。

“早期的市場熱度一方面確實(shí)能加速資本與人才的聚集,推動技術(shù)創(chuàng)新;但另一方面,如果缺乏清晰的價(jià)值定位和技術(shù)邊界認(rèn)知,也容易催生市場泡沫,甚至可能導(dǎo)致資源在所謂的‘偽需求’上錯配,延緩真正有價(jià)值應(yīng)用的落地?!痹┍硎?。

市場調(diào)研機(jī)構(gòu)Gartner預(yù)估,到2028年,至少15%的知識型任務(wù)將由Agent自主完成。但同時也指出,現(xiàn)階段AI Agent正處于技術(shù)炒作曲線的“膨脹期”,遠(yuǎn)未實(shí)現(xiàn)價(jià)值落地。

Gartner研究副總裁孫鑫在接受《中國電子報(bào)》采訪時表示,甄別真假AI Agent的關(guān)鍵便在于看它是否具備自主性、目標(biāo)導(dǎo)向、工具使用、記憶與學(xué)習(xí)能力等重要特征,要警惕“Prompt包裹型”產(chǎn)品,即僅靠提示工程實(shí)現(xiàn)表層效果?!耙恍┕緦⒁?guī)則引擎或提示詞模板偽裝成‘AI Agent’進(jìn)行營銷,這種包裝掩蓋了技術(shù)上的不成熟與實(shí)際可交付能力之間的差距?!睂O鑫提醒道。

不是所有業(yè)務(wù)場景都需要AI Agent

AI Agent的產(chǎn)業(yè)價(jià)值一方面在于它能夠大規(guī)模接管并高效執(zhí)行那些以往依賴人類專業(yè)知識和經(jīng)驗(yàn)進(jìn)行的復(fù)雜、重復(fù)性腦力勞動,從而極致釋放人力資本;另一方面,AI Agent能夠顯著降低高階技能的門檻,實(shí)現(xiàn)能力普惠,這將極大地激發(fā)個體創(chuàng)造力與生產(chǎn)力。

“更深層次的變革在于AI Agent的普及將催生全新的‘人機(jī)共生’的業(yè)務(wù)模式與社會協(xié)作形態(tài)。這種共生關(guān)系并非簡單的替代,而是通過智能協(xié)同,將人類從繁瑣事務(wù)中解放出來,更專注于創(chuàng)新、戰(zhàn)略思考和復(fù)雜決策,從而推動整個產(chǎn)業(yè)鏈條的智能化升級與價(jià)值重塑?!痹┍硎?。

然而,AI Agent并不是適合所有公司、所有業(yè)務(wù)場景的“萬金油”。孫鑫指出,Agent部署應(yīng)基于任務(wù)復(fù)雜性、自主性需求和系統(tǒng)整合能力。例如,高度規(guī)范、重復(fù)性流程適合Agent介入,而低復(fù)雜度或需要高度判斷力的場景則未必適合。企業(yè)還需評估其技術(shù)基礎(chǔ)、數(shù)據(jù)治理成熟度以及AI治理能力。

“實(shí)際上,大多數(shù)企業(yè)并沒有做好迎接智能體的準(zhǔn)備?!盜BM大中華區(qū)技術(shù)銷售總經(jīng)理、首席技術(shù)官翟峰如是說道。他認(rèn)為,隨著智能體的應(yīng)用,企業(yè)將要公開目前的應(yīng)用程序接口(API),這是最具挑戰(zhàn)性的部分,而解決這一問題的關(guān)鍵并不是模型是否夠好,而是企業(yè)的智能化就緒程度。

根據(jù)IBM商業(yè)價(jià)值研究院(IBV)最新發(fā)布的全球CEO調(diào)研報(bào)告,未來兩年企業(yè)對AI技術(shù)的投資將翻兩倍以上;大多數(shù)受訪CEO表示正在積極采用AI Agent,并為大規(guī)模應(yīng)用做準(zhǔn)備。然而,大規(guī)模的投資也導(dǎo)致了技術(shù)的碎片化,僅有25%的AI項(xiàng)目實(shí)現(xiàn)了預(yù)期的投資回報(bào)(ROI)。另外,IBM預(yù)計(jì)到?2028?年,全球新增的應(yīng)用數(shù)量將超過10?億個,這將帶來更加碎片化的IT環(huán)境,為企業(yè)的持續(xù)增長制造阻力。

袁博指出,部署AI Agent必須基于清醒的投入產(chǎn)出比分析與業(yè)務(wù)場景的實(shí)際適配度評估。盲目追求“高科技”而部署遠(yuǎn)超實(shí)際需求的AI Agent,不僅可能帶來高昂的開發(fā)、集成與維護(hù)成本,甚至可能因?yàn)橄到y(tǒng)的復(fù)雜性反而拖累業(yè)務(wù)效率。

比如,對于那些數(shù)據(jù)密集型、流程相對復(fù)雜,且對效率與智能化水平有高度要求的行業(yè)和場景,如智能制造中的生產(chǎn)調(diào)度優(yōu)化、金融服務(wù)中的智能投顧與風(fēng)險(xiǎn)控制、大型企業(yè)的客戶服務(wù)等,可積極探索AI Agent的應(yīng)用潛力。

而對于許多業(yè)務(wù)流程相對簡單、數(shù)據(jù)化程度不高,或者對即時性、靈活性要求遠(yuǎn)超智能性的場景,尤其是小微企業(yè),可能一個高效的自動化工具或一個傳統(tǒng)的SaaS服務(wù)就已經(jīng)能夠很好地滿足需求。例如,一家小型餐飲店,引入成熟的自動化點(diǎn)餐和會員管理系統(tǒng)可能比強(qiáng)行部署一個復(fù)雜的、需要大量數(shù)據(jù)喂養(yǎng)和定制化開發(fā)的AI Agent更為經(jīng)濟(jì)實(shí)用。

“Agent在中后臺工作處理有巨大優(yōu)勢,但在前臺工作中起到的作用較小。所以一些前臺類工作為主的場景或者公司,可以謹(jǐn)慎思考一下是否值得去部署?!崩铌柗治龅?。

應(yīng)從野蠻生長邁向規(guī)范化發(fā)展

“我認(rèn)為2025年將是‘AI Agent突破年’,尤其在編程領(lǐng)域,智能體可能成為主流應(yīng)用場景之一。”OpenAI聯(lián)合創(chuàng)始人兼首席執(zhí)行官山姆·奧特曼說道。同時,他預(yù)測稱,2026年,智能體將具備自主發(fā)現(xiàn)新知識的能力,形成具有獨(dú)立邏輯的決策框架。到2027年,智能體將正式進(jìn)入物理世界,作為“數(shù)字勞動力”在制造、醫(yī)療等領(lǐng)域創(chuàng)造實(shí)質(zhì)性的商業(yè)價(jià)值。

目前來看,AI Agent確實(shí)在朝著這個方向發(fā)展,只不過現(xiàn)階段的產(chǎn)品仍處于初級形態(tài)。面對復(fù)雜場景,技術(shù)成熟度仍顯不足。孫鑫指出,當(dāng)前LLM存在幻覺率、推理能力不足的問題,AI Agent的大規(guī)模落地存在技術(shù)挑戰(zhàn)。與此同時,Agent需與現(xiàn)有IT系統(tǒng)、流程打通,調(diào)用數(shù)據(jù)需符合安全與隱私規(guī)范,門檻不低。此外,部署Agent還需跨職能協(xié)作,具備Prompt Engineering、RAG開發(fā)、MLOps能力的人才仍稀缺。

要真正從概念走向規(guī)?;a(chǎn)業(yè)應(yīng)用,跨越技術(shù)與市場之間的鴻溝,還有很長一段路要走。袁博指出,首先要突破可靠性與可控性瓶頸,如何確保AI Agent在關(guān)鍵任務(wù)上的決策可靠性、行為可預(yù)測性及結(jié)果可解釋性,是其能否被信任并大規(guī)模應(yīng)用的前提;其次是系統(tǒng)集成與互操作性挑戰(zhàn),AI Agent要真正發(fā)揮價(jià)值,需要與企業(yè)內(nèi)部的數(shù)據(jù)庫、業(yè)務(wù)系統(tǒng)、API等進(jìn)行深度、動態(tài)的集成,這種集成不僅技術(shù)難度大、成本高,而且傳統(tǒng)企業(yè)IT系統(tǒng)在設(shè)計(jì)之初往往未考慮到與高度動態(tài)、自主決策的AI Agent進(jìn)行交互的需求,改造難度不??;最后要考慮成本效益的平衡,構(gòu)建和運(yùn)行一個功能全面、性能強(qiáng)大的AI Agent需要大量的算力資源,這可能導(dǎo)致其總體擁有成本(TCO)遠(yuǎn)高于現(xiàn)有的自動化解決方案,企業(yè)需要仔細(xì)權(quán)衡AI Agent帶來的效率提升與潛在的成本增加,確保其具備商業(yè)可行性。

從國內(nèi)市場來看,以DeepSeek、豆包為主的大模型在逐漸縮小和世界TOP大模型的差距,底層大模型的持續(xù)完善會推動Agent快速發(fā)展。李陽指出,目前國內(nèi)外大廠紛紛布局Agent,比如字節(jié)跳動的“扣子”、百度的“心響”、同程旅行的“程心AI”、飛豬的“問一問”等。后續(xù)更多公司將會跟進(jìn),中小公司可能更聚焦在垂直細(xì)分的Agent上。

孫鑫建議,要建立行業(yè)標(biāo)準(zhǔn),統(tǒng)一Agent架構(gòu)、能力評估與應(yīng)用邊界;要強(qiáng)化治理與責(zé)任劃分,避免AI幻覺帶來的合規(guī)風(fēng)險(xiǎn);要鼓勵開源和基礎(chǔ)設(shè)施建設(shè),降低開發(fā)門檻;要推動人才培養(yǎng),包括Agent設(shè)計(jì)師、AI運(yùn)營工程師等新角色。

“我們?nèi)孕璞3謱徤鳂酚^,對于更廣泛的長尾場景,或者那些對可靠性、安全性要求極高、監(jiān)管嚴(yán)格的領(lǐng)域,AI Agent的成熟商用可能還需要更長的培育期,或許要到2027—2028年甚至更晚?!痹┍硎尽?/p>

關(guān)注中國電子報(bào)關(guān)注本文作者

作者丨宋婧編輯丨邱江勇美編丨馬利亞監(jiān)制丨趙晨

相關(guān)推薦