3月31日,智譜在中關(guān)村論壇上正式發(fā)布AutoGLM沉思,這一全新智能體不僅具備深度研究能力(Deep Research),還能實現(xiàn)實際操作(Operator),真正推動AI Agent進(jìn)入“邊想邊干”的階段。
在現(xiàn)場演示環(huán)節(jié)可以看到,該智能體可以像人類一樣打開并瀏覽網(wǎng)頁,完成數(shù)據(jù)檢索、分析,并生成萬字報告,還可以自主選擇通過寫稿掙錢,完成從上網(wǎng)搜索征稿啟事、根據(jù)要求構(gòu)思寫稿、通過郵件向平臺投稿獲取稿費(fèi)等一系列復(fù)雜操作。
記者從發(fā)布會上了解到,從2023年10月最早推出具備Function Call能力的智譜清言,到2024年1月率先上線支持智能體編排的GLMs,再到2024年10月推出全球首個設(shè)備操控智能體AutoGLM,智譜一直引領(lǐng)AI Agent上界的探索。此次,智譜推出全新的AutoGLM沉思模型被認(rèn)為是全球首個集深度研究與實際操作能力于一體的Agent,這是自主智能體技術(shù)的一次重要進(jìn)步,也是設(shè)備操控智能體的進(jìn)一步升級。
智譜CEO張鵬表示,AutoGLM沉思體現(xiàn)了智譜對AI Agent的核心理解,即讓機(jī)器不僅能夠思考,還能主動行動,實現(xiàn)“邊想邊干”的目標(biāo)。這一能力的實現(xiàn)依賴于三個關(guān)鍵特性:一是深度思考,能夠模擬人類在面對復(fù)雜問題時的推理與決策過程;二是感知世界,能夠像人一樣獲取并理解環(huán)境信息;三是工具使用,能夠像人一樣調(diào)用和操作工具,完成復(fù)雜任務(wù)。
不同于OpenAI 的Deep Research(深度研究)功能,智譜AutoGLM沉思不僅能深入研究,還能真正執(zhí)行任務(wù),推動AI Agent從單純的思考者,進(jìn)化為能交付結(jié)果的智能執(zhí)行者。其背后的沉思模型作為全新的Agent大腦,能夠通過強(qiáng)化學(xué)習(xí),讓模型學(xué)會自我批評、反思甚至沉思,并通過更長的深度思考時間換取更優(yōu)的效果。它突破了實時聯(lián)網(wǎng)搜索、動態(tài)工具調(diào)用、深度分析和自我驗證,實現(xiàn)真正的長程推理和任務(wù)執(zhí)行。
據(jù)悉,在斯坦福大模型中心《AI指數(shù)2024》選定的智能體基準(zhǔn)評測AgentBench上,智譜AutoGLM系列模型在5個測試環(huán)境中也取得了 SOTA的成績。其中,在Phone Use基準(zhǔn)(AndroidLab & AndroidWorld)中,AutoGLM-Phone的任務(wù)成功率較此前最佳成績提升超過20%;在Browser Use基準(zhǔn)上,AutoGLM-Web也全面超越OpenAI GPT-4o和Anthropic Claude-3.5-Sonnet,展現(xiàn)了在網(wǎng)頁交互場景中的領(lǐng)先能力。
在GUI智能體領(lǐng)域,智譜自研模型GLM-PC(CogAgent)在多個權(quán)威評測榜單上取得SOTA 成績。憑借僅9B的參數(shù),CogAgent超越了包括GPT-4o + UGround、Claude Computer Use等更大規(guī)模的同類模型或商用API。
智譜方面表示,目前,AutoGLM沉思已在智譜清言PC客戶端上線,用戶可免費(fèi)體驗其研究能力和操作能力。此次發(fā)布的為 preview版本,核心支持 research 場景;在未來兩周,智譜將進(jìn)一步擴(kuò)展更多智能體執(zhí)行能力。包括推出“虛擬機(jī)”版本,進(jìn)一步增強(qiáng)AI Agent的實際落地能力。另外,沉思功能也已正式上線智譜清言網(wǎng)頁端、PC端和手機(jī) App,免費(fèi)、不限量地開放給用戶。這也是國內(nèi)首個正式開放的Deep Research功能。
作者丨宋婧編輯丨諸玲珍美編丨馬利亞監(jiān)制丨趙晨