能“邊想邊干”的AI智能體問世

03/31 15:33 作者：中國電子報

632

加入交流群

掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

3月31日，智譜在中關(guān)村論壇上正式發(fā)布AutoGLM沉思，這一全新智能體不僅具備深度研究能力（Deep Research），還能實現(xiàn)實際操作（Operator），真正推動AI Agent進(jìn)入“邊想邊干”的階段。

在現(xiàn)場演示環(huán)節(jié)可以看到，該智能體可以像人類一樣打開并瀏覽網(wǎng)頁，完成數(shù)據(jù)檢索、分析，并生成萬字報告，還可以自主選擇通過寫稿掙錢，完成從上網(wǎng)搜索征稿啟事、根據(jù)要求構(gòu)思寫稿、通過郵件向平臺投稿獲取稿費(fèi)等一系列復(fù)雜操作。

記者從發(fā)布會上了解到，從2023年10月最早推出具備Function Call能力的智譜清言，到2024年1月率先上線支持智能體編排的GLMs，再到2024年10月推出全球首個設(shè)備操控智能體AutoGLM，智譜一直引領(lǐng)AI Agent上界的探索。此次，智譜推出全新的AutoGLM沉思模型被認(rèn)為是全球首個集深度研究與實際操作能力于一體的Agent，這是自主智能體技術(shù)的一次重要進(jìn)步，也是設(shè)備操控智能體的進(jìn)一步升級。

智譜CEO張鵬表示，AutoGLM沉思體現(xiàn)了智譜對AI Agent的核心理解，即讓機(jī)器不僅能夠思考，還能主動行動，實現(xiàn)“邊想邊干”的目標(biāo)。這一能力的實現(xiàn)依賴于三個關(guān)鍵特性：一是深度思考，能夠模擬人類在面對復(fù)雜問題時的推理與決策過程；二是感知世界，能夠像人一樣獲取并理解環(huán)境信息；三是工具使用，能夠像人一樣調(diào)用和操作工具，完成復(fù)雜任務(wù)。

不同于OpenAI 的Deep Research（深度研究）功能，智譜AutoGLM沉思不僅能深入研究，還能真正執(zhí)行任務(wù)，推動AI Agent從單純的思考者，進(jìn)化為能交付結(jié)果的智能執(zhí)行者。其背后的沉思模型作為全新的Agent大腦，能夠通過強(qiáng)化學(xué)習(xí)，讓模型學(xué)會自我批評、反思甚至沉思，并通過更長的深度思考時間換取更優(yōu)的效果。它突破了實時聯(lián)網(wǎng)搜索、動態(tài)工具調(diào)用、深度分析和自我驗證，實現(xiàn)真正的長程推理和任務(wù)執(zhí)行。

據(jù)悉，在斯坦福大模型中心《AI指數(shù)2024》選定的智能體基準(zhǔn)評測AgentBench上，智譜AutoGLM系列模型在5個測試環(huán)境中也取得了 SOTA的成績。其中，在Phone Use基準(zhǔn)（AndroidLab & AndroidWorld）中，AutoGLM-Phone的任務(wù)成功率較此前最佳成績提升超過20%；在Browser Use基準(zhǔn)上，AutoGLM-Web也全面超越OpenAI GPT-4o和Anthropic Claude-3.5-Sonnet，展現(xiàn)了在網(wǎng)頁交互場景中的領(lǐng)先能力。

在GUI智能體領(lǐng)域，智譜自研模型GLM-PC（CogAgent）在多個權(quán)威評測榜單上取得SOTA 成績。憑借僅9B的參數(shù)，CogAgent超越了包括GPT-4o + UGround、Claude Computer Use等更大規(guī)模的同類模型或商用API。

智譜方面表示，目前，AutoGLM沉思已在智譜清言PC客戶端上線，用戶可免費(fèi)體驗其研究能力和操作能力。此次發(fā)布的為 preview版本，核心支持 research 場景；在未來兩周，智譜將進(jìn)一步擴(kuò)展更多智能體執(zhí)行能力。包括推出“虛擬機(jī)”版本，進(jìn)一步增強(qiáng)AI Agent的實際落地能力。另外，沉思功能也已正式上線智譜清言網(wǎng)頁端、PC端和手機(jī) App，免費(fèi)、不限量地開放給用戶。這也是國內(nèi)首個正式開放的Deep Research功能。

作者丨宋婧編輯丨諸玲珍美編丨馬利亞監(jiān)制丨趙晨

版權(quán)聲明：與非網(wǎng)經(jīng)原作者授權(quán)轉(zhuǎn)載，版權(quán)屬于原作者。文章觀點僅代表作者本人，不代表與非網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有侵權(quán)或者其他問題，請聯(lián)系本站作侵刪。侵權(quán)投訴

人工客服
（售后/吐槽/合作/交友）