在工業(yè)數(shù)字化轉(zhuǎn)型浪潮中,大模型技術(shù)正成為破解行業(yè)效率瓶頸的關(guān)鍵引擎。本文聚焦DeepSeek+Agent在工業(yè)知識管理領(lǐng)域的落地實(shí)踐,深度解析從原始數(shù)據(jù)層到應(yīng)用產(chǎn)品層的全景技術(shù)框架,通過能源、制造、跨國企業(yè)等多領(lǐng)域Agent應(yīng)用案例,揭示大模型如何重構(gòu)工業(yè)企業(yè)設(shè)備運(yùn)維、營銷服務(wù)、企業(yè)管理等核心場景,為工業(yè)領(lǐng)域智能化升級提供從技術(shù)架構(gòu)到場景落地的全鏈條參考。
分享嘉賓|云問科技?解決方案專家
01、DeepSeek大模型工業(yè)落地場景
以下為工業(yè)場景落地全景框架,最底層為D0級數(shù)據(jù)集,會采集用戶會話記錄、錄音數(shù)據(jù)、產(chǎn)品說明書、運(yùn)維文檔記錄、工單數(shù)據(jù)及服務(wù)全過程記錄等原始數(shù)據(jù)。其上為L0大模型層,涵蓋DeepSeek、通義千問等開源大模型及國外通用大模型。L1層基于數(shù)據(jù)和特定方向進(jìn)行優(yōu)化,例如通過文檔問答、數(shù)據(jù)微調(diào)大模型以提升該領(lǐng)域表現(xiàn),或利用工業(yè)企業(yè)獨(dú)有數(shù)據(jù)優(yōu)化模型,使其在垂直領(lǐng)域優(yōu)于通用模型。原始數(shù)據(jù)集需經(jīng)預(yù)處理,例如將影印版PDF等圖片格式數(shù)據(jù)轉(zhuǎn)化為文本格式,以便大模型處理。往上一層是AI能力平臺,集成小模型NLP組件、向量組件、檢索解析器及文本切片、文檔生成等通用組件。
再往上是產(chǎn)品層,主要包含三個方向:
Agent AIGC構(gòu)建工業(yè)企業(yè)內(nèi)部自定義應(yīng)用。例如開發(fā)產(chǎn)品問題解決助手,可自動檢索歷史設(shè)計(jì)文檔、工單記錄并提供處理建議,供現(xiàn)場維修人員或?qū)<覅⒖紙?zhí)行。此外還包括企業(yè)內(nèi)部報(bào)銷助手、翻譯助手、郵件回復(fù)助手等多種實(shí)用應(yīng)用,滿足工業(yè)企業(yè)多樣化需求。
第二是知識智能平臺,能夠?yàn)樗挟a(chǎn)品提供底層知識支撐。大模型想要實(shí)現(xiàn)優(yōu)質(zhì)服務(wù)與更佳效果,需要重視底層知識建設(shè),唯有依托高質(zhì)量知識與數(shù)據(jù)集,方可避免大模型產(chǎn)生幻覺,并在應(yīng)用中更貼合業(yè)務(wù)需求。
第三是智慧營服平臺,在完成知識構(gòu)建與大模型應(yīng)用開發(fā)后,可賦能客服場景。如家電企業(yè)對外提供客戶服務(wù)時所需的文本機(jī)器人、電話機(jī)器人、在線客服等產(chǎn)品線。
頂層是大模型應(yīng)用層,以下選取典型案例進(jìn)行說明。
首先是設(shè)備履歷庫,用于管理設(shè)備全生命周期信息,包括安裝時間、維修記錄、運(yùn)檢時間及設(shè)計(jì)使用壽命等。當(dāng)設(shè)備出現(xiàn)問題時,大模型可以檢索設(shè)備履歷庫,基于歷史記錄提供處理建議。
其次是經(jīng)銷商管理場景,例如為車企構(gòu)建經(jīng)銷商知識庫,可幫助經(jīng)銷商解決車輛使用與維修過程中遇到的專業(yè)問題。此外還有數(shù)字助手應(yīng)用,為某外企打造的內(nèi)部數(shù)字助手,集成發(fā)票報(bào)銷、票據(jù)處理、財(cái)務(wù)問題解答等財(cái)務(wù)相關(guān)Agent,形成財(cái)務(wù)數(shù)字員工,同時覆蓋研發(fā)、工業(yè)生產(chǎn)等領(lǐng)域,對外提供數(shù)字化服務(wù)。
工業(yè)領(lǐng)域智能知識中心與大模型結(jié)合可實(shí)現(xiàn)以下應(yīng)用:
在營銷與服務(wù)層面,面向ToC或ToB業(yè)務(wù)場景,通過大模型與知識庫協(xié)同,可解決用戶咨詢響應(yīng)問題,大幅降低服務(wù)成本并縮短客戶響應(yīng)時間。在營銷拓展方面,改變傳統(tǒng)人力主導(dǎo)模式,借助電話機(jī)器人或坐席輔助工具,依托大模型與知識庫提升業(yè)務(wù)拓展效率、降低人力成本。
在內(nèi)部培訓(xùn)與支撐層面,企業(yè)內(nèi)部知識可以通過大模型轉(zhuǎn)化成培訓(xùn)課件、業(yè)務(wù)考題及模擬對練場景,為員工成長提供系統(tǒng)化賦能支持。
在研發(fā)生產(chǎn)制造層面,設(shè)備設(shè)計(jì)時查詢國標(biāo)參數(shù)、過往設(shè)計(jì)資料等需求,可通過大模型檢索歷史內(nèi)容提供支撐。在生產(chǎn)檢修環(huán)節(jié),設(shè)備后續(xù)運(yùn)維、檢測工作也能借助大模型提升效率。
以下是工業(yè)領(lǐng)域Agent應(yīng)用建設(shè)路徑示意圖。
企業(yè)級Agent與ToC端的Agent存在差異,以Manus為例,其流程編排與插件調(diào)用均可自主完成,優(yōu)勢在于用戶僅需提出訴求,系統(tǒng)便能自行編排流程,并在各節(jié)點(diǎn)自動調(diào)用搜索、文檔問答、文檔生成組裝等功能,無需過多人工設(shè)計(jì)。在工業(yè)領(lǐng)域及ToB場景中,類似Manus自主完成流程編排與插件調(diào)用的方式存在不可控性。經(jīng)實(shí)踐驗(yàn)證,Manus對同一任務(wù)或問題的多次處理,因?yàn)槊看瘟鞒桃娲罱肮ぞ哒{(diào)用存在不確定性,可能輸出不同答案。因此,ToB領(lǐng)域的業(yè)務(wù)編排需基于實(shí)際業(yè)務(wù)訴求進(jìn)行。
以工業(yè)問題處理Agent構(gòu)建為例,需預(yù)先規(guī)劃處理流程:首先接收問題輸入,隨后檢索過往處理事件,通過查詢工單庫獲取相關(guān)處理方案。如果檢索到對應(yīng)解決方案,則輸出答案并對回復(fù)內(nèi)容進(jìn)行評估,評估合格后完成流程;如果沒有找到,需要進(jìn)一步檢索其他文檔以獲取解決方案。由此可見企業(yè)級Agent應(yīng)用與ToC端存在差異。
在實(shí)際應(yīng)用中,企業(yè)級Agent可服務(wù)于多場景:營銷領(lǐng)域,如電力行業(yè)的政策問答、電價(jià)異常處理;設(shè)備運(yùn)維領(lǐng)域,實(shí)現(xiàn)輔助診斷、技術(shù)標(biāo)準(zhǔn)查詢、巡檢輔助;管理領(lǐng)域,用于審計(jì)工作、生成組織訪談方案、處理報(bào)銷票據(jù)等。
02、工業(yè)Agent落地案例解析
案例一:某能源單位“領(lǐng)智平臺”
本案例為某大型能源央企打造了領(lǐng)智平臺,該企業(yè)在全國范圍內(nèi)擁有眾多子公司及業(yè)務(wù)單位,此前各總部與分公司通過自有網(wǎng)盤平臺管理數(shù)據(jù),存在兩大核心問題:一是跨公司數(shù)據(jù)不互通,二是網(wǎng)盤僅能實(shí)現(xiàn)數(shù)據(jù)存儲管理,難以支持?jǐn)?shù)據(jù)消費(fèi)應(yīng)用,僅能通過標(biāo)題檢索文檔,需下載后人工處理內(nèi)容。
基于此,項(xiàng)目采用DeepSeek大模型結(jié)合智能知識中臺構(gòu)建的解決方案,首要解決全集團(tuán)數(shù)據(jù)共享問題,將各部門、單位數(shù)據(jù)統(tǒng)一整合至單一知識庫中。
其次是數(shù)據(jù)應(yīng)用層面進(jìn)行了優(yōu)化:
1.?多模態(tài)檢索能力:支持對總公司及分公司數(shù)據(jù)文檔的跨層級檢索,除標(biāo)題外,文檔內(nèi)容、圖片、視頻等多模態(tài)數(shù)據(jù)均可被檢索。
2. RAG問答系統(tǒng):通過大模型實(shí)現(xiàn)檢索增強(qiáng)生成,用戶提問后,系統(tǒng)自動定位相關(guān)文檔片段并輸入大模型,由大模型基于問題生成總結(jié)性答案,替代傳統(tǒng)“檢索后人工閱讀”模式。
項(xiàng)目還完成多項(xiàng)技術(shù)探索:針對大量圖片型影印版PDF數(shù)據(jù),通過知識工程系統(tǒng)進(jìn)行數(shù)字化與結(jié)構(gòu)化處理,轉(zhuǎn)化為可檢索、可向量化的文本格式,顯著提升數(shù)據(jù)利用效率。其次是數(shù)據(jù)結(jié)構(gòu)化處理:將文檔中的公式、表格、摘錄等內(nèi)容提取并存儲至獨(dú)立數(shù)據(jù)庫,用戶可直接定位所需數(shù)據(jù)節(jié)點(diǎn),無需打開文檔逐頁檢索。
此外為某企業(yè)構(gòu)建了知識大腦,本案例和智領(lǐng)平臺的核心差異在于實(shí)現(xiàn)智力資產(chǎn)沉淀。此前企業(yè)專家、工程師的經(jīng)驗(yàn)知識多存儲于個人電腦或大腦中,未形成共享資產(chǎn)。通過知識工程系統(tǒng)、論壇系統(tǒng)及專家協(xié)作平臺,幫助企業(yè)將隱性個人知識轉(zhuǎn)化為可復(fù)用的企業(yè)知識資產(chǎn),伴隨企業(yè)的發(fā)展迭代,實(shí)現(xiàn)知識價(jià)值的長效積累。
案例三:某跨國公司“數(shù)字員工”
在為某跨國企業(yè)打造的數(shù)字員工應(yīng)用中,該企業(yè)國內(nèi)外員工總數(shù)達(dá)數(shù)十萬(僅國內(nèi)員工超十萬),人事、財(cái)務(wù)等職能部門面臨海量咨詢壓力。
項(xiàng)目初期部署了文本機(jī)器人,通過梳理常見問題形成FAQ知識庫,實(shí)現(xiàn)問題匹配與答案推送。鑒于人工梳理知識點(diǎn)占用大量人力,后期引入大模型自動生成:輸入文檔后,系統(tǒng)自動提取潛在問題及對應(yīng)答案,經(jīng)審核后入庫。
二期項(xiàng)目進(jìn)一步升級為AIGC數(shù)字助手,無需預(yù)先梳理FAQ即可直接響應(yīng)用戶咨詢。通過大模型與搜索能力結(jié)合的RAG問答技術(shù),系統(tǒng)將文檔切片后存入向量庫,用戶提問時先檢索匹配向量片段,再由大模型總結(jié)生成答案,大幅減少人工梳理FAQ的工作量。
三期項(xiàng)目進(jìn)一步升級,基于Agent技術(shù)對企業(yè)內(nèi)部業(yè)務(wù)流程進(jìn)行重新編排:以報(bào)銷場景為例,傳統(tǒng)線下報(bào)銷需手工貼票、填寫單據(jù)并提交財(cái)務(wù)審核,財(cái)務(wù)需結(jié)合報(bào)銷制度逐一核對。如今通過Agent平臺,用戶上傳發(fā)票后,系統(tǒng)自動提取票面信息,系統(tǒng)自動識別發(fā)票類型(如交通票)、金額、開票單位及時間等信息并填入報(bào)銷單,同時檢索報(bào)銷制度,自動比對是否違反規(guī)定(如差旅住宿標(biāo)準(zhǔn))。若發(fā)票金額超出標(biāo)準(zhǔn)則退回,若合規(guī)則提交財(cái)務(wù)審核,將報(bào)銷周期從原一周縮短至1-2天。后續(xù)計(jì)劃持續(xù)拓展大模型在生產(chǎn)、設(shè)計(jì)、設(shè)備運(yùn)維檢修等場景的應(yīng)用。
案例三:某鋼鐵單位故障處置Agent
本案例為某鋼鐵企業(yè)開發(fā)的故障處理Agent應(yīng)用了知識圖譜技術(shù)。區(qū)別于非結(jié)構(gòu)化的文檔,知識圖譜將故障類型、設(shè)備參數(shù)等信息結(jié)構(gòu)化處理,通過故障樹邏輯構(gòu)建處置流程:用戶輸入問題后,系統(tǒng)按預(yù)設(shè)步驟引導(dǎo)檢測,逐步定位故障點(diǎn)并提供解決方案,實(shí)現(xiàn)標(biāo)準(zhǔn)化故障處置。
云問科技為某車渠構(gòu)建的洞察分析Agent聚焦?fàn)I銷與企業(yè)管理領(lǐng)域,針對傳統(tǒng)幾十頁至百頁不等的行業(yè)分析報(bào)告閱讀效率低的問題,通過大模型數(shù)據(jù)分析功能自動提取報(bào)告核心數(shù)據(jù)與關(guān)鍵結(jié)論,簡化信息獲取流程。如果需了解數(shù)據(jù)變化趨勢,用戶只需向大模型提問,系統(tǒng)將自動分析趨勢成因并提供預(yù)測。
此外針對某車企經(jīng)銷商及4S店員工流動性高、培訓(xùn)復(fù)雜的問題,云問科技構(gòu)建了大模型培訓(xùn)Agent,通過大模型生成模擬真實(shí)對話場景的對練內(nèi)容。例如,當(dāng)購車客戶提出各類問題,AI員工需在線解答,系統(tǒng)實(shí)時評估回答質(zhì)量,分析是否解決客戶訴求與顧慮,并生成包含得分的完整分析報(bào)告。該項(xiàng)目上線后實(shí)現(xiàn)線索留資率提升15%,員工能力提升帶動業(yè)務(wù)增長。
03、DeepSeek落地難點(diǎn)與經(jīng)驗(yàn)
1. 貫通知識全生命周期的知識工程實(shí)現(xiàn)語料增強(qiáng)
在大模型落地過程中,知識體系建設(shè)是核心環(huán)節(jié)。盡管通用開源模型在公共領(lǐng)域表現(xiàn)優(yōu)異,但面對行業(yè)或企業(yè)專有數(shù)據(jù)時處理能力不足,根源在于缺乏垂直領(lǐng)域知識支撐。因此,大模型落地首要任務(wù)是構(gòu)建高質(zhì)量知識體系,涵蓋知識采編、梳理及管理全流程。
2. 向量表征技術(shù)與其他NLP小模型的融合應(yīng)用
大模型對算力要求很高,尤其在央國企國產(chǎn)化項(xiàng)目中,若采用華為等國產(chǎn)化硬件方案,僅硬件成本就可能超過百萬元。為此,可采用混合專家模型(MOE)架構(gòu)實(shí)現(xiàn)大小模型融合,降低大模型對算力的需求。降低算力即降低成本,由于每個token計(jì)算及硬件資源均產(chǎn)生費(fèi)用,因此在小模型可勝任的場景中,應(yīng)優(yōu)先使用小模型完成任務(wù)處理。
3. 外掛知識庫避免大模型幻覺問題
如前所述,將企業(yè)內(nèi)部高質(zhì)量知識存入知識庫并進(jìn)行向量化切片處理,后續(xù)應(yīng)用中可直接調(diào)用企業(yè)自有知識進(jìn)行解答和處理。相較于使用開源或公有云大模型基于公開資料的處理方式,在企業(yè)內(nèi)部場景下的應(yīng)用效果更優(yōu)。此知識庫即定義為全公司級知識中臺,區(qū)別于個人知識庫。此前有客戶提出疑問,使用開源Ragflow問答系統(tǒng)效果良好,為何要采購云問系統(tǒng)。對此可從三個維度解答:
其一為知識版本管理問題。Ragflow缺乏知識版本控制機(jī)制,而企業(yè)內(nèi)部知識存在動態(tài)更新特性(如公司發(fā)文修訂、產(chǎn)品迭代升級等)。若上傳多版本知識,系統(tǒng)可能調(diào)用舊版本內(nèi)容,用戶若直接將過時結(jié)果應(yīng)用于工作,可能引發(fā)風(fēng)險(xiǎn)。
其二為權(quán)限管理問題。個人使用場景下無需權(quán)限控制,所有數(shù)據(jù)歸個人所有。但在企業(yè)應(yīng)用中,個人與個人、部門與部門、子公司與總公司之間需設(shè)置數(shù)據(jù)權(quán)限。例如企業(yè)核心財(cái)務(wù)數(shù)據(jù)需嚴(yán)格保密,若企業(yè)知識庫權(quán)限管理不當(dāng)導(dǎo)致敏感數(shù)據(jù)泄露,可能造成嚴(yán)重后果。
其三為數(shù)據(jù)處理量級問題。個人場景下文檔數(shù)量通常為數(shù)十至數(shù)百篇,Ragflow可有效處理;但企業(yè)級知識庫規(guī)??蛇_(dá)千萬篇,遠(yuǎn)超一般大模型輸入限制。因此需通過工程化處理(如文檔切片、精準(zhǔn)搜索)提取相關(guān)片段輸入大模型,實(shí)現(xiàn)對超大規(guī)模數(shù)據(jù)的高效處理,這是個人知識庫與企業(yè)級知識庫的核心差異之一。