DeepSeek作為人工智能領(lǐng)域的創(chuàng)新先鋒,憑借其突破性技術(shù)為現(xiàn)有AI Agent賦予了更強(qiáng)大的任務(wù)執(zhí)行與決策支持功能。而企業(yè)接入DeepSeek將帶來哪些創(chuàng)新與實(shí)踐價(jià)值,DeepSeek該如何打破發(fā)展瓶頸,其落地場景與效果表現(xiàn)如何等問題仍需探索。
本文將結(jié)合數(shù)勢科技的實(shí)踐,探討如何通過DeepSeek和現(xiàn)有大模型的整合,推動企業(yè)在數(shù)字化經(jīng)營中的新變革。
分享嘉賓|岑潤哲 數(shù)勢科技 數(shù)據(jù)智能產(chǎn)品總經(jīng)理
01DeepSeek的到來,對于大數(shù)據(jù)分析和應(yīng)用領(lǐng)域,是“天然的利好”
數(shù)據(jù)應(yīng)用賽道中,DeepSeek帶來了諸多改變與優(yōu)勢。在數(shù)據(jù)分析領(lǐng)域,DeepSeek接入后,其在數(shù)學(xué)及編程能力的增強(qiáng)具有顯著優(yōu)勢,極大地提升了對復(fù)雜數(shù)據(jù)的處理、統(tǒng)計(jì)與分析能力。在數(shù)據(jù)應(yīng)用領(lǐng)域,代碼能力與數(shù)學(xué)能力至關(guān)重要。DeepSeek到來后,無論是前期的數(shù)據(jù)清洗和特征挖掘,中期構(gòu)建指標(biāo)體系與指標(biāo)語義層,還是后期的數(shù)據(jù)可視化及報(bào)告生成等環(huán)節(jié),其數(shù)學(xué)能力與推理能力的提升,對數(shù)據(jù)應(yīng)用的全鏈路機(jī)制都產(chǎn)生了積極影響。特別是在復(fù)雜數(shù)據(jù)清洗、數(shù)據(jù)可視化以及深度報(bào)告生成方面,DeepSeek都帶來了諸多利好。
從技術(shù)視角來看,其思維鏈對數(shù)據(jù)分析極為有利。在數(shù)勢服務(wù)的眾多金融機(jī)構(gòu)中,以往大模型存在一個問題:雖然能給出答案,但答案的推導(dǎo)過程是黑盒化的。而在DeepSeek的論文中,能夠從V3的基礎(chǔ)模型做強(qiáng)化模型成為DeepSeek-R1-Zero,強(qiáng)化學(xué)習(xí)不僅獎勵準(zhǔn)確性,還注重過程與結(jié)構(gòu)的規(guī)范性。這一機(jī)制的優(yōu)勢在于,不僅能準(zhǔn)確進(jìn)行數(shù)據(jù)分析,還能將條理清晰的推理思路總結(jié)呈現(xiàn)給用戶。例如,用戶進(jìn)行企業(yè)經(jīng)營分析時(shí),應(yīng)該從哪些維度選取何種指標(biāo),DeepSeek能將思考過程以步驟的形式呈現(xiàn)出來。這種激勵機(jī)制,極大地增強(qiáng)了數(shù)據(jù)分析報(bào)告的說服力,是數(shù)據(jù)應(yīng)用領(lǐng)域的一大亮點(diǎn)。
作為推理模型,R1在推理時(shí)十分注重Token輸出,輸出的Token越多,思考越細(xì)致,出錯概率越低。在進(jìn)行復(fù)雜代碼生成、數(shù)據(jù)數(shù)學(xué)計(jì)算及決策時(shí),R1的表現(xiàn)明顯優(yōu)于蒸餾后的版本或千問模型。然而R1存在速度慢的問題,因?yàn)樘幚韽?fù)雜任務(wù)需要消耗更多Token進(jìn)行思考。因此可以采用結(jié)合的思路,即使用蒸餾后的相對小參數(shù)量(如32B)的模型,先進(jìn)行任務(wù)分類與實(shí)體抽取,該模型在這方面與R1效果相差不大,且速度更快。然而,當(dāng)用戶的數(shù)據(jù)分析任務(wù)極為復(fù)雜時(shí),可能會調(diào)用如R1這類推理模型進(jìn)行深度推理與規(guī)劃,以更好地滿足用戶的分析需求。
通過近期就模型選用問題與多家金融機(jī)構(gòu)進(jìn)行的交流來看,若場景主要是滿足用戶的快速數(shù)據(jù)檢索需求,例如詢問今年某月份的余額增速情況,此時(shí)無需調(diào)用R1這類長推理模型進(jìn)行復(fù)雜任務(wù)拆解,使用V3模型進(jìn)行讀取識別與要素解析,即可快速提取數(shù)據(jù)。但如果用戶的分析需求并非簡單的數(shù)據(jù)提取,而是像撰寫信貸報(bào)告或詳細(xì)的銀行信貸資產(chǎn)增速分析報(bào)告,這類高階的數(shù)據(jù)推理或行動計(jì)劃輸出任務(wù),V3模型的快速思考可能無法很好地完成。這種情況下,R1的推理模型更為適用,它能夠?qū)⑷蝿?wù)進(jìn)行拆解。比如在分支行業(yè)績對比復(fù)盤時(shí),確定應(yīng)關(guān)注的指標(biāo),并將任務(wù)細(xì)化為具體步驟。因此,現(xiàn)在很多主流AI產(chǎn)品都會設(shè)置“是否啟用深度思考”的按鈕。從某種意義上講,這是通過產(chǎn)品的功能操作,讓用戶能夠選擇此次是進(jìn)行快思考還是慢思考。未來,此類融合方案或許會成為眾多產(chǎn)品的標(biāo)配。
02?數(shù)勢SwiftAgent的革新與應(yīng)用
?目前數(shù)勢在SwiftAgent中加入了“深度思考”按鈕,一旦用戶開啟該按鈕,便會調(diào)用R1模型進(jìn)行深度推理與分析。數(shù)勢的工具主要面向一些頭部企業(yè),通過接入DeepSeek后對部分能力特性進(jìn)行了升級,從四個方面極大地提升了大模型的能力。
前端代碼生成能力極為出色。實(shí)驗(yàn)得出,直接讓R1基于原始數(shù)據(jù)生成代碼,此時(shí)它在前端快速獲取可視化呈現(xiàn)的能力非常強(qiáng)。以往,大家更多地是借助BI工具來配置一系列看板或駕駛艙,而現(xiàn)在,直接將原始數(shù)據(jù)交給R1生成H5或JS代碼,其表現(xiàn)十分出色,這極大地增強(qiáng)了可視化能力。
其次推理能力顯著提升了報(bào)告的深度。以往模型可能只能給出一些較為基礎(chǔ)、缺乏深度的表述,而現(xiàn)在它能夠真正思考指標(biāo)是否存在問題,是否需要進(jìn)行假設(shè)推斷等,這大幅提升了報(bào)告的質(zhì)量和深度。數(shù)據(jù)分析報(bào)告的難點(diǎn)在于,指標(biāo)口徑的準(zhǔn)確性至關(guān)重要,結(jié)論需基于指標(biāo)異常進(jìn)行推斷,甚至有時(shí)還需結(jié)合企業(yè)內(nèi)部知識庫或相關(guān)文檔生成合理建議。當(dāng)數(shù)據(jù)需要可視化呈現(xiàn),如轉(zhuǎn)化為表格以進(jìn)行對比,或進(jìn)行異常結(jié)論挖掘時(shí),相較于以往如千問模型的思考深度更優(yōu),且整個過程對用戶具有可觀測性。
以財(cái)務(wù)數(shù)據(jù)異常分析為例,用戶輸入財(cái)務(wù)數(shù)據(jù),模型能夠明確告知用戶,因某指標(biāo)下降故而進(jìn)行異常分析,其思考過程中的每一個節(jié)點(diǎn)都能直觀地向用戶解釋分析的原因。如此一來,在呈現(xiàn)報(bào)告時(shí),用戶能夠清晰理解報(bào)告撰寫的邏輯,而不像以往大模型輸出結(jié)果時(shí),雖有內(nèi)容卻難以理解分析的依據(jù)。從這個層面來看,大模型思考過程的白盒化是一項(xiàng)重大變革,極大地增強(qiáng)了用戶對結(jié)果的可信度,也提升了數(shù)據(jù)解讀報(bào)告的能力。過去報(bào)告可能僅有純文字,如今則可融入圖片、表格等數(shù)據(jù)可視化元素,為用戶帶來更好的使用體驗(yàn)。
此外哪些能力適合由大模型直接生成代碼去完成,哪些更適合通過工具調(diào)用。目前大模型寫代碼的能力很強(qiáng),但有時(shí)仍需編寫Function Code,而非直接讓大模型生成代碼。這主要分為兩種情況:如果代碼的范式能夠固化,此時(shí)大模型直接寫代碼的準(zhǔn)確率會非常高?。所謂固化范式,以圖表為例,基本圖表具有固定范式,從數(shù)據(jù)分析可視化的角度來看,其模式早已固定,無論何時(shí),餅圖的呈現(xiàn)方式基本一致。在這種情況下,大模型編寫代碼時(shí)表現(xiàn)出色,基本不會出錯。然而,對于業(yè)務(wù)邏輯靈活的代碼,大模型則不太適合直接編寫。業(yè)務(wù)邏輯通常涉及數(shù)據(jù)庫中事實(shí)表與維度表的關(guān)聯(lián),這種關(guān)聯(lián)具有很強(qiáng)的業(yè)務(wù)邏輯,且不同公司內(nèi)部表與表之間的關(guān)系各不相同。若讓大模型強(qiáng)行編寫涉及三到四個表的復(fù)雜關(guān)聯(lián)代碼,其生成的代碼往往會出現(xiàn)問題。所以建議通過指標(biāo)平臺的API取數(shù)接口,實(shí)現(xiàn)指標(biāo)維度的拼接來獲取數(shù)據(jù),這種方式更為妥當(dāng)。
03?金融行業(yè)案例與展望
以下將詳細(xì)分享某城市商業(yè)銀行開展智能數(shù)據(jù)分析的成功案例,近期該銀行將內(nèi)部的千問模型替換為DeepSeek V3和R1后,取得了一定的效果提升。該客戶產(chǎn)品面臨的主要問題是解決行領(lǐng)導(dǎo)在數(shù)據(jù)提取和分析方面的痛點(diǎn)。這家銀行以往依靠分析師角色,通過人工提取數(shù)據(jù)表格的方式,為領(lǐng)導(dǎo)提供諸如收入、存貸款情況、同業(yè)負(fù)債情況等報(bào)表。對于銀行領(lǐng)導(dǎo)而言,其數(shù)據(jù)需求較為靈活,今日可能關(guān)注幾個分支行的余額增速,明日則可能關(guān)注業(yè)績排名。然而,銀行缺乏足夠的分析師來滿足這些多樣化需求。因此,銀行期望通過自然語言查詢機(jī)制,一方面釋放分析師的時(shí)間,提升取數(shù)效率;另一方面,為領(lǐng)導(dǎo)提供更敏捷的歸因分析及報(bào)告分析能力,以便洞察行內(nèi)指標(biāo)變化的異動原因,從而顯著提升工作效果與效率。項(xiàng)目完成后的第一周,領(lǐng)導(dǎo)們提交了數(shù)千條查詢請求,系統(tǒng)使用率較高。同時(shí),結(jié)合指標(biāo)語義層,數(shù)據(jù)準(zhǔn)確性高,從問詢到輸出數(shù)據(jù)的時(shí)間基本僅需5秒左右。
這家銀行開展此項(xiàng)目,以及眾多企業(yè)尋求類似服務(wù),本質(zhì)上源于兩個問題。
需求與供給的錯配。即便頭部銀行或大型企業(yè)擁有分析師及ETL人員,但隨著業(yè)務(wù)不斷拓展,需求持續(xù)增長,企業(yè)不可能招募等量工程師編寫腳本以滿足所有需求,導(dǎo)致人力供給與需求不匹配。因此,企業(yè)期望借助AI agent滿足日常取數(shù)和用數(shù)的分析訴求,解放人力。
指標(biāo)口徑層面存在黑盒問題。不同部門對同一指標(biāo)名稱可能存在不同理解,在底層數(shù)倉中口徑不一致。所以,構(gòu)建指標(biāo)語義層,統(tǒng)一指標(biāo)口徑,使部門間擁有共通的數(shù)據(jù)語言,成為亟待解決的問題。?
在實(shí)施方案中融合了大模型能力與指標(biāo)語義層交互能力。當(dāng)用戶提出問題時(shí),首先由大模型進(jìn)行判斷。若任務(wù)復(fù)雜,如需要生成深度歸因報(bào)告,則通過路由將需求轉(zhuǎn)至DeepSeek R1處理;若只是簡單的數(shù)據(jù)提取,如按時(shí)間、機(jī)構(gòu)、貸款余額等條件提取數(shù)據(jù),使用V3或更快的模型即可。即先由大模型進(jìn)行意圖理解,若為復(fù)雜任務(wù),則進(jìn)入任務(wù)規(guī)劃階段,由規(guī)劃層進(jìn)行多任務(wù)編排。在指標(biāo)查詢環(huán)節(jié),通過指標(biāo)語義層,提取用戶自然語言中的要素。例如用戶詢問各分支行業(yè)績情況,其中分支行為維度,過去三個月為時(shí)間,業(yè)績對應(yīng)若干指標(biāo),存在一套映射邏輯。最后將這些指標(biāo)語義邏輯翻譯成SQL語句執(zhí)行,并通過R1這樣的推理模型對報(bào)告進(jìn)行總結(jié),反饋給用戶。目前大模型在完整的數(shù)據(jù)提取方面能力有限,因?yàn)槠鋵QL底表邏輯的理解存在局限,不過大模型在任務(wù)識別與報(bào)告生成方面表現(xiàn)出色。因此,將大模型擅長與不擅長的部分區(qū)分開來,進(jìn)行方案融合,以更好地實(shí)施相關(guān)項(xiàng)目。
該銀行的技術(shù)團(tuán)隊(duì)曾嘗試直接使用R1模型生成SQL。當(dāng)表結(jié)構(gòu)較為簡單,例如查詢近7日資產(chǎn)時(shí),R1生成的SQL能夠正常運(yùn)行。然而,當(dāng)問題中的任務(wù)指令較多,不僅需要提取數(shù)據(jù),還涉及歸因分析以及報(bào)告撰寫等任務(wù)時(shí),單純通過代碼生成工具來完成就較為困難。此時(shí)會先利用R1進(jìn)行多任務(wù)規(guī)劃,第一個任務(wù)可能是取數(shù),第二個任務(wù)通過歸因分析小模型進(jìn)行維度歸因,最后借助知識庫生成報(bào)告。通過這種結(jié)合Agent架構(gòu)與Function Code形式,能夠更好地滿足業(yè)務(wù)方在真實(shí)復(fù)雜業(yè)務(wù)場景下的分析需求,這些需求不僅包括數(shù)據(jù)提取,還涵蓋高階的數(shù)據(jù)洞察、歸因、異常檢測以及報(bào)告撰寫等,這也是企業(yè)實(shí)際會面臨的問題。
在為該金融機(jī)構(gòu)提供服務(wù)時(shí),采取分場景推進(jìn)的方式。因?yàn)椴豢赡芤婚_始就覆蓋所有場景。在項(xiàng)目一期,首先解決行領(lǐng)導(dǎo)對行內(nèi)業(yè)績指標(biāo)對比的自然語言分析與報(bào)告生成需求。到了項(xiàng)目二期,則聚焦于實(shí)際業(yè)務(wù),如信貸、對公貸款業(yè)務(wù),進(jìn)行風(fēng)險(xiǎn)評估、財(cái)務(wù)分析或信用卡分析等,從總部視角逐步擴(kuò)展到各個業(yè)務(wù)線的領(lǐng)域和場景。項(xiàng)目一期上線后,用戶體驗(yàn)良好。以往,無論是行長還是分支行領(lǐng)導(dǎo),數(shù)據(jù)提取流程都是向分析師提出需求,由分析師進(jìn)行加工,這個過程來回可能需要4個小時(shí)。而現(xiàn)在,算法能夠主動幫助用戶發(fā)現(xiàn)指標(biāo)問題,例如告知用戶行內(nèi)不良率或貸款余額近期的變化,提醒領(lǐng)導(dǎo)關(guān)注。領(lǐng)導(dǎo)若想進(jìn)一步了解各機(jī)構(gòu)業(yè)務(wù)表現(xiàn)不佳的原因,進(jìn)行詳細(xì)的數(shù)據(jù)歸因洞察,可按照分支行、產(chǎn)品類型、客戶類型等維度進(jìn)行問詢。
最后,若領(lǐng)導(dǎo)需要向總行領(lǐng)導(dǎo)匯報(bào),系統(tǒng)可結(jié)合企業(yè)已有的數(shù)據(jù)庫和知識庫生成包含異常原因及應(yīng)對措施等內(nèi)容的簡單報(bào)告。在接入DeepSeek后,該銀行認(rèn)為其思維鏈生成及數(shù)據(jù)解讀模塊得到了顯著增強(qiáng)。以往報(bào)告可能只有純文字,現(xiàn)在則融合了表格、副文本、圖表與文字,大大提高了報(bào)告的易讀性和可解釋性,這也是DeepSeek接入后的優(yōu)勢所在。
最后分享一下對于DeepSeek的未來,尤其是推理模型演進(jìn)方向的展望。
第一,DeepSeek的出現(xiàn)實(shí)現(xiàn)了AI平權(quán)。這一成果意義重大,意味著無論是頭部企業(yè)還是中型企業(yè),都具備了部署開源模型的資源與能力,在這一點(diǎn)上,大企業(yè)和小企業(yè)處于同等地位,這是AI平臺發(fā)展的體現(xiàn)。未來,數(shù)據(jù)應(yīng)用組件將以DeepSeek為核心,分析組件作為執(zhí)行部分協(xié)同運(yùn)作,這樣能使強(qiáng)大的核心與不同的技能池有效配合,更好地滿足企業(yè)需求。
第二,目前DeepSeek仍無法掌握企業(yè)內(nèi)部的私域知識及數(shù)據(jù)編織邏輯。在此情況下,數(shù)據(jù)應(yīng)用產(chǎn)品需承擔(dān)“翻譯器”的角色。即在推理模型與企業(yè)級復(fù)雜數(shù)據(jù)結(jié)構(gòu)之間構(gòu)建語義層,以此作為連接用戶自然語言與底層數(shù)據(jù)表格架構(gòu)的橋梁,但這是大模型的通用能力所無法實(shí)現(xiàn)的。原因在于,DeepSeek當(dāng)前的上下文處理能力為64K或128K,然而企業(yè)實(shí)際數(shù)據(jù)量,大型機(jī)構(gòu)通常可達(dá)幾十PB甚至上百PB。顯然,無法將全部數(shù)據(jù)輸入模型進(jìn)行分析。因此,未來其64K或128K的上下文更適合用于推理,將任務(wù)細(xì)致拆解,再由“手腳”組件逐一執(zhí)行,獲取數(shù)據(jù)、開展相關(guān)分析,并將結(jié)果反饋給核心進(jìn)行總結(jié)報(bào)告,這種模式更具有可行性。
第三,目前在使用R1時(shí),存在無法控制思維鏈長度的問題,這導(dǎo)致其輸出有時(shí)較為啰嗦。若R1未來取得進(jìn)展,希望它能夠?qū)崿F(xiàn)對模型輸出的控制。例如能夠在某些場景下將Token控制在1000個以內(nèi),而在另一些場景下,允許2000個Token的輸出。如果未來能夠?qū)崿F(xiàn)對Token的控制,那么在眾多應(yīng)用場景中,將能夠靈活選擇輸出風(fēng)格。比如,選擇“謹(jǐn)慎型”輸出,回答問題更加嚴(yán)謹(jǐn);或者選擇相對活潑、簡潔的輸出風(fēng)格。