• 正文
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

DeepSeek R1模型本地部署與產(chǎn)品接入實操

02/17 10:17
1631
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

DeepSeek R1模型本地部署與產(chǎn)品接入實操

近期,深度求索(DeepSeek)推出的DeepSeek V3/R1系列模型在人工智能領(lǐng)域掀起了一股熱潮,引發(fā)了廣泛的關(guān)注與深入探討。該大模型憑借其卓越的推理能力和對硬件要求的顯著降低,贏得了市場的熱烈反響。DeepSeek的發(fā)布,標志著大模型產(chǎn)品正式邁入“普惠”時代,使得普通個人電腦乃至手機等便攜式設(shè)備均能流暢運行大型模型。這一里程碑式的進展,不僅激發(fā)了部署的浪潮,更激發(fā)了人們對大模型潛在應(yīng)用場景的無限遐想。

DeepSeek之所以備受矚目,不僅在于其技術(shù)的先進性,更在于其為用戶提供了前所未有的數(shù)據(jù)隱私與安全保障。在數(shù)據(jù)泄露風(fēng)險日益嚴峻的今天,DeepSeek的本地化部署方案為用戶提供了一個更為安心的選擇。通過本地部署,所有數(shù)據(jù)運算和存儲均在本地完成,有效規(guī)避了數(shù)據(jù)在傳輸和云端存儲過程中可能面臨的隱私泄露風(fēng)險。這一特性,使得DeepSeek R1在企業(yè)和個人用戶中均贏得了廣泛的認可與信賴。

自DeepSeek大模型發(fā)布以來,深蕾半導(dǎo)體團隊迅速展開了對DeepSeek大模型的相關(guān)研究,并積極探索DeepSeek大模型與SOC全系列產(chǎn)品結(jié)合的模式及市場機遇。

本地部署的私有化DeepSeek R1 32B大模型Web頁面訪問
通過本地部署私有化大模型,不僅為用戶提供了更為便捷的訪問途徑,還進一步強化了數(shù)據(jù)的安全性和隱私保護。這一舉措為后續(xù)SOC產(chǎn)品接入DeepSeek大模型降低了整體成本,同時也為企業(yè)內(nèi)部應(yīng)用DeepSeek大模型實現(xiàn)降本增效提供了堅實基礎(chǔ)。

本地部署的私有化Web頁面訪問DeepSeek R1 32B大模型的截圖

在Web應(yīng)用頁面中,用戶可以清晰地查看DeepSeek R1 32B模型的運行狀態(tài)、處理結(jié)果以及歷史記錄等信息。通過簡單的點擊和輸入操作,用戶即可輕松實現(xiàn)與模型的交互和數(shù)據(jù)處理。此外,該頁面還支持語音交互輸入方式,進一步提升了用戶體驗。

DeepSeek R1 32B模型不僅支持通用知識問答,還具備代碼編寫、邏輯推理等技能:

本地部署的服務(wù)器配置信息:

CPU:24核

顯卡:nvidia 3090ti 24g

內(nèi)存:60G

配置信息圖

VS680接入DeepSeek R1 32B模型API展示
我們還在VS680設(shè)備上的APP應(yīng)用中成功接入了DeepSeek R1 32B模型的API。VS680作為一款高性能計算機設(shè)備,其強大的計算能力和穩(wěn)定的系統(tǒng)環(huán)境為DeepSeek R1的運行提供了堅實的保障。特別是VS680自帶的7.9T AI算力,為端云結(jié)合的應(yīng)用模式創(chuàng)造了有利條件。

在演示中,我們可以看到VS680設(shè)備通過API接口與DeepSeek R1 32B模型實現(xiàn)了無縫連接。用戶只需在設(shè)備上輸入相應(yīng)的指令或數(shù)據(jù),DeepSeek R1模型即可迅速進行運算并返回結(jié)果。這一過程中,模型的響應(yīng)速度、準確性和穩(wěn)定性均得到了充分展現(xiàn)。

VS680接入字節(jié)豆包智能體DeepSeek R1 671B滿血模型展示

在字節(jié)官方火山引擎大模型開發(fā)平臺把“深蕾科技智能體”開發(fā)好,包括DeepSeek R1模型,角色定位,工作流等,然后發(fā)布到豆包應(yīng)用平臺,就可以在VS680上面直接實現(xiàn)滿血版的DeepSeek R1大模型接入使用。

深蕾科技智能體截圖

DeepSeek大模型與端側(cè)SOC的產(chǎn)品結(jié)合方案
針對VS680/SL1680系列大算力芯片,我們的研發(fā)團隊正在研究將蒸餾后的輕量級DeepSeek模型(DeepSeek-R1-Distill-Qwen-1.5B)部署到SOC本地,以便應(yīng)用于相關(guān)業(yè)務(wù)場景,如產(chǎn)品AI助手(問答服務(wù)、產(chǎn)品介紹、產(chǎn)品售后、產(chǎn)品故障排查等)。我們采用端側(cè)大模型與云端大模型相結(jié)合的方式,本地能處理的用戶任務(wù)使用端側(cè)大模型快速解決和輸出,而較復(fù)雜的邏輯以及聯(lián)網(wǎng)功能則通過請求云端大模型API的方式實現(xiàn)。

針對SL1640/SL1620/SR110系列小算力芯片,我們則通過API接入的方式進行產(chǎn)品賦能,如不帶屏語音交互產(chǎn)品、小屏桌面音視頻多媒體產(chǎn)品等。端側(cè)的語音識別、機器視覺與云端的DeepSeek大模型相結(jié)合,是智能硬件的最優(yōu)技術(shù)組合,能夠顯著提升產(chǎn)品的智能化程度,增加產(chǎn)品的附加值。

我們即將推出基于深蕾半導(dǎo)體SOC帶機器視覺和語音交互的DeepSeek大模型應(yīng)用解決方案,敬請期待!

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

深蕾半導(dǎo)體有限公司成立于2017年,是一家芯片設(shè)計公司,主要產(chǎn)品是音頻編解碼芯片Codec、智能音視頻編解碼芯片SoC。