近期,中國人工智能企業(yè)深度求索(DeepSeek)的大模型憑借其卓越的技術優(yōu)勢和廣泛的應用前景,迅速成為行業(yè)焦點。隨著多家國內外知名云平臺和科技企業(yè)相繼宣布上線DeepSeek大模型,人工智能市場迎來了新的變革浪潮。
據(jù)全球半導體觀察不完全統(tǒng)計,目前已包括國外巨頭英偉達、AMD、微軟、亞馬遜云科技、英特爾,國內GPU企業(yè)沐曦、天數(shù)智芯、摩爾線程、海光信息,云計算大廠華為云、騰訊云、天翼云、阿里云、百度智能云、火山引擎,以及無問芯穹、壁仞科技、硅基流動、PPIO派歐云、云軸科技等總計20家企業(yè)均已宣布適配及上架DeepSeek模型服務。
國際巨頭積極布局,引領全球AI發(fā)展
AMD
在國際市場上,AMD最早在1月25日就官宣將DeepSeek-V3模型集成到了Instinct MI300X GPU上。在X平臺發(fā)文中,AMD董事長兼CEO蘇姿豐稱贊DeepSeek展現(xiàn)了“AI世界創(chuàng)新的速度和步伐”、“模型和算法創(chuàng)新有利于AI普及”。
微軟
微軟也不甘落后,1月30日,微軟宣布DeepSeek-R1模型已通過AzureAIFoundry和GitHub提供。微軟計劃將該模型應用于其AI電腦Copilot+PC,并推出了針對NPU優(yōu)化的版本,進一步拓展了其AI應用生態(tài)。
英偉達
1月31日,英偉達接連官宣上線搭載DeepSeek-R1的軟件服務。英偉達官網顯示,DeepSeek-R1模型現(xiàn)已作為NVIDIANIM微服務預覽版提供,為開發(fā)者開啟了測試和體驗該API的通道。
英特爾
同樣在1月31日,英特爾也宣布DeepSeek能夠在搭載酷睿處理器的AI PC上離線使用。在酷睿Ultra 200H(Arrow Lake H)平臺上,DeepSeek-R1-1.5B模型能夠本地離線運行,做翻譯、做會議紀要、進行文檔撰寫等任務。
AWS(亞馬遜云科技)
AWS(亞馬遜云科技)同樣積極布局,1月31日,亞馬遜云科技宣布用戶可以在AmazonBedrock和AmazonSageMakerAI中部署DeepSeek-R1模型。此外,用戶還可以通過AmazonEC2和AmazonSageMakerAI,使用AmazonTrainium和AmazonInferentia部署DeepSeek-R1-Distill模型。
國內企業(yè)迅猛跟進
華為云
2月1日,華為云發(fā)文稱,硅基流動與華為云團隊聯(lián)合首發(fā)并上線基于華為云昇騰云服務的DeepSeekR1/V3推理服務。該服務借助自研推理加速引擎,不僅能讓部署的DeepSeek模型獲得與全球高端GPU部署模型相當?shù)男Ч?,還具備穩(wěn)定的生產級服務能力。
騰訊云
2月2日,騰訊云宣布在高性能應用服務HAI上支持一鍵部署DeepSeek-R1模型,開發(fā)者僅需3分鐘即可完成模型的啟動和配置,并且能與其他騰訊云服務無縫集成,極大提高了構建基于DeepSeekR1完整AI應用的效率。
天翼云
2月5日,中國電信天翼云宣布成為國內最早支持DeepSeek-R1模型的云服務商之一。天翼云在其智算產品體系中全面接入DeepSeek-R1模型,涉及的產品和服務涵蓋息壤-科研助手、天翼AI云電腦、“息壤”智算平臺、GPU云主機/裸金屬等。
阿里云
2月3日,阿里云宣布其PAIModelGallery支持云上一鍵部署DeepSeek-V3和DeepSeek-R1模型,用戶可以在該平臺上零代碼實現(xiàn)從訓練到部署再到推理的全過程。
百度智能云
2月3日,百度智能云千帆平臺正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低價格方案以及限時免費服務。
火山引擎
2月4日,火山引擎宣布全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型。企業(yè)用戶可在火山引擎機器學習平臺veMLP中部署或通過火山方舟平臺直接調用。
沐曦
沐曦聯(lián)合中國開源大模型平臺Gitee AI發(fā)布了全套DeepSeek-R1千問蒸餾模型,2月2日首批上線了1.5B、7B、14B、32B四個較小規(guī)模的模型,均部署在國產沐曦曦云GPU上。DeepSeek-R1模型與沐曦曦云GPU及Gitee AI平臺的結合,實現(xiàn)了從芯片到平臺、從算力到模型的全國產研發(fā)和中國制造,官方稱之為“100%國產AI的力量”。
天數(shù)智芯
天數(shù)智芯于2月4日宣布與Gitee AI合作,僅用時一天就完成了與DeepSeek-R1模型的適配工作,并正式上線多個大模型服務,包括DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。其表示國內GPU與DeepSeek的適配可實現(xiàn)深度學習框架與國內自主硬件的深度融合,促進國內AI產業(yè)鏈自主可控發(fā)展,減少對國外硬件平臺的依賴,降低技術風險和成本。
摩爾線程
摩爾線程于2月4日宣布已實現(xiàn)對DeepSeek蒸餾模型推理服務的部署,并即將開放自主設計的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸餾模型的分布式部署。其認為DeepSeek的開源模型與摩爾線程的硬件形成閉環(huán),驗證了國產全功能GPU對復雜AI任務的支持能力,為AGI技術普惠化提供了可行路徑。
海光信息
海光信息于2月4日宣布其技術團隊已完成DeepSeek V3和R1模型與海光DCU的適配并上線。海光DCU是其推出的高性能GPGPU架構AI加速卡,已在多個領域規(guī)模化應用。用戶可通過“光合開發(fā)者社區(qū)”中的“光源”板塊訪問并下載相關模型,基于DCU平臺快速部署和使用。
無問芯穹
無問芯穹早在1月28日就宣布其Infini-AI異構云對DeepSeek-R1-Distill 32B模型的支持。無問芯穹的Infini-AI異構云平臺上線了DeepSeek-R1-Distill等產品,為客戶提供基于DeepSeek模型的服務。
PPIO派歐云
PPIO派歐云于2月2日正式官宣其云服務平臺對DeepSeek模型的支持。PPIO派歐算力云支持了DeepSeek-V3、DeepSeek-R1以及蒸餾模型DeepSeek-R1-Distill-Llama-70B。
360數(shù)字安全
2月2日,360數(shù)字安全宣布其安全大模型正式接入DeepSeek。通過強化學習等技術手段,360將推出“DeepSeek版”安全大模型,發(fā)揮其安全大數(shù)據(jù)優(yōu)勢。
云軸科技ZStack
2月2日,云軸科技ZStack宣布其AIInfra平臺ZStack智塔全面支持企業(yè)私有化部署DeepSeekV3/R1/JanusPro三種模型。該平臺可基于多種國內外CPU/GPU適配,滿足企業(yè)不同AI場景的需求。
DeepSeek崛起:AI基建需求增長,產業(yè)邁向高成本效益
TrendForce集邦咨詢表示,全球AI Server市場自2023年起快速成長,預期2025年占整體Server出貨比例將逾15%,至2028年有望接近20%。近年大型CSP業(yè)者順應AI訓練需求積極擴建,自2025年起將重心擴展至邊緣AI推理,除了采用NVIDIA Blackwell等新一代GPU平臺,AWS等也加大開發(fā)自家ASIC力道,以提升成本效益、滿足特定AI應用需求。中國CSP和DeepSeek等相關AI業(yè)者著重開發(fā)更高效的AI芯片或算法,以促進AI需求和應用的多元發(fā)展。
AI 行業(yè)過去依賴擴大模型、增加數(shù)據(jù)和提升硬件效能來發(fā)展,但成本與效率成為挑戰(zhàn)。DeepSeek 采用蒸餾模型(Model Distillation)技術,壓縮大型模型以提升推理速度并降低硬件需求,同時充分發(fā)揮 NVIDIA Hopper 降規(guī)版芯片的效益,最大化運算資源利用。其成本優(yōu)勢來自高效能硬件選擇、新型蒸餾技術及 API 開源策略,不僅優(yōu)化技術與商業(yè)應用的平衡,也展現(xiàn) AI 產業(yè)向高效發(fā)展的趨勢。
DeepSeek大模型的成功上線,為企業(yè)提供了低成本、高性能的技術解決方案,還推動了人工智能行業(yè)的良性競爭與發(fā)展。隨著更多應用場景的開發(fā)和落地,DeepSeek有望在更多領域發(fā)揮重要作用,后續(xù)發(fā)展值得持續(xù)關注。