• 正文
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

PerfXCloud DeepSeek滿血專線,立即體驗(yàn)!澎峰科技”十年磨一劍,今朝綻鋒芒“

02/10 16:12
2833
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

零門檻體驗(yàn)DeepSeek-R1滿血版本,性能對(duì)標(biāo)OpenAI o1,即刻開(kāi)啟一場(chǎng)震撼人心的AI探索之旅。

????體驗(yàn)DeepSeek-R1滿血效果

如果您是開(kāi)發(fā)者,將需要使用DeepSeek API。注冊(cè)成為PerfXCloud用戶,即贈(zèng)送2千萬(wàn)token!本服務(wù)獲得了中國(guó)曙光、超算互聯(lián)網(wǎng)、沐曦的大力支持和算力支撐。澎峰科技+海光DCU:自研推理框架全面支持DeepSeek系列模型

DeepSeek模型廣場(chǎng)

DeepSeek-R1滿血體驗(yàn)???????????

DeepSeek-R1滿血版本和蒸餾版本的差異

滿血版是與DeepSeek官網(wǎng)性能一致的V3和R1的全量參數(shù)模型,一般需要多臺(tái)高性能GPU服務(wù)器并行才能流暢運(yùn)行推理服務(wù),低配也要數(shù)百萬(wàn)人民幣。而蒸餾版是利用DeepSeek-R1生成的數(shù)據(jù)對(duì)其他模型進(jìn)行微調(diào),從而提升其模型性能,但效果差于滿血版。DeepSeek-R1滿血版本性能對(duì)標(biāo)OpenAI o1商業(yè)版本水平,但價(jià)格只是它的1/30。

舉例參數(shù)規(guī)模和模型大?。???????

  • DeepSeek-R1:參數(shù)為 671B,模型大小約 720G。
  • DeepSeek-R1-Distill-Qwen-7B:參數(shù)為 7B,模型大小約 15G。
  • DeepSeek-R1-Distill-Llama-8B:參數(shù)為 8B,模型大小約 16G。
  • DeepSeek-R1-Distill-Qwen-32B:參數(shù)為 32B,模型大小約 75G。

 

相關(guān)推薦