• 正文
    • DPU與CPU、GPU的主要區(qū)別
    • DPU的應用正在走向多場景化
    • DPU戰(zhàn)場百家爭鳴
    • 國內(nèi)廠商各展所長
    • DPU進入爆發(fā)期
  • 推薦器件
  • 相關推薦
申請入駐 產(chǎn)業(yè)圖譜

算力重器DPU,火得猝不及防

2024/04/29
1379
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者:豐寧

計算機問世以來,一直采用的馮·諾依曼架構,該架構以計算和存儲為核心。其中CPU作為處理器單元,負責執(zhí)行各種算術和邏輯計算。RAM和硬盤則負責存儲數(shù)據(jù),與CPU進行交互。

再后來圖形、3D設計等多媒體軟件的高速發(fā)展,要處理的工作量越來越大,也越來越復雜。為了幫CPU分擔壓力,專門進行圖像和圖形處理工作的GPU應運而生。

如今,隨著數(shù)字經(jīng)濟的蓬勃發(fā)展,特別是生成式人工智能、大數(shù)據(jù)分析、自動駕駛、元宇宙等應用的迅速普及與實施,全球各行各業(yè)對大規(guī)模算力的渴求呈現(xiàn)出急劇增長的態(tài)勢。這時候,DPU(數(shù)據(jù)處理單元)憑借其卓越的性能和獨特優(yōu)勢,逐步嶄露頭角,成為推動算力提升的關鍵技術之一。

英偉達首席執(zhí)行官黃仁勛曾在演講中表示:“ DPU 將成為未來計算的三大支柱之一,未來的數(shù)據(jù)中心標配是‘ CPU + DPU + GPU ’。CPU 用于通用計算, GPU 用于加速計算, DPU 則進行數(shù)據(jù)處理。”

那么DPU的主要作用為何?相比CPU、GPU有哪些優(yōu)勢?

DPU與CPU、GPU的主要區(qū)別

DPU的出現(xiàn)并非偶然,而是對日益增長的數(shù)據(jù)處理需求的有力回應。

從功能上看,CPU、GPU和DPU雖都屬于計算處理器,但各自長于不同功能。CPU負責計算機系統(tǒng)的整體運行,是計算機的"大腦”,適用于各種廣泛的應用,但在處理大規(guī)模數(shù)據(jù)和特定計算任務時性能相對有限。

GPU是用于圖形計算任務的專用處理器,例如3D圖像渲染或視頻處理等。對于大規(guī)模并行計算任務(如深度學習訓練)有一定優(yōu)勢,但在一些特定任務上可能并不是最佳選擇。

而DPU專門設計用于數(shù)據(jù)處理任務,具有高度優(yōu)化的硬件結構,適用于特定領域的計算需求。其靈活性和高性能使其成為未來計算的重要組成部分。

從架構上看,CPU由幾個功能強大的處理核心組成,這些核心針對串行處理進行了優(yōu)化,優(yōu)勢在于按順序逐個執(zhí)行任務。GPU包含大量更簡單的核心,針對并行處理進行了優(yōu)化,優(yōu)勢在于同時處理大量任務。DPU則由處理核心、硬件加速器元件和高性能網(wǎng)絡接口組合而成,便于其處理以數(shù)據(jù)為中心的大規(guī)模任務。

再看應用領域,CPU幾乎存在于一切計算設備當中,包括智能手機、計算機、服務器等。GPU常被用于游戲PC設備。

DPU則主要用于數(shù)據(jù)中心。FPGA是DPU的核心技術之一,它具有在硬件級別上重新配置的能力,使其適用于多種計算任務。DPU利用FPGA的靈活性,通過重新配置硬件來實現(xiàn)高效的數(shù)據(jù)處理。異構計算是DPU的另一個關鍵技術,它通過同時利用不同類型的處理單元來執(zhí)行任務,以提高整體性能。異構計算中的處理單元可以包括CPU、GPU、FPGA等,它們共同協(xié)作完成計算任務。在兩大技術的加持下,DPU能夠充分發(fā)揮其性能優(yōu)勢,為數(shù)據(jù)中心提供強大的計算能力支持。

事實上,DPU已經(jīng)不是第一個為彌補CPU能力不足而備受關注的產(chǎn)品,多年前GPU的大熱也是為了彌補CPU在圖形處理能力方面的短板。換句話說,從CPU、GPU再到今天的DPU,技術變革背后體現(xiàn)的其實是時代的變化、用戶需求的變化。

DPU的應用正在走向多場景化

DPU 分擔的工作可以歸納為四個關鍵詞,分別是虛擬化、網(wǎng)絡、存儲以及安全。

DPU通過將控制平面下放,從而實現(xiàn)主機業(yè)務與控制平面的完全隔離,從而提升了虛擬環(huán)境的安全性。DPU的高效數(shù)據(jù)處理能力加速了虛擬機間的通信,提高了虛擬化性能。

此外,存儲行業(yè)的革新算法和實現(xiàn),也可以在 DPU 架構中,獨立于服務器操作系統(tǒng)進行部署。 DPU 技術幫助存儲廠商實現(xiàn)真正的 “算存分離”。

在網(wǎng)絡與安全方面,隨著數(shù)據(jù)泄露和隱私泄露的事件頻發(fā),數(shù)據(jù)安全和隱私保護已經(jīng)成為一個備受關注的問題。DPU可以利用可編程硬件卸載和加速內(nèi)聯(lián)安全服務,提供強大的零信任保護,有效隔離主機業(yè)務和控制平面,確保數(shù)據(jù)安全性。

具體到各個場景的應用中,上文提到的數(shù)據(jù)中心只是DPU主要的應用領域之一。

除了數(shù)據(jù)中心,DPU同樣能夠“駕馭”眾多應用。在HPC和AI場景,DPU可提供超高帶寬、無損網(wǎng)絡和高速存儲訪問能力,可為HPC和AI提供業(yè)務所需的超高性能網(wǎng)絡。網(wǎng)絡、存儲與安全是DPU的主要應用。

在風起云涌的邊緣計算領域,DPU的引入大有裨益。隨著業(yè)務增多,邊緣算力和帶寬需求大幅增加,但邊緣設施的規(guī)模和能力受限,CPU主要滿足核心業(yè)務的算力需求,對本不擅長的網(wǎng)絡、存儲、安全等相關處理無暇顧及。引入DPU可大大降低此類DPU對CPU的消耗,同時使用專用硬件提升處理性能,從而大幅提升邊緣計算的處理能力。

在智算場景下DPU也擁有廣闊的市場空間,DPU通過高性能網(wǎng)絡及領域功能硬件卸載,為智算中心提供了大帶寬、高吞吐、低時延的基礎設施能力,從而消除了數(shù)據(jù)IO瓶頸,釋放了算力。這使得DPU成為智算中心基礎設施的必選項,大幅提升了計算集群的算效比。

多元化的應用場景為DPU帶來了豐富的商業(yè)機遇,未來DPU有望進一步拓展至自動駕駛、人工智能和元宇宙等領域。

DPU戰(zhàn)場百家爭鳴

隨著 DPU 技術方案更加成熟、數(shù)據(jù)中心在全球范圍內(nèi)加速落地,英偉達、英特爾等廠商數(shù)據(jù)處理類芯片DPU/IPU大規(guī)模量產(chǎn),全球 DPU 市場將在未來幾年迎來爆發(fā)式增長。

DPU 行業(yè)市場集中度較高。根據(jù)頭豹研究院數(shù)據(jù),近年來國內(nèi) DPU 市場中,國際三大巨頭英偉達、博通、英特爾的份額分別達到 55%、36%、9%。Xilinx、Marvell、Pensando、Fungible、Amazon、Microsoft 等多家廠商在近 2-5 年內(nèi)也均有 DPU 或相似架構產(chǎn)品生產(chǎn),較國內(nèi)相對較早。

英偉達的數(shù)據(jù)中心“野心”

在上表列出的諸多公司中,英偉達具有先發(fā)優(yōu)勢。2019年3月,英偉達花費69億美元收購了以色列芯片公司 Mellanox 。英偉達將 Mellanox 的 ConnectX 系列高速網(wǎng)卡技術與自己的已有技術相結合,于2020年正式推出了兩款 DPU 產(chǎn)品BlueField-2 DPU 和 BlueField-2X DPU,正式拉開 DPU 發(fā)展的序幕。

如今,英偉達的BlueField 系列芯片已到達第三代,英偉達 BlueField-3 DPU 是一款支持 400Gb/s 速度的基礎設施計算平臺,能夠線速處理軟件定義網(wǎng)絡、存儲和網(wǎng)絡安全任務。BlueField-3 將強大的計算能力、高速網(wǎng)絡和廣泛的可編程性集于一身,可為要求苛刻的工作負載提供軟件定義的硬件加速解決方案。從加速 AI 到混合云和高性能計算,再到 5G 無線網(wǎng)絡,BlueField-3 重新定義了各種可能性。

英偉達的DPU主要作用是數(shù)據(jù)安全、網(wǎng)絡安全與存儲卸載等。在英偉達對DPU的布局中也足以看到,它在數(shù)據(jù)中心這一應用領域的野心,也有人稱,英偉達正“試圖利用DPU再一次復制此前GPU替代顯示加速卡成為通用顯示芯片的路徑”

英特爾推出IPU迎戰(zhàn)數(shù)據(jù)中心

英特爾在2021年6月新發(fā)布的IPU產(chǎn)品(可以被視為Intel版本的DPU),將FPGA與Xeon D系列處理器集成,成為了DPU賽道有力的競爭者。IPU是具有強化的加速器和以太網(wǎng)連接的高級網(wǎng)絡設備,它使用緊密耦合、專用的可編程內(nèi)核加速和管理基礎架構功能。2022 年的 Vision 全球用戶大會期間,英特爾又公布了 IPU 發(fā)展藍圖,呈現(xiàn)近三年及未來即將問世的產(chǎn)品與平臺。

在發(fā)展藍圖中,英特爾揭露 3 款 IPU 產(chǎn)品,分別對應 ASIC、IPU 平臺、SmartNIC,此外英特爾還揭露了兩條發(fā)展路線,一個是基于專屬 ASIC 芯片的 IPU,代號為 Mount Evans;另一個則是基于 FPGA 架構的兩種加速解決方案,代號為 Oak Springs Canyon 的 IPU 平臺。

針對兩種 IPU 應用特性的差異,英特爾也在此做出最新的詮釋。若是基于 FPGA 架構而成的 IPU,能更快供應市場需求,支持持續(xù)演化的網(wǎng)絡標準,透過能重復進行的可編程化特性,以及安全的資料傳輸路徑,能夠彈性處理多種特定工作負載;如果是基于 ASIC 架構而成的 IPU,可提供最佳效能與功耗的搭配,能用于確保網(wǎng)絡與存儲等任務領域的安全性。

發(fā)展藍圖顯示,英特爾的第二代IPU已于2022年推出,包括Mount Evans(英特爾首款ASIC IPU)和Oak Springs Canyon(英特爾第二代FPGA IPU),目前正在向谷歌及其它服務提供商出貨。第三代IPU代號為Mount Morgan和Hot Springs Canyon的400 GB IPU預計2023/2024年開始向客戶及合作伙伴出貨。下一代800GB IPU預計2025/2026年開始向客戶及合作伙伴出貨。

此外,賽靈思已經(jīng)推出DPU處理器——Alveo SmartNIC產(chǎn)品組合。DPU可以用作獨立的嵌入式處理器,但通常是被集成到SmartNIC里。博通旗下有Stingray,Marvell則擁有OCTEON和ARMADA產(chǎn)品系列。

相比于CPU和GPU賽道,DPU毫無疑問是一個嶄新的競技場。隨著網(wǎng)絡流量指數(shù)上漲,DPU市場前景廣闊。在國際巨頭加緊布局DPU業(yè)務的同時,國內(nèi)芯片市場也頻傳好消息。

國內(nèi)廠商各展所長

近年來,國家不斷推動數(shù)字經(jīng)濟的快速發(fā)展。算力基礎設施是數(shù)字經(jīng)濟發(fā)展的重要基礎,而算力和高性能網(wǎng)絡已成為算力基礎設施的核心能力,尤其是在人工智能和邊緣計算等需求的推動下,高性能網(wǎng)絡和DPU已愈發(fā)重要。

工業(yè)和信息化部、中央網(wǎng)信辦、教育部、國家衛(wèi)生健康委、中國人民銀行、國務院國資委等六部門近日聯(lián)合印發(fā)《算力基礎設施高質(zhì)量發(fā)展行動計劃》。該計劃具體規(guī)定了到2025年,算力基礎設施發(fā)展的主要目標、重點任務和保障措施等,并重點提出針對智能計算、超級計算和邊緣計算等場景,開展DPU等技術升級與試點應用,實現(xiàn)算力中心網(wǎng)絡高性能傳輸。這是國家層面的文件首次對未來3年的DPU發(fā)展指明了方向。

隨著 DPU 產(chǎn)業(yè)的快速發(fā)展,國內(nèi)也涌現(xiàn)出了一大批 DPU 公司。

中科馭數(shù)

中科馭數(shù)基于自研敏捷異構 KPU 芯片架構以及 DPU 軟件開發(fā)平臺 HADOS,公司自主研發(fā)了業(yè)界首顆融合高性能網(wǎng)絡與數(shù)據(jù)庫一體化加速功能的 DPU芯片和標準加速卡系列產(chǎn)品,可廣泛應用于超低延遲網(wǎng)絡、大數(shù)據(jù)處理、5G 邊緣計算、高速存儲等場景,助力算力成為數(shù)字時代的新生產(chǎn)力。

在 DPU 產(chǎn)品的研發(fā)迭代方面,中科馭數(shù)于 2019 年流片了第一代 DPU 芯片K1,第二代 DPU 芯片 K2 也于 2022 年初成功投片,目前已開始第三代 DPU 芯片 K2 Pro 的研發(fā)工作。針對數(shù)據(jù)中心關鍵性能瓶頸與業(yè)務需求,中科馭數(shù)也基于自研DPU芯片推出了RDMA加速卡、云原生網(wǎng)絡加速卡等系列產(chǎn)品,支持超大規(guī)模組網(wǎng)算力互連,以支撐算力底座建設所必須的100G+超高帶寬和低時延,使更多的CPU/GPU算力真正服務于業(yè)務,為智算中心建設提供全套的性能更高和算力更好的解決方案。

國產(chǎn)化建設浪潮之下,中科馭數(shù)也正全面擁抱國產(chǎn)化生態(tài),積極與國內(nèi)產(chǎn)業(yè)鏈上下游廠商開展產(chǎn)品兼容性認證。目前,中科馭數(shù)已與國內(nèi)6大CPU芯片、12家主流操作系統(tǒng)、9家主流數(shù)據(jù)庫廠商、8家頭部云/云原生廠商、17家TOP級服務器廠商完成兼容性適配。

芯啟源

芯啟源具有完全自主知識產(chǎn)權的 DPU 芯片。芯啟源 DPU 較傳統(tǒng)智能網(wǎng)卡提供了更大的處理能力、更強的靈活性、可編程數(shù)據(jù)包處理、可擴展 Chiplet結構等特性。采用 NP-SoC 模式進行芯片設計,通用 ARM 架構結合高度優(yōu)化面向數(shù)據(jù)包的 NP 芯片(RISC-V 內(nèi)核)、多線程的處理模式,使其可以達到 ASIC 固化芯片的數(shù)據(jù)處理能力,同時考慮到了全量可編程、靈活可擴展的屬性,用以支持400Gbps 及以上的性能目標、低功率且具有成本效益等。

芯啟源從2019年開始研發(fā)第一代FPGA智能網(wǎng)卡,2020年開始推出第二代基于NP-SoC架構的產(chǎn)品,逐步推向市場。如今,芯啟源推出了基于SoC-NP架構的DPU芯片智能網(wǎng)卡,具有可編程性、可擴展性和高性能三個重要特點,已成熟量產(chǎn)出貨,商業(yè)落地,能夠適應于廣泛的應用場景,成為了真正意義上國內(nèi)最早一批進入DPU領域的芯片公司。

據(jù)悉,芯啟源正在研發(fā)的新一代NFP-7000 DPU芯片,將對標Nvdia的BlueField-3,并用“通用型芯片+定制化軟件”的模式推動行業(yè)的網(wǎng)卡國產(chǎn)化。從設計目標來看,該款芯片的性能與功能,完全不亞于英偉達的BlueField-3,同時,該芯片未來會根據(jù)不同場景需求來設定其能力范圍,這樣將大大降低芯片的成本,更符合國內(nèi)芯片的多場景需求。

云豹智能

目前云豹智能領跑國內(nèi)數(shù)據(jù)中心場景的國產(chǎn)DPU芯片方案。云豹智能 DPU SoC 是國內(nèi)第一顆通用可編程 DPU 芯片,具備豐富的可編程性和完備的 DPU 功能,支持不同云計算場景和資源統(tǒng)一管理,優(yōu)化數(shù)據(jù)中心計算資源利用率。

云豹DPU通過對各種高速網(wǎng)絡、彈性存儲、安全服務及可靠運維和管控進行卸載、加速及隔離,為云端、數(shù)據(jù)中心、人工智能及邊緣計算等提供新一代計算平臺。

目前云豹智能已與頭部云計算大廠、電信運營商和央企等開展深度合作,共同推進DPU產(chǎn)業(yè)落地。

大禹智芯

大禹智芯也擁有DPU設計與研發(fā)及DPU大型商業(yè)化部署的成功經(jīng)驗。大禹智芯Paratus系列DPU產(chǎn)品采用三條產(chǎn)品線并行的方式逐步面向廣泛商用市場推出易用并好用的DPU產(chǎn)品:

Paratus 1.0作為大禹智芯DPU的第一條產(chǎn)品線產(chǎn)品,采用ARM SoC作為主處理單元,提供多個10Gbps/25Gbps的業(yè)務網(wǎng)絡接口,同時為了方便用戶管理,單獨設置了RJ45管理口。
Paratus 2.0作為大禹智芯DPU的第二條產(chǎn)品線產(chǎn)品,采用ARM SoC + FPGA的硬件架構,在Paratus 1.0產(chǎn)品基礎上,利用FPGA對可固化邏輯的數(shù)據(jù)包實現(xiàn)高性能轉發(fā),提供多個10G/25G、100G的業(yè)務網(wǎng)絡接口。

Paratus 3.0作為第三條產(chǎn)品線產(chǎn)品,將采用大禹智芯自研DPU芯片。該芯片將結合公司對DPU相關技術及未來應用場景的理解,和前兩條產(chǎn)品線(Paratus 1.0和Paratus 2.0)在實際場景部署中獲得的寶貴客戶反饋意見和經(jīng)驗積累,形成高度集成化的DPU產(chǎn)品。

阿里云 CIPU

2022 年阿里云峰會上,阿里云正式發(fā)布了云基礎設施處理器 CIPU,CIPU 的前身是MoC 卡 (Micro Server on a Card),MoC 卡是神龍架構的靈魂所在。MoC 卡擁有獨立的I/O、存儲和處理單元,承擔了網(wǎng)絡、存儲和設備虛擬化的工作。

第一代和第二代 MoC 卡解決了狹義上的計算虛擬化零開銷的問題,網(wǎng)絡和存儲部分的虛擬化仍由軟件實現(xiàn)。第三代MoC 卡實現(xiàn)了部分網(wǎng)絡轉發(fā)功能硬化,網(wǎng)絡性能大幅提升。第四代 MoC 卡實現(xiàn)了網(wǎng)絡、存儲全硬件卸載,還支持了 RDMA 能力。

除了上文列舉的幾家公司外,星云智聯(lián)、銳文科技等多家優(yōu)秀的國產(chǎn)廠商,均憑借技術創(chuàng)新與產(chǎn)品定義方面的優(yōu)勢,沿著差異化路線搶灘市場。不過,值得注意的是,目前國內(nèi)DPU仍處于發(fā)展早期階段。對于國內(nèi)DPU企業(yè)來說,眼下最重要的事還是要先把實際產(chǎn)品做出來,并在應用場景中進行檢驗,畢竟DPU作為一個新興的技術領域,其產(chǎn)品的開發(fā)難度較高,且市場對其性能、穩(wěn)定性和安全性等方面都有極高的要求。

DPU進入爆發(fā)期

根據(jù)賽迪顧問數(shù)據(jù)顯示,從2023年開始全球DPU市場規(guī)模將突破百億美元,并進入年增長率超50%的快車道。而中國DPU市場規(guī)模在2023年也將超300億元人民幣,呈現(xiàn)跳躍式增長,2025年國內(nèi)市場規(guī)模將達到565.9億元,五年復合增速達170.60%。

目前,包括亞馬遜、阿里云、華為在內(nèi)的云計算龍頭都在發(fā)展符合自身要求的DPU產(chǎn)品線。

除數(shù)據(jù)中心以外,智能駕駛、數(shù)據(jù)通信、網(wǎng)絡安全等也是DPU的下游應用領域。

此外,DPU與DOCA對于大模型和生成式AI而言,意義重大。根據(jù)Gartner,預計在 2026 年,超過80%的企業(yè)將使用生成式AI應用程序編程接口(API)或模型,或者在相關生產(chǎn)環(huán)境中部署支持生成式AI的應用程序。據(jù)統(tǒng)計,這一比例在2023年還不到5%,這意味著在短短三年內(nèi),采用或創(chuàng)建生成式AI模型的企業(yè)數(shù)量預計將會增長16倍。

也就是說,未來3年是生成式AI爆發(fā)的窗口期,也是普及BlueField DPU和DOCA的機遇期。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風險等級 參考價格 更多信息
LPC4357FET256,551 1 NXP Semiconductors LPC4357FET256 - Dual-core Cortex-M4/M0, 1 MB Flash, 136 kB SRAM, 2 HS USB with on-chip PHY, Ethernet, LCD, CAN, AES, SPIFI, SGPIO, SCT BGA 256-Pin

ECAD模型

下載ECAD模型
$15.87 查看
ATXMEGA64A4U-CU 1 Microchip Technology Inc IC MCU 8BIT 64KB FLASH 49VFBGA
$4.53 查看
ATXMEGA128A3U-AU 1 Microchip Technology Inc IC MCU 8BIT 128KB FLASH 64TQFP

ECAD模型

下載ECAD模型
$8.03 查看

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

公眾號:半導體產(chǎn)業(yè)縱橫。立足產(chǎn)業(yè)視角,提供及時、專業(yè)、深度的前沿洞見、技術速遞、趨勢解析,鏈接產(chǎn)業(yè)資源,構建IC生態(tài)圈,賦能中國半導體產(chǎn)業(yè),我們一直在路上。