在芯片叢林競爭中,新的技術架構往往意味著能改變游戲規(guī)則。
曾幾何時,數(shù)據(jù)如同洶涌的潮水,以指數(shù)級的速度在我們的數(shù)字世界里泛濫。從巨型數(shù)據(jù)中心到小小的個人電腦,都被卷入了這場數(shù)據(jù)洪流之中....此時,數(shù)據(jù)的心臟“芯片”,演繹著一輪又一輪技術之戰(zhàn)。本文的主角CXL高速互聯(lián)技術,正是從這片“混亂”的數(shù)據(jù)海洋中,開辟出一條嶄新的航道,使得不同類型的芯片可以實現(xiàn)更加緊密地協(xié)同工作,從而成為推動計算領域變革的關鍵力量。
從傳輸協(xié)議到資源共享,CXL究竟何物?
當前大數(shù)據(jù)、人工智能(AI)、云計算等領域快速發(fā)展,傳統(tǒng)的芯片架構和連接方式,在海量數(shù)據(jù)的沖擊下,漸漸有些力不從心。就好比一條狹窄的河道,要通過日益增多的船只,堵塞和低效成為了常態(tài)。特別是在數(shù)據(jù)中心、高性能計算(HPC)應用場景中,存儲和計算之間的協(xié)作瓶頸愈發(fā)明顯,大大限制了整個系統(tǒng)的性能。
此背景下,CXL技術應運而生,通過高速接口,打破了存儲和計算之間的隔閡,使其更高效地共享資源。CXL被認為是構建芯片之間的“超級高速公路”,允許不同的芯片組件,包括CPU、GPU、FPGA以及內存等,能夠以一種高速、低延遲且高效的方式相互通信和共享數(shù)據(jù)。
從本質上講,CXL(Compute Express Link)是一種新型的高速互聯(lián)技術,即下一代接口,可有效連接高性能計算系統(tǒng)中的CPU/GPU、存儲器等,支持大容量、超高速計算。對計算機系統(tǒng)而言,PCle和CXL技術都是重要的連接技術。從二者區(qū)別來看,CXL比PCIe具有更高的帶寬、更低的延遲,以及內存擴展、緩存一致性和設備直接內存訪問等更多的功能。其實從另一個角度來說,PCIe技術是CXL技術的底層基礎,CXL則可視為PCIe技術的再提高版本,延伸了更多變革性的功能。
1、CXL加速進化,3.2版本已來臨
從范式演變路徑來看,目前,CXL已經(jīng)發(fā)表了1.0/1.1、2.0、3.0/3.1/3.2多個不同的版本。2019年CXL1.0版本正式發(fā)布,到2022年CXL規(guī)范更新至3.0版本,隨后2023年CXL3.1發(fā)布,到如今CXL3.2發(fā)布,CXL正在不斷進步和成熟。
圖片來源:全球半導體觀察根據(jù)公開信息制圖
其中,CXL1.0版本于2019年3月推出,是CXL系列的開山之作,基于PCIe5.0技術構建,并引入了緩存一致性協(xié)議(CXL.cache),使得主機CPU能夠高效地訪問加速器設備上的共享內存資源;
CXL2.0在2020年11月發(fā)布,基于PCIe5.0技術,內存的池化(Pooling)功能較好地實現(xiàn)了以內存為中心的構想;
CXL3.0于2022年8月推出,在物理層基于PCIe6.0實現(xiàn)帶寬提升和信號傳輸方式改變,邏輯層增強了連接拓撲、內存共享與訪問、數(shù)據(jù)包大小等,同時擴展了功能,包括消除設備連接限制、增強設備通信、加入錯誤糾正機制和提升fabric功能等;
CXL3.1于2023年11月發(fā)布,具備開啟更多對等通信通道的能力,實現(xiàn)了對內存和存儲的獨立分離,形成獨立的模塊,據(jù)悉它將支持DDR6內存;
CXL3.2規(guī)范于2024年12月公布,該版本優(yōu)化了CXL存儲設備的監(jiān)控和管理,增強了CXL存儲設備在操作系統(tǒng)和應用程序方面的功能,并通過可信安全協(xié)議TSP擴展了安全性。
2、三套“組合拳”,CXL融合三種子協(xié)議
目前,CXL包括三個不同的協(xié)議層次,分別是CXL.io、CXL.cache、CXL.memory,每種協(xié)議在CXL的架構中都有特定的功能和應用場景。這三種協(xié)議的結合,使CXL成為支持異構計算、大規(guī)模數(shù)據(jù)處理和高效計算資源共享的重要技術,尤其是在數(shù)據(jù)中心、AI加速和高性能計算領域具有廣泛的應用前景。
·CXL.io:指CXL的基礎協(xié)議,用于連接計算、存儲和加速器(如GPU、FPGA)等不同的硬件資源。類似于PCIe的角色,可提供一個穩(wěn)定的通信通道,使得CXL設備可以順利“對話”。
·CXL.cache:稱為緩存一致性協(xié)議,主要用于數(shù)據(jù)緩存,使得不同計算單元之間可以共享緩存信息,從而減少內存和存儲的訪問次數(shù),進一步降低延遲。
·CXL.memory:稱為內存共享協(xié)議,屬于CXL最核心的協(xié)議之一,允許不同的計算單元共享內存資源,適用于需要大規(guī)模內存共享和資源池化的場景,如云計算、數(shù)據(jù)中心、大數(shù)據(jù)分析等。具體可以理解為,傳統(tǒng)的計算架構中,每個處理單元只能訪問自己專有的內存,而CXL突破了這種限制,支持GPU、FPGA、DPU等直接訪問主機內存,甚至將內存資源進行池化,實現(xiàn)高效的內存共享和靈活的內存分配。該功能提高了系統(tǒng)的可靠性,即使發(fā)生內存故障,CPU仍可以通過外部設備繼續(xù)運行。
CXL啟航,存儲大廠角逐新藍海
整個CXL生態(tài)正處于加速發(fā)展的階段,技術標準不斷演進,從CXL1.0逐步發(fā)展到CXL3.2,功能和性能持續(xù)提升。在應用方面,范圍也在持續(xù)擴大,從高性能計算、數(shù)據(jù)中心,逐步拓展到人工智能加速、云計算、邊緣計算等新興領域。如今,各種各樣的CXL產(chǎn)品已經(jīng)落地應用。
隨著CXL技術逐步進入主流市場,多家大廠紛紛布盤落子,目前CXL技術聯(lián)盟已匯聚了超過200多家成員,涵蓋了眾多領域的知名企業(yè)。
其中,CPU領域如英特爾、AMD等積極參與其中,從技術研發(fā)到產(chǎn)品應用全面推動CXL的發(fā)展;服務器領域如戴爾EMC、HPE、華為、浪潮信息等也陸續(xù)加入,為CXL技術在服務器領域的應用提供了強大的硬件支持和解決方案;存儲器領域如三星、SK海力士、美光科技、鎧俠等更是在CXL技術的推動下,不斷創(chuàng)新和推出新的存儲產(chǎn)品。
值得一提是,三星、SK海力士、美光科技、鎧俠這幾家存儲大廠已儼然成為了CXL的資深玩家。
圖表來源:全球半導體觀察根據(jù)公開信息整理
三星
三星于2021年5月開發(fā)出全球首款基于CXL的DRAM技術;2022年推出業(yè)界首款高容量512GB CXL DRAM;2023年5月開發(fā)出支持CXL2.0的128GB CXL DRAM;2024年3月,三星在Memcon 2024發(fā)布了CXL內存模塊-盒式(CMM-B),支持高達2TB容量與60GB/s帶寬,適用于AI和大數(shù)據(jù)分析等大內存需求應用。此外,三星與博通旗下的VMware推出了基于FPGA的分層內存解決方案CMM-HTM,結合DRAM與NAND介質,優(yōu)化內存管理,提升性能并降低成本。
2024年6月,三星宣布成功打造業(yè)界首個獲得紅帽認證的CXL基礎設施。這意味著從CXL相關產(chǎn)品到軟件,構成服務器的各種元素現(xiàn)在都可以在位于韓國華城的三星存儲器研發(fā)中心(SMRC)直接進行驗證。
另據(jù)《ZDNet Korea》7月報道,三星電子存儲部門新業(yè)務規(guī)劃團隊董事總經(jīng)理Choi Jang-seok表示,即將推出的內存模塊被指定為CMM-D2.0,將符合CXL2.0協(xié)議。這些模塊采用1ynm工藝DRAM顆粒,代表20-10nm級別的第二代DRAM技術,該技術能夠生產(chǎn)提供更高容量同時保持性能效率的內存模塊。
除了CMM-D模塊,三星還在開發(fā)一系列CXL存儲產(chǎn)品。其中包括集成多個CMM-D模塊的CMM-B內存盒模塊,以及將DRAM內存與NAND閃存顆粒相結合的CMM-H混合存儲模塊。
ChoiJang-seok此前強調,隨著CXL3.1技術的采用,CXL內存資源可以在多個主機之間共享,預計CXL市場將在今年下半年蓬勃發(fā)展,在2028年左右實現(xiàn)顯著增長。
SK海力士
2022年,SK海力士開發(fā)了首款結合計算功能與CXL存儲器的CMS(Computational Memory Solution),該方案是其與SK Telecom合作開發(fā)的成果,集成了計算功能,是首個將計算功能集成到CXL內存中的產(chǎn)品。
2024年初,SK海力士還展示了多款CXL產(chǎn)品,包括CMM-DDR5內存模塊和Niagara 2.0,通過HMSDK提升系統(tǒng)性能。2024年9月,SK海力士的HMSDK軟件成功集成至Linux操作系統(tǒng),優(yōu)化CXL存儲器運行,帶寬擴展30%以上。2024年11月,SK海力士與ASICLAND簽署311億韓元的CXL存儲器控制器設計合約,預計將在臺積電5納米制程上量產(chǎn)CXL 3.0/3.1芯片。
此外,SK海力士表示,據(jù)半導體行業(yè)預測,隨著下半年首批采用“CXL2.0”規(guī)格的服務器CPU問世,CXL將正式進入商業(yè)化階段。為此,公司正在對96GB(千兆字節(jié))及128GB容量的CXL2.0存儲器進行客戶驗證,并計劃在年底實現(xiàn)量產(chǎn)。
美光
2023年,美光發(fā)布了CZ120 CXL內存擴展模塊,支持CXL 2.0 Type3標準,具有128GB和256GB兩個容量選項,帶寬高達36GB/s。2024年,美光的CZ122模塊通過與英特爾至強6平臺的測試,顯著提升了HPC和AI工作負載的內存帶寬。
2024年5月,美光科技申請一項名為“在計算快速鏈路通信中使用張量存儲器存取的方法”的專利,旨在提高存儲器存取效率。業(yè)界稱,該專利中提到的張量存取電路能夠根據(jù)與存儲器的訪問操作相關的CXL命令進行相應的存儲器映射,這意味著美光的這項專利技術可以與CXL技術深度結合。
鎧俠
2023年8月,鎧俠在Flash Memory Summit 2023上展示了其基于3D NAND和XL-Flash CXL解決方案,并透露計劃推出兩款CXL產(chǎn)品lineup。其中,CXL+XL-Flash-based設備面向內存數(shù)據(jù)庫和AI推理等以性能和可靠性為核心的應用;CXL+BICS 3D NAND-powered設備則適用于大數(shù)據(jù)和AI訓練等對容量要求較高的應用。
2024年11月,鎧俠宣布其CXL接口存儲器研發(fā)項目獲得日本政府支持,計劃投入360億日元,加速CXL存儲器的商業(yè)化進程,預計2030-2034年實現(xiàn)市場化。
與DRAM相比,CXL存儲器更省電,而與NAND Flash相比,其擁有更快的讀取速度。具體而言,DRAM在電力中斷時數(shù)據(jù)就會消失,而CXL存儲器不僅能保留斷電時的數(shù)據(jù),還能大幅降低AI驅動下的能耗。
結語
CXL技術在數(shù)據(jù)洪峰的沖擊下破局而生,憑借精妙的技術原理搭建起芯片間的高效通路,成為了芯片行業(yè)協(xié)同發(fā)展的關鍵紐帶。CXL聯(lián)盟中的巨頭們的戰(zhàn)略布局,各顯神通,存儲廠商的積極參與也讓其生態(tài)日益繁榮,共同編織出一張緊密相連、高效協(xié)作的芯片產(chǎn)業(yè)新網(wǎng)絡。
正如美光科技認為的那樣,“CXL技術是解決現(xiàn)代計算架構中“內存墻”問題的關鍵,未來將對DRAM位增長率產(chǎn)生影響。”在這場技術變革的浪潮中,CXL技術從2019年的CXL1.0,到2023年的CXL3.1,再到2024年的CXL3.2,未來將以不可阻擋之勢重塑行業(yè)格局。