【AI加速了技術(shù)迭代】
許多技術(shù)專家似乎在一件事上達(dá)成了共識(shí):創(chuàng)新的速度從未如此之快。為什么呢?
很顯然,這是因?yàn)?a class="article-link" target="_blank" href="/e/1592241.html">人工智能(AI)。如今,各方都在競(jìng)相提供差異化的硬件解決方案,以便在邊緣端和數(shù)據(jù)中心實(shí)現(xiàn)優(yōu)化的人工智能性能。
數(shù)據(jù)科學(xué)家、人工智能系統(tǒng)架構(gòu)師、集成電路設(shè)計(jì)師、光學(xué)工程師、像Samtec這樣的互連供應(yīng)商以及其他解決方案提供商,都在重新思考系統(tǒng)拓?fù)浣Y(jié)構(gòu)。GPU集群、分解式計(jì)算、緩存一致性內(nèi)存、光互連和 200 Gbps 通道等,這些解決方案都在塑造著人工智能系統(tǒng)架構(gòu)。
鑒于這些現(xiàn)實(shí)情況,許多系統(tǒng)架構(gòu)師都在思考,PCIe 7.0?技術(shù) 128 GT/s 的原始比特率是否足夠快??紤]到 GPU到GPU 以及 GPU到CPU 的橋接協(xié)議已經(jīng)超過了 200 Gbps,這種質(zhì)疑似乎是合理的。很多人都在想,作為 GPU 到異構(gòu)計(jì)算處理器(XPU)互連的替代方案,PCIe 7.0 是否能夠跟上發(fā)展的步伐。
但這個(gè)問題問得合理嗎?
【PCIe 7.0 與 GPU到XPU 的應(yīng)用場(chǎng)景】
坦率地說(shuō),將 PCIe 7.0 技術(shù)與 GPU到XPU 的互連進(jìn)行比較,并不是一種公平的對(duì)等比較。確切地說(shuō),這就好比拿關(guān)公的青龍偃月刀和魯班的木工刨子作比較,兩者用途和設(shè)計(jì)初衷大相徑庭 。
PCI Express?(及其前身 PCI?)在傳統(tǒng)上用于將 x86 CPU 與通用計(jì)算應(yīng)用(如臺(tái)式機(jī)、筆記本電腦、工作站、服務(wù)器等)中的各種輸入 / 輸出(I/O)設(shè)備相連。通用計(jì)算 I/O 設(shè)備的例子可能包括顯卡、存儲(chǔ)設(shè)備、網(wǎng)絡(luò)適配器,甚至是人工智能加速器。
PCI-SIG?是一個(gè)擁有并管理 PCI 規(guī)范(作為開放行業(yè)標(biāo)準(zhǔn))的聯(lián)盟,該組織一直與成員公司合作,每三年將 PCIe 規(guī)范的性能提升一倍。按照計(jì)劃,PCIe 7.0 規(guī)范將于?2025年發(fā)布,目前他們正按計(jì)劃推進(jìn)。
現(xiàn)在讓我們來(lái)看看 “魯班的木工刨子” 這邊。GPU到XPU 的互連是為了實(shí)現(xiàn)高速的、點(diǎn)對(duì)點(diǎn)的 GPU到GPU 通信而設(shè)計(jì)的。在加速計(jì)算的早期版本中,系統(tǒng)架構(gòu)可能是每個(gè) CPU 搭配一個(gè) GPU。簡(jiǎn)單來(lái)說(shuō),這是一種 1 個(gè) CPU 對(duì) 1 個(gè) GPU 的架構(gòu)。
隨著人工智能模型的發(fā)展,1 個(gè) CPU 對(duì)多個(gè) GPU(n 個(gè) GPU)的架構(gòu)迅速出現(xiàn)。由于大語(yǔ)言模型(LLM)和其他模型擁有數(shù)萬(wàn)億個(gè)參數(shù),因此需要將數(shù)千個(gè) GPU “集群” 起來(lái),以處理必要的并行計(jì)算。結(jié)果就是,GPU到XPU 的互連速度越來(lái)越快。目前,200 Gbps 的 GPU到XPU 互連已成為標(biāo)準(zhǔn)。
那么最終的結(jié)果是什么呢?PCIe 7.0 技術(shù)是太快了,還是一推出就會(huì)被淘汰呢?
這取決于你問的是誰(shuí)。在Samtec看來(lái),對(duì)于那些可在通用計(jì)算、加速計(jì)算以及不斷發(fā)展的人工智能系統(tǒng)拓?fù)浣Y(jié)構(gòu)之間實(shí)現(xiàn)數(shù)據(jù)傳輸的 I/O 應(yīng)用場(chǎng)景,PCIe 7.0 技術(shù)將對(duì) GPU到 XPU的互連起到補(bǔ)充作用。
不過,問題來(lái)了,PCIe 7.0 技術(shù)的實(shí)際情況究竟如何呢?
【Samtec/Alphawave在128G?PAM4上的協(xié)同性】
簡(jiǎn)而言之,支持 PCIe 7.0 的技術(shù)是真實(shí)存在的,并且已經(jīng)可以用于原型實(shí)現(xiàn)。在24年歐洲光通信會(huì)議(ECOC)上,以及后來(lái)在開放計(jì)算項(xiàng)目峰會(huì)(OCP)上,Alphawave Semi和Samtec展示了 128 Gbps PAM4 系統(tǒng)的協(xié)同性。該演示設(shè)置將Alphawave Semi的IP與Samtec的高性能互連產(chǎn)品相結(jié)合。
Alphawave Semi PipeCORE? PCI-Express PHY 將?128 GT/s 的數(shù)據(jù)傳輸?shù)接筛鞣N Samtec 高性能互連系統(tǒng)組成的?2.5 米多長(zhǎng)的傳輸線上。盡管系統(tǒng)總長(zhǎng)度超過 2.5 米,并有 8 個(gè)連接點(diǎn),但仍實(shí)現(xiàn)了?e-10 或更好的出色的pre-FEC誤碼率(BER)。
NovaRay? I/O 面板安裝電纜系統(tǒng)是一種高速、高密度的電纜系統(tǒng),可提供約 4 Tbps 的總數(shù)據(jù)速率。它是為電纜到電纜的隔板面板連接而設(shè)計(jì)的。本次演示中的電纜組件長(zhǎng)度為 2.0 米。
【小 結(jié)】
那么,PCIe? 7.0 技術(shù)的出現(xiàn)是否為時(shí)尚早呢?它的速度足夠快嗎?
答案沒辦法很絕對(duì),但可以這么回答:PCIe 7.0 技術(shù)在合適的時(shí)間,將是用戶合適的解決方案。
因此,我們沒法錯(cuò)過他~ 而正如上文所提到的那樣,Samtec早已準(zhǔn)備就緒!