點擊免費下載:算力網(wǎng)絡白皮書
大家好,我是小棗君。
前幾期文章,我給大家詳細介紹了一下算力和算力網(wǎng)絡的本質(zhì)。今天,是算力系列的最后一期,我們詳細看看算力網(wǎng)絡的組網(wǎng)架構和技術體系。
█ 算力網(wǎng)絡的架構
之前我提到過,算力網(wǎng)絡的作用,是為用戶提供算力資源服務。
它將算力資源徹底“融入”通信網(wǎng)絡,以一個更整體的形式,提供最符合用戶需求的算力資源服務。
這是一個高度靈活、高度智能的網(wǎng)絡。
算力網(wǎng)絡的核心特征,是它通過算力,實現(xiàn)了對算力資源、網(wǎng)絡資源的全面接管,可以讓網(wǎng)絡實時感知用戶的算力需求,以及自身的算力狀態(tài)。經(jīng)過分析后,算力網(wǎng)絡可以調(diào)度不同位置、不同類型的算力資源,為用戶服務。
我們可以把它理解成一個“萬能水龍頭”。它總能夠按你的需要,提供合適強度、合適溫度、合適酸堿度的水流,讓你擁有最好的用水體驗。
那么,我們自然會很好奇,這個“萬能水龍頭”的背后,究竟是一張怎樣的“水網(wǎng)”?它是如何進行資源控制和調(diào)度的?
接下來,我們就看看算力網(wǎng)絡的體系架構。
首先,我需要提前說明一下,算力網(wǎng)絡目前還是一個研究中的技術,并沒有完全定型。所以,我下面給出的,只是各個運營商和設備商的算力網(wǎng)絡架構(設想)圖,相互之間會存在一定的差異。而且,未來也很可能在發(fā)生變動,請大家知悉。
下面的這幾張,就是運營商和設備商比較有代表性的算力網(wǎng)絡架構(設想)圖:
中國移動(來自《算力網(wǎng)絡技術白皮書》,2022)
中國移動(來自《算力網(wǎng)絡白皮書》)
中國聯(lián)通(來自華為WIN-WIN創(chuàng)新周,2022)
中國聯(lián)通算力網(wǎng)絡架構(來自《算力網(wǎng)絡架構與技術體系白皮書》)
中國電信云網(wǎng)融合目標技術架構
(來自《云網(wǎng)融合2030技術白皮書》)
華為(來自華為WIN-WIN創(chuàng)新周,2022)
這些圖都有點復雜,相信大家都不太看得懂。我畫一個簡單的示意圖,大家應該能看明白:
簡單來說,還是信息通信的分層思想,按層級來看,就能理清思路。為了減輕閱讀壓力,大家可以先把右邊的綠色低碳和安全防護先pass掉。
我們從下往上,一層一層來看。
算網(wǎng)基礎設施
算力網(wǎng)絡的最下層,依然是算網(wǎng)基礎設施層,這個逃不掉的。在算力網(wǎng)絡中,基礎設施不再僅僅是算力資源(CPU、存儲、GPU等),還包括了網(wǎng)絡資源。
在算力資源這邊,對算力基礎設施的整合,依舊是以云技術為核心,包括云原生、虛擬化、容器等。
在這里,和算力有關的一些底層新技術創(chuàng)新,也值得關注,例如異構計算、無服務計算(Serverless Computing)、存算一體、算力卸載等。大家可以先不管,以后再專題介紹。
網(wǎng)絡這邊,變化比較大。前幾期文章給大家介紹過,云網(wǎng)融合趨勢下的網(wǎng)絡變化,用一句話來解釋,就是把封閉的網(wǎng),變得更開放(解耦),讓它變成像計算機一樣,可以通過軟件的方式(軟件定義),去給它下“命令”。
網(wǎng)絡的底層(物理層、數(shù)據(jù)鏈路層),在傳輸網(wǎng)這邊,依舊是光(只有光,才能保證通信帶寬和容量等基本硬指標)。光底層的技術,例如OTN、OXC、ROADM、C+L頻段、400G/800G啥的,都還是它們,沒有什么區(qū)別。
在接入網(wǎng)那邊,5G NR、PON(50G-PON),也沒有什么特別(除了邊緣算力會有點關系之外)。
變化大的,在網(wǎng)的上層。我們待會再講。
- 算網(wǎng)一體(算力資源管理、網(wǎng)絡資源管理)
再往上,開始有不一樣了。因為算力網(wǎng)絡要調(diào)度算力和網(wǎng)絡資源,所以,需要對資源進行“預處理”和“銜接”。(這一層,其實很多架構里都歸于編排管理層。我覺得單獨拎出來,會比較容易理解一些。)
這一層,最值得關注的是算力路由。
算力網(wǎng)絡和傳統(tǒng)網(wǎng)絡的最大區(qū)別,在于它所擁有三大特性。第一大特性,就是算力路由。
在算力之前,先要說說算力感知。
算力感知是網(wǎng)絡對算力資源和算力服務的部署位置、實時狀態(tài)、負載信息、業(yè)務需求的全面感知。中國移動的算力感知網(wǎng)絡白皮書,就是站在算力感知的角度,進行分析的。
算力感知網(wǎng)絡的體系架構(來自中國移動《算力感知網(wǎng)絡CAN技術白皮書2021》)
一方面,各算力節(jié)點將算網(wǎng)信息度量建模后統(tǒng)一發(fā)布,網(wǎng)絡通過對多節(jié)點上報的算網(wǎng)信息進行聚合,構建全局統(tǒng)一的算網(wǎng)狀態(tài)視圖。另一方面,網(wǎng)絡完成對業(yè)務算網(wǎng)需求的統(tǒng)一解析,實現(xiàn)對業(yè)務的全面感知,為基于業(yè)務需求進行算力調(diào)度提供保障。
算力狀態(tài)感知與通告(來自《算力感知網(wǎng)絡CAN技術白皮書2021》)
說白了,算力感知的目的,就是摸清手上到底有多少資源,用戶到底有怎樣的需求。
感知的對象,肯定需要進行度量和標識。于是,就有了算力度量和算力標識。
這兩塊,運營商目前非常重視。
算力這個東西存在多樣性,也存在異構硬件芯片,所以,目前還沒有形成統(tǒng)一的度量體系和標準。這會對建立統(tǒng)一的算力模型造成麻煩。很簡單,度量單位都不一樣,如何進行算力評估和計費?
算力標識的話,就相當于算力的身份證。用戶通過算力標識指示所需服務,網(wǎng)絡通過解析算力標識獲取目標算力服務、算力需求等信息,為算力調(diào)度等提供基礎。這個算力標識,必須是全局統(tǒng)一且可驗證的。
好了,接下來,就是算力路由。
在剛才那個中國移動的算力感知網(wǎng)絡架構圖里,在算力資源層之外,還單獨劃了一個算力路由層。
算力路由層是算力感知網(wǎng)絡的核心功能層,支持對網(wǎng)絡、計算、存儲等多維資源、服務的感知與通告,實現(xiàn)“網(wǎng)絡+計算”的聯(lián)合調(diào)度。
算力路由層,包括算力路由控制技術和算力路由轉(zhuǎn)發(fā)技術,實現(xiàn)業(yè)務請求在路由層的按需調(diào)度。
說到算力路由,肯定就要說到CFN(Computing First Networking,計算優(yōu)先網(wǎng)絡)。
CFN廣義上有時候會被用來指代整個算力網(wǎng)絡。但是,在這里,CFN是一種分布式路由協(xié)議,在不同邊緣云之間,按需進行著算力的調(diào)度和均衡。
CFN技術架構(來自《算力感知網(wǎng)絡技術白皮書》)
CFN這個東西其實很有意思。我們傳統(tǒng)理解的路由,都是數(shù)據(jù)報文的路由。CFN這里的路由,是將計算資源狀況和網(wǎng)絡資源狀況作為路由信息,發(fā)布到網(wǎng)絡。然后呢,網(wǎng)絡基于虛擬的服務ID,將計算任務報文,路由到最合適的計算節(jié)點。
目前,CFN協(xié)議主要通過在業(yè)務路由的BGP報文頭中,以擴展字節(jié)信息的方式攜帶算力信息,將網(wǎng)絡中計算節(jié)點的負載情況實時向全網(wǎng)進行擴散。
很顯然,算力路由和CFN,是上一層進行算力調(diào)度的前提。
- 編排管理
再往上,就是算力網(wǎng)絡的核心關鍵部分——編排管理。
搞過核心網(wǎng)NFV(網(wǎng)元功能虛擬化)的同學,對編排一定非常熟悉。在NFV架構里,就有編排。這是一個很有意思的詞,把你給“收編、安排”了。說白了,就是完全控制和調(diào)度。
算力網(wǎng)絡的第二大特性,就是算力調(diào)度。
算力調(diào)度,就是基于算網(wǎng)大腦,進行全網(wǎng)算力資源的智能編排、彈性調(diào)度。
更具體來說,是:完成算力運營及算力服務編排,完成對算力資源和網(wǎng)絡資源的管理,包括對算力資源的感知、度量和OAM管理等;實現(xiàn)對終端用戶的算網(wǎng)運營,以及對算力路由層和網(wǎng)絡資源層的管理。
算力資源被感知、標識和感知之后,為了進行管理,還有一個算力資源管理的邏輯過程(也有被單獨稱為:算力管理層)。主要包括算力注冊、算力OAM(性能監(jiān)控、故障管理)、算力運營(計費管理、服務合約等)。
算力管理層
(來自《算力感知網(wǎng)絡CAN技術白皮書2021》)
這個功能劃分就很麻煩。在有的運營商架構圖里,這塊被定義為算力管理層,單獨存在。而在有的架構圖里,沒有這一層,劃在了編排管理層。所以說,各個理解都不一樣,很頭大。反正大家要知道,有這么一個功能組。
想要實現(xiàn)它,肯定離不開一個控制網(wǎng)絡的“神經(jīng)中樞”。
調(diào)度和編排算力網(wǎng)絡的核心控制部分,有的運營商把它叫做“算網(wǎng)大腦”。
這個“算網(wǎng)大腦”,有四個重要的作用:
1、獲取全域?qū)崟r的算、網(wǎng)、數(shù)資源,以及云、邊、端分布情況,構建全域態(tài)勢感知地圖。
2、跨域協(xié)同調(diào)度,將多域協(xié)同的調(diào)度任務智能、自動地分解給各個使能平臺,實現(xiàn)算、網(wǎng)、數(shù)的資源調(diào)度。
3、多域融合編排,針對多域融合業(yè)務需求,基于算、網(wǎng)、數(shù)的原子能力按需靈活組合編排。
4、智能輔助決策,基于不同業(yè)務的SLA要求、網(wǎng)絡整體負載、可用算力資源池分布等因素,智能、動態(tài)地計算出算、網(wǎng)、數(shù)的最優(yōu)協(xié)同策略。
算網(wǎng)管理編排層,維護全局靜態(tài)的算力、服務和網(wǎng)絡拓撲信息,并同步給各入口算力路由節(jié)點。算力路由節(jié)點維護算力服務的拓撲信息以及算力資源和網(wǎng)絡的資源實時狀態(tài)信息,通過分布式算力路由節(jié)點進行算網(wǎng)協(xié)同調(diào)度。
“算網(wǎng)大腦”是算力網(wǎng)絡的神經(jīng)中樞,統(tǒng)籌全局資源,重要性不言而喻。
在“算網(wǎng)大腦”中引入AI人工智能,那肯定是不用說了。除了AI之外,現(xiàn)在,運營商和設備商還打算往里面塞“數(shù)字孿生”、“意圖引擎”,極力提升“算網(wǎng)大腦”的智能化水平。
說實話,仔細看管理編排層,我就有一種感覺,算力網(wǎng)絡就是SDN和NFV技術的升級加融合,處處都是這兩個技術的影子。只不過,表面又加上很多其它的技術,形成了一個更完整、更龐大的體系。
- 服務運營
算力大腦之上,是不是就沒有了?并不是,別忘了,我們還有服務運營層。
服務運營層,說白了,就是給上層應用提供管控算力網(wǎng)絡的接口。算網(wǎng)大腦不是真正的老板,只是一個“大管家”。真正管控網(wǎng)絡的,是上層用戶和應用。
服務運營層的目的,就是向上提供算力網(wǎng)絡的能力開放。重點技術包括:算力交易、算力并網(wǎng)、算力封裝、意圖感知等。
算力網(wǎng)絡的第三大特性,就是算力交易。
路由、調(diào)度、交易,是算力網(wǎng)絡三大特性
算力交易是算力網(wǎng)絡的一個重要創(chuàng)新。
在算力和網(wǎng)絡沒有融合之前,用戶使用誰家的云計算,就給誰錢,使用誰家的通信網(wǎng)絡,就給誰錢。算網(wǎng)融合后,算力到處都是,調(diào)度來調(diào)度去,你到底該給誰錢?
算力交易,就是為了解決這個問題。
在算力交易場景中,會有一個可信泛在算力交易平臺。
來自《算力網(wǎng)絡——云網(wǎng)融合2.0時代的網(wǎng)絡架構與關鍵技術》
大致過程是這樣的:
首先,算力消費方提出詳細的算力需求。然后,算力交易平臺根據(jù)需求,將可用的資源整合,生成一個算力網(wǎng)絡資源表。根據(jù)時延和成本等因素,會有對應的報價。接下來,算力消費方根據(jù)資源表,選擇一個最適合自己的“套餐”。然后,就是在算力交易平臺上簽訂交易合約。再然后,交易平臺根據(jù)合約,通過算力網(wǎng)絡調(diào)度資源,并且更新資源信息。最后,合約結束,服務終止,釋放資源。
算力網(wǎng)絡交易平臺
(來自《整合多方算力網(wǎng)絡,實現(xiàn)計算資源利用率最優(yōu)》,雷波)
在21世紀,凡是提到交易模式,就一定會牽扯到一個詞——區(qū)塊鏈。
是的沒錯,算力交易平臺,也是借助區(qū)塊鏈技術,實現(xiàn)分布式賬本、匿名交易等功能。
綜上所述,算力網(wǎng)絡緊密圍繞用戶的算力需求,覆蓋了算力產(chǎn)生、調(diào)度、交易、消費的全生命周期。算力網(wǎng)絡想要實現(xiàn)的,就是算隨人動,算隨“需求”動,達到極致完美的算力供給與需求匹配,一點也不將就,一點也不浪費。
█ 算力網(wǎng)絡的標準進展
這幾年,算力網(wǎng)絡在國內(nèi)非常熱門。不管是運營商還是設備商,都極為重視這個概念。
尤其是國內(nèi)運營商,對算力網(wǎng)絡簡直就是到了狂熱的地步。
原因很簡單,國外運營商很少碰網(wǎng),基本上就是搞搞通信,最多搞搞傳統(tǒng)通信的云化。而國內(nèi)運營商,既有網(wǎng),又有云,特別希望把網(wǎng)和云的資源融合、盤活。而且,我們國家比較重視基礎設施建設,算力網(wǎng)絡是重要的數(shù)字基礎設施,所以,運營商作為國企,也特別看重這塊的積累。
一方面,為了掌握技術標準的主動權,另一方面,為了品牌宣傳和形象造勢,三大運營商在算力網(wǎng)絡上就開始卷起來了。
2019年,是公認的算力網(wǎng)絡元年。這一年的11月1日,中國聯(lián)通率先行動,在北京PT展期間,發(fā)布了《中國聯(lián)通算力網(wǎng)絡白皮書》。這是國內(nèi)第一本和算力網(wǎng)絡相關的白皮書。
此后,國內(nèi)運營商們爭先恐后,陸續(xù)發(fā)布了多本白皮書,以及積極推動算力網(wǎng)絡的標準制定。
在標準推進方面,我根據(jù)網(wǎng)上的資料,整理了一張表格,大致記錄了各大標準組織在算力網(wǎng)絡標準制定方面的情況,僅供參考:
綜合自中信證券,各大白皮書,官網(wǎng)消息
試驗進展:
來自中信證券
█ 結語
從實際情況來看, 算力網(wǎng)絡離我們還有很長一段距離。目前,我們處于云網(wǎng)融合的進展階段,算網(wǎng)一體或算力網(wǎng)絡,還在研究之中。
盡管如此,算力網(wǎng)絡作為算力和聯(lián)接力未來的發(fā)展趨勢,是毋庸置疑的。算與網(wǎng)的融合一體,是必然的,也是整個通信行業(yè)的歸途。傳統(tǒng)通信作為“管道”,無法提升自己的價值,唯有全面投入云的懷抱,才是最好的出路。
好了,以上就是今天文章的全部內(nèi)容。技術干貨很多,看起來比較費勁。有些東西是我自己的理解,也不一定準確,歡迎大家批評指正。
大家有興趣的話,可以仔細在研讀一下運營商的白皮書。我把所有白皮書都打包了一下,大家可以隨意點擊下載:算力網(wǎng)絡白皮書