• 正文
    • █ 算力網(wǎng)絡的架構
    • █ 算力網(wǎng)絡的標準進展
    • █ 結語
  • 相關推薦
申請入駐 產(chǎn)業(yè)圖譜

算力網(wǎng)絡,到底是如何工作的?附-算力網(wǎng)絡白皮書下載

2024/08/12
9539
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

點擊免費下載:算力網(wǎng)絡白皮書

大家好,我是小棗君。

前幾期文章,我給大家詳細介紹了一下算力算力網(wǎng)絡的本質(zhì)。今天,是算力系列的最后一期,我們詳細看看算力網(wǎng)絡的組網(wǎng)架構和技術體系。

█ 算力網(wǎng)絡的架構

之前我提到過,算力網(wǎng)絡的作用,是為用戶提供算力資源服務。

它將算力資源徹底“融入”通信網(wǎng)絡,以一個更整體的形式,提供最符合用戶需求的算力資源服務。

這是一個高度靈活、高度智能的網(wǎng)絡。

算力網(wǎng)絡的核心特征,是它通過算力,實現(xiàn)了對算力資源、網(wǎng)絡資源的全面接管,可以讓網(wǎng)絡實時感知用戶的算力需求,以及自身的算力狀態(tài)。經(jīng)過分析后,算力網(wǎng)絡可以調(diào)度不同位置、不同類型的算力資源,為用戶服務。

我們可以把它理解成一個“萬能水龍頭”。它總能夠按你的需要,提供合適強度、合適溫度、合適酸堿度的水流,讓你擁有最好的用水體驗。

那么,我們自然會很好奇,這個“萬能水龍頭”的背后,究竟是一張怎樣的“水網(wǎng)”?它是如何進行資源控制和調(diào)度的?

接下來,我們就看看算力網(wǎng)絡的體系架構。

首先,我需要提前說明一下,算力網(wǎng)絡目前還是一個研究中的技術,并沒有完全定型。所以,我下面給出的,只是各個運營商和設備商的算力網(wǎng)絡架構(設想)圖,相互之間會存在一定的差異。而且,未來也很可能在發(fā)生變動,請大家知悉。

下面的這幾張,就是運營商和設備商比較有代表性的算力網(wǎng)絡架構(設想)圖:

中國移動(來自《算力網(wǎng)絡技術白皮書》,2022)

 

中國移動(來自《算力網(wǎng)絡白皮書》)

 

中國聯(lián)通(來自華為WIN-WIN創(chuàng)新周,2022)

 

中國聯(lián)通算力網(wǎng)絡架構(來自《算力網(wǎng)絡架構與技術體系白皮書》)

 

中國電信云網(wǎng)融合目標技術架構

(來自《云網(wǎng)融合2030技術白皮書》)

華為(來自華為WIN-WIN創(chuàng)新周,2022)

這些圖都有點復雜,相信大家都不太看得懂。我畫一個簡單的示意圖,大家應該能看明白:

簡單來說,還是信息通信的分層思想,按層級來看,就能理清思路。為了減輕閱讀壓力,大家可以先把右邊的綠色低碳和安全防護先pass掉。

我們從下往上,一層一層來看。

算網(wǎng)基礎設施

算力網(wǎng)絡的最下層,依然是算網(wǎng)基礎設施層,這個逃不掉的。在算力網(wǎng)絡中,基礎設施不再僅僅是算力資源(CPU、存儲、GPU等),還包括了網(wǎng)絡資源。

在算力資源這邊,對算力基礎設施的整合,依舊是以云技術為核心,包括云原生、虛擬化、容器等。

在這里,和算力有關的一些底層新技術創(chuàng)新,也值得關注,例如異構計算、無服務計算(Serverless Computing)、存算一體、算力卸載等。大家可以先不管,以后再專題介紹。

網(wǎng)絡這邊,變化比較大。前幾期文章給大家介紹過,云網(wǎng)融合趨勢下的網(wǎng)絡變化,用一句話來解釋,就是把封閉的網(wǎng),變得更開放(解耦),讓它變成像計算機一樣,可以通過軟件的方式(軟件定義),去給它下“命令”。

網(wǎng)絡的底層(物理層、數(shù)據(jù)鏈路層),在傳輸網(wǎng)這邊,依舊是光(只有光,才能保證通信帶寬和容量等基本硬指標)。光底層的技術,例如OTN、OXC、ROADM、C+L頻段、400G/800G啥的,都還是它們,沒有什么區(qū)別。

接入網(wǎng)那邊,5G NR、PON(50G-PON),也沒有什么特別(除了邊緣算力會有點關系之外)。

變化大的,在網(wǎng)的上層。我們待會再講。

  • 算網(wǎng)一體(算力資源管理、網(wǎng)絡資源管理)

再往上,開始有不一樣了。因為算力網(wǎng)絡要調(diào)度算力和網(wǎng)絡資源,所以,需要對資源進行“預處理”和“銜接”。(這一層,其實很多架構里都歸于編排管理層。我覺得單獨拎出來,會比較容易理解一些。)

這一層,最值得關注的是算力路由。

算力網(wǎng)絡和傳統(tǒng)網(wǎng)絡的最大區(qū)別,在于它所擁有三大特性。第一大特性,就是算力路由。

在算力之前,先要說說算力感知。

算力感知是網(wǎng)絡對算力資源和算力服務的部署位置、實時狀態(tài)、負載信息、業(yè)務需求的全面感知。中國移動的算力感知網(wǎng)絡白皮書,就是站在算力感知的角度,進行分析的。

算力感知網(wǎng)絡的體系架構(來自中國移動《算力感知網(wǎng)絡CAN技術白皮書2021》)

一方面,各算力節(jié)點將算網(wǎng)信息度量建模后統(tǒng)一發(fā)布,網(wǎng)絡通過對多節(jié)點上報的算網(wǎng)信息進行聚合,構建全局統(tǒng)一的算網(wǎng)狀態(tài)視圖。另一方面,網(wǎng)絡完成對業(yè)務算網(wǎng)需求的統(tǒng)一解析,實現(xiàn)對業(yè)務的全面感知,為基于業(yè)務需求進行算力調(diào)度提供保障。

算力狀態(tài)感知與通告(來自《算力感知網(wǎng)絡CAN技術白皮書2021》)

說白了,算力感知的目的,就是摸清手上到底有多少資源,用戶到底有怎樣的需求。

感知的對象,肯定需要進行度量和標識。于是,就有了算力度量和算力標識。

這兩塊,運營商目前非常重視。

算力這個東西存在多樣性,也存在異構硬件芯片,所以,目前還沒有形成統(tǒng)一的度量體系和標準。這會對建立統(tǒng)一的算力模型造成麻煩。很簡單,度量單位都不一樣,如何進行算力評估和計費?

算力標識的話,就相當于算力的身份證。用戶通過算力標識指示所需服務,網(wǎng)絡通過解析算力標識獲取目標算力服務、算力需求等信息,為算力調(diào)度等提供基礎。這個算力標識,必須是全局統(tǒng)一且可驗證的。

好了,接下來,就是算力路由。

在剛才那個中國移動的算力感知網(wǎng)絡架構圖里,在算力資源層之外,還單獨劃了一個算力路由層。

算力路由層是算力感知網(wǎng)絡的核心功能層,支持對網(wǎng)絡、計算、存儲等多維資源、服務的感知與通告,實現(xiàn)“網(wǎng)絡+計算”的聯(lián)合調(diào)度。

算力路由層,包括算力路由控制技術和算力路由轉(zhuǎn)發(fā)技術,實現(xiàn)業(yè)務請求在路由層的按需調(diào)度。

說到算力路由,肯定就要說到CFN(Computing First Networking,計算優(yōu)先網(wǎng)絡)。

CFN廣義上有時候會被用來指代整個算力網(wǎng)絡。但是,在這里,CFN是一種分布式路由協(xié)議,在不同邊緣云之間,按需進行著算力的調(diào)度和均衡。

CFN技術架構(來自《算力感知網(wǎng)絡技術白皮書》)

CFN這個東西其實很有意思。我們傳統(tǒng)理解的路由,都是數(shù)據(jù)報文的路由。CFN這里的路由,是將計算資源狀況和網(wǎng)絡資源狀況作為路由信息,發(fā)布到網(wǎng)絡。然后呢,網(wǎng)絡基于虛擬的服務ID,將計算任務報文,路由到最合適的計算節(jié)點。

目前,CFN協(xié)議主要通過在業(yè)務路由的BGP報文頭中,以擴展字節(jié)信息的方式攜帶算力信息,將網(wǎng)絡中計算節(jié)點的負載情況實時向全網(wǎng)進行擴散。

很顯然,算力路由和CFN,是上一層進行算力調(diào)度的前提。

  • 編排管理

再往上,就是算力網(wǎng)絡的核心關鍵部分——編排管理。

搞過核心網(wǎng)NFV(網(wǎng)元功能虛擬化)的同學,對編排一定非常熟悉。在NFV架構里,就有編排。這是一個很有意思的詞,把你給“收編、安排”了。說白了,就是完全控制和調(diào)度。

算力網(wǎng)絡的第二大特性,就是算力調(diào)度。

算力調(diào)度,就是基于算網(wǎng)大腦,進行全網(wǎng)算力資源的智能編排、彈性調(diào)度。

更具體來說,是:完成算力運營及算力服務編排,完成對算力資源和網(wǎng)絡資源的管理,包括對算力資源的感知、度量和OAM管理等;實現(xiàn)對終端用戶的算網(wǎng)運營,以及對算力路由層和網(wǎng)絡資源層的管理。

算力資源被感知、標識和感知之后,為了進行管理,還有一個算力資源管理的邏輯過程(也有被單獨稱為:算力管理層)。主要包括算力注冊、算力OAM(性能監(jiān)控、故障管理)、算力運營(計費管理、服務合約等)。

算力管理層

(來自《算力感知網(wǎng)絡CAN技術白皮書2021》)

這個功能劃分就很麻煩。在有的運營商架構圖里,這塊被定義為算力管理層,單獨存在。而在有的架構圖里,沒有這一層,劃在了編排管理層。所以說,各個理解都不一樣,很頭大。反正大家要知道,有這么一個功能組。

想要實現(xiàn)它,肯定離不開一個控制網(wǎng)絡的“神經(jīng)中樞”。

調(diào)度和編排算力網(wǎng)絡的核心控制部分,有的運營商把它叫做“算網(wǎng)大腦”。

這個“算網(wǎng)大腦”,有四個重要的作用:

1、獲取全域?qū)崟r的算、網(wǎng)、數(shù)資源,以及云、邊、端分布情況,構建全域態(tài)勢感知地圖。

 

2、跨域協(xié)同調(diào)度,將多域協(xié)同的調(diào)度任務智能、自動地分解給各個使能平臺,實現(xiàn)算、網(wǎng)、數(shù)的資源調(diào)度。

 

3、多域融合編排,針對多域融合業(yè)務需求,基于算、網(wǎng)、數(shù)的原子能力按需靈活組合編排。

 

4、智能輔助決策,基于不同業(yè)務的SLA要求、網(wǎng)絡整體負載、可用算力資源池分布等因素,智能、動態(tài)地計算出算、網(wǎng)、數(shù)的最優(yōu)協(xié)同策略。

算網(wǎng)管理編排層,維護全局靜態(tài)的算力、服務和網(wǎng)絡拓撲信息,并同步給各入口算力路由節(jié)點。算力路由節(jié)點維護算力服務的拓撲信息以及算力資源和網(wǎng)絡的資源實時狀態(tài)信息,通過分布式算力路由節(jié)點進行算網(wǎng)協(xié)同調(diào)度。

“算網(wǎng)大腦”是算力網(wǎng)絡的神經(jīng)中樞,統(tǒng)籌全局資源,重要性不言而喻。

在“算網(wǎng)大腦”中引入AI人工智能,那肯定是不用說了。除了AI之外,現(xiàn)在,運營商和設備商還打算往里面塞“數(shù)字孿生”、“意圖引擎”,極力提升“算網(wǎng)大腦”的智能化水平。

說實話,仔細看管理編排層,我就有一種感覺,算力網(wǎng)絡就是SDN和NFV技術的升級加融合,處處都是這兩個技術的影子。只不過,表面又加上很多其它的技術,形成了一個更完整、更龐大的體系。

  • 服務運營

算力大腦之上,是不是就沒有了?并不是,別忘了,我們還有服務運營層。

服務運營層,說白了,就是給上層應用提供管控算力網(wǎng)絡的接口。算網(wǎng)大腦不是真正的老板,只是一個“大管家”。真正管控網(wǎng)絡的,是上層用戶和應用。

服務運營層的目的,就是向上提供算力網(wǎng)絡的能力開放。重點技術包括:算力交易、算力并網(wǎng)、算力封裝、意圖感知等。

算力網(wǎng)絡的第三大特性,就是算力交易。

路由、調(diào)度、交易,是算力網(wǎng)絡三大特性

算力交易是算力網(wǎng)絡的一個重要創(chuàng)新。

在算力和網(wǎng)絡沒有融合之前,用戶使用誰家的云計算,就給誰錢,使用誰家的通信網(wǎng)絡,就給誰錢。算網(wǎng)融合后,算力到處都是,調(diào)度來調(diào)度去,你到底該給誰錢?

算力交易,就是為了解決這個問題。

在算力交易場景中,會有一個可信泛在算力交易平臺。

來自《算力網(wǎng)絡——云網(wǎng)融合2.0時代的網(wǎng)絡架構與關鍵技術》

大致過程是這樣的:

首先,算力消費方提出詳細的算力需求。然后,算力交易平臺根據(jù)需求,將可用的資源整合,生成一個算力網(wǎng)絡資源表。根據(jù)時延和成本等因素,會有對應的報價。接下來,算力消費方根據(jù)資源表,選擇一個最適合自己的“套餐”。然后,就是在算力交易平臺上簽訂交易合約。再然后,交易平臺根據(jù)合約,通過算力網(wǎng)絡調(diào)度資源,并且更新資源信息。最后,合約結束,服務終止,釋放資源。

算力網(wǎng)絡交易平臺

(來自《整合多方算力網(wǎng)絡,實現(xiàn)計算資源利用率最優(yōu)》,雷波)

在21世紀,凡是提到交易模式,就一定會牽扯到一個詞——區(qū)塊鏈。

是的沒錯,算力交易平臺,也是借助區(qū)塊鏈技術,實現(xiàn)分布式賬本、匿名交易等功能。

綜上所述,算力網(wǎng)絡緊密圍繞用戶的算力需求,覆蓋了算力產(chǎn)生、調(diào)度、交易、消費的全生命周期。算力網(wǎng)絡想要實現(xiàn)的,就是算隨人動,算隨“需求”動,達到極致完美的算力供給與需求匹配,一點也不將就,一點也不浪費。

█ 算力網(wǎng)絡的標準進展

這幾年,算力網(wǎng)絡在國內(nèi)非常熱門。不管是運營商還是設備商,都極為重視這個概念。

尤其是國內(nèi)運營商,對算力網(wǎng)絡簡直就是到了狂熱的地步。

原因很簡單,國外運營商很少碰網(wǎng),基本上就是搞搞通信,最多搞搞傳統(tǒng)通信的云化。而國內(nèi)運營商,既有網(wǎng),又有云,特別希望把網(wǎng)和云的資源融合、盤活。而且,我們國家比較重視基礎設施建設,算力網(wǎng)絡是重要的數(shù)字基礎設施,所以,運營商作為國企,也特別看重這塊的積累。

一方面,為了掌握技術標準的主動權,另一方面,為了品牌宣傳和形象造勢,三大運營商在算力網(wǎng)絡上就開始卷起來了。

2019年,是公認的算力網(wǎng)絡元年。這一年的11月1日,中國聯(lián)通率先行動,在北京PT展期間,發(fā)布了《中國聯(lián)通算力網(wǎng)絡白皮書》。這是國內(nèi)第一本和算力網(wǎng)絡相關的白皮書。

此后,國內(nèi)運營商們爭先恐后,陸續(xù)發(fā)布了多本白皮書,以及積極推動算力網(wǎng)絡的標準制定。

在標準推進方面,我根據(jù)網(wǎng)上的資料,整理了一張表格,大致記錄了各大標準組織在算力網(wǎng)絡標準制定方面的情況,僅供參考:

綜合自中信證券,各大白皮書,官網(wǎng)消息

試驗進展:

來自中信證券

█ 結語

從實際情況來看, 算力網(wǎng)絡離我們還有很長一段距離。目前,我們處于云網(wǎng)融合的進展階段,算網(wǎng)一體或算力網(wǎng)絡,還在研究之中。

盡管如此,算力網(wǎng)絡作為算力和聯(lián)接力未來的發(fā)展趨勢,是毋庸置疑的。算與網(wǎng)的融合一體,是必然的,也是整個通信行業(yè)的歸途。傳統(tǒng)通信作為“管道”,無法提升自己的價值,唯有全面投入云的懷抱,才是最好的出路。

好了,以上就是今天文章的全部內(nèi)容。技術干貨很多,看起來比較費勁。有些東西是我自己的理解,也不一定準確,歡迎大家批評指正。

大家有興趣的話,可以仔細在研讀一下運營商的白皮書。我把所有白皮書都打包了一下,大家可以隨意點擊下載:算力網(wǎng)絡白皮書

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

通信行業(yè)知名新媒體鮮棗課堂創(chuàng)始人,通信行業(yè)資深專家、行業(yè)分析師、自媒體作者,《智聯(lián)天下:移動通信改變中國》叢書作者。通信行業(yè)13年工作經(jīng)驗,曾長期任職于中興通訊股份有限公司,從事2/3/4G及5G相關技術領域方面的研究,曾擔任中興通訊核心網(wǎng)產(chǎn)品線產(chǎn)品經(jīng)理、能力提升總監(jiān)、中興通訊學院二級講師、中興通訊高級主任工程師,擁有豐富的行業(yè)經(jīng)驗和積累。