全球領(lǐng)先的開(kāi)源解決方案提供商紅帽公司和AMD(納斯達(dá)克股票代碼:AMD)近日宣布建立戰(zhàn)略合作,旨在推動(dòng)AI能力發(fā)展,并優(yōu)化虛擬化基礎(chǔ)設(shè)施。通過(guò)此次深化合作,紅帽與AMD將拓展客戶在混合云環(huán)境中的選擇——從部署經(jīng)過(guò)優(yōu)化、高效的AI模型,到更具成本效益地實(shí)現(xiàn)傳統(tǒng)虛擬機(jī)(VM)的現(xiàn)代化升級(jí)。
隨著AI的引入導(dǎo)致工作負(fù)載需求和多樣性持續(xù)增加,企業(yè)必須具備滿足這些不斷增長(zhǎng)需求的能力和資源。然而,典型的數(shù)據(jù)中心主要專注于傳統(tǒng)IT系統(tǒng),幾乎沒(méi)有余力支持AI等密集型工作負(fù)載。為滿足這一需求,紅帽與AMD正攜手,將紅帽行業(yè)領(lǐng)先的開(kāi)源解決方案與AMD全面的高性能計(jì)算架構(gòu)產(chǎn)品組合結(jié)合起來(lái)。
AMD與紅帽:推動(dòng)更高效生成式AI的實(shí)現(xiàn)
紅帽和AMD正將紅帽AI的強(qiáng)大能力與AMD基于x86架構(gòu)的處理器及GPU架構(gòu)的產(chǎn)品組合相結(jié)合,為AI驅(qū)動(dòng)的工作負(fù)載提供優(yōu)化、成本高效且生產(chǎn)就緒的環(huán)境。
AMD Instinct GPU現(xiàn)已全面支持紅帽O(jiān)penShift AI,為客戶提供在混合云環(huán)境中部署AI所需的高性能處理能力,且無(wú)需極高的資源需求。此外,使用AMD Instinct MI300X GPU與紅帽企業(yè)Linux AI,紅帽與AMD在Microsoft Azure ND MI300X v5上進(jìn)行了測(cè)試,成功演示了在單個(gè)虛擬機(jī)(VM)上跨多個(gè)GPU部署的小型語(yǔ)言模型(SLM)和大型語(yǔ)言模型(LLM)的AI推理能力,減少了橫跨多個(gè)虛擬機(jī)部署的需求,降低了性能成本。
為了進(jìn)一步提升性能加速和調(diào)優(yōu)能力,紅帽與AMD正在上游vLLM社區(qū)開(kāi)展合作,以推動(dòng)更高效的AI推理。通過(guò)這些上游的激活措施,紅帽與AMD旨在提供:
- AMD GPU性能提升:通過(guò)將AMD內(nèi)核庫(kù)上游化并優(yōu)化Triton內(nèi)核及FP8等組件,紅帽與AMD正在提升密集型和量化模型的推理性能,使vLLM在AMD Instinct MI300X加速器上實(shí)現(xiàn)更快速、更高效的執(zhí)行。
- 增強(qiáng)的多GPU支持:通過(guò)提升集合通信和優(yōu)化多GPU工作負(fù)載,可為更具可擴(kuò)展性和能效的AI部署打開(kāi)大門(mén),這對(duì)需要跨多個(gè)GPU進(jìn)行分布式計(jì)算的工作負(fù)載尤為有利,可減少瓶頸并提升整體吞吐量。
- 擴(kuò)大的vLLM生態(tài)系統(tǒng)合作:紅帽、AMD與IBM等其他行業(yè)領(lǐng)導(dǎo)者之間的交叉協(xié)作,有助于加速上游開(kāi)發(fā),推動(dòng)vLLM項(xiàng)目與AMD GPU優(yōu)化的持續(xù)改進(jìn),進(jìn)而為依賴AMD硬件進(jìn)行AI推理和訓(xùn)練的vLLM用戶帶來(lái)益處。
基于在vLLM社區(qū)中的此次合作,AMD Instinct GPU將原生支持紅帽AI推理服務(wù)器(Red Hat AI Inference Server)——紅帽的企業(yè)級(jí)vLLM發(fā)行版,為用戶帶來(lái)一個(gè)開(kāi)箱即用、強(qiáng)大、可靠且可擴(kuò)展的AI推理服務(wù)器。作為vLLM項(xiàng)目的頂級(jí)商業(yè)貢獻(xiàn)者,紅帽致力于在企業(yè)選擇的硬件上部署vLLM時(shí)實(shí)現(xiàn)兼容性,其中包括AMD Instinct GPU。在AMD Instinct GPU上運(yùn)行vLLM使企業(yè)能夠在經(jīng)過(guò)驗(yàn)證和測(cè)試的GPU硬件上部署任何開(kāi)源AI模型,獲得出色的優(yōu)化效果和性能表現(xiàn)。
AMD EPYC?處理器還可實(shí)現(xiàn)端到端的AI性能,是托管GPU驅(qū)動(dòng)系統(tǒng)的理想選擇。這有助于提升每臺(tái)GPU服務(wù)器的性能和投資回報(bào)率(ROI),即使面對(duì)最嚴(yán)苛的AI工作負(fù)載也不例外。
重塑現(xiàn)代數(shù)據(jù)中心
通過(guò)優(yōu)化現(xiàn)有數(shù)據(jù)中心布局,企業(yè)能夠更高效、更便捷地重新配置資源以推動(dòng)AI創(chuàng)新。紅帽O(jiān)penShift虛擬化是紅帽O(jiān)penShift的一項(xiàng)功能,它為企業(yè)提供了一條簡(jiǎn)化路徑,使其能夠以云原生應(yīng)用平臺(tái)的便捷性和速度來(lái)遷移和管理虛擬機(jī)工作負(fù)載。紅帽O(jiān)penShift虛擬化已針對(duì)AMD EPYC處理器完成驗(yàn)證,能夠充分利用AMD EPYC處理器卓越的性能與能效,無(wú)論在混合云的哪個(gè)位置,都能確保性能和效率,同時(shí)為通向云原生未來(lái)架設(shè)橋梁。
基于AMD EPYC處理器的紅帽O(jiān)penShift虛擬化可助力企業(yè)優(yōu)化在領(lǐng)先服務(wù)器(如戴爾PowerEdge、HPE ProLiant和聯(lián)想ThinkSystem產(chǎn)品等)上的應(yīng)用部署。在升級(jí)傳統(tǒng)數(shù)據(jù)中心時(shí),紅帽O(jiān)penShift虛擬化能夠?qū)崿F(xiàn)虛擬機(jī)與容器化應(yīng)用在本地、公有云或混合云中的統(tǒng)一管理。這有助于實(shí)現(xiàn)更高的基礎(chǔ)設(shè)施整合率,從而顯著降低硬件、軟件許可及能源層面的總體擁有成本(TCO)。此外,該方案還可以具有額外優(yōu)勢(shì):使IT團(tuán)隊(duì)能夠更高效地管理當(dāng)前關(guān)鍵工作負(fù)載,同時(shí)釋放資源與能源以應(yīng)對(duì)當(dāng)前及未來(lái)的AI工作負(fù)載需求。
支持證言
紅帽高級(jí)副總裁兼首席產(chǎn)品官Ashesh Badani
“充分實(shí)現(xiàn)AI的價(jià)值意味著企業(yè)必須擁有選擇和靈活性,以優(yōu)化其IT基礎(chǔ)設(shè)施來(lái)應(yīng)對(duì)規(guī)模需求帶來(lái)的嚴(yán)苛挑戰(zhàn)。我們與AMD擴(kuò)展合作,為尋求為未來(lái)不斷演變的IT環(huán)境做好準(zhǔn)備的企業(yè)提供了更廣泛的選擇,從在高性能CPU架構(gòu)和虛擬化平臺(tái)上實(shí)現(xiàn)現(xiàn)有投資的現(xiàn)代化,到通過(guò)下一代硬件加速器和開(kāi)源AI技術(shù)為生產(chǎn)級(jí)AI做好準(zhǔn)備。”
AMD執(zhí)行副總裁及首席商務(wù)官Philip Guido
“隨著企業(yè)客戶工作負(fù)載日益多樣化和嚴(yán)苛,他們需要可擴(kuò)展的解決方案。通過(guò)將紅帽行業(yè)領(lǐng)先的開(kāi)源平臺(tái)與世界一流的AMD Instinct GPU和AMD EPYC CPU相結(jié)合,我們正提供客戶所需的性能和效率,以加速AI、虛擬化和混合云創(chuàng)新。”