• 正文
    • 01.銳炫Pro B50:AI性能提升至3倍,性價比較RTX A1000翻番
    • 02.銳炫Pro B60:AI峰值算力197TOPS,跑DeepSeek-R1倍殺RTX 5060Ti
    • 03.8張銳炫Pro B60互連,可跑1500億參數(shù)大模型
    • 04.英特爾Gaudi 3:PCIe卡AI峰值算力達1678TFLOPS,機架級配備8.2TB HBM
    • 05.結(jié)語:英特爾邁向全面轉(zhuǎn)型,力補AI產(chǎn)品實力,強調(diào)“執(zhí)行力”與“說真話”
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

6小時前
305
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者 | ?ZeR0,編輯 | ?漠影

陳立武表露對“新英特爾”的期許。

芯東西5月20日報道,臺北國際電腦展COMPUTEX 2025今日盛大開幕,芯片產(chǎn)業(yè)領(lǐng)袖云集,陳立武首次以英特爾CEO身份赴臺,并與中國臺灣供應(yīng)鏈伙伴餐敘。英特爾更是一舉發(fā)布多款GPU和AI產(chǎn)品,包括英特爾銳炫Pro B50/B60 GPU、Gaudi 3 AI加速器輕量級開源軟件框架Intel AI Assistant Builder,展露其在AI及專業(yè)視覺領(lǐng)域的最新布局。

英特爾銳炫Pro B60/B50 GPU基于Xe?2架構(gòu),具備AI特性,為要求嚴苛的AI推理工作負載和工作站應(yīng)用而設(shè)計,進一步豐富了英特爾專業(yè)級GPU產(chǎn)品線。其中,銳炫Pro B60配備24GB顯存,AI峰值算力197TOPS,適用于推理工作站;銳炫Pro B50配備16GB顯存,AI峰值算力為170TOPS,適用于圖形工作站。

兩款GPU均搭載英特爾XMX AI核心和先進的光線追蹤單元,并支持多GPU擴展,通過將高顯存容量與關(guān)鍵軟件兼容性相結(jié)合,為創(chuàng)作者和AI開發(fā)者提供了可擴展的、經(jīng)濟高效的解決方案。銳炫Pro B50直接面向零售市場,建議零售價為299美元(約合人民幣2159元),性價比優(yōu)勢突出。銳炫Pro B60將主要通過B2B模式進行項目采購,正在與多家系統(tǒng)集成商和OEM廠商進行合作。

華擎、藍戟、Lanner、銘瑄、傲世、Senao和撼與科技等AIB合作伙伴將于今年6月開始提供英特爾銳炫Pro B60 GPU樣品。英特爾銳炫Pro B50 GPU將于今年7月開始在英特爾授權(quán)經(jīng)銷商處上市。

有合作伙伴將提供銳炫Pro B60的單卡雙GPU方案,板載顯存容量達48GB。英特爾Gaudi 3 AI加速器提供PCIe機架級系統(tǒng)部署選擇,為企業(yè)和云AI推理提供可擴展的開放解決方案。英特爾Gaudi 3 PCIe卡支持在現(xiàn)有服務(wù)器數(shù)據(jù)中心環(huán)境中進行可擴展的AI推理,將于今年下半年上市。

在CES 2025首次亮相后,英特爾AI Assistant Builder軟件框架現(xiàn)已在GitHub上提供公開測試版。該框架專為在基于英特爾AI PC上本地構(gòu)建和運行自定義AI agents而設(shè)計,可幫助企業(yè)或個人快速構(gòu)建并部署AI agents。

01.銳炫Pro B50:AI性能提升至3倍,性價比較RTX A1000翻番

英特爾銳炫Pro B50 GPU實現(xiàn)了同類價位段最高配置:擁有16個Xe核心,配備16GB顯存、128 XMX引擎,顯存帶寬為224GB/s,AI峰值算力(Int8)為170TOPS,單卡功耗僅70W。PCIe Gen 5速度的提升也會帶來10%-20%的性能提升。

與同類產(chǎn)品對比,銳炫Pro B50的顯存容量、驅(qū)動程式優(yōu)化、PCIe Gen 5提升均表現(xiàn)更優(yōu)。同類產(chǎn)品通常配備6GB或8GB顯存。

與上一代產(chǎn)品及競品相比,銳炫Pro B50在圖形和AI推理性能上有1.1倍~3.5倍的提升。

在通用性能方面,銳炫Pro B50相比上一代產(chǎn)品提升50%~130%。其性價比不僅相較銳炫Pro A50、英偉達RTX A1000翻倍提升,比起銳炫Pro A60也略勝一籌。

該系列GPU在Windows上兼容消費級和專業(yè)級驅(qū)動程序,在Linux上支持容器化的軟件棧。其軟件??梢院喕疉I部署,并支持逐步升級和功能優(yōu)化。新發(fā)布的兩款GPU針對AEC(建筑、工程、施工)和推理工作站進行了優(yōu)化,并通過大量ISV認證和優(yōu)化的軟件提供穩(wěn)定、可靠的性能。

英特爾副總裁兼客戶端顯卡總經(jīng)理Vivian Lien稱,全新英特爾銳炫Pro GPU為一直在尋求針對性解決方案的中小型企業(yè),提供了易于獲取且可擴展的解決方案。

02.銳炫Pro B60:AI峰值算力197TOPS,跑DeepSeek-R1倍殺RTX 5060Ti

銳炫Pro B60擁有20個Xe核心,配備24GB顯存、160 XMX引擎,顯存帶寬為456GB/s,AI峰值算力(Int8)為197TOPS,根據(jù)不同系統(tǒng)設(shè)計,單卡功耗區(qū)間為120~200W。

從性能來看,銳炫Pro B60運行DeepSeek-R1、Phi 4、QwQ、Qwen 2.5、Llama 3等模型時,相比英偉達RTX 2000 Ada 16GB、RTX 5060Ti 16GB的吞吐量更高。

更大參數(shù)規(guī)模的模型,需要更大的顯存。7B模型若采用FP16進行推理,至少需要16GB顯存。70B模型采用INT4量化,需要超過30GB的顯存,若采用FP16,顯存需求更是將超過100GB。

通過多卡互連,銳炫Pro B60能夠以更大的顯存容量,來支撐大模型運行,并在上下文和并發(fā)擴展方面展現(xiàn)優(yōu)勢。一張銳炫Pro B60跑不了32B參數(shù)量的DeepSeek-R1蒸餾模型,但2張GPU就能支持20k tokens上下文,4張GPU可將上下文窗口擴展到100k以上,足以直接輸入一本不太厚的書或論文。

企業(yè)級應(yīng)用場景對并發(fā)性提出了更高的要求。在設(shè)定8k上下文窗口的情況下,單張銳炫Pro B60無法支撐DeepSeek-R1 32B FP8精度模型的運行。使用兩張顯卡時,系統(tǒng)可支持5-6個并發(fā)用戶。

而當(dāng)采用四張顯卡、利用全部96GB顯存時,系統(tǒng)可支持超過50個并發(fā)用戶,足以滿足中小企業(yè)的大部分需求。英特爾自己也用銳炫Pro B60來解決問題。在開發(fā)酷睿Ultra第二代Lunar Lake產(chǎn)品時,英特爾在VPC解碼過程中發(fā)現(xiàn)了一個Bug,表現(xiàn)出現(xiàn)花屏現(xiàn)象。這類問題通常非常復(fù)雜,可能跨越多個軟件層,且代碼量巨大。

一位經(jīng)驗豐富的工程師通常需要花費數(shù)天時間,從數(shù)萬行l(wèi)og中發(fā)現(xiàn)問題,debug找到根源,并提供代碼修復(fù)方案,然后重新進行測試。而英特爾在配備4張銳炫Pro B60和至強W處理器的服務(wù)器上部署運行多AI agent協(xié)同方案,僅花費數(shù)小時便完成了從問題定位到代碼修復(fù)的全過程,并最終完成了所有問題的修復(fù)和重新測試。

03.8張銳炫Pro B60互連,可跑1500億參數(shù)大模型

推理工作站具有廣闊的發(fā)展前景,主要體現(xiàn)在:1)安全部署,數(shù)據(jù)無需上傳至云端,可在本地處理;2)提供一站式解決方案,將所有軟件置于容器中,幫助客戶解決問題,易于設(shè)置;3)易于擴展,可靈活配置不同數(shù)量的顯卡;4)成本效益具有顯著優(yōu)勢。英特爾發(fā)布了一款可配置的工作站級英特爾至強平臺(代號Project Battlematrix),旨在減少AI開發(fā)人員的摩擦點。

借助高達192GB的視頻隨機存取存儲器(VRAM),它最多可支持8張英特爾銳炫Pro B60 24GB GPU,運行高達1500億個參數(shù)的中等規(guī)模且精度高的AI模型。

為了優(yōu)化AI推理性能,英特爾在底層軟件上引入GPUDirect Peer-to-Peer技術(shù),可在GPU之間直接拷貝數(shù)據(jù),不需要CPU參與。此外,其張量并行算法則可以把一張顯卡放不下的大模型平均切分到4張或者是8張卡上進行推理,然后把結(jié)果合并輸出給用戶。

英特爾采用容器化方案來幫助客戶解決軟件部署的復(fù)雜性問題,在容器內(nèi)部對大語言模型進行了大量的優(yōu)化,包括Linux軟件棧的支持、驗證以及分階段的軟件發(fā)布。其Project Battlematrix Linux軟件棧如下圖所示,Linux操作系統(tǒng)位于容器之外,往上是用戶層驅(qū)動,Level 0是英特爾的底層驅(qū)動,再向上是英特爾OneAPI和XPU Manager,上層是英特爾對生態(tài)系統(tǒng)的支持。目前該軟件棧采用vLLM Serving,未來也將支持SGLang等其他開源軟件。英特爾對各層軟件進行了完整的驗證和優(yōu)化,并通過容器形式一鍵交付給客戶,以方便部署。

英特爾還展示了軟件功能路線圖,預(yù)計第三季度發(fā)布經(jīng)過完整驗證和產(chǎn)品化的容器,第四季度推出SR-IOV、VDI虛擬桌面的軟件性能優(yōu)化以及完整的管理功能。

04.英特爾Gaudi 3:PCIe卡AI峰值算力達1678TFLOPS,機架級配備8.2TB HBM

英特爾進一步推進其AI戰(zhàn)略,推出英特爾Gaudi 3 AI加速器的全新部署方案。

英特爾Gaudi 3 PCIe卡配備128GB HBM2e,F(xiàn)P8精度下AI峰值算力達到1678TFLOPS,支持在現(xiàn)有服務(wù)器數(shù)據(jù)中心環(huán)境中進行可擴展的AI推理。

AI大模型Llama為例,得益于可擴展配置,可靈活運行從輕量級Llama 3.1 8B到規(guī)模較大的Llama 4 Scout或Maverick等各種規(guī)模的AI模型。英特爾Gaudi 3機架級系統(tǒng)參考設(shè)計帶來了極大的靈活性和可擴展性,每個機架最多可容納64個加速器,并擁有高達8.2TB的高帶寬內(nèi)存(HBM)。其機架級架構(gòu)針對大型AI模型進行深度優(yōu)化,可提供實時推理性能。開放式模塊化設(shè)計打破了供應(yīng)商的限制,而有線背板和盲插2D全機架布線讓安裝和維護變得更加簡單。

通過液冷,這些系統(tǒng)可提供強大的性能,并有助于TCO的控制。這些配置支持云服務(wù)提供商(CSP)的定制化需求和開放計算項目(OCP)設(shè)計規(guī)范。英特爾承諾構(gòu)建開放、靈活和安全AI基礎(chǔ)設(shè)施。

05.結(jié)語:英特爾邁向全面轉(zhuǎn)型,力補AI產(chǎn)品實力,強調(diào)“執(zhí)行力”與“說真話”

此次新品發(fā)布正值英特爾與臺灣科技生態(tài)系統(tǒng)合作40周年。英特爾進一步擴大專業(yè)級GPU陣容,提供大顯存、高性價比以及為AI推理和專業(yè)工作站量身定制的配置,并展示了其AI加速器產(chǎn)品及AI Assistant Builder的可用性。這些新產(chǎn)品有望為英特爾開辟新的局面。

在英特爾臺灣40周年晚宴活動上,陳立武發(fā)表致辭,談到英特爾將全面轉(zhuǎn)型,重回工程導(dǎo)向,不僅做CPU,還要構(gòu)建完整的AI計算系統(tǒng),包括芯片、軟件、存儲、互連及工作負載整合,并強化與中國臺灣科技供應(yīng)鏈及客戶的交流合作。陳立武再度表露改造英特爾的決心和策略,以及對“新英特爾”的期許。英

特爾在PC市場有超過68%的市占率,在服務(wù)器市場有55%的市占率。據(jù)陳立武透露,一些客戶反饋為了提高系統(tǒng)性能,正在評估推動開發(fā)定制芯片。陳立武強調(diào)了兩個目標(biāo):打造好產(chǎn)品,令客戶滿意。為此,他讓英特爾工程團隊直接向他匯報,確保做出正確的芯片產(chǎn)品,并積極招募人才。他告訴團隊:“如果你不先告訴我壞消息,而是讓我從客戶口中得知,那你就麻煩大了。我要的是誠實、真實的文化?!?/p>

此次來臺行程中,陳立武拜訪了許多OEM客戶,聽到很多反饋?!澳銜吹揭粋€全新的英特爾?!彼嘈庞⑻貭栁磥韺⒁愿t卑、更開放的態(tài)度,主動傾聽客戶聲音,不僅要推出好產(chǎn)品,更要讓生產(chǎn)穩(wěn)定、準(zhǔn)時、品質(zhì)穩(wěn)定。“我相信只要持續(xù)執(zhí)行、執(zhí)行、執(zhí)行,就能讓英特爾恢復(fù)元氣?!标惲⑽湔f,他不是搞營銷的,不會吹噓表現(xiàn),英特爾將用成果說話。

 

英特爾

英特爾

英特爾在云計算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。

英特爾在云計算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。收起

查看更多

相關(guān)推薦