全新MLCommons結(jié)果公布，英特爾在AI領(lǐng)域的優(yōu)勢盡顯

2023/06/28 作者：與非網(wǎng)編輯

1531

加入交流群

掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

Habana Gaudi2和第四代英特爾至強可擴展處理器為AI訓練提供領(lǐng)先的性能并大幅節(jié)約成本

今日，MLCommons公布其行業(yè)AI性能基準測試MLPerf訓練3.0的結(jié)果，其中，Habana? Gaudi? 2深度學習加速器與第四代英特爾?至強?可擴展處理器展現(xiàn)出令人印象深刻的訓練結(jié)果。

英特爾執(zhí)行副總裁兼數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera表示：“最新由MLCommons發(fā)布的MLPerf結(jié)果驗證了使用英特爾至強可擴展處理器和英特爾Gaudi深度學習加速器，可以在AI領(lǐng)域為客戶帶來更高的性價比（TCO）。其中，至強的內(nèi)置加速器使其成為在通用處理器上運行大量AI工作負載的理想解決方案，而Gaudi則為大語言模型和生成式AI提供了極具競爭力的優(yōu)異性能。此外，英特爾的可擴展系統(tǒng)配備了經(jīng)過優(yōu)化的、易于編程的開放軟件，可降低客戶和生態(tài)伙伴在數(shù)據(jù)中心部署從云到智能邊緣各種基于AI的解決方案的門檻?！?/p>

目前，業(yè)內(nèi)普遍認為生成式AI和大語言模型（LLMs）僅適宜在GPU上運行。然而，最新的數(shù)據(jù)顯示，基于英特爾產(chǎn)品組合的AI解決方案，能夠為在封閉生態(tài)系統(tǒng)中尋求擺脫當前效率與規(guī)模限制的客戶提供極具競爭力的選擇。

最新的MLPerf訓練3.0結(jié)果展現(xiàn)了英特爾產(chǎn)品在一系列深度學習模型上的優(yōu)異性能。在大語言模型GPT-3上，基于Gaudi2的軟件與系統(tǒng)在AI訓練成熟度上得到了大規(guī)模驗證。值得一提的是，Gaudi2是僅有的兩個向GPT-3大模型訓練基準提交性能結(jié)果的解決方案之一。

與此同時，Gaudi2還為客戶提供了極具競爭力的成本優(yōu)勢，包括服務器和系統(tǒng)成本。其在GPT-3、計算機視覺和自然語言模型上經(jīng)由MLPerf驗證的杰出性能，以及即將推出的軟件，使Gaudi2成為業(yè)界一個極具吸引力與性價比解決方案。

在CPU方面，第四代至強可擴展處理器采用英特爾AI引擎，其深度學習訓練性能的結(jié)果表明，客戶可以使用基于至強的服務器，構(gòu)建一個通用AI系統(tǒng)以用于數(shù)據(jù)預處理、模型訓練和部署，從而獲得兼具AI性能、效率、準確性和可擴展性的最優(yōu)組合。

關(guān)于Habana Gaudi2的測試結(jié)果：訓練生成式AI和大語言模型需要服務器集群來滿足大規(guī)模的計算要求。最新MLPerf結(jié)果切實驗證了Habana Gaudi2在要求極為苛刻的模型——1750億參數(shù)的GPT-3上的出色性能以及高效的可擴展性。

測試亮點：

Gaudi2在GPT-3*上實現(xiàn)了令人印象深刻的訓練時間：在384個加速器上的訓練時間為311分鐘。
在GPT-3模型上，從256個加速器到384個加速器實現(xiàn)近線性95%的擴展效果。
在計算機視覺模型ResNet-50（8個加速器）和Unet3D（8個加速器）以及自然語言處理模型BERT（8個和64個加速器）上取得了優(yōu)異的訓練結(jié)果。
與去年11月提交的數(shù)據(jù)相比，BERT和ResNet模型的性能分別提高了10%和4%，證明Gaudi2軟件成熟度的提升。
Gaudi2支持“開箱即用”功能，客戶在本地或在云端使用Gaudi2時，可以獲得與本次測試相當?shù)男阅芙Y(jié)果。

Habana? Gaudi?2夾層卡

器件型號	數(shù)量	器件廠商	器件描述	ECAD模型	參考價格	更多信息
MK10DX256VLH7R	1	Freescale Semiconductor	Kinetis K 32-bit MCU, ARM Cortex-M4 core, 256KB Flash, 72MHz, QFP 64		$9.1	查看
ATMEGA88PA-MMHR	1	Atmel Corporation	RISC Microcontroller, 8-Bit, FLASH, AVR RISC CPU, 20MHz, CMOS, PQCC28, 4 X 4 MM, 1 MM HEIGHT, 0.45 MM PITCH, GREEN, PLASTIC, VQFN-28		$2.43	查看
ATXMEGA256A3U-AU	1	Atmel Corporation	RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PQFP64, 14 X 14 MM, 1 MM THICKNESS, 0.80 MM PITCH, GREEN, PLASTIC, MS-026AEB, TQFP-64	ECAD模型下載ECAD模型	$6.75	查看