• 正文
    • ?01、風(fēng)口上的GPU
    • ?02、AI芯片的另外兩種主流選擇
    • ?03、多家機構(gòu),看好ASIC
    • ?04、國際龍頭,各自布局
    • ?05、蘋果,屢試“新果”
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

AI芯片新戰(zhàn)役:ASIC登場,GPU失色

2024/12/30
3051
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者:豐寧

談及AI芯片,公眾首先映入腦海的往往是GPU的身影。GPU在訓(xùn)練和運行大AI模型方面一直占據(jù)主導(dǎo)地位,其強大的并行處理能力讓它在處理復(fù)雜計算任務(wù)時游刃有余。然而由于一些原因,炙手可熱的GPU正在面臨一些挑戰(zhàn)與局限性,使其 “AI寵兒” 的地位逐漸受到動搖。

?01、風(fēng)口上的GPU

關(guān)于GPU市場格局變動的原因,可歸結(jié)為以下三大要素:

第一點,GPU已成為AI芯片領(lǐng)域競爭的核心焦點。目前,英偉達所產(chǎn)出的GPU主要被各大科技巨頭所壟斷。近日,LessWrong網(wǎng)站上發(fā)表了一篇博客,根據(jù)公開數(shù)據(jù)對英偉達芯片的產(chǎn)量、各個AI巨頭的GPU/TPU數(shù)量進行了估計。其中微軟目前擁有75萬至90萬塊H100 GPU,預(yù)計到2025年這一數(shù)字將飆升至250萬至310萬塊。谷歌的表現(xiàn)同樣強勢,現(xiàn)階段掌握了100萬至150萬塊H100,明年預(yù)計增加到350萬至420萬塊。Meta擁有55萬至65萬塊GPU,預(yù)計未來一年將增長至190萬至250萬塊。此外,亞馬遜當(dāng)前擁有25萬至40萬塊GPU,預(yù)計將在2025年達到130萬至160萬塊。而新興公司xAI也在迅速崛起,預(yù)計從10萬塊H100增長至55萬至100萬塊。這些數(shù)據(jù)充分反映出大型企業(yè)對AI算力的爭奪已趨于白熱化,尤其是微軟和谷歌。此外,Melius Research的分析師Ben Reitzes的報告顯示,這些巨頭正在特別購買英偉達的GB200芯片,其中微軟下單量在70萬至140萬塊之間,谷歌為40萬塊,亞馬遜則購買了36萬塊,OpenAI也不甘示弱,至少擁有40萬塊GB200芯片。科技巨頭包攬英偉達GPU的同時,直接導(dǎo)致了中小型企業(yè)在獲取GPU資源上面臨嚴(yán)峻挑戰(zhàn)。

第二點,GPU價格的飆升使得這些科技巨頭在采購芯片時需要支付更高的成本。據(jù)投行Raymond James的分析師估計,H100售價為2.5萬至3萬美元。?就算是價格、訂購數(shù)量都按照區(qū)間的低端進行計算,微軟也需要花費超過180億美元用于購買GPU。微軟、亞馬遜、谷歌等科技巨頭正在全球范圍內(nèi)加速布局AI算力,以維持其市場競爭力。據(jù)報道,這些公司在AI相關(guān)項目和數(shù)據(jù)中心上的投資已超過400億美元,并預(yù)計未來十年的支出將達到1萬億美元。在眾多花錢的項目中,購買GPU便是各家的當(dāng)務(wù)之急。日前,埃隆·馬斯克的人工智能初創(chuàng)公司xAI已經(jīng)向英偉達成功下單,訂購了價值10.8億美元的GB200 AI芯片,并憑借這筆巨額交易獲得了優(yōu)先交付的權(quán)利。高昂的售價讓科技巨頭們壓力倍增,叫苦不迭。

第三點,從另一角度來看,即便科技巨頭暫且將成本因素置于次要地位,英偉達本身的供應(yīng)不足狀況仍使這些科技巨頭憂心不已。目前,英偉達的GPU壟斷了約80%的AI半導(dǎo)體,制造在臺積電進行。在后續(xù)的流程中,會利用CoWoS進行封裝,但是CoWoS的產(chǎn)量目前是一個瓶頸。另外,在CoWoS中,GPU周圍放置了多個HBM(高帶寬內(nèi)存),這些HBM是堆疊的DRAM,也被認為是瓶頸之一。

在產(chǎn)能不足、巨頭哄搶、售價高昂的背景下,大大小小眾多企業(yè)開始積極探尋英偉達 GPU 的替代品,試圖破解AI芯片市場的一家獨大的現(xiàn)狀

AMD首席執(zhí)行官蘇姿豐(Lisa Su)也在前不久表示,隨著行業(yè)將精力集中于更加標(biāo)準(zhǔn)化的模型設(shè)計,將有機會構(gòu)建更多在可編程性和靈活性方面要求不那么高的定制芯片。這種芯片將更加節(jié)能、體積更小、成本更低?!澳壳?,GPU是大語言模型的首選架構(gòu),因為GPU在并行處理方面非常高效,但在可編程性方面有所欠缺,”蘇姿豐說?!拔迥甓嗪笏€會是首選架構(gòu)嗎?我認為情況會發(fā)生變化?!碧K姿豐預(yù)計,五年或七年時間內(nèi)GPU還不會失勢,但會出現(xiàn)GPU以外的新勢力。那么,除了GPU,還有哪些類型的芯片能夠勝任AI計算的任務(wù)呢?

?02、AI芯片的另外兩種主流選擇

在近兩年的技術(shù)浪潮中,另外兩種芯片——FPGA與ASIC,也逐漸走進了大眾的視野。FPGA(Field Programmable Gate Array,現(xiàn)場可編程門陣列),是一種半定制芯片。用戶可以根據(jù)自身的需求進行重復(fù)編程。

FPGA 的優(yōu)點是既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點,對芯片硬件層可以靈活編譯,功耗小于 CPU、GPU;缺點是硬件編程語言較難,開發(fā)門檻較高,芯片成本、價格較高。FPGA 比 GPU、CPU 更快是因為其具有定制化的結(jié)構(gòu)。ASIC(Application Specific Integrated Circuit特定用途集成電路)根據(jù)產(chǎn)品的需求進行特定設(shè)計和制造的集成電路,其定制程度相比于 GPU 和 FPGA 更高。ASIC 算力水平一般高于GPU、FPGA,但初始投入大,專業(yè)性強縮減了其通用性,算法一旦改變,計算能力會大幅下降,需要重新定制。

從成本角度看,GPU、FPGA、ASIC 三種硬件從左到右,從軟件到硬件,通用性逐漸降低、越專用,可定制化逐漸提高,相應(yīng)的設(shè)計、開發(fā)成本逐漸提高,但是單位成本理論性能越高。

從運算速度來看,由于GPU架構(gòu)固定,硬件原生支持的指令也固定。而FPGA和ASIC則是可編程的,因此,GPU的運算速度要遜色于FPGA和ASIC。

從功耗和時延角度來看,GPU的功耗遠遠大于FPGA和ASIC。GPU時延也高于FPGA、ASIC。

FPGA與ASIC的適用場景也不盡相同,就邊緣AI而言,F(xiàn)PGA確實展現(xiàn)出了更高的適用性;ASIC的主要優(yōu)勢在于其針對特定任務(wù)的高度優(yōu)化,這通常會導(dǎo)致更高的性能和更低的功耗(在大量生產(chǎn)時),也正因此,在AI計算應(yīng)用中,業(yè)內(nèi)對于ASIC的呼聲似乎要略高于FPGA。

?03、多家機構(gòu),看好ASIC

12月,博通的定制ASIC和英偉達GPU引起廣泛討論。摩根士丹利12月15日發(fā)布研報《AI ASIC 2.0:潛在贏家》,認為ASIC憑借針對性優(yōu)化和成本優(yōu)勢,有望逐步從英偉達GPU手中爭取更多市場份額。隨著生成式AI應(yīng)用的迅猛發(fā)展,全球AI計算需求呈現(xiàn)爆炸式增長。報告預(yù)計,到2027年,云端AI半導(dǎo)體市場規(guī)模將達到2380億美元,而在樂觀情境下甚至可能達到4050億美元。

摩根士丹利預(yù)計,AI ASIC市場規(guī)模將從2024年的120億美元增長至2027年的300億美元,年復(fù)合增長率達到34%。盡管英偉達的AI GPU性能卓越,但摩根士丹利認為,云服務(wù)提供商如谷歌、亞馬遜和微軟,仍在積極推動ASIC設(shè)計。這背后的驅(qū)動力主要有兩個。

首先,是優(yōu)化內(nèi)部工作負載。通過開發(fā)自定義芯片,CSP可以更高效地滿足其內(nèi)部AI推理和訓(xùn)練需求。

其次,是更好的性價比。報告指出,雖然英偉達的GPU具備強大的計算性能,但其硬件價格高昂,特別是在AI訓(xùn)練過程中。相比之下,ASIC的單位成本更低,尤其是在大規(guī)模使用后。巴克萊的另一份報告則預(yù)計,AI推理計算需求將快速提升,預(yù)計其將占通用人工智能總計算需求的70%以上,推理計算的需求甚至可以超過訓(xùn)練計算需求,達到后者的4.5倍。英偉達GPU目前在推理市場中市占率約80%,但隨著大型科技公司定制化ASIC芯片不斷涌現(xiàn),這一比例有望在2028年下降至50%左右。

?04、國際龍頭,各自布局

博通,是AI市場的“新任寵兒”

截至12月13日收盤,美股又一家萬億美元市值芯片公司誕生。當(dāng)天博通股價大漲超過24%,市值首次突破1萬億美元大關(guān),也成為繼英偉達和臺積電之后,全球第三家市值過萬億美元的半導(dǎo)體行業(yè)公司。博通股價大漲是在公司公布了好于預(yù)期財報之后。博通全年業(yè)績顯示,2024財年,全年營收達516億美元,同比增長44%,其中AI和VMware兩大業(yè)務(wù)板塊成為核心增長引擎。ASIC定制服務(wù)是博通半導(dǎo)體業(yè)務(wù)的一項重要收入來源,特別是在AI的驅(qū)動之下,博通來自與AI相關(guān)的ASIC定制服務(wù)營收正快速增長。博通CEO陳福陽在近日的財報電話會上預(yù)測稱,目前的三大科技客戶將在2027財年花費600億至900億美元購買博通供應(yīng)的人工智能組件。業(yè)界分析,博通ASIC芯片的大客戶包括谷歌、Meta;近期市場消息顯示,蘋果也有計劃開發(fā)AI服務(wù)器芯片,合作方很有可能也是博通。不僅如此,從美國目前對中國的禁售條款來看,ASIC芯片似乎始終被排除在外,博通也因此持續(xù)受益。隨著博通為云計算廠商定制更多AI芯片,這些廠商可能減少對英偉達芯片的依賴,有市場投資者擔(dān)心英偉達未來的芯片需求可能有所緩解。

Marvell受到追捧

與博通業(yè)務(wù)模型類似的Marvell也在近日受到資本市場追捧。12月初,Marvell已經(jīng)發(fā)布了2025財年第三財季財報,期內(nèi)公司實現(xiàn)營業(yè)收入15.16億美元,同比增長7%、環(huán)比增長19%。其中數(shù)據(jù)中心相關(guān)收入同比增長98%、環(huán)比增長25%,這是公司旗下所有業(yè)務(wù)中唯一實現(xiàn)同比收入增長的業(yè)務(wù)類型。Marvell總裁兼CEO Matt Murphy指出,這主要來自于AI定制化芯片需求支撐,此外還有云服務(wù)客戶對于互聯(lián)產(chǎn)品的持續(xù)性需求。預(yù)計這種趨勢將延續(xù)到2026財年(約指2025公歷年份)。僅在12月,Marvell先是官宣與亞馬遜云(AWS)擴大戰(zhàn)略合作,宣布一項為期五年、跨代際產(chǎn)品的合作計劃,涵蓋Marvell旗下定制AI芯片、DSP、數(shù)據(jù)中心互聯(lián)光模塊、以太網(wǎng)交換機解決方案等多種類型,以支持AWS推進在數(shù)據(jù)中心計算、網(wǎng)絡(luò)和存儲等方面強化產(chǎn)品能力。不久還宣布推出業(yè)界首款3nm高速(1.6Tbps)互聯(lián)平臺。博通和Marvell有類似的產(chǎn)業(yè)定位,并不聚焦于GPU這類通用的大規(guī)模并行計算芯片設(shè)計研發(fā),而是更專注于幫助有芯片定制化需求的主流云服務(wù)廠商進行產(chǎn)品設(shè)計。這也是ASIC芯片相關(guān)業(yè)績高速成長的原因。

谷歌,自研TPU

Google 早在 2013 年就秘密研發(fā)專注 AI機器學(xué)習(xí)算法芯片,并用于云計算數(shù)據(jù)中心,取代英偉達 GPU。這款TPU自研芯片2016年公開,為深度學(xué)習(xí)模型執(zhí)行大規(guī)模矩陣運算,如自然語言處理、計算機視覺和推薦系統(tǒng)模型。Google 其實在 2020 年的資料中心便建構(gòu) AI 芯片 TPU v4,直到 2023 年 4 月才首次公開細節(jié)。值得注意的是TPU是一種定制化的 ASIC 芯片,它由谷歌從頭設(shè)計,并專門用于機器學(xué)習(xí)工作負載。2023年12月6日,谷歌官宣了全新的多模態(tài)大模型Gemini,并丟出了另一個重磅炸彈——全新的自研芯片TPU v5p,它也是迄今為止功能最強大的TPU。隨后在今年5月,谷歌又宣布了第六代數(shù)據(jù)中心 AI 芯片 Tensor 處理器單元--Trillium。據(jù)悉,除了英偉達所占據(jù)的80%市場,其余20%的絕大部分由各種版本的谷歌TPU所控制。谷歌自身不出售芯片,而是通過其云計算平臺租用訪問權(quán)限。

微軟:推出基于Arm架構(gòu)的通用型芯片Cobalt、ASIC芯片Maia 100

2023年11月,微軟在Ignite技術(shù)大會上發(fā)布了首款自家研發(fā)的AI芯片Azure Maia 100,以及應(yīng)用于云端軟件服務(wù)的芯片Azure Cobalt。兩款芯片將由臺積電代工,采用5nm制程技術(shù)。Cobalt是基于Arm架構(gòu)的通用型芯片,具有128個核心,Maia 100是一款專為 Azure 云服務(wù)和 AI 工作負載設(shè)計的 ASIC 芯片,用于云端訓(xùn)練和推理的,晶體管數(shù)量達到1050億個。這兩款芯片將導(dǎo)入微軟Azure數(shù)據(jù)中心,支持OpenAI、Copilot等服務(wù)。負責(zé)Azure芯片部門的副總裁Rani Borkar表示,微軟已開始用Bing和Office AI產(chǎn)品測試Maia 100芯片,微軟主要AI合作伙伴、ChatGPT開發(fā)商OpenAI,也在進行測試中。不過,微軟并不認為自己的 AI 芯片可以廣泛替代英偉達的產(chǎn)品。

有分析認為,微軟的這一努力如果成功的話,也有可能幫助它在未來與英偉達的談判中更具優(yōu)勢。除了前述幾家公司,Meta等科技行業(yè)領(lǐng)導(dǎo)者正積極加快自主研發(fā)芯片的步伐。這些努力不僅限于ASIC領(lǐng)域,還包括FPGA和RISC-V等多個方向,旨在降低對英偉達技術(shù)的依賴。

在科技行業(yè)中,不單單是這些頭部企業(yè)有所動作。摩根士丹利在相關(guān)報告里對全球 ASIC 供應(yīng)鏈展開了梳理,并且確定了六大潛在的優(yōu)勢方:ASIC供應(yīng)商方面,除了博通,Alchip(世芯電子)和Socionext也被視為ASIC市場的潛力股。其中,Alchip由于與AWS的深度合作,預(yù)計將在2026年顯著提升市場份額。電子設(shè)計自動化工具方面,Cadence有望實現(xiàn)結(jié)構(gòu)性增長。代工廠方面,臺積電及其供應(yīng)鏈伙伴將從ASIC設(shè)計與制造的快速增長中受益。測試服務(wù)方面,Advantest是AI芯片測試領(lǐng)域的領(lǐng)先者,其在AI設(shè)備測試方面的專注將為其帶來顯著增長。HBM方面,三星電子是非英偉達HBM市場份額領(lǐng)先者,將從ASIC需求增長中獲益。

?05、蘋果,屢試“新果”

今年7月,蘋果公司發(fā)布iPhone AI的首個預(yù)覽版,隨后發(fā)布論文,稱其人工智能模型是在谷歌的TPU(張量處理單元)上訓(xùn)練的。論文中介紹了為支持Apple Intelligence功能而開發(fā)的基礎(chǔ)語言模型,包括一個設(shè)計用于在設(shè)備上高效運行的約30億參數(shù)模型和一個基于私有云計算的云側(cè)大模型。

近日,蘋果公司在亞馬遜的AWS Reinvent大會上又高調(diào)宣布將使用亞馬遜自家定制的AI芯片進行模型訓(xùn)練。根據(jù)蘋果機器學(xué)習(xí)與人工智能高級總監(jiān)Benoit Dupin的說法,蘋果正在評估亞馬遜最新的Trainium2芯片,尤其是其在預(yù)訓(xùn)練“蘋果智能”(Apple Intelligence)模型方面的潛力。這一跡象表明,在訓(xùn)練尖端人工智能方面,大型科技公司正在探索除英偉達GPU以外的其他替代方案。

長久以來,人工智能訓(xùn)練主要依賴于價格高昂的英偉達圖形處理器然而,云服務(wù)提供商與初創(chuàng)企業(yè)正積極研發(fā)成本更低的替代方案,并探索可能實現(xiàn)更高效處理的新途徑。蘋果采用定制芯片的做法,或許在向其他企業(yè)傳遞一個信號:非英偉達的訓(xùn)練方案同樣也能奏效。

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

公眾號:半導(dǎo)體產(chǎn)業(yè)縱橫。立足產(chǎn)業(yè)視角,提供及時、專業(yè)、深度的前沿洞見、技術(shù)速遞、趨勢解析,鏈接產(chǎn)業(yè)資源,構(gòu)建IC生態(tài)圈,賦能中國半導(dǎo)體產(chǎn)業(yè),我們一直在路上。