• 正文
    • ?01、HBM:突破存儲墻的“垂直革命”
    • ?02、先進封裝:從“單一芯片”到“系統(tǒng)級整合”
    • ?03、隱形賽點的深層博弈
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

HBM與先進封裝:AI算力革命的隱形賽點

04/14 09:40
1733
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者:方圓

人工智能大模型的爆發(fā)式發(fā)展正重塑全球半導(dǎo)體產(chǎn)業(yè)格局。從訓(xùn)練千億參數(shù)的Transformer模型到實時推理的生成式AI應(yīng)用,算力需求呈現(xiàn)指數(shù)級增長。據(jù)IDC預(yù)測,2025年中國智能算力規(guī)模將達1037.3 EFLOPS,增長43%。然而,傳統(tǒng)“存儲墻”(由于存儲系統(tǒng)的性能限制,導(dǎo)致計算機整體性能無法有效提升的現(xiàn)象)問題成為算力提升的瓶頸:數(shù)據(jù)在存儲器處理器之間的搬運速度遠低于計算速度,導(dǎo)致能效比低下。

在此背景下,高帶寬存儲器(HBM)與先進封裝技術(shù)成為突破關(guān)鍵。HBM通過3D堆疊與硅通孔(TSV)技術(shù),實現(xiàn)單顆帶寬超1TB/s,較傳統(tǒng)GDDR6提升5倍;而臺積電CoWoS、英特爾EMIB等先進封裝技術(shù)則通過異構(gòu)集成,將CPU、GPU、NPU等芯片整合為“超級芯片”,突破單芯片面積與功耗限制。這兩項技術(shù)共同構(gòu)成AI算力革命的“隱形戰(zhàn)場”,其發(fā)展不僅關(guān)乎技術(shù)路線競爭,更涉及地緣政治與產(chǎn)業(yè)鏈話語權(quán)的爭奪。

?01、HBM:突破存儲墻的“垂直革命”

傳統(tǒng)計算架構(gòu)中,計算單元與存儲單元的物理分離導(dǎo)致數(shù)據(jù)搬運能耗占總功耗的60%以上,形成制約算力提升的“內(nèi)存墻”。以GPT-4為代表的萬億參數(shù)大模型,每次推理需調(diào)用數(shù)TB級數(shù)據(jù),若依賴傳統(tǒng)GDDR5內(nèi)存,僅數(shù)據(jù)傳輸延遲就足以讓算力效率腰斬。這正是英偉達在H100芯片中引入HBM3的根本動因——其帶寬達到3.35TB/s,是GDDR6X的5倍,將數(shù)據(jù)搬運時間壓縮至納秒級。

自2014年首款HBM產(chǎn)品發(fā)布以來,HBM技術(shù)已經(jīng)發(fā)展至第四代改進型,分別是HBM(第一代)、HBM2(第二代)、HBM2E(第三代)、HBM3(第四代)和HBM3E(第四代改進型)。隨著技術(shù)的不斷進步,HBM芯片的容量從1GB升級至24GB,帶寬從128GB/s提升至1.2TB/s,數(shù)據(jù)傳輸速率從1Gbps提高至9.2Gbps。

HBM通過3D堆疊工藝將8-12層DRAM芯片垂直集成,借助TSV(硅通孔)技術(shù)實現(xiàn)層間萬級互聯(lián)通道。以SK海力士最新量產(chǎn)的HBM3E為例,其采用1β nm制程與混合鍵合技術(shù),單顆容量達24GB,帶寬突破1TB/s,相當于在指甲蓋大小的空間內(nèi)構(gòu)建起12車道的數(shù)據(jù)高速公路。這種突破不僅來自DRAM工藝進步,更依賴于2.5D封裝中硅中介層的精密布線——臺積電CoWoS技術(shù)能在1平方厘米內(nèi)布置超過10萬條微凸點,將處理器與內(nèi)存的物理距離縮短至微米級。

AI 的蓬勃發(fā)展使得 HBM 的需求呈現(xiàn)爆發(fā)式增長。隨著 AI 技術(shù)在云端 / 電商服務(wù)、智能制造、金融保險、智慧醫(yī)療及智能駕駛輔助等眾多行業(yè)的深度滲透,AI 服務(wù)器與高端 GPU 的需求水漲船高。據(jù) TrendForce 數(shù)據(jù)顯示,預(yù)計 2023 年 AI 服務(wù)器(包含搭載 GPU、FPGA、ASIC 等)出貨量近 120 萬臺,同比增長 38.4%,占整體服務(wù)器出貨量近 9%,至 2026 年占比將提升至 15%,2022-2026 年 AI 服務(wù)器出貨量年復(fù)合增長率達 22%。在 AI 服務(wù)器中,HBM 成為關(guān)鍵標配,特別是在訓(xùn)練側(cè),AI 服務(wù)器基本需要采用中高端 GPU,如英偉達A100/H100 等,HBM 的滲透率接近 100%。推理側(cè)隨著 AIGC 模型逐漸復(fù)雜化,采用中高端 GPU 并搭載 HBM 也成為必然趨勢。

當HBM與GPU通過先進封裝實現(xiàn)異質(zhì)集成,算力密度的衡量標準已從單純的晶體管數(shù)量轉(zhuǎn)向“每瓦特帶寬”。英偉達H200的案例極具代表性:盡管其GPU架構(gòu)與H100相同,但通過搭載HBM3E使LLM推理速度提升1.9倍,這證明在AI時代,“內(nèi)存帶寬×能效比”的組合正成為比浮點運算峰值更關(guān)鍵的指標。

全球?HBM 市場呈現(xiàn)高度集中態(tài)勢,2022 年三大原廠 HBM 市占率分別為 SK 海力士 50%、三星約 40%、美光約 10%。SK 海力士憑借先發(fā)優(yōu)勢,為英偉達提供?HBM3,目前在市場份額上保持領(lǐng)先。不過,2024 年三星開始擴大對英偉達的?HBM3 供應(yīng),美光也成功批量生產(chǎn) HBM3E,未來三星和美光有望逐步擴大在 HBM 市場的份額。為了滿足市場對 HBM 的旺盛需求,各大存儲芯片大廠紛紛加大產(chǎn)能擴張力度。SK 海力士正在擴大其在清州 M15X 工廠的 HBM 產(chǎn)能,投資額超過 20 萬億韓元(約合 146 億美元),計劃于 2025 年 11 月完工;此外,有消息人士透露,三星正在建立一條?HBM4 專用生產(chǎn)線,處于 “試生產(chǎn)” 階段。據(jù)韓聯(lián)社報道,三星計劃在現(xiàn)有封裝設(shè)施的基礎(chǔ)上興建服務(wù)于 HBM?內(nèi)存的半導(dǎo)體封裝工廠;美光正在美國建設(shè)?HBM 測試產(chǎn)線與量產(chǎn)線,且其首次考慮在馬來西亞生產(chǎn)?HBM,維吉尼亞州 Dominion Fab6 可能擴建供應(yīng) HBM 前段。

?02、先進封裝:從“單一芯片”到“系統(tǒng)級整合”

先進封裝技術(shù)在AI 算力提升中同樣扮演著不可或缺的角色。隨著摩爾定律逐漸放緩,通過傳統(tǒng)制程升級來提高晶體密度的方式,其性價比越來越低,且面臨著量子隧穿效應(yīng)等諸多技術(shù)難題,研發(fā)成本大幅增加,良率卻難以保證。在這樣的背景下,先進封裝技術(shù)應(yīng)運而生,成為提升芯片性能的新路徑。

先進封裝與傳統(tǒng)封裝有著本質(zhì)區(qū)別。傳統(tǒng)封裝主要功能是為半導(dǎo)體芯片提供電氣連接,并保護芯片免受外界元件影響,其電路連接主要依賴引線框架,這種方式生產(chǎn)工藝相對簡單、成本較低,但封裝后的芯片尺寸較大,芯片管腳數(shù)量受限,在以人工智能、高性能計算為代表的新需求面前逐漸力不從心。而先進封裝則以提高連接密度、提高系統(tǒng)集成度與小型化為主要方向,電路連接主要通過凸塊(Bump)完成,整個體系涵蓋倒裝焊(Flip Chip)、晶圓級封裝(WLP)、扇入 / 扇出、2.5D 封裝(Interposer)、3D 封裝(TSV)、混合鍵合、Chiplet 等一系列先進技術(shù)與理念。先進封裝能夠大幅提高芯片集成度,縮短芯片之間的互連長度,增加 I/O 數(shù)量,提升散熱性能,實現(xiàn)系統(tǒng)重構(gòu),同時提高加工效率和設(shè)計效率。

以?AI 訓(xùn)練芯片為例,高帶寬內(nèi)存(HBM)需要通過邏輯芯片和多層的 DRAM 堆疊來實現(xiàn)高速數(shù)據(jù)傳輸,其中 HBM 內(nèi)部的 DRAM 堆疊屬于 3D 封裝,而 HBM 與芯片其他部分合封于硅中介層上屬于 2.5D 封裝。2.5D/3D 封裝技術(shù)憑借能夠打破 “內(nèi)存墻” 制約的優(yōu)勢,成為 AI 及高性能計算需求下的主流方案。2.5D 封裝是將芯片堆疊于中間層之上或透過硅橋連結(jié)芯片,以水平堆疊方式,主要應(yīng)用于拼接邏輯運算芯片和高帶寬存儲器;3D 封裝則是垂直堆疊芯片的技術(shù),主要面向高效能邏輯芯片、SoC 制造。

臺積電的?CoWoS(Chip on Wafer on Substrate)技術(shù)是 2.5D/3D 封裝技術(shù)的典型代表,它將芯片堆疊起來再封裝于基板上,減少了芯片空間,降低了功耗和成本,實現(xiàn)了多個芯片在一個封裝中的高度集成,提高了信號傳輸速度和可靠性,具備高性價比優(yōu)勢。目前,全球絕大部分 AI 芯片廠商均采用了 CoWoS 先進封裝,這也導(dǎo)致臺積電 CoWoS 產(chǎn)能持續(xù)吃緊。

根據(jù)市場調(diào)研機構(gòu)?Yole 數(shù)據(jù)預(yù)測,全球先進封裝市場規(guī)模將由 2022 年的 443 億美元增長到 2028 年的 786 億美元,年復(fù)合成長率為 10.6%,增速遠高于傳統(tǒng)封裝。在競爭格局方面,臺積電憑借在先進制程積累的技術(shù)優(yōu)勢,成為全球先進封裝領(lǐng)域的龍頭企業(yè)。其推出的 3DFabric,搭載了完備的 3D 硅堆棧和先進的封裝技術(shù),英偉達、AMD 等全球 AI 芯片龍頭均采用臺積電的先進封裝技術(shù)。

三星、英特爾、日月光等企業(yè)在先進封裝領(lǐng)域也有深厚的技術(shù)積累和市場份額。國內(nèi)廠商也在奮起直追,長電科技、通富微電均具備?CoWoS 先進封裝能力,長電先進 XDFOI? 2.5D 試驗線已建設(shè)完成并進入穩(wěn)定量產(chǎn)階段,同步實現(xiàn)國際客戶 4nm 節(jié)點多芯片系統(tǒng)集成封裝產(chǎn)品出貨;通富微電與全球 AI 芯片龍頭 AMD 深入合作布局 CoWoS 產(chǎn)品;盛合精微雖然起步較晚,但進展迅速,目前已經(jīng)可以提供基于硅通孔(TSV)載板、扇出型和大尺寸基板等多個不同平臺的多芯片高性能集成封裝一站式量產(chǎn)服務(wù),滿足人工智能、數(shù)據(jù)中心、智能手機領(lǐng)域需求。

先進封裝工藝的升級,帶動了半導(dǎo)體設(shè)備及材料需求的持續(xù)增長。先進封裝涉及光刻、刻蝕、沉積、拋光等多種工藝,對應(yīng)設(shè)備材料需求從傳統(tǒng)的封裝設(shè)備材料擴展至前道晶圓制造用的設(shè)備材料。設(shè)備端包括光刻機、刻蝕、薄膜沉積設(shè)備等;材料端涵蓋電鍍液及添加劑、拋光液、功能性濕電子化學品、光刻膠、臨時鍵合膠、靶材等。目前,先進封裝設(shè)備的國產(chǎn)替代正在全面推進,在固晶機、封裝光刻機、刻蝕、薄膜沉積設(shè)備、鍵合設(shè)備、CMP、減薄設(shè)備等多個領(lǐng)域,國內(nèi)企業(yè)均取得了不同程度的突破。材料方面,雖然高端封裝基板、環(huán)氧塑封料、PSPI 光刻膠、臨時鍵合膠等品類國產(chǎn)化程度較低,但國內(nèi)企業(yè)也在積極布局,部分產(chǎn)品已進入客戶驗證或小批量試產(chǎn)階段。

先進封裝技術(shù)通過異構(gòu)集成與微縮互連,重構(gòu)芯片設(shè)計范式。臺積電CoWoS技術(shù)采用硅中介層(Interposer)連接多個芯片,實現(xiàn)2.5D封裝,英偉達H100 GPU即通過此技術(shù)集成HBM3,帶寬達3 TB/s。英特爾EMIB技術(shù)則通過嵌入式硅橋連接不同制程的芯片,支持Chiplet架構(gòu),AMD MI300芯片借此將CPU、GPU與HBM集成,算力密度提升3倍。

臺積電2024年CoWoS月產(chǎn)能突破4萬片,仍無法滿足需求——僅英偉達B100芯片就預(yù)定60%產(chǎn)能。三星投資200億美元建設(shè)"封裝巨城",其H-Cube技術(shù)可封裝1200mm2超大型中介層,是傳統(tǒng)方案的3倍。這場競賽背后是驚人的資本消耗:單條CoWoS產(chǎn)線投資超30億美元,相當于3座傳統(tǒng)封測廠的投入。

封裝環(huán)節(jié)價值占比從28nm時代的7%飆升至3nm時代的25%,臺積電憑借CoWoS技術(shù)將封測毛利率拉升至52%,倒逼傳統(tǒng)封測巨頭日月光轉(zhuǎn)型先進封裝。更深遠的影響在于產(chǎn)業(yè)鏈主導(dǎo)權(quán)轉(zhuǎn)移——芯片設(shè)計企業(yè)必須提前18個月與臺積電協(xié)調(diào)封裝方案,AMD MI300X因封裝資源不足被迫延遲量產(chǎn)。

?03、隱形賽點的深層博弈

HBM 與先進封裝技術(shù)并非孤立存在,而是相輔相成、協(xié)同共進,共同為 AI 算力的提升貢獻力量。HBM 解決了內(nèi)存帶寬和容量的瓶頸問題,使得處理器能夠快速獲取和處理大量數(shù)據(jù),而先進封裝技術(shù)則通過優(yōu)化芯片間的連接和集成方式,進一步提升了數(shù)據(jù)傳輸效率和系統(tǒng)性能。

在?AI 服務(wù)器中,HBM 與 AI 芯片通過先進封裝技術(shù)實現(xiàn)了緊密結(jié)合,極大地提高了系統(tǒng)的整體性能。例如,通過 2.5D/3D 封裝技術(shù)將 HBM 與 GPU 封裝在一起,縮短了數(shù)據(jù)傳輸路徑,減少了信號延遲,使得 GPU 能夠更高效地調(diào)用 HBM 中的數(shù)據(jù),從而加速 AI 計算過程。這種協(xié)同效應(yīng)在 AI 訓(xùn)練和推理中表現(xiàn)得尤為明顯,能夠顯著提升模型訓(xùn)練速度和推理的準確性。

從產(chǎn)業(yè)鏈角度來看,HBM 與先進封裝的發(fā)展也帶動了上下游產(chǎn)業(yè)的協(xié)同發(fā)展。上游的半導(dǎo)體設(shè)備和材料企業(yè),如應(yīng)用材料、東京電子、北方華創(chuàng)、中微公司等,需要不斷研發(fā)和生產(chǎn)更先進的設(shè)備和材料,以滿足 HBM 和先進封裝的工藝要求;中游的芯片設(shè)計和制造企業(yè),如英偉達、AMD、三星、臺積電等,通過采用 HBM 和先進封裝技術(shù),推出更具競爭力的產(chǎn)品;下游的 AI 應(yīng)用企業(yè),如谷歌、微軟百度、阿里巴巴等,能夠利用這些高性能的芯片和內(nèi)存,開發(fā)出更強大、更智能的 AI 應(yīng)用。

在這場?AI 算力革命的隱形戰(zhàn)場中,HBM 與先進封裝技術(shù)無疑是最為關(guān)鍵的力量。它們的發(fā)展不僅將推動 AI 技術(shù)邁向新的高度,還將深刻影響整個半導(dǎo)體產(chǎn)業(yè)的格局。對于企業(yè)來說,抓住 HBM 與先進封裝技術(shù)帶來的機遇,加大研發(fā)投入,提升技術(shù)實力和市場競爭力,是在未來科技競爭中取得優(yōu)勢的關(guān)鍵。

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

公眾號:半導(dǎo)體產(chǎn)業(yè)縱橫。立足產(chǎn)業(yè)視角,提供及時、專業(yè)、深度的前沿洞見、技術(shù)速遞、趨勢解析,鏈接產(chǎn)業(yè)資源,構(gòu)建IC生態(tài)圈,賦能中國半導(dǎo)體產(chǎn)業(yè),我們一直在路上。