作者 | ?云鵬,編輯 | ?心緣
手機AI芯片大戰(zhàn),正成為今天科技賽場上極為重要的一場較量。從手機芯片大廠到手機終端巨頭,無一不在力挺端側(cè)AI,不論是系統(tǒng)級還是個性化AI的實現(xiàn),都離不開AI的端側(cè)計算,而計算就離不開芯片。尤其結(jié)合當下AI智能體、AI OS方向成為行業(yè)共識,AI對芯片能力的需求愈發(fā)高漲,這種需求不是簡單的“TOPS”算力,而是對芯片全方位能力的考驗。
放眼國內(nèi),小米掏出自研SoC大招,玄戒O1首秀即在CPU、GPU性能方面與高通聯(lián)發(fā)科掰手腕,與蘋果A18 Pro較量互有勝負。據(jù)小米方面透露,其自研NPU架構(gòu)也實現(xiàn)了不少細節(jié)創(chuàng)新。
華為海思的麒麟手機芯片雖仍然受限于工藝制程,卻在架構(gòu)和軟件系統(tǒng)層面尋找突破口,自研泰山大小核徹底擺脫Arm架構(gòu),基于自研鴻蒙操作系統(tǒng)的深度優(yōu)化連年實現(xiàn)整機性能的提升,AI功能落地速度甚至部分超過安卓旗艦機。
放眼全球,蘋果芯片在硬件性能方面已經(jīng)遇到不少有力挑戰(zhàn)者,在AI掉隊之下,如何基于芯片和系統(tǒng)優(yōu)勢實現(xiàn)AI體驗是蘋果當務(wù)之急;三星3nm工藝被曝良率堪憂,自家Exynos旗艦芯遲遲未能量產(chǎn)落地,內(nèi)部團隊動蕩,但其多年技術(shù)積累令其仍然是AI手機時代不可忽視的一股芯片力量。在終端大廠加碼布局自研芯片之時,高通、聯(lián)發(fā)科自然也感受到了壓力,高通自研Oryon架構(gòu)CPU進一步實現(xiàn)能效比的提升,聯(lián)發(fā)科連放AI開發(fā)工具大招力求用完善生態(tài)吸引AI開發(fā)者。
縱觀行業(yè),雖說做手機不一定是“得芯片者得天下”,但在AI手機時代強化對芯片技術(shù)的掌控,已悄然成為巨頭們的必然選擇。
▲六大主流手機AI芯片廠商旗艦SoC及工藝情況
從工藝制程到芯片架構(gòu),再到基于芯片的AI開發(fā)生態(tài),如今各家有哪些關(guān)鍵動作和布局,又有哪些臺上臺下的精彩較量?我們嘗試在這場AI芯片手機大戰(zhàn)中洞察到更多關(guān)鍵趨勢。
01.2nm被蘋果搶先包圓小米高通聯(lián)發(fā)科們要靠什么打贏“能效比”?
為何芯片對AI手機的體驗如此重要?性能和功耗表現(xiàn)可以說是一切功能想要真正落地前都必須要邁過的一道坎。對于移動智能設(shè)備來說,PPT中漂亮AI功能的實現(xiàn),前提都是不能以犧牲手機功耗、續(xù)航為基礎(chǔ),這是一條絕對的“紅線”。十幾年來,提升芯片能效一直是智能手機芯片行業(yè)迭代的重點,而在AI手機時代,這一需求顯得更為迫切。從工藝制程到芯片架構(gòu)設(shè)計,各家的競爭態(tài)勢愈發(fā)激烈。工藝方面,如今旗艦手機SoC的工藝制程已經(jīng)普遍來到了第二代3nm階段,包括蘋果、高通、聯(lián)發(fā)科、小米。當然,蘋果每年都會率先包圓臺積電最新最強的工藝,比如明年的2nm。蘋果分析師Jeff Pu提到,A19 Pro芯片會采用臺積電第三代3nm制程,蘋果最快會在明年的iPhone 18系列上引入臺積電2nm工藝。
臺積電董事長魏哲家在財報電話會上曾透露,臺積電寶山廠首批2nm產(chǎn)能已經(jīng)全部被蘋果包圓了。高通、聯(lián)發(fā)科、小米雖然不是第一批,但目前的旗艦芯片也都用上了蘋果“同款”工藝,三星這邊雖然自家集團中的半導體部門有著先進工藝制程技術(shù),但在量產(chǎn)和內(nèi)部管理方面卻頻頻“翻車”,甚至原計劃的3nm Exynos系列芯片直接難產(chǎn)。就在最近,三星的芯片業(yè)務(wù)被曝出偽造數(shù)據(jù)、掩蓋缺陷的丑聞,據(jù)報道,三星芯片工程師也紛紛跳槽到對家,可以說是“屋漏偏逢連夜雨”。相比三星工藝翻車,華為海思這邊則是承壓前行,由于代工受到限制,麒麟手機芯片無法用上最新工藝制程,在芯片能效比提升方面與同代采用新工藝的旗艦芯片會拉開一定差距,操作系統(tǒng)和軟件層面的優(yōu)化對整機性能提升貢獻較大。
整體來看,工藝制程的升級對芯片能效的提升固然十分重要,但工藝制程的進步在明顯放緩,手機能效比如果想要實現(xiàn)顛覆性提升,不能僅憑工藝升級。臺積電在2024年的IEDM會議上提到,同面積2nm芯片的晶體管數(shù)量比3nm芯片多15%,同功耗下芯片性能提升大約15%。在工藝之外,芯片設(shè)計層面、架構(gòu)層面等更多廠商可自主把控環(huán)節(jié)的技術(shù)創(chuàng)新就顯得更為重要,這也是各家能夠形成差異的一部分。
02.巨頭死磕自研架構(gòu)芯片設(shè)計掀起“真假自研大戰(zhàn)”
業(yè)內(nèi)普遍認為,在做AI手機這事上,蘋果有著軟硬件打通的先天優(yōu)勢——越深度全面地掌握底層技術(shù),就越容易最終實現(xiàn)整機更好的體驗。各家手機AI芯片的自研深度或許決定著其AI手機體驗的上限天花板。雖然自研芯片的優(yōu)勢不是絕對的,但強化對自研芯片技術(shù)的掌握,已經(jīng)成為目前手機芯片領(lǐng)域毋庸置疑的大勢所趨。具體來看,各家手機AI芯片自研模式有所不同,蘋果、華為、高通,基于Arm指令集,在SoC所有核心模塊實現(xiàn)自研;聯(lián)發(fā)科、小米、三星,基于Arm指令集,采用Arm公版架構(gòu)+部分模塊自研。
當然,不論是哪種模式,都是毫無疑問的“自研”。簡單來說,Arm指令集就像是芯片說的“語言”,但兩個人即便都用同樣的語言來寫文章,也會有“大學生論文”和“小學生作文”的差別。蘋果這邊的自研深度自然不必多說,甚至可以說是“斷檔式領(lǐng)先”。深度自研在AI方面實則能帶來不少優(yōu)勢,比如蘋果芯片的GPU模塊可以針對圖形處理和AI計算進行優(yōu)化,其神經(jīng)網(wǎng)絡(luò)引擎(NPU)更是蘋果獨特優(yōu)勢,對端側(cè)AI各類功能加速都進行了深度優(yōu)化。
華為雖然芯片工藝受限,但麒麟芯片的架構(gòu)卻一直在持續(xù)迭代。據(jù)了解,在最新的麒麟9020這一代上,華為已經(jīng)實現(xiàn)了CPU全部核心替換為自研泰山架構(gòu),從超大核到小核。而GPU方面也有其自研的馬良系列。
實際上,華為也是在麒麟9020這一代上才實現(xiàn)的完全核心模塊自研,此前9010的CPU小核依然用的Arm公版IP。在AI手機這波浪潮中,華為是手機行業(yè)中第一個將大模型能力用在手機上,實現(xiàn)自家智能助手升級的廠商,其自研麒麟芯片和自研鴻蒙操作系統(tǒng)的深度協(xié)同,讓華為即使在工藝制程受限的情況下,每年也能穩(wěn)定實現(xiàn)一定的整機性能提升,這對于AI體驗的落地也十分關(guān)鍵。
相較于蘋果華為這種“自產(chǎn)自銷”的廠商,高通作為三方芯片廠商,其自研芯片的特性多少會一定程度上掣肘于安卓系統(tǒng)。目前高通自研Oryon CPU已經(jīng)迭代至第二代,并大規(guī)模量產(chǎn)應(yīng)用在旗艦手機中,其自研的Adreno GPU也做了十幾年。Oryon CPU架構(gòu)的突破,幫高通在CPU單核、多核性能上都領(lǐng)先于同代聯(lián)發(fā)科旗艦SoC,在手機CPU能效方面穩(wěn)居第一梯隊。高通自研的Hexagon NPU,最新一代AI算力突破了80TOPS,據(jù)稱今年即將突破100TOPS,從算力絕對值層面來說,高通自研NPU有比較明顯的優(yōu)勢。聯(lián)發(fā)科、小米的CPU、GPU核心模塊都是基于Arm IP授權(quán)進行定制設(shè)計,均為Arm架構(gòu);三星的Exynos CPU雖然是Arm架構(gòu),但GPU卻采用了AMD的RDNA 3架構(gòu)。
ISP和NPU沒有“公版”之說,因此各家都是自研定制,比如ISP方面聯(lián)發(fā)科的Imagiq、小米的自研ISP;聯(lián)發(fā)科旗艦芯NPU有42TOPS算力,小米也有自研6核NPU。前段時間關(guān)于芯片“自研”的討論成為科技圈第一大話題,實際上,正如前文所說,芯片自研與否與是否采用了Arm架構(gòu)或Arm IP授權(quán)并無直接關(guān)系。一個手機SoC里面包含上百個IP模塊,如何讓各個模塊高效、低功耗地集成在一起,并保證其協(xié)同工作,還要實現(xiàn)差異化優(yōu)勢,這是真正的難點所在。一位芯片行業(yè)人士告訴智東西,最難的不是“自研”,而是真正把芯片設(shè)計的每一個細節(jié)吃透,做出一個成熟好用、性能功耗平衡優(yōu)秀的芯片,實際上,實現(xiàn)這件事的過程,就是在自研芯片??梢钥吹剑环矫?,自研芯片核心技術(shù)可以直觀地給產(chǎn)品帶來性能或體驗的優(yōu)勢,另一方面,芯片自研帶來的不僅是芯片產(chǎn)品本身,更是對一家廠商整個技術(shù)版圖的重要補全,對廠商優(yōu)化芯片與操作系統(tǒng)、大模型、應(yīng)用的協(xié)同都會有幫助。不做深度自研,很難像蘋果一樣實現(xiàn)人無我有的優(yōu)勢,強化手機AI芯片自研技術(shù),已經(jīng)成為行業(yè)的必然方向。
03.都說蘋果AI掉隊了怎么突然被蘋果“反將一手”?
正如前文所說,如今早已不是“唯TOPS論”的時代,隨著端側(cè)AI快速發(fā)展,AI應(yīng)用真正落地的能效表現(xiàn)成為行業(yè)關(guān)注焦點。優(yōu)秀模型一個接一個,但AI手機上的AI應(yīng)用能否高效利用端側(cè)AI大模型能力,如何在有限的能效內(nèi)更高效地運行AI,最終實現(xiàn)好的AI體驗,仍然存在很大優(yōu)化空間。在芯片本身過硬的基礎(chǔ)上,手機AI芯片的相關(guān)開發(fā)加速工具支持完善程度也十分關(guān)鍵。在這方面,蘋果在今年WWDC上,邁出了非常關(guān)鍵的一步——向所有App開放權(quán)限,允許App直接訪問蘋果智能核心的設(shè)備端大語言模型。
如何訪問?蘋果發(fā)布了基礎(chǔ)模型框架,也就是如今業(yè)內(nèi)常常被討論的蘋果開源機器學習框架(MLX),讓開發(fā)者可以使用蘋果的模型,開發(fā)工具層面的App Intents則讓開發(fā)者能在整個系統(tǒng)中關(guān)聯(lián)自己App的內(nèi)容和功能。具體來看,蘋果MLX支持Python、C++、C和Swift等多種主流編程語言,根據(jù)GitHub信息,其API對于開發(fā)者來說熟悉易用,同時支持函數(shù)變換的組合性、延遲計算模式、動態(tài)圖構(gòu)建、跨設(shè)備運行能力以及統(tǒng)一內(nèi)存模型。在性能方面,跟傳統(tǒng)的機器學習框架相比,蘋果MLX內(nèi)存?zhèn)鬏旈_銷為零拷貝,同時對蘋果芯片GPU計算能力進行了優(yōu)化,未來MLX可以直接調(diào)用ANE專用指令集,而其他框架大多是間接支持或有限支持;動態(tài)圖響應(yīng)速度方面,MLX能達到毫秒級,PyTorch為秒級,TensorFlow則需分鐘級。
對于開發(fā)者們來說,MLX的實時錯誤追蹤比傳統(tǒng)靜態(tài)圖框架快3-5倍,85%的NumPy/PyTorch代碼可直接遷移,并且還可以利用蘋果芯片統(tǒng)一架構(gòu)減少跨平臺適配工作。可以說,蘋果MLX是全流程的開源框架,從模型訓練到推理的端側(cè)優(yōu)化,并且深度整合了自家的硬件。安卓陣營中雖然沒有能完全對標蘋果MLX的開源機器學習框架,但在開發(fā)者提效降本方面也都發(fā)布了各自的軟件平臺或開發(fā)工具。安卓陣營的芯片廠商更多通過閉源SDK或開源協(xié)作的方式支持AI開發(fā)。比如高通的AI軟件棧,可以讓開發(fā)者在手機上市幾個月前,通過高通Device Cloud,基于驍龍8 Elite開發(fā)AI應(yīng)用服務(wù),進行調(diào)試、優(yōu)化。AI應(yīng)用可以通過ONNX、DirectML等框架和高通AI軟件棧,實現(xiàn)NPU的加速。
聯(lián)發(fā)科這邊則有天璣開發(fā)工具集(Dimensity Development Studio),比如其中的Neuron Studio能基于神經(jīng)網(wǎng)絡(luò)進行自動化調(diào)優(yōu),幫開發(fā)者進行跨模型的全鏈路分析,節(jié)省調(diào)優(yōu)時間。
此外,聯(lián)發(fā)科的天璣AI開發(fā)套件2.0,通過開源彈性架構(gòu)提升開放度,模型庫適配的模型數(shù)量提升了3.3倍,對DeepSeek這樣的熱門模型的關(guān)鍵技術(shù)實現(xiàn)端側(cè)支持,提升tokens的生產(chǎn)速度??傮w來看,讓AI芯片的能力可以被開發(fā)者高效地用到AI應(yīng)用中,實現(xiàn)更好的端側(cè)AI體驗,這事目前仍然只有蘋果做的是最完善的,安卓陣營并非不做,但生態(tài)層面的不統(tǒng)一、各自為戰(zhàn)仍然會帶來很大挑戰(zhàn)。
04.結(jié)語:手機AI芯片之戰(zhàn)不能輸?shù)挠舱?/strong>
在AI手機高歌猛進之下,手機AI芯片走到了舞臺C位,成為巨頭兵家必爭之地。雖然蘋果看似在AI功能落地的“豐富度”上少了些驚艷感,但仔細梳理卻能看到其AI功能端側(cè)實現(xiàn)占比極高,其從底層芯片、操作系統(tǒng)到大模型、應(yīng)用的打通,是安卓陣營極難段時間追趕的。
蘋果AI誠然有其內(nèi)部深層次問題,從團隊到技術(shù),但歸根結(jié)底,蘋果依然按照他最擅長的做法——小步快跑,來做AI,蘋果確實在“架橋鋪路”上花費了更多時間,但一旦打好地基,AI大廈的上限將充滿巨大想象空間。這也是安卓陣營從終端廠商到芯片廠商都不斷加碼芯片自研技術(shù)布局的重要性所在。
真正好的端側(cè)AI體驗,離不開這些底層技術(shù)的支撐。毫無疑問,AI的到來給手機芯片市場注入了新的活力,帶來了新的變量,能否做出好的手機AI芯片將成為決勝AI手機之戰(zhàn)的關(guān)鍵。
(本文系網(wǎng)易新聞?網(wǎng)易號特色內(nèi)容激勵計劃簽約賬號【智東西】原創(chuàng)內(nèi)容,未經(jīng)賬號授權(quán),禁止隨意轉(zhuǎn)載。)