為什么最近一兩年GPU芯片公司啟動(dòng)IPO的越來越多?分析完文末給答案。
目前燧原科技、壁仞、摩爾線程等都在輔導(dǎo)IPO。16號(hào)沐曦正式啟動(dòng)A股上市進(jìn)程。今天我們看看AI芯片市場(chǎng),以及GPGPU公司-沐曦。
首先了解一下AI芯片的概念,實(shí)際上所有面向人工智能領(lǐng)域的芯片都可以稱為 AI 芯片。
廣義上講,目前市場(chǎng)上說的AI 芯片,主要指用于處理人工智能應(yīng)用場(chǎng)景中大量計(jì)算任務(wù)的模塊,除了以 GPU、FPGA、ASIC 為代表的 AI 加速芯片,還有比較前沿性的研究,例如:類腦芯片、可重構(gòu)通用 AI 芯片等。
狹義上AI 芯片指的是針對(duì)人工智能算法做了特殊加速設(shè)計(jì)的芯片。以 AI 芯片為載體實(shí)現(xiàn)的算力是人工智能發(fā)展水平的重要衡量標(biāo)準(zhǔn),發(fā)展更注重超速運(yùn)算能力的 AI 芯片成為推動(dòng)人工智能產(chǎn)業(yè)爆發(fā)的關(guān)鍵核心要素之一,其快速發(fā)展對(duì)人工智能技術(shù)的進(jìn)步和行業(yè)應(yīng)用起到了決定性的作用。
目前AI芯片主要有下面幾類形式:
AI 芯片的興起源于 AI 對(duì)算力的高需求。算力是實(shí)現(xiàn) AI 產(chǎn)業(yè)化的核心力量,隨著人工智能應(yīng)用場(chǎng)景的不斷拓展和數(shù)據(jù)規(guī)模的急劇增長(zhǎng),算法模型的參數(shù)量呈指數(shù)級(jí)增加,特別是深度學(xué)習(xí)成為當(dāng)前 AI 研究和運(yùn)用的主流方式,加速計(jì)算成為不可或缺的需求。
雖然 CPU 可以執(zhí)行 AI 算法,但因?yàn)镃PU內(nèi)部有大量其他邏輯,比如控制單元,而這些邏輯對(duì)于 AI 算法來說是用不上的,所以,使用 CPU 并不能達(dá)到最優(yōu)的性價(jià)比。因此,AI 芯片應(yīng)運(yùn)而生,它們被設(shè)計(jì)出來適配海量并行計(jì)算能力,進(jìn)而可以加速 AI 計(jì)算。
AI 芯片的維度。根據(jù)部署位置(云端、終端)和承擔(dān)任務(wù)(訓(xùn)練、推理)的不同,可以劃分出 AI 芯片的市場(chǎng)領(lǐng)域。比如百度的昆侖芯、字節(jié)的AI芯片等都是云端的芯片。
根據(jù)部署的位置不同,AI 芯片可以分為:云側(cè)AI 芯片、端側(cè)AI 芯片。
云端即數(shù)據(jù)中心,在深度學(xué)習(xí)的訓(xùn)練階段需要極大的數(shù)據(jù)量和大運(yùn)算量,單一處理器無法獨(dú)立完成,因此訓(xùn)練環(huán)節(jié)只能在云端實(shí)現(xiàn)。
云端 AI 芯片的特點(diǎn)是性能強(qiáng)大,同時(shí)能夠支持大量運(yùn)算、并且能靈活地支持圖片、語音、視頻等不同 AI 應(yīng)用?;谠?AI 芯片的技術(shù),能讓各種智能設(shè)備和云端服務(wù)器進(jìn)行快速的連接,并且連接能夠保持最大的穩(wěn)定。
終端即手機(jī)、安防攝像頭、汽車、智能家居設(shè)備、各種 IoT 設(shè)備等執(zhí)行邊緣計(jì)算的智能設(shè)備。終端的數(shù)量龐大,而且需求差異較大。
端 AI 芯片的特點(diǎn)是體積小、耗電少,而且性能不需要特別強(qiáng)大,通常只需要支持一兩種 AI 能力。
根據(jù)承擔(dān)任務(wù)的不同,AI 芯片可以分成:訓(xùn)練芯片、推理芯片。
訓(xùn)練芯片主要用于構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,即用大量標(biāo)記過的數(shù)據(jù)來“訓(xùn)練”相應(yīng)的系統(tǒng),使之可以適應(yīng)特定的功能。訓(xùn)練需要極高的計(jì)算性能,需要較高的精度,需要能處理海量的數(shù)據(jù),需要有一定的通用性,以便完成各種各樣的學(xué)習(xí)任務(wù)。對(duì)于訓(xùn)練芯片來說,更注重絕對(duì)的計(jì)算能力;
推理芯片主要用于利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行推理預(yù)測(cè),指利用訓(xùn)練好的模型,使用新數(shù)據(jù)推理出各種結(jié)論。即借助現(xiàn)有神經(jīng)網(wǎng)絡(luò)模型進(jìn)行運(yùn)算, 利用新的輸入數(shù)據(jù)來一次性獲得正確結(jié)論的過程。推理芯片更注重綜合指標(biāo),需要全面考慮單位能耗算力、時(shí)延、成本等等。
第一波人工智能浪潮是基于 ASIC(專用集成電路)架構(gòu)。在算法穩(wěn)定的情況下,專用芯片的性能和功耗優(yōu)勢(shì)顯而易見,能夠滿足企業(yè)對(duì)極致算力和能效的需求。然而,下游 AI 算法的演進(jìn)速度遠(yuǎn)遠(yuǎn)超過了人們的想象。專用芯片在特定場(chǎng)景下能夠?qū)崿F(xiàn)更高的算力和能效,但難以適應(yīng)算法種類快速增加和迭代速度的情況。因此,通用性更強(qiáng)的 GPGPU(通用圖形處理器)長(zhǎng)期是 AI 芯片的首選。
第二波浪潮中主流技術(shù)路徑是 GPGPU(通用 GPU)。國(guó)內(nèi)初創(chuàng)公司集中于2017 年-2020 年期間啟動(dòng)自研 GPGPU 芯片的研發(fā),其中誕生了不少公司,壁仞、沐曦等都在這里面。由于 GPGPU 難解高功耗與低算力利用率問題,ASIC 和 GPGPU 在應(yīng)對(duì)生成式 AI 及大模型正對(duì)算力基礎(chǔ)設(shè)施提出的新要求時(shí)都顯得有些捉襟見肘。
第三波浪潮的基礎(chǔ)是存算一體等新興技術(shù)。不同于 ASIC 與 GPGPU,這些新興技術(shù)路線跳出了馮·諾依曼架構(gòu)體系,理論上擁有得天獨(dú)厚的高能效比優(yōu)勢(shì),又能繞過先進(jìn)制程封鎖,兼顧更強(qiáng)通用性與更高性價(jià)比,算力發(fā)展空間巨大。隨著新型存儲(chǔ)器件走向量產(chǎn),存算一體 AI 芯片已經(jīng)挺進(jìn) AI 大算力芯片落地競(jìng)賽。
國(guó)內(nèi)各科技巨頭都在這個(gè)領(lǐng)域展開布局。例如,百度于 2011 年成立了昆侖芯,開始探索芯片領(lǐng)域;阿里巴巴在 2018 年成立了平頭哥,其中含光就是專注于 AI 芯片,字節(jié)也在近幾年做云端的AI芯片研發(fā),涉足芯片領(lǐng)域。
國(guó)內(nèi) AI芯片廠商以中小公司為主,多集中于設(shè)備端 AI ASIC 的開發(fā),其中寒武紀(jì)成為全國(guó) AI 芯片領(lǐng)域獨(dú)角獸公司。
全球 GPU 領(lǐng)域處于寡頭壟斷的局面,市場(chǎng)由英特爾、英偉達(dá)和AMD 三分天下。英偉達(dá)憑借其自身 CUDA 生態(tài)占據(jù)絕對(duì)主導(dǎo)地位。從細(xì)分市場(chǎng)來看,英偉達(dá)和 AMD 在獨(dú)立 GPU 芯片市場(chǎng)基本包攬全場(chǎng),英特爾占比極小。
GPGPU 方面,國(guó)內(nèi)外廠商仍存在較大差距。
制程方面,目前 Nvidia 已率先到達(dá) 4nm,國(guó)內(nèi)廠商多集中在 7nm;算力方面,國(guó)內(nèi)廠商大多不支持雙精度(FP64)計(jì)算,在單精度(FP32)及定點(diǎn)計(jì)算(INT8)方面與國(guó)外中端產(chǎn)品持平;
生態(tài)方面,與 Nvidia CUDA 的成熟生態(tài)相比,差距較為明顯。海光 DCU 系列產(chǎn)品以 GPGPU架構(gòu)為基礎(chǔ),兼容通用的“類 CUDA”環(huán)境以及國(guó)際主流商業(yè)計(jì)算軟件和人工智能軟件,對(duì)標(biāo)目前國(guó)際主流 NVIDIA A100 產(chǎn)品,海光 DCU 單芯片產(chǎn)品基本能達(dá)到其70%的性能水平,但是公司 DCU 產(chǎn)品的片間互聯(lián)性能還有較大的提升空間。
以上關(guān)于AI芯片的介紹告一段落,下面看看沐曦這家公司。
沐曦于 2020 年 9 月成立于上海,致力于為異構(gòu)計(jì)算提供全棧 GPU 芯片及解決方案,可廣泛應(yīng)用于人工智能、智慧城市、數(shù)據(jù)中心、云計(jì)算、自動(dòng)駕駛、數(shù)字孿生、元宇宙等前沿領(lǐng)域,為數(shù)字經(jīng)濟(jì)發(fā)展提供強(qiáng)大的算力支撐。
沐曦的創(chuàng)始團(tuán)隊(duì)主要來自AMD。創(chuàng)始人陳維良是清華大學(xué)微電子學(xué)研究所碩士,曾長(zhǎng)期就職于AMD,擔(dān)任AMD全球GPGPU設(shè)計(jì)總負(fù)責(zé)人,負(fù)責(zé)全球通用計(jì)算GPU產(chǎn)品線的整體設(shè)計(jì)與管理,主導(dǎo)并完成15款高性能GPU產(chǎn)品的流片與量產(chǎn)
沐曦推出 MXN 系列 GPU(曦思)用于 AI 推理,MXC 系列 GPU(曦云)用于 AI 訓(xùn)練及通用計(jì)算,以及 MXG 系列 GPU(曦彩)用于圖形渲染,滿足數(shù)據(jù)中心對(duì)“高能效”和“高通用性”的算力需求。
沐曦產(chǎn)品均采用完全自主研發(fā)的 GPU IP,擁有完全自主知識(shí)產(chǎn)權(quán)的指令集和架構(gòu),配以兼容主流 GPU 生態(tài)的完整軟件棧(MXMACA),具備高能效和高通用性的天然優(yōu)勢(shì)。能夠?yàn)榭蛻魳?gòu)建軟硬件一體的全面生態(tài)解決方案,是“雙碳”背景下推動(dòng)數(shù)據(jù)中心建設(shè)和產(chǎn)業(yè)數(shù)字化、智能化轉(zhuǎn)型升級(jí)的算力基石。
我們看看沐曦的發(fā)展歷程!
下面是對(duì)沐曦合作的情況進(jìn)行分享,這也是很重要的部分,主要適合百度、優(yōu)刻得等公司的合作,整理于官網(wǎng)以及公開渠道。
詳細(xì)介紹完,我們?cè)賮碚f一下,為什么很多芯片公司都要上市!
因?yàn)闆]有錢,公司的發(fā)展是從投資人拿錢,前幾年基本上都是靠著融資活著,如果沒有融資,自己有沒有造血能力,那大部分公司就會(huì)發(fā)不起工資導(dǎo)致欠薪或裁員甚至解散,去年有很多芯片公司就是這樣,就不列舉了。
幾年之后,公司越來越龐大,之前融資太多,再想融資以及相當(dāng)困難,因?yàn)橥瑯?0億,幾年前投資的,可能拿了很多股份占比,現(xiàn)在投資卻只能拿很少一部分,回報(bào)低風(fēng)險(xiǎn)高,所以越來越多投資機(jī)構(gòu)不會(huì)投這種公司,反而會(huì)投一下些早期的公司。
沒有了融資的錢,自己造血能力又不足,怎么辦呢?就到股市去找錢!
如果想看市場(chǎng)機(jī)會(huì),及時(shí)聯(lián)系我,基本都能內(nèi)推和輔導(dǎo)推薦!??!
更多芯片行業(yè)精彩,關(guān)注一起學(xué)習(xí)、成長(zhǎng)