隨著AI滲透至每一個終端,每一個機器,每一個人的生活,AI不再是“中心計算”的專屬特權(quán),而將成為一個社會級智能系統(tǒng)的組成部分。要實現(xiàn)這一愿景,關(guān)鍵在于是否有足夠便宜、足夠高效、足夠靈活的“算力基建”。
2025年5月,在第十五屆松山湖中國IC創(chuàng)新高峰論壇現(xiàn)場,圍繞AI基礎(chǔ)設(shè)施與邊緣計算展開的技術(shù)分享接連登場。
愛芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉
愛芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉介紹了邊緣AI芯片AX8850的技術(shù)架構(gòu)與實際應(yīng)用,更從底層計算邏輯出發(fā),重新定義了AI處理器在“普惠AI”時代的角色。通過AX8850這類產(chǎn)品,愛芯元智正試圖打通AI應(yīng)用最后一公里,推動從“能用AI”到“用得起AI”的產(chǎn)業(yè)躍遷。
AI正成為基礎(chǔ)設(shè)施
不同于前幾年將算力集中在云端、交互局限于“文字與語音”的形式,如今AI開始嵌入攝像頭、機器人、無人設(shè)備,完成從“認知到執(zhí)行”的具身轉(zhuǎn)化。AI開始成為一種“有形的基礎(chǔ)設(shè)施”,其普及程度與用水、用電的公共資源相提并論。
“我們希望把算力做得更經(jīng)濟,真正實現(xiàn)‘普惠AI’,讓智能變得更加可及?!痹趧⒔▊タ磥?,AI本質(zhì)上正在成為一種穩(wěn)定可靠的智能輸出基建。它的作用是將物理世界數(shù)字化——但不同于傳統(tǒng)意義上對數(shù)值和符號的采集,AI能對視頻、圖像、行為、空間結(jié)構(gòu)等進行高維度的理解和重構(gòu),從而讓終端實現(xiàn)更深層次的自動化與智能協(xié)同。
他指出,這種智能輸出基礎(chǔ)設(shè)施的核心驅(qū)動力,并不是算法的花哨程度,而是算力的成本與能效比。只有當“1元錢”的算力能跑出足夠多的推理量,才能真正讓AI走向“水電化”部署的可能。
AI是一種新的“程序范式”
在傳統(tǒng)計算架構(gòu)中,程序是由開發(fā)者制定規(guī)則,依靠流程與邏輯來推動的。然而AI程序不同,它是數(shù)據(jù)驅(qū)動的。開發(fā)者只需設(shè)計好網(wǎng)絡(luò)結(jié)構(gòu),模型的行為和性能則由數(shù)據(jù)訓(xùn)練來決定。這種范式的改變,對底層算力提出了完全不同的要求。
劉建偉系統(tǒng)地分析了AI程序的兩個底層邏輯:
以Tensor為核心的計算模型:AI程序的最小計算單位不再是標量或低維向量,而是高維Tensor,常見于卷積、歸一化、注意力機制等神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中。這些數(shù)據(jù)結(jié)構(gòu)往往是千維、萬維,導(dǎo)致計算密度呈指數(shù)級增長。
數(shù)據(jù)驅(qū)動的連續(xù)流處理:AI并不適合傳統(tǒng)CPU所擅長的跳轉(zhuǎn)密集型任務(wù),而更適配于類似圖形渲染的數(shù)據(jù)流處理模式。這種特點也促使GPU在AI早期階段成為主流推理平臺。
但GPU并不是AI應(yīng)用的終點。它的通用性在云端足夠強大,但在邊緣部署中往往存在成本高、功耗大、體積受限等情況。于是,為AI而生的NPU(神經(jīng)網(wǎng)絡(luò)處理器)應(yīng)運而生。
AX8850正是愛芯元智在這一背景下,結(jié)合多年量產(chǎn)打磨的自研核心技術(shù) AI-ISP與混合精度NPU,推出的旗艦級邊緣AI SoC產(chǎn)品。
10倍能效比提升,AX8850的“性價比”優(yōu)勢
AX8850并不是追求單純的“峰值性能”或者“參數(shù)堆疊”,而是針對邊緣部署需求,在架構(gòu)、指令集、內(nèi)存訪問方式等多個維度進行“算力性價比”的極致優(yōu)化。
其架構(gòu)采用了基于算子指令集的數(shù)據(jù)流微架構(gòu)設(shè)計。在AI語義中,“算子”如同神經(jīng)網(wǎng)絡(luò)的基本構(gòu)件(Conv、LayerNorm、Attention等),AX8850直接將這些算子作為硬件調(diào)度的執(zhí)行單元。相比通用CPU通過匯編指令控制每一條數(shù)據(jù)路徑的處理方式,這種“以算子為中心”的架構(gòu)更貼合AI程序的運行模式。
其次,AX8850采用異構(gòu)多核、多線程處理架構(gòu),可根據(jù)任務(wù)類型自動調(diào)用CNN、BEV、Transformer等不同模型結(jié)構(gòu)。同時,原生支持DeepSeek、Qwen、LLaMA等主流輕量化大模型,并內(nèi)嵌量化與剪枝優(yōu)化算法,確保大模型在邊緣側(cè)流暢運行。
最重要的是能效比的提升——AX8850相較于同等GPU方案實現(xiàn)了約10倍的能效比優(yōu)勢。這意味著,原來需要通過高性能GPU完成的AI任務(wù),如今在一塊成本更低、體積更小的芯片上也能輕松運行。
AX8850的強大算力并非停留在實驗室,其真正價值在于為邊緣AI提供可落地的“智價比基建”。
在此次論壇中,劉建偉展示了多個AX8850的真實應(yīng)用場景:
語義感知與圖生文生成:芯片可實時理解視頻畫面中的人物行為,并結(jié)合語音或文本輸入生成描述性內(nèi)容,實現(xiàn)“環(huán)境理解+語義表達”的閉環(huán)。例如,識別“穿紅衣服的人走進房間”并自動生成對應(yīng)提示;
多輪對話與機器人情緒表達:AX8850可嵌入人機交互系統(tǒng)中,實現(xiàn)多輪對話控制,同時根據(jù)語境生成圖像反饋,表達情緒狀態(tài)或控制機器執(zhí)行動作——這是“人機交互+行動執(zhí)行”的典型具身智能場景;
視頻級聯(lián)感知與事件判斷:在智慧城市、智能家居、看護等領(lǐng)域,AX8850支持連續(xù)視頻幀的深度分析,如跌倒檢測、異常行為判斷等,通過時間線索提升感知準確性;
多攝像頭與毫米波融合感知:支持多視角攝像頭融合構(gòu)建三維感知,還能接入4D毫米波雷達數(shù)據(jù),在視覺受限場景下補全目標檢測信息,提高感知魯棒性;
DeepSeek類大模型邊緣部署:可在低功耗條件下運行Transformer類大模型,適配掃地機器人、巡檢無人機、車載娛樂等場景中的AI助手。
這些案例共同指向一個趨勢——邊緣AI不再只是圖像識別和簡單推理,而正在邁向“認知+執(zhí)行”的高階智能階段。
AX8850的軟件工具生態(tài)鏈
AI處理器的價值,不僅取決于芯片的硬件性能,還高度依賴其軟件生態(tài)的配合程度。劉建偉在演講中也明確指出,愛芯元智在軟件工具鏈上的投入已持續(xù)多年,涵蓋模型轉(zhuǎn)換、編譯優(yōu)化、運行時調(diào)度、硬件加速等全流程。AX8850支持主流深度學(xué)習(xí)框架(如PyTorch、TensorFlow等),并提供適配自家NPU的優(yōu)化編譯器,方便開發(fā)者一鍵部署模型。同時在推理引擎層面,支持動態(tài)調(diào)度、數(shù)據(jù)流圖優(yōu)化、精度感知執(zhí)行等關(guān)鍵功能,確保模型運行時達到最佳功耗與響應(yīng)速度平衡。更重要的是,軟件棧通過持續(xù)升級,保證了芯片與前沿AI算法的同步發(fā)展,為未來應(yīng)用場景預(yù)留擴展空間。