佐思汽研發(fā)布《2025年高通汽車業(yè)務(wù)分析 暨 汽車新四化每周觀察2025年4月第4期》。
DeepSeek引入強(qiáng)化學(xué)習(xí)和知識蒸餾技術(shù),將大模型能力遷移至輕量化模型,使端側(cè)設(shè)備能運行更高性能的模型。
通過技術(shù)降本增效、開源生態(tài)共建,DeepSeek不僅加速了端側(cè)AI的快速發(fā)展,還重新定義了智能終端的交互邏輯。其核心價值在于將云端大模型能力“下沉”至終端,推動AI從集中式向分布式演進(jìn),為隱私安全、實時響應(yīng)和個性化服務(wù)提供了新的可能性。
黃仁勛在CES 2025的演講中提出:“AI的未來不應(yīng)該僅限于云端,而是應(yīng)該無處不在”。無處不在的AI就是端側(cè)AI。
端側(cè)AI大模型相比云端模型具有多方面的優(yōu)勢:
隱私:在隱私保護(hù)方面,數(shù)據(jù)無需上傳至云端,用戶的敏感信息可以完全保留在設(shè)備內(nèi);
響應(yīng)速度:端側(cè)模型消除了網(wǎng)絡(luò)傳輸延遲,能夠?qū)崿F(xiàn)毫秒級的響應(yīng);
個性化體驗:本地模型可以根據(jù)用戶習(xí)慣持續(xù)學(xué)習(xí)調(diào)整,提供更貼合個人需求的服務(wù);
能效:避免了數(shù)據(jù)傳輸的能耗,整體能效更高;
網(wǎng)絡(luò)依賴性:端側(cè)模型可以在離線狀態(tài)下持續(xù)工作,不受網(wǎng)絡(luò)質(zhì)量波動影響。
端側(cè)AI需要找到理想載體,它既能提供足夠的算力、電力和散熱能力,又具有移動性。汽車正是這樣一個理想的候選者。
一、端側(cè)AI在汽車領(lǐng)域的應(yīng)用潛力
智能駕駛:實時決策與安全性提升
當(dāng)車輛在高速公路上行駛時,前方突然出現(xiàn)障礙物。傳統(tǒng)依賴云端的系統(tǒng)可能需要300毫秒才能作出反應(yīng),而這段時間足以讓車輛前進(jìn)近10米。而搭載端側(cè)AI的智能汽車可將反應(yīng)時間縮短至30毫秒以內(nèi),這種"零延遲"體驗不僅提升了駕駛安全性,更重塑了人車交互的全新體驗。
智能座艙:個性化交互升級,滿足數(shù)據(jù)保密需求
本地部署的端側(cè)AI(如面壁智能cpmGO(小鋼炮超級助手))支持語音、圖像、情緒識別融合,實現(xiàn)“零延遲”的座艙服務(wù)(如自動調(diào)節(jié)空調(diào)、閱讀燈)。同時,端側(cè)AI在本地處理個人數(shù)據(jù),避免上傳云端,滿足用戶對行車數(shù)據(jù)安全的需求。
端側(cè)AI在汽車的潛在應(yīng)用領(lǐng)域包括:
整理:佐思汽研
二、芯片公司紛紛發(fā)力端側(cè)AI
2025年4月,意法半導(dǎo)體(ST)收購加拿大AI初創(chuàng)公司Deeplite。Deeplite被稱為邊緣AI的DeepSeek,該公司在模型優(yōu)化、量化和壓縮方面有獨特技術(shù),可使AI大模型在邊緣設(shè)備上運行得更快、更小、更節(jié)能。Deeplite的優(yōu)化、量化和壓縮深度學(xué)習(xí)模型技術(shù),無疑能夠加速ST的首款高性能STM32N6 MCU的采用。
2025年3月,高通宣布將收購邊緣 AI 開發(fā)平臺 Edge Impulse。此次收購使超過17萬名開發(fā)者能夠為廣泛的邊緣AI應(yīng)用和硬件創(chuàng)建、部署人工智能模型。
2025年2月,NXP宣布將收購高性能、高能效和可編程離散神經(jīng)處理單元(NPU)的行業(yè)領(lǐng)導(dǎo)者 Kinara。Kinara 的分立式 NPU(包括 Ara-1 和 Ara-2)在性能和能效方面處于行業(yè)領(lǐng)先地位。這使它們成為視覺、語音、手勢和各種其他生成式 AI 驅(qū)動的多模式實現(xiàn)等新興 AI 應(yīng)用的首選解決方案。這兩款設(shè)備均采用創(chuàng)新架構(gòu),支持映射推理圖,以便在 Kinara 的可編程專有神經(jīng)處理單元上高效執(zhí)行,從而最大限度地提高邊緣 AI 性能。
三、高通在端側(cè)AI的布局與優(yōu)勢
2024-2025年,高通在端側(cè)AI領(lǐng)域全面發(fā)力,一方面推出性能強(qiáng)大的AI芯片,另一方面推出完善的AI工具鏈。
芯片方面,高通最新的至尊版驍龍汽車平臺,專門為汽車定制了Oryon CPU,其速度相比前代提升至3倍,同時還配備了面向汽車應(yīng)用設(shè)計的Adreno GPU,性能也提升了3倍。而在AI方面,全新平臺集成了專用的神經(jīng)網(wǎng)絡(luò)處理器(NPU),針對多模態(tài)AI設(shè)計,其性能目標(biāo)是前代座艙平臺的12倍。
2025年4月,偉世通推出的cognitoAI高性能座艙系統(tǒng),搭載偉世通自主研發(fā)的汽車人工智能框架——cognitoAI與高通驍龍座艙平臺至尊版(SA8397)。偉世通cognitoAI高性能座艙系統(tǒng)采用與高通聯(lián)合開發(fā)的混合多模態(tài)AI架構(gòu),整合語音、攝像頭信息與車輛數(shù)據(jù),并通過先進(jìn)大語言模型(LLM)實現(xiàn)主動式情境感知交互。所有模型均通過高通AI推理引擎(QNN)進(jìn)行量化與優(yōu)化,并運行于專為邊緣推理優(yōu)化的驍龍?座艙平臺至尊版Hexagon NPU。這一端到端AI解決方案可高效處理預(yù)測性建議、環(huán)境感知與多模態(tài)推理等復(fù)雜任務(wù)。
除了AI芯片,高通還推出完善的AI工具鏈:AI Hub,AI Stack, AI Orchestrator等。
高通AI Stack(軟件棧)旨在幫助開發(fā)者實現(xiàn)一次開發(fā),即可跨高通所有硬件運行AI負(fù)載。高通AI軟件棧全面支持主流AI框架,比如 TensorFlow、PyTorch、ONNX 和Keras,以及包括TensorFlow Lite、TensorFlow Lite Micro 和ONNX Runtime 等在內(nèi)的runtime。此外,它還集成了推理軟件開發(fā)包(SDK),比如廣受歡迎的高通神經(jīng)網(wǎng)絡(luò)處理SDK,包括面向Android、Linux和Windows的不同版本。
高通開發(fā)者庫和服務(wù)支持最新編程語言、虛擬平臺和編譯器。在更底層,高通的系統(tǒng)軟件集成了基礎(chǔ)的實時操作系統(tǒng)(RTOS)、系統(tǒng)接口和驅(qū)動程序。還支持廣泛的操作系統(tǒng)( 包 括 Android、Windows、Linux和 QNX),以及用于部署和監(jiān)控的基礎(chǔ)設(shè)施( 比如 Prometheus、Kubernetes和 Docker)。
來源:高通
高通在端側(cè)AI領(lǐng)域的布局與優(yōu)勢如下:
整理:佐思汽研
總之,端側(cè)AI正從技術(shù)探索邁向規(guī)?;涞?,其核心價值在于實時性、隱私性與場景適配能力。汽車領(lǐng)域作為關(guān)鍵賽道,已通過智能駕駛與座艙革新展現(xiàn)巨大潛力。高通憑借芯片-軟件-生態(tài)的全鏈路布局,成為端側(cè)AI落地的核心推手。