Deepseek已經(jīng)火了個把月。
它的出現(xiàn)提升了普羅大眾對于大模型的認可度,改變了大模型的行業(yè)格局,讓豆包、Kimi等競品有些黯然失色。對于下游終端而言,Deepseek的最大作用,或是加快了端側(cè)AI落地應(yīng)用的步伐。
在最近一段時間內(nèi),市場已經(jīng)在給出“2025是端側(cè)AI應(yīng)用元年”之類的概念,而在此之前還在搖旗吶喊“2024是端側(cè)AI元年”。概念的更迭在一定程度上顯現(xiàn)出市場對新鮮事物的敏銳性,也同樣反映了Deepseek對于端側(cè)AI的推動作用。
那么,端側(cè)AI如今的實際發(fā)展處于什么階段?在應(yīng)用落地過程中還有哪些需要解決的問題?
Vol.1/? ?什么是端側(cè)AI
當(dāng)前我們所熟知的Deepseek、ChatGPT、文心一言、通義千問及Kimi等語言大模型皆屬于云端AI范疇。一般而言,云端AI從終端采集信息,再將信息通過網(wǎng)絡(luò)傳輸?shù)皆浦行膫?cè)進行后續(xù)處理,再輸出到終端。所謂端側(cè)AI,則是在終端設(shè)備上直接運行人工智能算法 ,讓設(shè)備具備智能化處理和決策的能力。而終端設(shè)備則包括智能手機、電腦、智能家居、可穿戴設(shè)備等等,所以與AI結(jié)合后也衍生出了AI手機、AI PC、AI眼鏡等概念。
由于可以在本地設(shè)備完成數(shù)據(jù)處理、分析與輸出,少了上傳云端這一環(huán)節(jié),端側(cè)AI的響應(yīng)速度更快,可以離線使用,只要設(shè)備算力支持,基本上不會有“服務(wù)器繁忙,請稍后再試”的情況出現(xiàn)。
不過,此前將大模型“搬運”至終端設(shè)備往往遇到一個問題,那便是大語言模型內(nèi)置參數(shù)多達百億千億,而PC、智能手機等設(shè)備的算力是有限的,還需要考慮內(nèi)存容量、內(nèi)存寬度及功耗等因素,所以端側(cè)與AI的融合并不算好。我們?nèi)粘J褂玫闹悄苁謾C或電腦等設(shè)備,有時候就算多同時運行幾個應(yīng)用或者對設(shè)備配置要求比較高的游戲時,都會卡成“PPT”,更別提搭載大模型了。
就在從業(yè)者等著產(chǎn)業(yè)鏈上下游聚力進行系統(tǒng)級優(yōu)化(硬件、算法、大模型之間的協(xié)同),抱著幾年后才能實現(xiàn)端側(cè)AI高效落地的想法時,Deepseek的橫空出世給業(yè)界提供了解題思路。一方面,Deepseek蒸餾和量化出來的端側(cè)模型最小參數(shù)規(guī)模為1.5B,可以與當(dāng)前大多數(shù)智能手機、PC實現(xiàn)硬件無縫銜接;另一方面,通過優(yōu)化模型架構(gòu),Deepseek的動態(tài)異構(gòu)計算框架支持端側(cè)芯片內(nèi)多種計算單元的協(xié)同調(diào)度來解決硬件配置碎片化難題。
“Deepseek的出現(xiàn)無疑為端側(cè)AI的推進帶來了諸多積極作用。”芯??萍枷蛐編煚敱硎?,首先,端側(cè)AI的發(fā)展是技術(shù)進步的必然趨勢。隨著人工智能技術(shù)的不斷發(fā)展,越來越多的應(yīng)用場景需要本地化的智能處理能力,以減少數(shù)據(jù)傳輸延遲、保護用戶隱私并降低對云服務(wù)的依賴。
“AI發(fā)展之路依然漫長,從云到端將會是一個新的發(fā)展趨勢?!本嫘究萍挤矫嫱瑯诱J為當(dāng)下端側(cè)AI的發(fā)展是大趨勢,會給半導(dǎo)體市場需求提供增長動力,也同時參考傳統(tǒng)計算在處理數(shù)據(jù)的演變歷史,AI處理將是云端與終端結(jié)合的混合式?!盎旌鲜紸I能實現(xiàn)A I的規(guī)模化擴展,并發(fā)揮其最大潛能?;旌螦 I架構(gòu)在云端和邊緣終端之間分配并協(xié)調(diào)A I工作負載,所以預(yù)測混合AI應(yīng)該會是AI的未來?!?/p>
Vol.2/? ?場景應(yīng)用加速落地 企業(yè)基于AI定義芯片
在AI發(fā)展的過程當(dāng)中,應(yīng)用場景落地是最為關(guān)鍵的一步。
“AI降本之后,終端應(yīng)用預(yù)計會有大的爆發(fā),繼續(xù)看好眼鏡、玩具、AI手機、AI PC等消費電子?!币患覈鴥?nèi)消費電子配套芯片公司人士接受《科創(chuàng)板日報》采訪時表示,盡管他們的產(chǎn)品在產(chǎn)業(yè)鏈幾乎最上游,但還是能感受到DeepSeek為智能終端行業(yè)帶來的積極影響。
或為搶占用戶心智和提升產(chǎn)品賣點,蘋果、谷歌、榮耀、VIVO等公司均在2024年加強了在端側(cè)領(lǐng)域的投入。而在2025年的CES上,各大參展企業(yè)所展出的產(chǎn)品也都與AI強相關(guān),如手機、手表。耳機、音響、機器人、廚具等,但凡產(chǎn)品存在人機交互的空間,廠商都在做相應(yīng)的工作。
不過,此前受限于各種因素,端側(cè)與AI之間的融合并不成功。
以AI眼鏡為例,2024年發(fā)布的部分AI眼鏡疑似翻車。據(jù)多家媒體報道,受制于續(xù)航、散熱、價格高等因素,一些國產(chǎn)AI眼鏡的市場表現(xiàn)未能達到企業(yè)預(yù)期。另外,也因AI眼鏡所采用的SOC芯片與AI的匹配度有限,端側(cè)AI的使用體感一般。
值得一提的是,了解到軟硬件融合的重要性,蘋果、英特爾、高通、AMD等多家芯片企業(yè)巨頭已經(jīng)根據(jù)當(dāng)前AI發(fā)展的實際需要,推出了具備強大AI處理能力的芯片產(chǎn)品。例如蘋果A18 Pro芯片則搭載了16核神經(jīng)網(wǎng)絡(luò)引擎,提供了強大的AI運算能力,相比前代產(chǎn)品有了顯著提升,能夠支持多種AI特性。?驍龍8至尊版搭載了高通自研的Hexagon NPU,性能相比前代提升了最高12倍,支持多種精度的AI運算,能夠利用大型語言模型和動作模型,為端側(cè)AI提供強大的支持。
除蘋果、高通等海外芯片企業(yè)之外,國內(nèi)有哪些芯片企業(yè)推出了基于端側(cè)AI時代定義的芯片?
近幾個月,國內(nèi)的瑞芯微受益于端側(cè)AI概念,在二級市場有著非常亮眼的表現(xiàn),其市值一度超過800億元。據(jù)了解,瑞芯微部署AloT多年,開發(fā)的旗艦產(chǎn)品RK3588 系列非常契合端側(cè)AI的需要,集成了ARM四核Cortex-A76和四核Cortex-A55,內(nèi)置6T算力的NPU。能夠支持端側(cè)主流的 0.5B~3B 參數(shù)級別的模型部署。根據(jù)東北證券研報數(shù)據(jù),這款芯片系列已經(jīng)用用于AR眼鏡、平板電腦、新能源汽車等場景當(dāng)中。
據(jù)了解,炬芯科技面向電池驅(qū)動的低功耗IoT領(lǐng)域成功落地了第一代基于模數(shù)混合電路實現(xiàn)的SRAM based CIM(Mixed-mode SRAM based CIM,簡稱MMSCIM)在500MHz時實現(xiàn)了0.1TOPS的算力,并且達成了6.4TOPS/W的能效比。2024年,炬芯科技發(fā)布了全新一代基于MMSCIM端側(cè)AI音頻芯片,共三個芯片系列:第一個系列是 ATS323X,面向低延遲私有無線音頻領(lǐng)域;第二個系列是ATS286X,面向藍牙AI音頻領(lǐng)域;第三個系列是ATS362X,面向AI DSP領(lǐng)域。其中ATS323X有望最快在2025年上半年實現(xiàn)終端產(chǎn)品量產(chǎn)。
芯海科技同樣跟隨AI技術(shù)的發(fā)展,不斷推出能夠滿足市場需求的產(chǎn)品。在端側(cè)方面,芯海科技有集成了高精度ADC的傳感器信號調(diào)理芯片、BMS芯片、壓力觸控芯片等??傮w而言,在計算外圍產(chǎn)品生態(tài)中,芯海科技實現(xiàn)了從EC到PD、HapticPad、USB HUB、BMS的全方位產(chǎn)品布局,同時也完成了從AI PC到臺式機、工控機、邊緣計算及服務(wù)器的全面覆蓋。
Vol.3/? ?如何解決數(shù)據(jù)安全問題?
在端側(cè)AI火熱之時,還存在一個重要的隱患尚未解決——數(shù)據(jù)安全與隱私保護。
進入信息時代和智能時代為人們的生活工作帶來不少便利,但也存在不少副作用,隱私和信息泄露便是其中之一。據(jù)報道,近期一場規(guī)模巨大的物聯(lián)網(wǎng)(IoT)安全漏洞事件曝光了27億條包含敏感用戶數(shù)據(jù)的信息,其中包括Wi-Fi網(wǎng)絡(luò)名稱、密碼、IP地址和設(shè)備標(biāo)識符,這存在非常大的數(shù)據(jù)風(fēng)險,有可能被攻擊者利用。據(jù)Palo Alto Networks的威脅報告,之所以會發(fā)生這樣的事故,在于98%的物聯(lián)網(wǎng)設(shè)備數(shù)據(jù)未加密,57%的設(shè)備高度脆弱。
隨著邁入AI時代,原本尚未解決的數(shù)據(jù)安全和隱私保護問題正變得更加復(fù)雜,這其中涉及第三方大模型,手機終端廠商、大模型提供者和開發(fā)者等不同商業(yè)主體間的生態(tài)模式及責(zé)任邊界尚不清晰。盡管端側(cè)AI的概念當(dāng)中,數(shù)據(jù)可以在本地設(shè)備處理,經(jīng)過加密之后上傳至云端,無需擔(dān)憂個人隱私泄露的問題,較云端大模型更加安全。但實際上,端側(cè)AI并沒有辦法從根本上解決問題。
“從云端到端側(cè),每一個環(huán)節(jié)都可能成為數(shù)據(jù)泄露的薄弱環(huán)節(jié)。云端雖然擁有強大的數(shù)據(jù)處理能力,但一旦遭受攻擊,海量用戶數(shù)據(jù)將面臨巨大風(fēng)險。相比之下,端側(cè)AI在數(shù)據(jù)安全方面具有天然優(yōu)勢,但仍需警惕硬件層面的潛在漏洞。”炬芯科技方面向芯師爺坦言。
“主要歸因于第三方App介入時的隱私保護邊界模糊、無障礙權(quán)限的濫用、數(shù)據(jù)在端側(cè)云端和第三方AI之間流動復(fù)雜等因素。”芯??萍挤矫嬉蚕蛐編煚斨赋觯藗?cè)AI之所以無法再根本上杜絕信息泄露的情況。芯??萍挤矫娣Q,以計算機系統(tǒng)為例。計算機系統(tǒng)由硬件單元、底層固件、操作系統(tǒng)、應(yīng)用軟件組成,其系統(tǒng)啟動流程的每個環(huán)節(jié),包括“硬件上電啟動、底層固件執(zhí)行、硬件配置完成、操作系統(tǒng)加載、應(yīng)用軟件執(zhí)行”等流程,每一步都可能成為被替換攻擊的目標(biāo),進而導(dǎo)致本地機密數(shù)據(jù)泄露。
對如何解決端云協(xié)同中的交互數(shù)據(jù)安全問題,阿里研究院人工智能治理中心主任傅宏宇曾撰文給出自己的思考,或可作為端側(cè)AI背景下對數(shù)據(jù)安全保護的一個參考。
傅宏宇認為,首先需要建設(shè)云側(cè)、端側(cè)等執(zhí)行環(huán)境的安全保障能力,采取協(xié)議承諾、技術(shù)管控等方式讓用戶對自身數(shù)據(jù)可控可管可審計,為用戶進一步使用模型、與模型進行數(shù)據(jù)交互奠定信任基礎(chǔ)。
一是要保障用戶數(shù)據(jù)處理環(huán)境的安全一致性。無論是端側(cè)還是云側(cè),用戶-模型交互處理的整體環(huán)境應(yīng)當(dāng)在數(shù)據(jù)安全保障級別上需要和用戶私域等同,用戶數(shù)據(jù)在各類執(zhí)行環(huán)境中都受到同等的安全保護,例如對企業(yè)用戶需高度關(guān)注企業(yè)商業(yè)秘密在傳輸、存儲過程中的加密和防攻擊,應(yīng)用處理過程中的權(quán)限限制,對個人用戶則要保障對其個人數(shù)據(jù)的控制權(quán)和安全性,保證對數(shù)據(jù)處理的知情同意。
二是要保障用戶對自身數(shù)據(jù)的高度可控性。嚴(yán)格遵守用戶指令,以用戶授權(quán)為前提,強化權(quán)限保護、數(shù)據(jù)可控性、可審計性,責(zé)任可追蹤。通過授權(quán)和密鑰控制,保障用戶數(shù)據(jù)的私密性,對用戶數(shù)據(jù)管控和濫用防控,讓用戶了解并控制各執(zhí)行環(huán)境中的數(shù)據(jù)使用情況,避免超權(quán)限、超范圍、超目的的數(shù)據(jù)訪問,做到“操作可審計”。在發(fā)現(xiàn)事故后快速定位問題源頭,區(qū)分是用戶不當(dāng)使用、系統(tǒng)漏洞還是外部攻擊等行為所導(dǎo)致的安全風(fēng)險,做到“責(zé)任可追溯”。
另外,對于個人信息和隱私保護,監(jiān)管層也非常關(guān)切,出臺了不少法律法規(guī),可以在一定程度上約束部分企業(yè)在這方面的小心思。例如,《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個人信息保護法》明確規(guī)定了處理個人信息的要求,包括知情同意規(guī)則,最小必要原則等;今年1月1日生效的《網(wǎng)絡(luò)數(shù)據(jù)安全管理條例》進一步對涉及自動化工具、生成式人工智能等新興技術(shù)的數(shù)據(jù)處理活動作出了特殊規(guī)定。
值得一提的是,除了大模型、APP、手機廠商等企業(yè)在設(shè)備、應(yīng)用運行和數(shù)據(jù)處理過程中可能引發(fā)的數(shù)據(jù)安全問題外,一些非法的黑客攻擊同樣需要各方多加留意。去年12月,歐盟網(wǎng)絡(luò)安全局(ENISA)發(fā)布《2024年聯(lián)盟網(wǎng)絡(luò)安全狀況報告》,報告針對2023年7月至2024年6月期間歐盟的網(wǎng)絡(luò)威脅進行了評估,結(jié)果顯示,歐盟面臨嚴(yán)重的網(wǎng)絡(luò)威脅,遭受的網(wǎng)絡(luò)攻擊明顯升級,攻擊的種類、數(shù)量及后果均創(chuàng)新高。報告認為,未來網(wǎng)絡(luò)攻擊可能對重要實體造成嚴(yán)重破壞,尤其是拒絕服務(wù)(DDoS)和勒索軟件攻擊,勒索軟件仍然是歐盟面臨的最主要的威脅形式。
針對上述情況,2022 年以來歐盟委員會先后推出《網(wǎng)絡(luò)安全條例》草案、第二版《網(wǎng)絡(luò)與信息安全指令》、歐盟網(wǎng)絡(luò)彈性法案(CRA)、歐盟無線電設(shè)備指令(RED)授權(quán)法案等,旨在促進成員國網(wǎng)絡(luò)安全機制間的互聯(lián)互通,支撐歐洲更多行業(yè)部門的基礎(chǔ)設(shè)施應(yīng)對快速變化和大規(guī)模的網(wǎng)絡(luò)攻擊安全威脅。
也就是說,芯片等硬件企業(yè)無法缺席這場對數(shù)據(jù)安全的保衛(wèi)戰(zhàn)。
“數(shù)據(jù)安全是一場沒有硝煙的戰(zhàn)爭,需要時刻保持警惕,不斷創(chuàng)新。”炬芯科技方面向芯師爺表示,炬芯科技致力于通過前沿的芯片安全技術(shù),如芯片安全信任根技術(shù)、高級加密標(biāo)準(zhǔn)(AES)等,為數(shù)據(jù)安全筑起銅墻鐵壁。同時,積極擁抱PSA(Platform Security Architecture)認證體系,以國際認可的安全標(biāo)準(zhǔn),不斷提升產(chǎn)品的安全性能。
芯海科技也稱,目前,“公司在數(shù)據(jù)安全保護方面采取的措施涵蓋了數(shù)據(jù)加密、訪問控制、安全審計、硬件架構(gòu)設(shè)計和故障恢復(fù)機制等多個方面,為端側(cè)AI的數(shù)據(jù)安全提供了有力的保障?!睋?jù)了解,芯??萍荚?024年推出的 CSCE2102 芯片(簡稱:E2102)便在固件安全方面做出了顯著的創(chuàng)新提升。
Vol.4/? ?結(jié)語
在智能時代和AI時代,數(shù)據(jù)安全從來不是單個企業(yè)或單個組織能夠完成的事業(yè),這需要從技術(shù)、法律、生態(tài)和用戶等多個維度構(gòu)建堅固的數(shù)據(jù)安全防線,才從根本上降低端側(cè)AI的數(shù)據(jù)泄露風(fēng)險。
雖然,在過去的十?dāng)?shù)年間,數(shù)據(jù)安全的城墻并未完滿砌成,個人隱私和數(shù)據(jù)泄露案例頻發(fā),但并不意味著這項事業(yè)在后續(xù)的AI時代可以懈怠。事實上,只有在這片安全的土地上,AI的花朵才能綻放得更加絢爛,人類的智慧才能在數(shù)字的天空中自由翱翔。
參考資料:
第一財經(jīng):《越聰明,越開放,越危險!如何讓個人隱私不“裸奔”?》
21世紀(jì)經(jīng)濟報道:《當(dāng)deepseek們走向端側(cè) 用戶數(shù)據(jù)安全成必答題丨端側(cè)AI戰(zhàn)事》