• 正文
    • █?端側AI,為什么會爆發(fā)?
    • █?機器人
    • █?AI智能無人零售
    • █?開發(fā)板——端側AI產品開發(fā)神器
    • █?結語
  • 相關推薦
申請入駐 產業(yè)圖譜

全面發(fā)力端側AI,這個AIoT廠商給出完美解決方案

04/07 16:46
638
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

前幾天看到一個有趣的比喻——

有人將ChatGPT比作iPhone,它的出現(xiàn),帶來了一種全新的概念(大模型/智能手機)。而DeepSeek,則被比作是國產安卓手機,它的作用,是讓這個概念真正走進了千家萬戶。

我個人認為,這個比喻是非常貼切的。今年以來,DeepSeek的橫空出世,掀起了一股席卷全球的AI浪潮。它憑借混合專家(MoE)架構、多頭潛在注意力(MLA)機制、低精度訓練(FP8)策略等技術創(chuàng)新,不僅提升了模型的性能,還大幅降低了訓練和推理成本,對AI的發(fā)展產生了深遠影響。

簡單來說,就是DeepSeek讓更多的人都能用得起大模型了。隨著DeepSeek的火爆出圈,AI落地全面提速,端側AI更是進入了爆炸式增長的階段。

█?端側AI,為什么會爆發(fā)?

對AI稍有了解的讀者都知道,大模型的構建和使用,包括了訓練和推理兩個過程。訓練,是通過“投喂”數(shù)據(jù),找到更佳的模型參數(shù),讓大模型變成可用的狀態(tài)。推理,則是將大模型投入應用,針對新數(shù)據(jù)進行預測。

大模型發(fā)展的早期階段,訓練和推理都是在云端完成的。端側AI,則是指將大模型直接部署在終端設備(例如智能手機、售貨機、POS機、汽車等)上,在端側進行推理,以此提供更好的實時響應能力和數(shù)據(jù)安全性。

端側AI相比云端AI,主要區(qū)別在于算力相對較弱,以及對功耗和成本非常敏感。DeepSeek引領的大模型“平民化”熱潮,恰逢其時地解決了這個問題,為端側AI的發(fā)展掃清了障礙。

DeepSeek通過蒸餾技術和算法優(yōu)化,顯著降低了大模型的存儲需求與計算量。通過技術開源硬件適配,端側設備的AI功能集成門檻明顯下降了。基于終端設備模組有限的算力,也能夠部署一定級別的大模型,滿足AI應用場景需求。

我們以業(yè)界知名物聯(lián)網(wǎng)整體解決方案供應商移遠通信的方案為例。他們針對不同場景,推出了一系列高中低端AI算力模組。

其中,旗艦邊緣計算智能模組SG885G,搭載高通? QCS8550高性能平臺,具備高達48 TOPS的綜合算力。

SG885G此前已率先成功實現(xiàn)了DeepSeek-R1蒸餾小模型的穩(wěn)定運行。實測數(shù)據(jù)顯示,其生成tokens的速度超過每秒40個tokens,且未來隨著性能的不斷優(yōu)化,速度還將進一步提升,為智能終端設備帶來更強大的AI能力。

面向高端的SG560D模組,同樣來自高通平臺(QCM6490),綜合算力可以達到14 TOPS。

移遠也有來自國產平臺的智能模組。如面向中端的SG530C,采用的就是紫光展銳的UIS7885平臺,算力達到8 TOPS。

面對低端場景,移遠也能提供對應的方案。例如SG368Z和SC362Z-AP,算力為1 TOPS,適合對成本和功耗有更高要求的場景。

模組的算力,是端側AI落地的一個前提條件。但更重要的是,需要充分了解用戶的需求,在方案設計驗證、模型微調、模型部署等方面具備工程化的能力。

移遠通信在這些方面已經(jīng)積累了豐富的經(jīng)驗。

在方案方面,移遠針對業(yè)界各大主流模型進行了大量驗證,摸清了模型的能力邊界和適用場景。在用戶場景中,如果直接采用現(xiàn)成模型構建方案,會導致嚴重的精度和準確性問題。而移遠會基于用戶場景,進行模型微調,確保模型與場景完全匹配,用戶能獲得最佳體驗。

模型部署更是移遠的強項。他們深耕行業(yè)多年,對垂直行業(yè)有非常充分的了解,能夠針對不同行業(yè)用戶的場景需求,進行從小模型到大模型的適配部署。

端側AI落地,不僅考驗硬件算力,也考驗軟件算法。而算法,是基于數(shù)據(jù)不斷磨合而成熟的。移遠通信在算力、算法和數(shù)據(jù)方面,都具有自身獨特的優(yōu)勢,從而形成了強大的市場競爭力,也成為行業(yè)用戶的合作首選。

接下來,我們不妨從目前端側AI最火爆的兩個應用方向,詳細看看移遠方案究竟是如何落地的。

█?機器人

先來看看現(xiàn)在最熱門的機器人(具身智能)賽道。

具身智能是機器人智能的理論基礎,而機器人是具身智能的物理載體。目前,業(yè)界普遍認為,機器人(具身智能)是大模型技術在端側落地的關鍵場景,已經(jīng)進入了高速發(fā)展的快車道。

機器人,尤其是服務類機器人,需要與用戶進行直接交互,需要應對復雜場景下的感知、決策和控制任務,對實時數(shù)據(jù)處理有極高的要求。

通過在端側集成AI大模型,服務機器人能夠在本地進行數(shù)據(jù)處理,大幅降低數(shù)據(jù)延遲,提高響應速度。用戶可以獲得更加流暢、智能、高效的機器人服務體驗。

移遠通信的端側大模型解決方案,已經(jīng)成功實現(xiàn)了在服務機器人領域的落地。

該方案基于SG885G模組,融合了前沿的LLM(大語言模型)、RAG(檢索增強生成)與Agent(智能體)等業(yè)界主流技術,可以實現(xiàn) “情景理解、知識融合、智能交互、自主決策、任務執(zhí)行”等多種功能。

在移遠端側大模型解決方案的助力下,服務機器人可實現(xiàn)1s以內的意圖識別,解碼速率超過15 tokens/s(人的正常語速約為10 tokens/s),語音交互更加自然。

目前,在醫(yī)療康養(yǎng)、智能客服、接待導覽、零售導購等多個實際場景,移遠大模型解決方案賦能的服務機器人,都展現(xiàn)出了強大的應用價值,也吸引了行業(yè)內外的廣泛關注。

不久前,移遠通信聯(lián)合德壹發(fā)布了全球首款搭載端側大模型的AI具身理療機器人,就非常有代表性。

這款創(chuàng)新產品支持8自由度3D視覺導航,融合尖端AI技術、中醫(yī)理療智慧與具身智能,可以實現(xiàn)“無人化、個性化、精準化”的理療體驗。

這款機器人甚至可以支持無網(wǎng)模式。在沒有網(wǎng)絡連接、沒有理療師介入的情況下,它都可以快速且準確地理解用戶的自然語言指令和意圖,高效完成通用聊天、醫(yī)療領域RAG問答、指令控制等任務。

此外,德壹機器人還具備很強的觀察能力。它借助多模態(tài)感知技術(視覺+力控+紅外熱成像),實時掃描用戶身體,精準識別人體經(jīng)絡與穴位。通過結合用戶健康數(shù)據(jù)與實時體征,德壹機器人能夠動態(tài)生成個性化理療方案。

目前,在亞健康調理、慢性疼痛緩解、產后康復等多個場景,德壹機器人都已投入商用,為用戶提供服務。

█?AI智能無人零售

自動售貨機是大家比較常見的一個物聯(lián)網(wǎng)應用場景。

在多年的發(fā)展歷程中,自動售貨行業(yè)經(jīng)歷了從機械式到RFID射頻技術、重力感應、靜態(tài)視覺識別、動態(tài)視覺識別等多種商品識別方式的演變。 從靜態(tài)視覺到動態(tài)視覺,均以AI視覺識別能力為基礎,且依賴于物聯(lián)網(wǎng)技術的支撐。

在2025世界移動通信大會(MWC)上,移遠通信宣布推出全新AI智能無人零售解決方案,采用的就是前沿的“動態(tài)視覺+邊緣計算”技術。

該方案采用高性能5G AI算力模組SG560D(同時也兼容其它多款算力模組),依托在自研算法上的深厚技術積累,對硬件推理性能進行了深度優(yōu)化,可以直接對實時動態(tài)視頻流進行計算,實現(xiàn)精準商品識別和秒級響應速度,帶給消費者“掃碼開門、即拿即走”的無縫購物體驗。

在SKU(庫存單位)方面,該方案經(jīng)過海量數(shù)據(jù)的深度訓練,具備更強的模型泛化能力,可精準識別上千種商品。方案的模型能力還能持續(xù)在線升級,不斷拓展可識別商品的種類。

在準確率方面,方案采用“單/雙攝像頭+智能算法識別”等多重機制,并結合重量等數(shù)據(jù)進行交叉驗證,可以實現(xiàn)高達99%的端到端識別準確率。

在支撐客戶運營方面,方案可無縫對接客戶應用程序,為其提供全棧式技術與服務支撐,實現(xiàn)實時數(shù)據(jù)分析,并且能夠深度洞察消費偏好。這可以助力客戶實現(xiàn)數(shù)據(jù)驅動的精細化運營,進一步降本增效。

目前,移遠AI智能無人零售解決方案已經(jīng)與興元科技“喵星人”智能售貨機等多家客戶產品完成系統(tǒng)集成,并進入實地場景測試階段。

█?開發(fā)板——端側AI產品開發(fā)神器

除了豐富的AI模組及解決方案,在加速端側AI應用落地的過程中,移遠通信還打造了QuecPi Alpha智能生態(tài)開發(fā)板,以高效、靈活等優(yōu)勢,推動端側AI技術不斷突破。

在2025世界移動通信大會(MWC)上,該開發(fā)板正式面向全球市場發(fā)布。

所謂開發(fā)板,就是一個開發(fā)平臺。物聯(lián)網(wǎng)技術應用于千行百業(yè),每個行業(yè)都有不同的場景需求。因此,需要一個開發(fā)板平臺,進行行業(yè)場景下的物聯(lián)網(wǎng)終端開發(fā)技術測試和驗證。

尤其是端側AI落地,很多企業(yè)用戶都需要一個平臺,驗證大模型的能力,以及性能、功耗和兼容性表現(xiàn)。

QuecPi Alpha智能生態(tài)開發(fā)板基于高通躍龍? QCS6490處理器打造,配備8核CPU,8GB/4GB LPDDR4X內存,AI算力高達12 TOPS。其支持Linux、Ubuntu等多種開源操作系統(tǒng),并采用高通Adreno? 642L/643 GPU,在處理圖像及視頻數(shù)據(jù)等AI計算任務時,展現(xiàn)出卓越的靈活性和高效性。

QuecPi Alpha可以說是端側AI產品開發(fā)的一個神器,廣泛覆蓋了AIoT行業(yè)的諸多應用場景,如AI邊緣計算、工業(yè)機器人、服務/陪伴/教育/娛樂機器人、工控、多媒體終端、數(shù)字廣告牌、智能家居等。

以智慧交通和智能安全為例,QuecPi Alpha能夠在復雜場景下快速、精準地識別并標注車輛、車牌、行人等目標物體。它在邊緣計算、低延遲處理方面的優(yōu)異表現(xiàn),為交通管理等領域的實時決策提供了有力支持。

█?結語

根據(jù)最新數(shù)據(jù),全球端側AI設備市場規(guī)模已超過600億美元,年復合增長率(CAGR)達到22%。預計到2030年,更將超過1500億美元。

這是一個巨大的市場機遇。想要把握這個機遇,就必須在端側算力、模型適配、模型部署等方面進行深入研究和持續(xù)投入。選擇一個好的物聯(lián)網(wǎng)解決方案,顯然能夠以最短的周期推出滿足用戶體驗的產品,從而在激烈的市場競爭中脫穎而出。

我們期待這個市場的進一步爆發(fā),加速推動AI的落地和普及,將人類早日帶入真正的數(shù)智時代。

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

通信行業(yè)知名新媒體鮮棗課堂創(chuàng)始人,通信行業(yè)資深專家、行業(yè)分析師、自媒體作者,《智聯(lián)天下:移動通信改變中國》叢書作者。通信行業(yè)13年工作經(jīng)驗,曾長期任職于中興通訊股份有限公司,從事2/3/4G及5G相關技術領域方面的研究,曾擔任中興通訊核心網(wǎng)產品線產品經(jīng)理、能力提升總監(jiān)、中興通訊學院二級講師、中興通訊高級主任工程師,擁有豐富的行業(yè)經(jīng)驗和積累。