• 正文
    • GPT引發(fā)機器人行業(yè)沸騰“假聰明”退出歷史舞臺
    • 機器人接入大模型分三步走不是人人都有“入場券”
    • 所有行業(yè)值得重做一遍機器人迎來“iPhone時刻”?
    • 結(jié)語:GPT卷進機器人掀起交互式革命
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

GPT卷入實體機器人行業(yè),進門掘金的“入場券”是什么?

2023/04/14
514
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

看似好做的GPT機器人,不是人人都有“入場券”。

近期,接入GPT的阿梅卡(Ameca)機器人的問答視頻火遍全網(wǎng),讓人不禁震驚:“機器人的GPT時刻來了?”

當被問到開心事時,這個英國人形娛樂機器人公司Engineered Arts打造的機器人眨著眼睛并面露激動地說“誕生那一刻”讓她開心;被問到“一生中最悲傷的一天”,阿梅卡眉頭緊鎖回答:“我意識到我永遠不會像人類能體驗到真愛、陪伴或簡單的生活樂趣,這是一件令人沮喪的事情?!?/p>

阿梅卡為我們描繪了一個未來機器人的粗略輪廓,背后,類GPT技術(shù)正讓機器人第一次真正睜眼看世界。

類GPT技術(shù)為方興未艾的機器人行業(yè)帶來革命性力量。根據(jù)中信證券報告,ChatGPT 與機器人的結(jié)合,將彌補當前機器人在智能性、易用性、經(jīng)濟性上的短板,有效提升機器人在各個行業(yè)的滲透率。

微軟聯(lián)合創(chuàng)始人比爾·蓋茨近期說GPT模型是“40多年來最革命性技術(shù)進步”。聚焦到機器人領(lǐng)域,獵戶星空董事長傅盛此前發(fā)文稱:“GPT-4發(fā)布世界要變了!每個人都要關(guān)心?!?/p>

那么類GPT技術(shù)為機器人產(chǎn)業(yè)帶來了哪些肉眼可見的機會?什么樣的機器人企業(yè)能夠抓住GPT時代的機遇?縱觀行業(yè),服務(wù)機器人賽道又會出現(xiàn)什么樣的范式變革?通過對話國內(nèi)AI服務(wù)器機器人領(lǐng)軍企業(yè)獵戶星空業(yè)務(wù)策略負責人劉宇翔,本文對此進行了深入探討。

GPT引發(fā)機器人行業(yè)沸騰“假聰明”退出歷史舞臺

“心情非常激動,NLP(自然語言處理)長期短板限制被打破了,ChatGPT不是鸚鵡學舌式的‘假聰明’,而是像人一樣去理解材料和對話,對機器人行業(yè)會是一個非常大的突破?!眲⒂钕柙谌ツ甑捉佑|了對話機器人ChatGPT,他對智東西這樣談到親身體驗。

另一國內(nèi)知名機器人企業(yè)的語音技術(shù)科學家也有同感:“去年11月30日,看到ChatGPT的驚艷表現(xiàn)后,我們意識到AI真正賦能到各行各業(yè),服務(wù)機器人走進千家萬戶的時間到了?!?/p>

實際上,很多產(chǎn)業(yè)人可能了解,阿梅卡只能算描繪了未來理想機器人的粗略輪廓,披著獵奇的外衣,類GPT技術(shù)為行業(yè)帶來的真實價值遠不止于此。

類GPT技術(shù)具有解決的機器人領(lǐng)域新剛需的潛力,具體有哪些想象空間?

劉宇翔說,其為機器人帶來最核心進化是對話理解能力。具備了多模態(tài)思維鏈能力的GPT-4模型具有一定邏輯分析能力,已經(jīng)不是傳統(tǒng)意義上的詞匯概率逼近模型。

比如我們之前看到一些公司前臺或展區(qū)設(shè)有導(dǎo)覽機器人,很多是根據(jù)配置的問題答案庫調(diào)取回答,作為前臺和導(dǎo)覽人員工作受限。接入類GPT技術(shù)的前臺機器人不僅能做一些演示及效果,還能真正與訪客進行深入對話,通過深入交流解決來訪者的實際問題。

在機器人研發(fā)和制造環(huán)節(jié),類GPT技術(shù)也促進機器人研發(fā)制造環(huán)節(jié)效率提高。比如很多機器人研發(fā)人員已采用類GPT技術(shù)檢索代碼問題;涉及到機器人制造中的零部件選型,機器人企業(yè)可以讓類GPT產(chǎn)品通過閱讀供應(yīng)鏈文檔去輔助推薦選型等。

此外還有一些通用場景,比如在營銷及運營環(huán)節(jié),機器人企業(yè)可基于類GPT技術(shù)對宣傳資料撰寫、客戶溝通郵件的撰寫。

當我們將視野從大語言模型投向更廣泛的GPT-4等多模態(tài)大模型,會發(fā)現(xiàn)更令人興奮的潛在機會。

近期,微軟基于GPT-4搭建實體機器人Demo的嘗試以論文方式公開。根據(jù)這一論文,GPT能夠控制機器人完成語言理解之外的事,與外界物理世界發(fā)生聯(lián)動,帶來機器人端到端的體驗。

劉宇翔稱,通用大模型帶來的是更通用的機器人,機器人進入家庭的夢想將更進一步。比如你回家了跟機器人說“你幫我找點喝的”,機器人在接收你的消息后,會結(jié)合你的習慣或與你對話判斷你可能想喝甜的還是酸的,哪個不適合你,親自將水取出遞給你。

機器人接入大模型分三步走不是人人都有“入場券”

今年1月,工信部等十七部門發(fā)布《“機器人+”應(yīng)用行動實施方案》,該政策提出到 2025 年,服務(wù)機器人行業(yè)應(yīng)用深度和廣度要顯著提升。適逢當下國內(nèi)外的大模型紛紛推出,包括商貿(mào)物流、醫(yī)療健康、養(yǎng)老、商業(yè)社區(qū)服務(wù)等多個機器人行業(yè)賽道都成為類大模型技術(shù)落地的掘金地。

飛快的速度,是中國智能產(chǎn)業(yè)江湖生存的必備技能。我們看到國內(nèi)已有一些服務(wù)機器人企業(yè)接入類GPT技術(shù),但多位業(yè)內(nèi)人士告訴我們,這些嘗試大多比較初級。

劉宇翔認為,機器人接入GPT的可以粗略分為L0~L2三個級別:

L0是僅接入大模型官方API,幾乎沒有做二次開發(fā),難度系數(shù)較低;

L1是在接入大模型的基礎(chǔ)上,結(jié)合場景理解滿足需求做產(chǎn)品開發(fā),這才達到及格線;

L2則是接入大模型的機器人企業(yè)基于本地知識做二次開發(fā),甚至得到自己的(半)自研大模型(平民化大模型),解決場景問題,產(chǎn)品能做出來、賣出去,這才達到優(yōu)秀線。

劉宇翔談道,接入類GPT技術(shù)接口可能容易,但要實現(xiàn)從L0到L2的跨越并不容易。

他告訴智東西,機器人企業(yè)在接入類GPT技術(shù)之前首先要考慮的是“第一性原理”。比如從獵戶星空來說,公司自去年底就開始研判并推進這一技術(shù)與機器人的結(jié)合,計劃于近期推出產(chǎn)品。其出手的第一性原理是:

1、基于類GPT技術(shù)做以前的機器人技術(shù)做不到的事。

也就是說,既然都采用的類GPT技術(shù),機器人企業(yè)必須把場景往深處做。比如讓原本只能回答有限問題的導(dǎo)覽機器人,進化為與用戶進行交互式學習的導(dǎo)覽機器人,比如能就西安博物館里的展品深入探討,大模型在語音識別、軟件服務(wù)等各個環(huán)節(jié)輔助下,實現(xiàn)與游客更加多維度、更流暢的交流,體現(xiàn)與先前產(chǎn)品的代際差。

2、做僅靠類GPT技術(shù)做不了的事。

舉個例子,我們看到博物館的導(dǎo)覽機器人已經(jīng)上崗多地,他們會帶人們巡游展館、聲情并茂地解說。當接入GPT技術(shù)之后,參觀者可以直接去和機器人對話,讓機器人根據(jù)提問展開講講。但GPT模型獨自是做不到這些的,內(nèi)容比較泛,而是要結(jié)合實體機身、傳感器、本地地圖和導(dǎo)航系統(tǒng)、本地知識庫等能力。

劉宇翔說,用好類GPT技術(shù)只是一方面,更多的難度還是在于機器人本身。

“如果你已經(jīng)有一個機器人了,把它變成GPT時代的機器人是合理的,但若‘真正機器人’都做不出來,難度還是在機器人這一端?!鳖怗PT技術(shù)需要結(jié)合整個智能機器人鏈條才能發(fā)揮“端到端”的作用。

以NLP與ASR(智能語言識別)技術(shù)結(jié)合為例,大模型能幫導(dǎo)覽機器人更聰明地理解對話,但如果它連聽都聽不清人的話,語音識別是錯的,就根本不用談理解對話。因為新詞更新速度不夠、復(fù)雜噪音環(huán)境識別不足、遠場環(huán)境服務(wù)迭代不及時等問題都會影響用戶輸入,這就好像一顆好腦子長在了耳背的人身上,大模型的作用也會發(fā)揮不出來。

3、做真正能跟客戶產(chǎn)生價值的事。

這一點比較好理解,像阿梅卡一樣的機器人或許是引人關(guān)注的,但這種獵奇的應(yīng)用可能暫且實用性不大,也很難批量復(fù)制和商業(yè)化落地。因此結(jié)合場景理解,做能量產(chǎn)、賣得好的GPT時代機器人尤為關(guān)鍵。

可以看到,雖然接入類GPT應(yīng)用的接口只是一瞬間的事,但打好機器人“身體底子”、進一步疊技能卻仍是一件難度較高的事,不是人人都具備“入場券”。

所有行業(yè)值得重做一遍機器人迎來“iPhone時刻”?

所有的行業(yè)都值得基于大模型重做一遍,機器人行業(yè)也正面臨一個交互式革命。

微軟聯(lián)合創(chuàng)始人比爾·蓋茨3月時在博客中談道,GPT模型是他自1980年他第一次看到現(xiàn)代圖形用戶界面(GUI)以來最具革命性的進步。聚焦到服務(wù)機器人領(lǐng)域,獵戶星空董事長傅盛也在3月15日第一時間分享了GPT-4體驗視頻,他說:“GPT-4發(fā)布世界要變了!每個人都要關(guān)心?!?/p>

這個“變”指的是什么?劉宇翔談到他的理解,大語言模型將帶來兩大方面的變化:

一是交互的革命。2007年喬布斯發(fā)布iPhone時就是一個交互革命,觸摸鍵盤由此替代了物理鍵盤,軟件定義了不同鍵位的形態(tài)和用法;現(xiàn)在隨著GPT-4的到來,觸摸鍵盤將可能進一步被語音交互替代;二是社會生產(chǎn)力變革,生產(chǎn)效率會大大提升。其中前者對機器人領(lǐng)域影響更大,而后者對內(nèi)容產(chǎn)業(yè)影響力較大。

這也解釋了為什么英偉達創(chuàng)始人兼CEO黃仁勛在3月GTC大會上稱:“我們正處于AI的‘iPhone時刻’。”iPhone時代實際上就是移動互聯(lián)網(wǎng)的新交互時代到來,對于AI來說,伴隨著類GPT技術(shù)橫空出世,它也將更深入地滲透到人類關(guān)于機器人的愿景里。

劉宇翔認為,從智能終端來說,包括智能手機、電腦、智能音箱、機器人、汽車等產(chǎn)品都可能被重做一遍,就像2012年大家基于安卓把所有PC軟件重做一遍一樣。也就是說,在GPT的新浪潮下,行業(yè)賽道之間也在相互競賽,爭取更快進入“GPT時刻”,成為最終極的GPT終端。

成立于2016年的獵戶星空在創(chuàng)業(yè)之初提出了機器人公式:“AI+軟件+硬件+服務(wù)=機器人”,據(jù)稱目前已經(jīng)形成了包含口、耳、眼、腿、手、腦在內(nèi)的全鏈條AI技術(shù)。同時,公司已自研了操作系統(tǒng)Robot OS、語音OS、導(dǎo)航技術(shù),并且已經(jīng)擁有全棧硬件設(shè)計制造能力,以及服務(wù)機器人落地現(xiàn)場及云端的服務(wù)能力。

▲獵戶星空機器人公式

根據(jù)官方數(shù)據(jù),截至2022年底,獵戶星空的服務(wù)機器人出貨量已經(jīng)達到45000臺,日均語音交互頻次超1700萬次,總服務(wù)人次近5億人。據(jù)悉,獵戶星空基于大語言模型的相關(guān)產(chǎn)品也將在近期推出,面向市場交出答卷。

結(jié)語:GPT卷進機器人掀起交互式革命

智能服務(wù)機器人在我國發(fā)展多年,經(jīng)歷了跌跌撞撞的發(fā)展歷程,NLP技術(shù)的短板一直是一個嚴峻限制。類GPT技術(shù)的出現(xiàn)使得智能機器人企業(yè)以較低成本調(diào)取頂尖語言理解能力成為可能,有望提升智能服務(wù)機器人在各個行業(yè)的滲透率。

新的交互式革命正在掀起,單一功能機器人向通用機器人發(fā)展的過渡期也在縮短。而當有了多模態(tài)大模型的支持,與大模型相配合的機器人整機以及設(shè)計算法、軟件、硬件、服務(wù)等各個環(huán)節(jié)的研發(fā)和創(chuàng)新能力,也將成為影響機器人企業(yè)角逐勝負的關(guān)鍵要素。

相關(guān)推薦