相比遍地開花的人臉識(shí)別,智能語音的存在感似乎弱了很多。是錯(cuò)覺還是現(xiàn)實(shí)?
在AI大廠的老王,做智能語音產(chǎn)品經(jīng)理有幾年了,在語音喚醒、ASR、NLP、TTS方面積累了不少經(jīng)驗(yàn),不過,挖掘語音需求和場景始終是他心頭的一座大山。如何找到足夠好的落地場景?如何將方案和需求精準(zhǔn)匹配?老王覺得,用戶的真實(shí)痛點(diǎn)永遠(yuǎn)是個(gè)謎。
小李曾感到幸運(yùn),碩士一畢業(yè)就加入了一家風(fēng)頭正勁的創(chuàng)業(yè)公司做智能語音算法工程師。不過,幾年下來,他感覺公司業(yè)績并沒有很大起色,語音產(chǎn)品只打入了家電和玩具市場,量不算大,利潤薄得可憐。再反思自己,雖然身邊很多智能硬件也都有了語音控制和交互能力,哪怕天天都在用的手機(jī)也有,但他基本是不用語音功能的。自己尚且如此,其他的消費(fèi)者呢?智能語音功能是偽需求嗎?小李對當(dāng)年一腳踏進(jìn)的賽道陷入了深深的迷茫中……
從事智能座艙語音交互研發(fā)的大劉,原本在國際大廠做通用語音平臺(tái),去年被現(xiàn)在的公司挖來,專門適配車載場景做語音開發(fā)。對眼下的賽道和薪資,大劉都很滿意,唯一有些焦慮的是,各大品牌紛紛涌入這個(gè)市場,“高質(zhì)量、差異化”是老板天天掛在嘴邊的要求?!捌囈欢ㄊ鞘謾C(jī)之后,智能語音落地的大市場”,大劉深信。
十字路口顧盼
老王、小李、大劉可能是語音細(xì)分賽道不同體量、不同方向從業(yè)者在當(dāng)下的縮影。
2015年曾是語音賽道的高光時(shí)刻,中國智能音箱的發(fā)展正是起步于這一年。語音市場熱度攀高,互聯(lián)網(wǎng)巨頭、產(chǎn)品方案公司,在這一年后紛紛入了局。經(jīng)歷幾年激烈競爭后,智能語音公司現(xiàn)在走到了一個(gè)十字路口:向前,落地不及預(yù)期;向左向右,場景需要逐步滲透。可一旦上了路,就不能原地不動(dòng),更不能后退。
于是只能見到幾家屈指可數(shù)的“老司機(jī)”,平穩(wěn)行駛通過;其他一些對自家技術(shù)實(shí)力有信心、愿意繼續(xù)沖一把的,正在鉚足勁踩油門,尋求下一個(gè)突破點(diǎn);另一些既沒有技術(shù)壁壘,又沒有可持續(xù)盈利場景的公司,已經(jīng)在猶豫要不要踩剎車……
不得不承認(rèn),整個(gè)智能語音行業(yè)正在經(jīng)歷一輪洗牌,留下真正有技術(shù)實(shí)力、盈利能力強(qiáng)的企業(yè)。 步入冷靜期的智能語音,下一步怎么走?
To B——難挖的富礦
《2020—2021中國語音產(chǎn)業(yè)發(fā)展白皮書》顯示,2020年我國智能語音市場規(guī)模達(dá)到217億元,同比增長31%,2021年預(yù)計(jì)達(dá)285億元,同比增長44%。隨著規(guī)模的不斷擴(kuò)大,融合應(yīng)用不斷豐富,智能語音技術(shù)在智慧教育、智慧醫(yī)療、智慧城市、智慧制造等領(lǐng)域加速落地。
不過,有行業(yè)人士指出,廣泛的應(yīng)用領(lǐng)域也就意味著更多元化的使用場景。然而,目前的語音技術(shù)對于使用場景具有較強(qiáng)的限制性。盡管快速更新迭代的神經(jīng)網(wǎng)絡(luò)架構(gòu)已經(jīng)將安靜環(huán)境下的近場語音識(shí)別的錯(cuò)誤率降低3%以下,但現(xiàn)實(shí)環(huán)境中,多數(shù)應(yīng)用場景無法滿足理想的環(huán)境條件,在進(jìn)行語音識(shí)別時(shí)需要同時(shí)考慮到各種噪聲、信道等因素。
為了使語音識(shí)別技術(shù)在更廣泛的使用場景下保持良好的表現(xiàn),智能語音廠商需要提供硬件與軟件協(xié)同的一站式服務(wù),并且需要根據(jù)實(shí)際痛點(diǎn)需求進(jìn)行針對性地優(yōu)化。硬件+軟件+服務(wù),顯然,這是頭部公司才擁有的入場券,對企業(yè)的全棧能力、數(shù)據(jù)能力要求都較高。
此外,面向企業(yè)、行業(yè)等To B市場,語音廠商的上下游合作模式非常關(guān)鍵。例如切入傳統(tǒng)行業(yè)需要提供包括核心設(shè)備的完整解決方案,需要與傳統(tǒng)行業(yè)集成商或最終客戶進(jìn)行定制化、深度合作,這對技術(shù)輸出水平、生態(tài)資源等都是較大的挑戰(zhàn)。
車載——難在“卷”上賽道
語音交互功能是汽車智能化的重要特征之一,它在汽車上的優(yōu)勢比較明顯——能夠幫助駕駛者降低對車內(nèi)設(shè)備或其它智能便攜設(shè)備的手動(dòng)操作依賴,增加駕駛安全性。據(jù)億歐智庫數(shù)據(jù),2021年中國語音交互車載應(yīng)用的市場規(guī)模為22.2億元,2022年預(yù)計(jì)可以到達(dá)25.1億元,2019年-2022年復(fù)合增長率達(dá)到20.8%。2021年中國新發(fā)布的乘用車,語音交互功能在座艙內(nèi)的滲透率已經(jīng)位于第4位,達(dá)到86%。顯然,語音交互功能已經(jīng)成為中國乘用汽車座艙內(nèi)的標(biāo)配功能。
不過,“車規(guī)級”語音畢竟不同于普通應(yīng)用場景,有獨(dú)特的挑戰(zhàn)需要克服。主要體現(xiàn)在三方面:
首先,要應(yīng)對汽車移動(dòng)狀態(tài)下的網(wǎng)絡(luò)抖動(dòng),在保證聲音保真率的情況下盡量壓縮對流量及硬件性能的消耗。
第二是語音高保真度帶來的挑戰(zhàn)。一般情況下,大部分車載語音系統(tǒng)的語音采樣率為16kHz(一秒鐘有1萬6千個(gè)采樣點(diǎn)),量化水平在8比特(每個(gè)采樣點(diǎn)數(shù)據(jù)量為8比特)。但大部分車載語音模型在采樣率和量化水平上都會(huì)高于這一數(shù)值,這就涉及到高質(zhì)量語音模型與實(shí)時(shí)處理、傳輸?shù)荣Y源的結(jié)合,需要合理規(guī)劃車身資源與邊緣計(jì)算、云計(jì)算的結(jié)合。
第三個(gè)挑戰(zhàn)主要是合成語音的歧義問題,這在所有語音場景中是一個(gè)普遍挑戰(zhàn),只是在不同場景下,用戶對歧義的容忍度有差別。特別在車載場景中,駕駛員注意力需要高度集中,歧義問題需要引起重視,減少對用戶體驗(yàn)的影響。
目前看來,車載智能語音產(chǎn)業(yè)鏈的上、中、下游邊界逐漸趨于模糊,競爭結(jié)構(gòu)正在重組。以科大訊飛、思必馳、云知聲、捷通華聲等智能語音處理引擎及應(yīng)用供應(yīng)商為例,他們處于產(chǎn)業(yè)鏈中游,作為上游的需求方,業(yè)務(wù)范圍逐漸向上延展;作為下游的供應(yīng)方,合作模式逐漸向下深入。
并且,頭部公司在產(chǎn)品技術(shù)水平、業(yè)務(wù)涵蓋范圍、用戶生態(tài)等方面具有優(yōu)勢,已經(jīng)占據(jù)了較高的市占率。對于行業(yè)新秀來說,則需要通過定制化方案、價(jià)格優(yōu)勢方面尋求更多客戶資源。
To C——難在碎片中生存
智能語音在消費(fèi)設(shè)備中的典型應(yīng)用包括智能手機(jī)、可穿戴設(shè)備以及小部分智能家居產(chǎn)品等。智能家居市場由于規(guī)模龐大、且正處于智能化升級期,成為智能語音的主攻方向之一。
經(jīng)過幾年的市場普及,消費(fèi)者對語音產(chǎn)品已經(jīng)有初步概念,之前還只是部分單品通過語音交互實(shí)現(xiàn)智能化,比如智能手環(huán)、智能電視、智能音箱等,而2020年之后,幾乎是全品類向語音智能化滲透,包括燈具、開關(guān)、空調(diào)、電動(dòng)窗簾、電風(fēng)扇、衛(wèi)浴、廚具等。
不過,智能家居的痛點(diǎn)仍然存在,體現(xiàn)在智能語音領(lǐng)域,具體包括缺乏統(tǒng)一標(biāo)準(zhǔn)和場景化服務(wù)、用戶體驗(yàn)感差、核心元件國產(chǎn)化率低等等。
行業(yè)人士認(rèn)為,智能語音在與傳統(tǒng)家居市場的融合過程中,可能有無數(shù)的“坑”可能要踩,但一個(gè)首要原則是實(shí)用性,試圖強(qiáng)力改變用戶習(xí)慣,或是同質(zhì)化的產(chǎn)品,最終都難以規(guī)?;l(fā)展。
其次,在解決設(shè)備只有聯(lián)網(wǎng)才能實(shí)現(xiàn)語音功能的問題上,離線語音已經(jīng)顯露出一定的優(yōu)勢。它能夠針對性地對單個(gè)產(chǎn)品進(jìn)行聲音控制,且無需將數(shù)據(jù)傳向云端,充分保證了用戶隱私。不論是大家電還是小家電,均可實(shí)現(xiàn)離線語音控制系統(tǒng)的配對。
此外,一些行業(yè)人士也表示,在激烈且碎片化的語音市場競爭中,生態(tài)和商業(yè)模式很關(guān)鍵,技術(shù)和應(yīng)用領(lǐng)先的時(shí)間差很關(guān)鍵。特別在智能家居逐步轉(zhuǎn)向場景化、全屋智能化方向,有望催生出更多非剛需家電品類的需求,帶來增量機(jī)遇,但只有真正便捷、智能化的語音體驗(yàn)才有望成為家電各品類產(chǎn)品的標(biāo)配。
寫在最后
語音賽道玩家眾多,但盈利仍是多數(shù)企業(yè)的核心挑戰(zhàn)。不同類型廠商面臨的挑戰(zhàn)也不同,中游技術(shù)層服務(wù)商研發(fā)投入巨大;下游應(yīng)用環(huán)節(jié),在觸達(dá)行業(yè)核心需求上仍面臨難題。特別是對于碎片化的智能硬件市場,爆款效應(yīng)明顯,如果不能真正起量,將難以擺脫虧損的陰影。在這樣的行業(yè)大環(huán)境中,大部分初創(chuàng)企業(yè)困難重重,而頭部企業(yè)在不斷拓展自身產(chǎn)業(yè)鏈,構(gòu)建完整的生態(tài)結(jié)構(gòu),大者恒大的兩極化發(fā)展態(tài)勢恐將越來越明顯。
經(jīng)過多年發(fā)展,智能語音產(chǎn)業(yè)逐步步入平臺(tái)期,技術(shù)和市場應(yīng)用正面臨著新的挑戰(zhàn)。核心技術(shù)仍有待繼續(xù)突破,下一步發(fā)展的關(guān)鍵創(chuàng)新點(diǎn),除了語音領(lǐng)域的不斷迭代,也需要交叉融合領(lǐng)域的創(chuàng)新。