NVIDIA 今天宣布推出一款工具,只需 30 分鐘的音頻數(shù)據(jù),即可在一天之內(nèi)打造類似真人的定制語(yǔ)音。
NVIDIA Riva 定制語(yǔ)音是 NVIDIA Riva 語(yǔ)音 AI 軟件的一項(xiàng)功能,它提供強(qiáng)大的功能,使數(shù)百萬(wàn)公司使用少量數(shù)據(jù)即可在幾小時(shí)而不再是幾周內(nèi)開(kāi)發(fā)富有表現(xiàn)力的定制語(yǔ)音。
企業(yè)可以使用 Riva 定制語(yǔ)音打造具有專屬語(yǔ)音的虛擬助理。呼叫中心可以借其快速開(kāi)發(fā)具有辨識(shí)度的品牌語(yǔ)音,為客戶提供服務(wù)。開(kāi)發(fā)者可以借其創(chuàng)建各種各樣的應(yīng)用程序,為有語(yǔ)言障礙的人提供支持。
NVIDIA AI軟件產(chǎn)品管理副總裁Kari Briski表示:“長(zhǎng)期以來(lái),模仿類似真人的互動(dòng)一直是AI面臨的一項(xiàng)巨大挑戰(zhàn),特別是對(duì)于那些具有行業(yè)術(shù)語(yǔ)的公司而言?,F(xiàn)在,這些公司能夠使用語(yǔ)音 AI 傾聽(tīng)客戶,并且以他們品牌專屬的、富有表現(xiàn)力的語(yǔ)音回復(fù)客戶,推動(dòng)更有趣味、更加愉悅的互動(dòng)。”
最新版的 NVIDIA Riva 語(yǔ)音 AI 軟件開(kāi)發(fā)套件提供 Riva 定制語(yǔ)音。Riva SDK 包括先進(jìn)的自動(dòng)語(yǔ)音識(shí)別和文本到語(yǔ)音轉(zhuǎn)換功能,可根據(jù)不同的口音和領(lǐng)域進(jìn)行定制。它還能夠?qū)⒄Z(yǔ)音服務(wù)擴(kuò)展到云、數(shù)據(jù)中心及邊緣的數(shù)十萬(wàn)串流。
?
生態(tài)系統(tǒng)之聲
在不到三年的時(shí)間里,NVIDIA 的對(duì)話式 AI 軟件已實(shí)現(xiàn) 25 萬(wàn)次以上的下載量,在眾多行業(yè)得到廣泛應(yīng)用。
RingCentral 是全球企業(yè)云通信、視頻會(huì)議、協(xié)作和客服中心解決方案的優(yōu)秀供應(yīng)商,正在借助 Riva 自動(dòng)語(yǔ)音識(shí)別提供視頻會(huì)議實(shí)時(shí)字幕功能,打造更具吸引力的會(huì)議體驗(yàn)。
RingCentral 執(zhí)行副總裁兼產(chǎn)品和工程總經(jīng)理 Nat Natarajan 表示:“我們的目標(biāo)是讓會(huì)議更智能,現(xiàn)在借助 NVIDIA Riva,能夠基于 NVIDIA GPU 訓(xùn)練實(shí)時(shí)轉(zhuǎn)錄模型,提高不同口音的準(zhǔn)確性。未來(lái),我們預(yù)計(jì)會(huì)有多個(gè)并發(fā)串流,Riva 可以輕松擴(kuò)展,在 300 毫秒內(nèi)實(shí)時(shí)處理這些串流。我們很高興能與 NVIDIA 合作,一起展望未來(lái)?!?/p>
中國(guó)平安是全球最大的金融服務(wù)公司之一,正通過(guò)虛擬代理人來(lái)減少等待時(shí)間,改善客戶體驗(yàn)。借助 Riva,它可以構(gòu)建實(shí)時(shí)語(yǔ)音應(yīng)用程序,不斷提高準(zhǔn)確性。
?中國(guó)平安首席科學(xué)家肖京表示:“中國(guó)平安每天使用聊天機(jī)器代理人處理數(shù)百萬(wàn)客戶查詢。借助 NVIDIA 面向自動(dòng)語(yǔ)音識(shí)別的預(yù)訓(xùn)練模型,在我們的數(shù)據(jù)上進(jìn)一步微調(diào),我們的系統(tǒng)在準(zhǔn)確性方面提高了 5%,讓我們能夠提供更具吸引力、更加可靠的服務(wù)?!?/p>
?此外,還有數(shù)十家軟件制造商在生產(chǎn)中使用 NVIDIA 對(duì)話式 AI。Gosoft Contact Center 正在與 CP All 合作,后者擁有 20 多個(gè)業(yè)務(wù)領(lǐng)域,其零售領(lǐng)域在泰國(guó)涵蓋 10000 多家 7-11 便利店。高度準(zhǔn)確的 AI 語(yǔ)音機(jī)器人在泰語(yǔ)方面經(jīng)過(guò)訓(xùn)練,每天總計(jì)可以幫助處理 24 萬(wàn)次呼叫。
Plabook Education 和 Data Monsters 正在與美國(guó)各地的學(xué)區(qū)合作,幫助孩子們學(xué)習(xí)通過(guò) AI 數(shù)字虛擬形象閱讀助理進(jìn)行閱讀,該助理可以幫助識(shí)別發(fā)音錯(cuò)誤的單詞并衡量其閱讀準(zhǔn)確性。
供貨情況和定價(jià)
針對(duì)小型研發(fā),NVIDIA Riva 在 NVIDIA NGC? 容器倉(cāng)庫(kù)上免費(fèi)提供。開(kāi)發(fā)者可以加入 Riva 開(kāi)放測(cè)試計(jì)劃,立即試用軟件并且接收相關(guān)功能更新通知。
對(duì)于具有大規(guī)模部署和尋求 NVIDIA 專家技術(shù)支持的客戶,NVIDIA 還宣布 NVIDIA Riva 企業(yè)版計(jì)劃,該計(jì)劃預(yù)計(jì)將于明年初推出。
Riva亮相GTC
?在GTC主題演講中,NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛展示了Riva的語(yǔ)音AI能力,其中包括在Riva自定義語(yǔ)音的演示中,展示了只需30分鐘的數(shù)據(jù)就能創(chuàng)造出類似人類的新的聲音。
Riva還通過(guò)Project Tokkio、DRIVE Concierge和Project Maxine在Omniverse Avatar(一個(gè)創(chuàng)建交互虛擬形象的平臺(tái))中得以展現(xiàn)。Project Tokkio和DRIVE Concierge展示了客戶服務(wù)和車(chē)內(nèi)環(huán)境中的虛擬形象,而Project Maxine則強(qiáng)調(diào)了實(shí)時(shí)翻譯并轉(zhuǎn)錄到多種語(yǔ)言。
在GTC上,有二十多場(chǎng)專注于對(duì)話式AI的演講,包括Hugging Face、Snap、T-Mobile等公司的演講。演講主題涉及開(kāi)發(fā)和整合GPU加速的語(yǔ)音和語(yǔ)言AI應(yīng)用等方面最先進(jìn)的算法、工具、挑戰(zhàn)以及效果等。
免費(fèi)注冊(cè)GTC 2021詳細(xì)了解 NVIDIA Riva,大會(huì)以線上形式舉行,持續(xù)到11月11日。歡迎觀看黃仁勛在 11 月 9 日的 GTC 主題演講的直播以及重播。
在線觀看NVIDIA Riva 定制語(yǔ)音軟件介紹視頻:https://www.ixigua.com/7028556117475066382?logTag=975d654e77ae53fc0fe4?