NVIDIA 于今日發(fā)布兩項全新大型語言模型(LLM)云 AI 服務(wù)——NVIDIA NeMo 大型語言模型服務(wù)和 NVIDIA BioNeMo LLM 服務(wù),使開發(fā)者能夠輕松調(diào)整 LLM 并部署定制的 AI 應(yīng)用程序,其可用于內(nèi)容生成、文本摘要、聊天機器人、代碼開發(fā),以及蛋白質(zhì)結(jié)構(gòu)和生物分子特性預(yù)測等。
通過 NeMo LLM 服務(wù),開發(fā)者能夠在 NVIDIA 管理的基礎(chǔ)設(shè)施上使用被稱為提示學(xué)習(xí)的訓(xùn)練方法快速定制多個預(yù)訓(xùn)練基礎(chǔ)模型。NVIDIA BioNeMo 服務(wù)是云應(yīng)用程序編程接口(API),它可以將 LLM 用例擴展到語言以外的科學(xué)應(yīng)用中,加快制藥和生物技術(shù)公司的藥物研發(fā)速度。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示: “大型語言模型具有改變每個行業(yè)的潛力。通過對基礎(chǔ)模型進(jìn)行調(diào)整,可將 LLM 的力量帶給數(shù)百萬的開發(fā)者,讓他們無需重新構(gòu)建龐大的模型,即可創(chuàng)建各種語言服務(wù)并推動科學(xué)發(fā)現(xiàn)?!?/p>
NeMo LLM 服務(wù)通過提示學(xué)習(xí)提高準(zhǔn)確性,加快部署速度
借助 NeMo LLM 服務(wù),開發(fā)者可以使用自己的訓(xùn)練數(shù)據(jù)定制基礎(chǔ)模型——從 30 億個參數(shù)到世界上最大的 LLM 之一 Megatron 530B。與從頭開始訓(xùn)練模型所需的數(shù)周或數(shù)月相比,該過程只需幾分鐘到幾小時。
提示學(xué)習(xí)是使用一種名為 P-tuning 的技術(shù)來定制模型,使開發(fā)者只需使用幾百個示例就能快速定制最初需要使用數(shù)十億個數(shù)據(jù)點訓(xùn)練的基礎(chǔ)模型。定制流程生成任務(wù)專屬的提示標(biāo)記,這些標(biāo)記會與基礎(chǔ)模型相結(jié)合,為特定用例提供更高的準(zhǔn)確性和更相關(guān)的響應(yīng)。
開發(fā)者可以使用同一模型定制多個用例并生成許多不同的 Prompt Token。游樂場功能提供可以輕松實驗并與模型互動的無代碼選項,進(jìn)一步提高了 LLM 對行業(yè)特定用例的有效性和可及性。
一旦準(zhǔn)備好部署,經(jīng)過調(diào)整的模型即可在云實例、本地系統(tǒng)上或通過 API 運行。
BioNeMo LLM 服務(wù)使研究人員能夠充分利用大規(guī)模模型的力量
BioNeMo LLM 服務(wù)包括兩個用于化學(xué)和生物學(xué)應(yīng)用的新 BioNeMo 語言模型。該服務(wù)提供蛋白質(zhì)、DNA 和生物化學(xué)數(shù)據(jù)方面的支持,幫助研究人員發(fā)現(xiàn)生物序列中的模式和洞察。
BioNeMo 使研究人員能夠利用包含數(shù)十億個參數(shù)的模型來擴大研究范圍。這些大型模型可以儲存更多關(guān)于蛋白質(zhì)結(jié)構(gòu)、基因間進(jìn)化關(guān)系的信息,甚至可以生成用于治療的新型生物分子。
? ? ?
云 API 提供對 Megatron 530B 和其他現(xiàn)成模型的訪問
除了調(diào)整基礎(chǔ)模型之外,LLM 服務(wù)還提供通過云 API 使用現(xiàn)成和定制模型的選項。
? ? ?
這讓開發(fā)者可以訪問包括 Megatron 530B 在內(nèi)的各種預(yù)訓(xùn)練 LLM,以及使用 NVIDIA NeMo Megatron 框架創(chuàng)建的 T5 和 GPT-3 模型。NVIDIA NeMo Megatron 框架現(xiàn)已進(jìn)入公測階段,可支持各種應(yīng)用和多語言服務(wù)需求。 ? ??
汽車、計算、教育、醫(yī)療、電信等行業(yè)的領(lǐng)導(dǎo)者正在使用 NeMo Megatron 為客戶提供中文、英語、韓語、瑞典語等語言的領(lǐng)先服務(wù)。
供貨情況
NeMo LLM 和 BioNeMo 服務(wù)以及云 API 預(yù)計將在下個月開放搶先體驗,開發(fā)者現(xiàn)在就可以申請并了解詳情。
現(xiàn)在可以從 NVIDIA NGC? 獲得 NeMo Megatron 框架的公測版,并且該框架在優(yōu)化后,可在 NVIDIA DGX? Foundry 和 NVIDIA DGX SuperPOD? 以及 Amazon Web Services、Microsoft Azure 和 Oracle Cloud Infrastructure 的加速云實例上運行。
想要體驗 NeMo Megatron 框架的開發(fā)者可以免費試用 NVIDIA LaunchPad 實驗室。
關(guān)注黃仁勛在 GTC 2022 上的主題演講,進(jìn)一步了解 NVIDIA AI 驅(qū)動的大型語言模型。