本文和傅利葉研究團隊合作完成。
訓(xùn)練人形機器人在需要高度交互性與適應(yīng)性的領(lǐng)域作業(yè),比如科學(xué)研究、醫(yī)療保健和制造業(yè)等,非常具挑戰(zhàn)性且資源消耗很大。
總部位于上海的機器人公司傅利葉正在努力在該領(lǐng)域取得突破,開發(fā)先進的人形機器人,使其能夠融入對精準度和靈活性要求極高的真實應(yīng)用場景。
傅利葉于去年 9 月底宣布推出 GR-2,擴展了其 GRx 人形機器人系列。相較于上一代 GR-1(全球首款量產(chǎn)人形機器人),GR-2 進行了硬件設(shè)計升級,具備更強的適應(yīng)性、更先進的靈活性,以及類似人類的活動范圍。
利用 NVIDIA Isaac Gym開發(fā)人形機器人 GR-2
為了開發(fā)和測試 GR-2,傅利葉團隊采用了 NVIDIA Isaac Gym(現(xiàn)已棄用)進行強化學(xué)習(xí)。他們目前正在將其工作流遷移到 NVIDIA Isaac Lab,這是一個開源的模塊化機器人學(xué)習(xí)框架,旨在簡化機器人適應(yīng)新技能的過程。
從仿真到真實的學(xué)習(xí)已成為機器人技術(shù)的關(guān)鍵,特別是對于坐下、起身甚至跳舞等復(fù)雜動作而言。借助 Isaac Gym,傅利葉能夠?qū)崿F(xiàn)對真實場景的仿真,最大限度地減少測試和維護的時間和成本。
團隊仿真了復(fù)雜的多機器人場景和真實環(huán)境,從而增強了 AI 決策的魯棒性,并提升了機器人在不可預(yù)測環(huán)境中的實際表現(xiàn)。傅利葉還利用 Isaac Gym 對抓取算法進行預(yù)訓(xùn)練,在實際部署前,對成功率進行仿真測算。這種方法顯著減少了真實世界中的試錯,節(jié)省了時間和資源。
通過優(yōu)化 AI,為真實世界的機器人應(yīng)用賦能
在訓(xùn)練 GR-2 完成從地面躺姿到站立的動作時,傅利葉對在不同高度完成任務(wù)所需的物理條件進行了仿真。通過復(fù)制 GR-2 模型,他們測試了該模型在各種設(shè)置下的表現(xiàn),并在約 15 小時內(nèi)完成了 3,000 次迭代,與傳統(tǒng)訓(xùn)練方法相比,時間顯著縮短。當直接將模型應(yīng)用于 GR-2 的物理控制時,模型的動作張量成功率達到了 89%。
100 次測試迭代后的檢查點
500 次測試迭代后的檢查點
1,600 次測試迭代后的檢查點
3,000 次測試迭代后的檢查點
圖 1:傅利葉團隊發(fā)現(xiàn)在進行 1,600 次測試迭代后,從躺姿到站立動作的成功率顯著提高
為了優(yōu)化開發(fā)流程,傅利葉團隊還使用了 NVIDIA TensorRT 軟件開發(fā)工具包進行實時推理優(yōu)化,利用 CUDA 庫進行并行處理,并使用 NVIDIA cuDNN 庫加速 PyTorch 等深度學(xué)習(xí)框架。
遷移到 NVIDIA Isaac Lab 將使傅利葉能夠在由 NVIDIA RTX 分塊渲染技術(shù)支持的多物理虛擬環(huán)境中,訓(xùn)練更復(fù)雜的算法并進行更多仿真。
探索下一代機器人能力
通過采用 NVIDIA 技術(shù),傅利葉顯著縮短了模型訓(xùn)練時間,并提高了仿真的準確性,從而增強了工程和研發(fā)團隊之間的協(xié)作。
NVIDIA 的工具還讓復(fù)雜的 AI 功能,如語言模型和預(yù)測分析等成為了可能,這些功能以往因資源消耗過大而難以實現(xiàn)。
傅利葉 CEO ?顧捷表示:“我們所取得的進展正在突破人形機器人技術(shù)的邊界。通過改進機器人的實時運動控制和 AI 驅(qū)動的決策能力,我們正在為服務(wù)行業(yè)、學(xué)術(shù)研究和醫(yī)療康復(fù)等領(lǐng)域的人機交互設(shè)定新標準。”
了解更多關(guān)于傅利葉 GR-2 人形機器人的信息:http://www.fftai.com/
開始進行開發(fā)
需要從 NVIDIA Isaac Gym 遷移到 NVIDIA Isaac Lab,請查看 Isaac Lab 遷移指南:https://isaac-sim.github.io/IsaacLab/main/source/migration/migrating_from_isaacgymenvs.html
如果您是 Isaac Lab 的新用戶,請參閱開發(fā)者入門指南:https://isaac-sim.github.io/IsaacLab/main/source/tutorials/index.html#