①ASAP可運用強化學習和真實世界的數(shù)據(jù)來訓練delta動作模型,有效縮小了仿真與現(xiàn)實之間的差距,讓人形機器人掌握非常流暢且動感的全身控制動作; ②ASAP框架的意義或在于優(yōu)化機器人訓練成本; ③Jim Fan表示,未來屬于混合仿真時代,2030年的“人形機器人奧運會”會很精彩。
《科創(chuàng)板日報》2月5日訊(編輯 宋子喬) 繼黃仁勛在英偉達年會上表演熱門舞蹈APT后,機器人也能跳這支舞了,表演者為宇樹科技G1人形機器人。
不僅如此,英偉達團隊還展示了能模仿C羅、詹姆斯和科比的G1人形機器人。
這些動作均為慢動作演示,基于一個名為ASAP(Aligning Simulation and Real Physics,對齊模擬與真實物理)的real2sim2real模型,由卡內(nèi)基梅隆大學(CMU)和英偉達的研究團隊共同提出,可運用強化學習和真實世界的數(shù)據(jù)來訓練delta動作模型,有效縮小了仿真與現(xiàn)實之間的差距,讓人形機器人掌握非常流暢且動感的全身控制動作。
該項目的論文和代碼已開源,華人學者依然占據(jù)相關(guān)論文的大部分作者席位。
新模型如何讓機器人擁有更強的行動能力?
據(jù)英偉達高級研究科學家Jim Fan介紹,ASAP采用了“真實→仿真→真實”方法,“在網(wǎng)上看到的多數(shù)機器人演示視頻都是經(jīng)過加速處理的,而我們特意放慢動作速度,讓你能清晰觀賞每個流暢的動作細節(jié)?!?/p>
訓練過程主要可拆解成兩步:
1、在仿真環(huán)境對機器人進行預訓練
在預訓練階段,研究團隊將真人運動視頻作為數(shù)據(jù)來源,在仿真環(huán)境中訓練動作跟蹤策略。先將這些運動數(shù)據(jù)重定向到人形機器人上,然后訓練一個基于相位條件的運動跟蹤策略,讓機器人模仿重定向后的動作。隨后,在仿真環(huán)境中回放這些數(shù)據(jù),動力學差異就會以跟蹤誤差的形式表現(xiàn)出來。
2、后訓練階段進一步校準機器人動作
訓練一個delta動作模型,通過縮小真實世界和仿真狀態(tài)的差異,學習如何補償這些偏差,縮小仿真環(huán)境和真實世界中的動力學差異。然后,ASAP把這個delta動作模型集成到仿真器中,對預訓練策略進行微調(diào),讓它和現(xiàn)實世界的動力學更匹配。
ASAP框架的意義或在于優(yōu)化機器人訓練成本,在仿真虛擬環(huán)境中訓練出來的機器人也能解鎖真實世界的物理動態(tài)。Jim Fan表示,通過額外神經(jīng)網(wǎng)絡(luò)學習差異參數(shù),本質(zhì)上是對傳統(tǒng)物理引擎進行“動態(tài)校準”,使機器人能依托GPU的并行計算能力,在仿真環(huán)境中獲得近乎真實的大規(guī)模訓練體驗,“未來屬于混合仿真時代。”他還樂觀表示,2030年的“人形機器人奧運會”會很精彩。
英偉達已經(jīng)成立GEAR(通用智能體研究實驗室)并入股FigureAI,從軟件平臺到硬件本體,全面切入人形機器人賽道。
在今年1月剛剛結(jié)束的2025 CES上,黃仁勛發(fā)布開幕演講稱“通用機器人領(lǐng)域的ChatGPT時刻即將到來”,英偉達正在積極推動機器人技術(shù)的發(fā)展,致力于打造全方位的機器人生態(tài)系統(tǒng)。
同月,黃仁勛在北京參加例行年會時,會見了多家國內(nèi)頭部機器人公司的代表,宇樹科技CEO王興興、銀河通用創(chuàng)始人兼CTO王鶴、深涌智能Emerging AI創(chuàng)始人黃可鋮等創(chuàng)業(yè)者皆到場,到場的機器人企業(yè)還包括逐際動力、加速進化等。
英偉達機器人技術(shù)業(yè)務副總裁Deepu Talla一行還在1月份到訪了北京國家地方共建具身智能機器人創(chuàng)新中心。
宇樹H1人形機器人則在2025央視春晚中表演了扭秧歌,展現(xiàn)良好運控性能及AI訓練成果。
東吳證券表示,機器人當前類比2014年電動車,即將量產(chǎn),開啟10年產(chǎn)業(yè)大周期。并且,電動車與機器人均由特斯拉引領(lǐng),初創(chuàng)公司和人工智能在人形機器人領(lǐng)域布局激進,與特斯拉差距縮小,如華為、英偉達、智元、宇樹等,投資主線從1放大至1+N。
該機構(gòu)進一步表示,最看好三個方向:
1)綁定龍頭供應鏈:特斯拉人形機器人進展最確定,產(chǎn)品性能軟硬件最優(yōu),放量最早,特斯拉供應鏈彈性最大。其次為潛力廠商,如英偉達、華為(或提供整體解決方案授權(quán)方式)、智元、宇樹等;
2)壁壘最高的核心環(huán)節(jié):零部件來看,壁壘排序滾柱絲杠>傳感器>諧波減速器>空心杯電機;
3)產(chǎn)業(yè)趨勢和方向:靈巧手方案變化、傳感器方案變化。
![arrow](https://cdnjs.cls.cn/www/20200601/image/right-arrow.png)