智元機器人近日宣布了一項重大技術創新,正式推出了業內首個開源的機器人世界模型平臺——Genie Envisioner(簡稱GE)。這一平臺的誕生,標志著機器人在學習技術領域邁出了劃時代的一步。
與傳統機器人學習方式截然不同,Genie Envisioner平臺構建了一個以統一視頻生成世界模型為核心的閉環系統。該系統整合了未來幀預測、策略學習與仿真評估等功能模塊,使得機器人能夠在單一模型中實現從環境感知、決策思考到動作執行的整個流程,極大地提升了機器人的自主學習和適應能力。
該平臺的核心競爭力在于其高度集成的閉環架構。其中,GE-Base模型經過海量數據訓練,具備卓越的環境布局解析和動作意圖理解能力。GE-Act作為動作解碼器,負責將GE-Base模型的理解結果轉化為具體的動作指令。而GE-Sim則是一個基于動作條件的神經仿真器,通過精細的分層機制,實現了高精度的視覺預測。這三個部分緊密配合,共同驅動著整個平臺的高效運行。
為了打造這一平臺,智元機器人投入了大量資源,收集了約3000小時的真實機器人操作視頻數據。這些數據不僅為模型建立了語言指令與視覺空間之間的直接聯系,還完整地保留了操作過程中的時空信息,為平臺的準確性和實用性奠定了堅實基礎。
在實際應用測試中,搭載GE-Act模塊的機器人已經成功完成了多項復雜任務,如制作三明治、倒茶和擦拭桌面等。這些成功案例不僅充分展示了GE平臺的技術優勢,也進一步證明了其在提升機器人智能化水平和任務執行能力方面的巨大潛力。隨著技術的不斷成熟和完善,相信Genie Envisioner平臺將在更多領域發揮重要作用,推動機器人技術的持續創新和發展。