埃隆·馬斯克在得克薩斯超級(jí)工廠的CNBC專(zhuān)訪中再次強(qiáng)調(diào),Optimus人形機(jī)器人將成為特斯拉產(chǎn)品線中的一顆璀璨明珠。為了支撐這一雄心勃勃的聲明,特斯拉官方Optimus社交媒體賬號(hào)發(fā)布了一段視頻,展示了Optimus在日常生活場(chǎng)景中的卓越表現(xiàn),這段視頻無(wú)疑是其能力展示中的巔峰之作。
視頻中,Optimus在家庭環(huán)境中大顯身手,無(wú)論是扔垃圾、使用清潔工具,還是撕紙巾、烹飪輔助,甚至是家居管理如開(kāi)關(guān)窗簾,都顯得游刃有余。更令人驚嘆的是,它還能輕松地將一輛Model X的前連桿搬移到手推車(chē)上,展現(xiàn)了其強(qiáng)大的物理操作能力和精準(zhǔn)度。
值得注意的是,Optimus執(zhí)行這些復(fù)雜任務(wù)的基礎(chǔ)是一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)。特斯拉Optimus團(tuán)隊(duì)通過(guò)向機(jī)器人輸入大量人類(lèi)執(zhí)行類(lèi)似任務(wù)的第一人稱(chēng)視頻數(shù)據(jù),使其能夠直接學(xué)習(xí)和模仿這些動(dòng)作。這一創(chuàng)新方法不僅提高了機(jī)器人的學(xué)習(xí)效率,更為其快速掌握和完善新技能奠定了堅(jiān)實(shí)基礎(chǔ)。
特斯拉Optimus項(xiàng)目副總裁Milan Kovac在社交媒體上分享了團(tuán)隊(duì)的最新進(jìn)展和未來(lái)規(guī)劃。他透露,團(tuán)隊(duì)正致力于讓Optimus能夠直接從互聯(lián)網(wǎng)視頻中學(xué)習(xí)人類(lèi)執(zhí)行任務(wù)的方式,這包括第一人稱(chēng)視角、第三人稱(chēng)視角以及隨機(jī)攝像頭拍攝的內(nèi)容。這一能力的實(shí)現(xiàn),標(biāo)志著Optimus在智能學(xué)習(xí)方面取得了重大突破。
Kovac進(jìn)一步解釋說(shuō):“我們最近在將人類(lèi)視頻知識(shí)轉(zhuǎn)移到機(jī)器人上取得了顯著進(jìn)展,目前雖然僅限于第一人稱(chēng)視角,但這已經(jīng)讓我們能夠比僅依賴(lài)遠(yuǎn)程操作數(shù)據(jù)更快地開(kāi)展新任務(wù)。遠(yuǎn)程操作不僅復(fù)雜,而且數(shù)據(jù)獲取有限。”他強(qiáng)調(diào),通過(guò)這一過(guò)程,Optimus正迅速涌現(xiàn)出眾多新技能,這些技能可以通過(guò)自然語(yǔ)言(無(wú)論是語(yǔ)音還是文本)進(jìn)行調(diào)用,并由機(jī)器人上的單一神經(jīng)網(wǎng)絡(luò)統(tǒng)一處理。
展望未來(lái),特斯拉Optimus團(tuán)隊(duì)計(jì)劃進(jìn)一步擴(kuò)大其學(xué)習(xí)范圍,將第三人稱(chēng)視頻的轉(zhuǎn)移學(xué)習(xí)納入其中,即利用隨機(jī)互聯(lián)網(wǎng)視頻作為學(xué)習(xí)材料。同時(shí),他們還將通過(guò)在真實(shí)世界或合成世界(模擬/世界模型)中進(jìn)行自我強(qiáng)化學(xué)習(xí),進(jìn)一步提升機(jī)器人的可靠性和性能。這一系列舉措無(wú)疑將推動(dòng)Optimus向更高層次的智能和實(shí)用性邁進(jìn)。