在理想汽車的最新活動(dòng)中,AItalk系列迎來(lái)了第二集,李想在這一集中深入探討了VLA(視覺(jué)語(yǔ)言行動(dòng)模型)的概念。
李想提到,VLA在機(jī)器人領(lǐng)域同樣備受關(guān)注,但對(duì)于理想汽車而言,它有著獨(dú)特的定義。理想汽車將VLA視為一個(gè)“司機(jī)大模型”,一個(gè)能夠像人類司機(jī)一樣執(zhí)行任務(wù)的智能系統(tǒng)。
李想強(qiáng)調(diào),VLA的實(shí)現(xiàn)并非一蹴而就,而是一個(gè)逐步進(jìn)化的過(guò)程。他分享了VLA發(fā)展的第一個(gè)階段,即從2021年開(kāi)始,理想汽車?yán)脵C(jī)器學(xué)習(xí)技術(shù)進(jìn)行感知,并結(jié)合后續(xù)的規(guī)則算法,包括規(guī)劃、控制、執(zhí)行等模塊,這些模塊分段式地協(xié)同工作。
為了更形象地說(shuō)明這一點(diǎn),李想打了一個(gè)比方,將這一階段的智能比作昆蟲(chóng)動(dòng)物的智能。他指出,這種智能依賴于既定的規(guī)則和高精地圖,就像螞蟻通過(guò)特定的路徑和任務(wù)分配來(lái)完成工作一樣。
李想進(jìn)一步解釋,雖然這一階段的智能還相對(duì)基礎(chǔ),但它為VLA的未來(lái)發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。隨著技術(shù)的不斷進(jìn)步和算法的持續(xù)優(yōu)化,理想汽車期待VLA能夠逐漸進(jìn)化到更高層次的智能,最終實(shí)現(xiàn)像人類司機(jī)一樣靈活、高效地執(zhí)行任務(wù)。