在小米近期舉辦的一場技術(shù)分享會上,羅福莉以一場別開生面的演講完成了她在小米的首秀。這位在人工智能領(lǐng)域備受矚目的青年學(xué)者,憑借其獨(dú)特的視角和深刻的見解,迅速成為全場焦點(diǎn),也讓外界對她擔(dān)任小米基座大模型核心研發(fā)角色的期待值拉滿。
演講開場,羅福莉并未急于切入Xiaomi MiMo的最新技術(shù)進(jìn)展,而是將時間軸拉長至10億年前,以生物進(jìn)化的宏大敘事為引,重新審視當(dāng)下人工智能領(lǐng)域的變革浪潮。她指出,自然界構(gòu)建“智能”體系遵循著清晰的邏輯鏈條:6億年前,生命通過多巴胺分泌學(xué)會與環(huán)境互動,形成對世界的初步認(rèn)知;2億年前,哺乳動物進(jìn)化出“預(yù)演未來”的能力,能夠在行動前模擬風(fēng)險;直到近10萬年,人類才憑借語言這一抽象符號系統(tǒng)登頂智能金字塔。與之形成鮮明對比的是,大模型的發(fā)展路徑呈現(xiàn)逆向特征——先掌握語言能力,再逐步補(bǔ)足思考與具身感知。
“語言不是簡單的符號組合,而是人類思維在物理世界的投影。”羅福莉解釋道,當(dāng)大模型在文本中挖掘規(guī)律時,本質(zhì)上是在壓縮人類數(shù)十億年積累的認(rèn)知經(jīng)驗,這種壓縮過程構(gòu)成了現(xiàn)代人工智能的基礎(chǔ)。但她同時指出,當(dāng)前技術(shù)框架仍存在根本性局限:模型僅能處理人類思維的文本投影,卻缺乏對物理世界的真實感知,其運(yùn)作邏輯更像是“已知結(jié)果倒推過程”,難以真正理解問題本質(zhì)。
針對這一瓶頸,羅福莉提出了小米的技術(shù)突破方向。她透露,Xiaomi MiMo基座模型通過架構(gòu)創(chuàng)新,在參數(shù)量減少1/2至2/3的情況下,推理性能仍可與DeepSeek V3.2、Kimi K2-Thinking等主流模型媲美。這意味著在相同難度任務(wù)中,MiMo能以更少的參數(shù)調(diào)用實現(xiàn)更快處理速度。其升級版MiMo-V2-Flash已初步具備模擬能力,例如通過HTML語言編寫操作系統(tǒng)或繪制圖形,但距離真正的物理感知仍有差距。
作為一家兼具軟硬件研發(fā)實力的科技企業(yè),小米為突破技術(shù)邊界提供了獨(dú)特路徑。羅福莉提出“具身智能”作為實現(xiàn)AGI(通用人工智能)的終極方案,強(qiáng)調(diào)人形機(jī)器人是連接數(shù)字模型與物理世界的最佳載體。當(dāng)被問及如何突破文本限制實現(xiàn)真正智能時,MiMo模型本身給出回應(yīng):“AGI必須是具身的、嵌入環(huán)境的,通過持續(xù)交互涌現(xiàn)的智能形態(tài)。”
這一思路與行業(yè)動態(tài)形成有趣對比。近期meta花費(fèi)143億美元收購Scale AI,旨在解決數(shù)據(jù)標(biāo)注難題,而羅福莉向小米提出的方案則另辟蹊徑:通過具身智能模擬重力、氣流、水流等物理現(xiàn)象,讓AI在交互中理解世界運(yùn)行規(guī)則。這種技術(shù)路線不僅規(guī)避了算力競賽與數(shù)據(jù)采購的高昂成本,更可能為通往AGI開辟新賽道。現(xiàn)場觀眾不禁思考:這種顛覆性創(chuàng)新,究竟該用怎樣的價值衡量?






















