在小米近期舉辦的“人車家全生態(tài)大會”上,一位年輕的女性高管憑借一場學術(shù)范十足的演講引發(fā)行業(yè)關(guān)注。她便是小米MiMo大模型團隊負責人羅福莉,這位頂著“AI天才少女”光環(huán)的95后科學家,首次公開亮相便展現(xiàn)出對技術(shù)趨勢的深刻洞察。
出生于四川宜賓的羅福莉,求學軌跡堪稱學霸典范:北京師范大學計算機本科畢業(yè)后,進入北京大學計算語言學研究所攻讀碩士學位。2019年,她在國際頂級學術(shù)會議ACL上一口氣發(fā)表8篇論文,迅速在人工智能領(lǐng)域嶄露頭角。其職業(yè)履歷同樣亮眼,先后在阿里達摩院和DeepSeek擔任核心研發(fā)崗位,直至今年11月通過朋友圈官宣加入小米,此前傳聞雷軍為其開出千萬年薪的消息更是一度沖上熱搜。
在技術(shù)演講中,羅福莉提出顛覆性觀點:當代智能體必須突破單純的語言交互,重點發(fā)展代碼編寫與工具調(diào)用能力。她形象地比喻道:“智能體間的溝通帶寬如同窄帶網(wǎng)絡,必須通過提升推理效率來加速信息傳遞。”基于此,她預言下一代智能體將實現(xiàn)兩大跨越:從被動回答問題轉(zhuǎn)向主動完成任務,并具備與物理世界實時交互的能力。這一論斷與小米正在構(gòu)建的“人車家”生態(tài)形成強烈呼應——截至第三季度,小米AIoT平臺全球連接設備已突破10.4億臺,如何讓這些設備真正理解人類需求成為關(guān)鍵命題。
入職不足半月,羅福莉便帶領(lǐng)團隊交出首份答卷:在開源社區(qū)發(fā)布跨具身基座模型MiMo-Embodied,嘗試打通自動駕駛與機器人領(lǐng)域的技術(shù)壁壘。這項研究由她擔任核心作者,小米智駕首席科學家陳龍負責項目統(tǒng)籌。該模型的設計理念源于羅福莉?qū)Α拔锢鞟I”的執(zhí)著追求,她在朋友圈寫道:“智能終將從語言邁向物理世界,我們正在構(gòu)建這樣的未來。”英偉達官網(wǎng)對物理AI的定義是“通過運動技能理解現(xiàn)實世界的交互模型”,而羅福莉更強調(diào):“真正的智能要在真實交互中‘活’出來,而非從文本中‘讀’出來。”
這種技術(shù)路線在小米最新發(fā)布的MiMo-V2-Flash模型中得到驗證。這個擁有3090億參數(shù)量的開源模型,通過動態(tài)參數(shù)激活技術(shù)將活躍參數(shù)量壓縮至150億,在保持高性能的同時顯著降低計算成本。羅福莉透露,該模型已初步具備模擬物理世界的能力,這為小米布局具身智能提供了重要技術(shù)支撐。
在智能家居領(lǐng)域,小米的探索更為激進。11月推出的Xiaomi Miloco方案,試圖讓設備從“被動響應”轉(zhuǎn)向“主動服務”。傳統(tǒng)智能家居依賴用戶預設規(guī)則,而Miloco通過端側(cè)視覺語言大模型MiMo-VL-Miloco-7B,結(jié)合攝像頭實時數(shù)據(jù),可實現(xiàn)多維度場景感知。國金證券研報指出,用戶只需口語化表達需求,系統(tǒng)就能自動創(chuàng)建智能規(guī)則,徹底擺脫復雜的手動設置。
資深行業(yè)觀察家丁道師認為,這種變革將重新定義人機交互方式:“未來可能連APP都不需要打開,回家燈自動亮起、空調(diào)調(diào)節(jié)溫度,甚至根據(jù)用戶情緒播放音樂。”GKURC智庫分析師丁少將則指出,Miloco代表的技術(shù)方向可能催生類似AI手機的集中式操作系統(tǒng),通過本地AI中樞統(tǒng)一調(diào)度跨品牌設備。但他同時提醒,打破品牌生態(tài)壁壘、建立統(tǒng)一協(xié)議標準仍是最大挑戰(zhàn),“一旦實現(xiàn),智能家居將從單點智能升級為自主決策的空間智能體”。
小米的技術(shù)布局已顯現(xiàn)體系化特征。據(jù)盧偉冰披露,MiMo系列已形成覆蓋推理、視覺、多模態(tài)、音頻與具身智能的完整矩陣:包括70億參數(shù)的推理大模型、視覺推理模型MiMo-VL、端到端音頻生成模型MiMo-Audio等。其中專為智能家居設計的MiMo-VL-Miloco,正通過持續(xù)學習家庭場景數(shù)據(jù),向“理解人類意圖”的目標邁進。





















