在近期舉辦的小米“人車家全生態大會”上,一款名為MiMo-V2-Flash的新模型成為焦點。這款由新加入小米的羅福莉團隊研發的模型,以其獨特的定位和性能表現,引發了行業內外的廣泛關注。
MiMo-V2-Flash并非傳統意義上的“大”模型,其參數規模為309B,激活參數為15B。羅福莉在介紹時坦言,這個尺寸甚至讓她不愿稱之為大模型。然而,正是這樣一個“小而精”的模型,在小米的構想中,被賦予了為Agent提供基座訓練的重任。為了實現這一目標,模型在優化過程中特別側重于高性價比和快速響應能力,例如,它能夠達到每秒150 tokens的生成速度,且成本極低,同時在性能上也不打折扣。
在評估榜單上,MiMo-V2-Flash的表現同樣亮眼。羅福莉透露,該模型的代碼能力和Agent能力已經躋身全球開源模型的前列,甚至在某些評估基準上超過了DeepSeek-V3、Kimi K2-Thinking等知名模型,而其參數規模僅為這些模型的一半到三分之一。
盡管小米的新模型在發布后口碑兩極分化,有人稱贊其代碼能力領先,也有人質疑其是否為“刷分”之作,但無論如何,小米對AI的重視和投入已是不爭的事實。在12月18日的人車家全生態大會上發布這一模型,無疑彰顯了AI在小米戰略中的重要地位。
對于小米而言,AI的應用場景主要集中在兩個方面:一是智能終端側,通過輕量化模型和端側部署,升級“超級小愛”和澎湃OS,將AI技術融入用戶的日常生活;二是智能駕駛側,利用大模型作為基座,提升智駕能力的上限。為了實現這些目標,小米在AI領域可謂下足了功夫。
從技術架構上看,MiMo-V2-Flash采用了混合注意力機制,這一選擇并非偶然。小米團隊通過實驗發現,滑動窗口注意力(SWA)在長文和推理能力上優于主流的線性注意力機制,且固定大小的KV Cache極易適配現有的基礎設施。因此,他們采用了5:1的SWA與全局注意力(GA)的混合結構,以優化成本和提升推理速度。與Claude Sonnet 4.5相比,小米新模型的推理價格僅為其2.5%,而生成速度卻是其2倍。
然而,對于小米來說,將模型接入車、手機等設備中仍面臨挑戰。盡管MiMo-V2-Flash在性能上表現出色,但300B的規模距離端側落地仍有距離。不過,這并未阻止小米在AI領域的探索步伐。羅福莉在演講時提出的觀點頗具啟發性:AI進化的下一個起點,應該是一個能夠與真實環境交互的物理模型。她強調,小米要打造的本質上不是一個程序,而是一個具備物理一致性、時空連貫性的虛擬宇宙。
從小米今年的模型發布動態來看,其未來的優化方向似乎已逐漸清晰:一是繼續死磕端側,為智能終端加碼;二是攻克物理模型,補足在智駕方面的模型能力。為了實現這些目標,小米在研發投入上可謂不遺余力。小米集團總裁盧偉冰在財報電話會上明確表示,AI是核心研發方向。2025年,小米研發投入預計超過300億元,其中四分之一將直接投向AI領域,并計劃在未來五年投入超過2000億元。
在組織層面,小米也在積極搭建自己的AI Infra平臺,并著手組建GPU萬卡集群,以支撐其AI大模型的大力投入。據悉,小米的AI團隊在成立時已有6500張GPU資源。同時,小米的人才拼圖也在逐步完整。除了負責基礎大模型的羅福莉外,小米還挖來了陳龍服務于智駕團隊。這種“雙核”配置在技術路線上已經初見成效——陳龍團隊提出并開源了全球首個打通自駕與具身操作的跨具身基座模型MiMo-Embodied。
這一模型試圖解決自動駕駛與機器人之間的知識遷移難題,意味著小米正在嘗試用一套通用的AI邏輯去驅動其龐大的硬件生態。從手中的手機到智能家居,再到智駕,小米正試圖通過掌握最高效的“大腦”和最廣泛的“身體”,在智能時代完成一次徹底的進化。至于這一進化能否成功,不僅取決于模型做得好不好,更取決于這些技術能否真正跑通每一臺小米設備,轉化為用戶感知得到的體驗。




















