午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

資訊在沃

小米MiMo-VL多模態大模型開源,性能超越阿里Qwen2.5-VL-72B引關注

   發布時間:2025-05-30 20:30 作者:朱天宇

小米公司近日通過其官方公眾號“Xiaomi MiMo”震撼宣布,已將旗下多模態大模型——Xiaomi MiMo-VL,正式向全球開源。此次開源的版本中,MiMo-VL-7B的強化學習(RL)前后模型,以及支持超過50項任務的框架,均已在GitHub上亮相。

MiMo-VL在多任務處理上的卓越表現,特別是在多模態推理領域,讓人眼前一亮。盡管MiMo-VL-7B的參數規模僅為7B,但在奧林匹克競賽基準測試(OlympiadBench)及多個數學競賽(如MathVision、MathVerse)中,其表現均大幅超越了參數規模達72B的阿里Qwen-2.5-VL-72B和QVQ-72B-Preview,甚至超過了非開源的GPT-4o。在小米內部的大模型競技場中,MiMo-VL-7B同樣以出色的用戶體驗,力壓GPT-4o,成為開源模型中的新標桿。

MiMo-VL-7B不僅在復雜的圖片推理和問答任務上游刃有余,還展現了驚人的GUI操作能力,能夠完成多達10余步的復雜操作。這一能力預示著在AI Agent時代,MiMo-VL將擁有巨大的應用潛力。例如,用戶可以通過MiMo-VL,輕松地將心儀的商品,如小米SU7,添加到心愿單中,享受前所未有的便捷體驗。

小米團隊在構建MiMo-VL時,投入了大量精力收集、清洗和合成高質量的預訓練多模態數據。這些數據涵蓋了圖片-文本對、視頻-文本對以及GUI操作序列等多種類型,總量高達2.4T tokens。通過精細地調整不同數據類型在訓練過程中的比例,小米團隊成功地強化了模型的長程多模態推理能力。

小米還創新性地采用了混合在線強化學習算法(MORL),該算法融合了文本推理、多模態感知推理以及RLHF等多種反饋信號,全方位提升了模型的推理能力、感知性能和用戶體驗。這一算法的引入,無疑為MiMo-VL的卓越表現奠定了堅實的基礎。

MiMo-VL的開源不僅展示了小米在AI領域的深厚積累,更為全球開發者提供了一個強大的多模態大模型平臺。未來,隨著更多開發者的加入和貢獻,MiMo-VL的應用場景和性能表現無疑將更加豐富多彩。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新