成人在线观看网址,国产精品福利视频,9久久免费国产精品特黄

小米MiMo-VL多模態大模型開源，性能超越阿里Qwen2.5-VL-72B引關注

發布時間：2025-05-30 20:30 來源：ITBEAR 作者：朱天宇

小米公司近日通過其官方公眾號“Xiaomi MiMo”震撼宣布，已將旗下多模態大模型——Xiaomi MiMo-VL，正式向全球開源。此次開源的版本中，MiMo-VL-7B的強化學習（RL）前后模型，以及支持超過50項任務的框架，均已在GitHub上亮相。

MiMo-VL在多任務處理上的卓越表現，特別是在多模態推理領域，讓人眼前一亮。盡管MiMo-VL-7B的參數規模僅為7B，但在奧林匹克競賽基準測試（OlympiadBench）及多個數學競賽（如MathVision、MathVerse）中，其表現均大幅超越了參數規模達72B的阿里Qwen-2.5-VL-72B和QVQ-72B-Preview，甚至超過了非開源的GPT-4o。在小米內部的大模型競技場中，MiMo-VL-7B同樣以出色的用戶體驗，力壓GPT-4o，成為開源模型中的新標桿。

MiMo-VL-7B不僅在復雜的圖片推理和問答任務上游刃有余，還展現了驚人的GUI操作能力，能夠完成多達10余步的復雜操作。這一能力預示著在AI Agent時代，MiMo-VL將擁有巨大的應用潛力。例如，用戶可以通過MiMo-VL，輕松地將心儀的商品，如小米SU7，添加到心愿單中，享受前所未有的便捷體驗。

小米團隊在構建MiMo-VL時，投入了大量精力收集、清洗和合成高質量的預訓練多模態數據。這些數據涵蓋了圖片-文本對、視頻-文本對以及GUI操作序列等多種類型，總量高達2.4T tokens。通過精細地調整不同數據類型在訓練過程中的比例，小米團隊成功地強化了模型的長程多模態推理能力。

小米還創新性地采用了混合在線強化學習算法（MORL），該算法融合了文本推理、多模態感知推理以及RLHF等多種反饋信號，全方位提升了模型的推理能力、感知性能和用戶體驗。這一算法的引入，無疑為MiMo-VL的卓越表現奠定了堅實的基礎。

MiMo-VL的開源不僅展示了小米在AI領域的深厚積累，更為全球開發者提供了一個強大的多模態大模型平臺。未來，隨著更多開發者的加入和貢獻，MiMo-VL的應用場景和性能表現無疑將更加豐富多彩。

更多>同類內容

午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

小米MiMo-VL多模態大模型開源，性能超越阿里Qwen2.5-VL-72B引關注