午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

資訊在沃

小米MiMo大模型開源,推理性能趕超OpenAI,能否讓小愛同學更智能?

   發(fā)布時間:2025-04-30 14:32 作者:顧雨柔

在科技巨頭紛紛布局人工智能領(lǐng)域的浪潮中,小米公司近期宣布了一項重大進展,正式推出了其首個專注于提升模型推理能力的大型語言模型——Xiaomi MiMo,并且決定將其開源,以供全球開發(fā)者共同研究和使用。

據(jù)小米方面介紹,MiMo模型的誕生,源于對當前大模型技術(shù)瓶頸的深刻洞察以及對提升模型推理能力的迫切需求。該模型旨在通過技術(shù)創(chuàng)新,打破現(xiàn)有預(yù)訓練模型的局限性,進一步激發(fā)AI在復(fù)雜邏輯推理、數(shù)學運算及代碼生成等高級認知任務(wù)上的潛力。

在基準測試方面,MiMo模型展現(xiàn)出了令人矚目的表現(xiàn)。小米公布的測試數(shù)據(jù)顯示,其7B參數(shù)的MiMo模型在多個衡量模型推理能力的公開基準測試中,性能超越了同類甚至更大規(guī)模的模型。特別是在AIME 24-25評測集和LiveCodeBench v5評測集上,MiMo的表現(xiàn)不僅超過了OpenAI的閉源推理模型o1-mini,還超越了參數(shù)量高達32B的阿里開源推理模型QwQ-32B-Preview。

MiMo模型在強化學習領(lǐng)域也展現(xiàn)出了顯著的優(yōu)勢。與當前業(yè)內(nèi)廣泛用作強化學習起始模型的DeepSeek-R1-Distill-7B和Qwen2.5-32B相比,MiMo-7B在數(shù)學與代碼領(lǐng)域的強化學習潛力評估中表現(xiàn)更優(yōu)。這一成果進一步證明了MiMo模型在推理效率和效果上的行業(yè)領(lǐng)先地位。

那么,MiMo模型是如何在推理能力上取得如此突破的呢?這得益于小米大模型Core團隊在模型設(shè)計與訓練流程上的多項技術(shù)創(chuàng)新。在預(yù)訓練階段,團隊著重挖掘富推理語料,并創(chuàng)新性地合成了約200B tokens的高質(zhì)量推理數(shù)據(jù),采用三階段訓練模式,逐步提升難度,累計訓練數(shù)據(jù)量達到25T tokens。

在后訓練階段,小米團隊引入了創(chuàng)新的強化學習算法和框架。他們提出了Test Difficulty Driven Reward機制,旨在緩解困難推理問題中的獎勵稀疏性,并引入Easy Data Re-Sampling策略以提高訓練穩(wěn)定性。同時,通過設(shè)計的Seamless Rollout系統(tǒng),顯著提升了強化學習訓練效率和驗證效率。

為推動人工智能社區(qū)在推理能力方向的共同發(fā)展,小米已將Xiaomi MiMo-7B的四個變體模型全部開源,并托管于HuggingFace平臺。這一舉措使得全球的開發(fā)者和研究人員能夠免費獲取并使用這些模型,進一步促進了人工智能技術(shù)的創(chuàng)新和發(fā)展。

據(jù)了解,Xiaomi MiMo是小米新近成立的「小米大模型Core團隊」的首個重要對外成果。該團隊表示,將繼續(xù)秉持務(wù)實創(chuàng)新的精神,探索人工智能的前沿領(lǐng)域,致力于通過技術(shù)突破不斷拓展智能的邊界。這一成果不僅展示了小米在人工智能領(lǐng)域的實力,也為全球開發(fā)者提供了寶貴的研究資源。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新