馬斯克旗下人工智能公司xAI近日推出全新大模型Grok 4.1,以"雙商在線"為賣點,直接對標尚未正式發布的GPT-5.1。這款模型分為Thinking(推理版)和標準版兩個版本,現已在Grok官網、X平臺及移動端應用全面開放免費體驗。
在權威評測平臺LMArena的最新榜單中,Grok 4.1 Thinking以1483分登頂全球大模型排行榜,較第二名Gemini 2.5 Pro高出31分。其標準版同樣表現強勁,直接占據榜單次席。更引人注目的是情商測試EQ-Bench3的結果:Thinking版以1586分刷新紀錄,標準版緊隨其后,國產模型Kimi K2位列第三。
實測體驗顯示,新模型在交互方式上發生顯著變化。相比前代產品,Grok 4.1展現出更強的共情能力,回復結尾會主動添加愛心符號,被用戶形容為"更有耐心的傾聽者"。其創意寫作能力提升尤為突出,評分較前代激增600分,文本生成更具畫面感和敘事性。同時,模型幻覺率從12.09%大幅降至4.22%,信息準確性顯著改善。
技術突破源于強化學習框架的全面升級。xAI后訓練負責人Dustin Tran透露,團隊在支撐前代模型的基礎設施上,通過優化模型風格特征和個性表達,開發出利用智能體推理模型作為獎勵機制的新方法。這種自主評估體系使大規模迭代響應成為可能,強化學習規模較前代擴大10倍。
團隊構成成為另一關注焦點。近期流傳的xAI合影顯示,核心研發團隊以亞裔面孔為主,有消息稱原Grok團隊白人成員已全部離職。這種人員調整被外界解讀為馬斯克的人才戰略轉型,但公司尚未對此作出正式回應。
關于備受期待的Grok 5,馬斯克在最新訪談中透露,這款預計參數規模達6萬億的模型將推遲至明年發布。他解釋稱,作為邁向通用人工智能的關鍵里程碑,Grok 5需要前所未有的計算資源支持,目前仍在進行極其嚴格的測試驗證。這與此前報道中提到的資源限制和測試難度問題形成呼應。
行業觀察人士指出,Grok 4.1的發布既是技術迭代的成果展示,也暗含馬斯克構建AI生態的深層布局。不過隨著谷歌Gemini 3.0等競品即將入場,大模型領域的競爭格局仍存在變數。這場由科技巨頭主導的AI競賽,正在持續改寫人工智能技術的發展軌跡。



















