谷歌最新人工智能模型Gemini 3正式登場,一經發布便在行業內引發巨大反響。這款被谷歌首席執行官桑達爾·皮查伊盛贊為“最智能模型”的產品,早在發布前就備受關注,如今終于揭開神秘面紗,展現出強大的實力。
與早期小步快跑的探索模式不同,Gemini 3的發布是一次全面且充分的展示。據Gemini團隊介紹,它不僅是全球領先的多模態理解模型,更是目前最強大的智能體和氛圍編程模型,其基礎是先進的推理能力。網友們在看到Gemini 3的評測表現后紛紛驚嘆,直言終于明白谷歌為何能成為股神巴菲特的“心頭好”。
Gemini 3的發布可謂不給競爭對手留機會,在各大評測集中表現卓越。它以1501分的成績強勢奪回LMArena大模型競技場榜首位置,超越了此前馬斯克xAI發布的Grok 4.1模型。從測試結果來看,Gemini 3 Pro憑借領先的推理能力和強大的多模態功能,性能顯著超越前一代的Gemini 2.5 Pro,對OpenAI的最新模型GPT - 5.1更是呈現出“碾壓”態勢。
在“人類終極考試”中,Gemini 3 Pro未使用任何工具,得分率就達到了37.5%;在GPQA Diamond基準測試中,準確率高達91.9%;在“地獄模式”數學測試MathArena Apex中,以23.4%的成績達到最先進水平,為數學領域的前沿模型樹立了新標桿。除了文本能力,Gemini 3 Pro在MMMU - Pro上取得81%的成績,在Video - MMMU上達到87.6%,在SimpleQA Verified基準測試中也獲得了72.1%的當前最先進得分,展現出在事實準確性方面的顯著進步,具備解決跨越科學和數學等廣泛主題復雜問題的能力。在AI界的圖靈測試“ARC - AGI - 2”中,Gemini 3 Pro拿下31.1%的高分,遠超GPT - 5.1的17.6%,這表明AI開始展現出類似人類的智力和思維方式,能在未見過的任務模式下進行推理。
Gemini 3的出色表現也得到了行業大佬的認可。OpenAI聯合創始人、CEO山姆·奧特曼發推評價“Gemini 3看起來很不錯”,xAI創始人、CEO埃隆·馬斯克也表示“干得很好”。
即日起,Gemini全面融入谷歌的產品生態,這也是谷歌首次在產品發布當日就將Gemini引入搜索領域。同時,Gemini 3同步向Gemini app用戶、AI Studio和Vertex AI的開發者,以及全新的智能體開發平臺Google Antigravity推出,彰顯出谷歌用AI定義整個生態每個支點的平臺級野心。
本次發布的Gemini 3 Pro深度思考版本模型雖尚未全面開放,但從測試表現可知其Benchmark水平比Gemini 3 Pro高出一個數量級。谷歌表示,將在未來幾周向Google AI Ultra訂閱者開放,目前該模型還在進行安全評估。
Gemini 3的功能十分強大且多樣。它可以編寫代碼來可視化托卡馬克中的等離子體流動,還能創作詩歌捕捉聚變的物理原理。如果用戶想學習家族傳統菜肴,它能解讀并翻譯不同語言的手寫食譜,生成可分享的食譜。對于想學習新領域知識的用戶,把學術論文、講座視頻等素材提供給Gemini 3,它能生成交互式記憶卡片、可視化或其他格式的代碼,幫助用戶掌握相關知識。它還能充當教練角色,觀看打球運動視頻指出改進之處并生成訓練計劃。在搜索模式下,使用Gemini 3可實現新的生成式UI體驗,如沉浸式視覺布局、交互式工具和模擬等。它還能編寫擁有豐富可視化界面和互動性的3D飛船游戲、可玩的科幻世界以及更具實用性的網頁等,令極客論壇上的前端開發者感嘆其不僅能高效寫代碼,還能理解審美,動畫效果恰到好處。
2025年,AI行業“模型即智能體”的熱潮席卷全球,大模型從被動的“預測引擎”升級為主動的“行動實體”,具備自主決策和執行能力。然而,to C智能體產品普遍面臨“叫好不叫座”的困境,用戶體驗可靠好用的產品較少,這背后考驗的是基礎模型推理、工具運用與任務規劃的綜合實力。Gemini 3率先取得突破,成為第一個在模型界面融入通用Agent能力并支持執行多種復雜任務的產品。其工具使用能力相比2.5 Pro提升了30%,不僅能更準確選擇正確工具,還能理解何時需要不同工具組合完成復雜任務。
此次發布中,谷歌還帶來了全新Agent開發平臺Google Antigravity。借助Gemini 3的高級推理、工具使用和智能編碼能力,Google Antigravity將AI輔助從開發者工具包中的工具轉變為活躍伙伴。雖然其核心仍沿用熟悉的AI集成開發環境(IDE),但智能體被提升到專屬界面,可直接訪問編輯器、終端和瀏覽器,能代表開發者自主規劃和執行復雜的端到端軟件任務,并自行驗證代碼。
谷歌還提到,Gemini 3是迄今為止最安全的模型,接受了Google AI模型中最全面的一套安全評估,展現出更低的諂媚性、更高的抗提示注入能力,并強化了抵御網絡攻擊濫用的保護措施。值得一提的是,Gemini 3的訓練完全基于自家TPU,在全球AI公司等待英偉達GPU發貨時,谷歌有肆意擴張參數的底氣。隨著Gemini 3加入模型“角斗場”,谷歌宣告王者歸來,圍繞大模型的新一輪競爭已全面打響。

















