Alphabet旗下谷歌公司近日正式發布其最新人工智能模型Gemini 3,這款被業界稱為“全球最強多模態理解模型”的產品,以1501分的成績刷新LMArena排行榜紀錄,標志著人工智能領域進入谷歌與OpenAI雙雄競爭的新階段。發布當日,Gemini 3即被整合至谷歌搜索、Gemini應用等核心產品,展現出谷歌在AI商業化落地上的激進策略。
在性能測試中,Gemini 3展現出全方位優勢。基礎版本在GPQA Diamond研究生級推理測試中取得91.9%的準確率,Humanity’s Last Exam多步邏輯推理測試中以37.5%的無工具得分超越GPT-5 Pro此前紀錄,SimpleQA Verified事實準確性測試更以72.1%的分數領先行業。其多模態處理能力尤為突出,MMMU-Pro測試得分81%,Video-MMMU測試達87.6%,可無縫處理文本、圖像、視頻、音頻及代碼五種信息模態。
配套推出的Deep Think增強推理模式成為技術突破點。通過“思維簽名”和“思考等級”技術,該模式將思維鏈轉化為可量產的產品,在Humanity’s Last Exam測試中得分提升至41.0%,GPQA Diamond測試準確率高達93.8%,ARC-AGI-2測試更創下45.1%的紀錄。代碼生成領域同樣表現亮眼,Gemini 3以1487分登頂WebDev Arena排行榜,Terminal-Bench 2.0測試得分54.2%,SWE-bench Verified基準測試達76.2%,被谷歌稱為“迄今最優秀的智能體編碼模型”。其配備的100萬token上下文窗口,可輕松應對長文本處理和復雜任務拆解。
產品落地策略上,谷歌打破傳統發布周期,在Gemini 3發布當日即完成核心產品整合。谷歌搜索AI Mode引入沉浸式視覺布局和交互式工具,提供全新生成式用戶界面;Gemini應用6.5億月活躍用戶可直接體驗新模型能力,AI Overviews的20億月活用戶同步享受升級服務。開發者生態方面,模型通過Google AI Studio、Vertex AI等官方平臺及Cursor、GitHub等第三方工具開放訪問,全新推出的Google Antigravity開發平臺更將AI輔助升級為協同合作伙伴,支持智能體在編輯器、終端和瀏覽器間無縫協作。
安全評估方面,Gemini 3成為谷歌史上最嚴格的審查對象,在抵御提示注入攻擊和網絡濫用方面表現優異。目前該模型已向部分訂閱用戶開放,Google AI Ultra訂閱用戶將在未來幾周率先體驗Deep Think模式,后續逐步擴大開放范圍。這場AI競賽中,OpenAI憑借ChatGPT周活突破7億占據用戶優勢,而谷歌則依托Gemini應用6.5億月活和AI Overviews 20億月活的基礎,通過新模型快速完成產品升級,形成雙雄對峙的競爭格局。






















