谷歌近日正式發布其最新大模型Gemini 3 Pro,這款由內部團隊與首席執行官桑達爾·皮查伊共同推動的產品,旨在打造綜合性能最強的基礎模型。谷歌DeepMind首席執行官德米斯·哈薩比斯透露,研發團隊特別針對前代版本在編程、邏輯推理及數學能力上的不足進行了優化,使新模型在這些領域表現更為突出。他直言,Gemini 3 Pro是谷歌向通用人工智能(AGI)邁進的關鍵一步。
在功能層面,谷歌副總裁喬希·伍德沃德通過播客節目《Hard Fork》分享了Gemini 3的獨特優勢。他指出,該模型在處理多步驟任務時展現出更強的連貫性,能夠穩定維持思維鏈條,避免中途斷裂。它還能根據用戶需求動態生成定制化交互界面,例如互動式教程或嵌入式計算器,提升使用體驗。谷歌公布的數據顯示,Gemini應用月活躍用戶已突破6.5億,若計入通過搜索“AI概覽”功能接觸該模型的用戶,月活躍人數達20億。為擴大用戶基礎,谷歌宣布全美高校學生將免費獲得一年期Gemini高級版使用權。
盡管Gemini 3的部署正在全面推進,哈薩比斯的研究重心已轉向更具挑戰性的領域——世界模型(World Models)。他透露,自己目前將大部分時間投入這一方向,并列舉了SIMA 2(可泛化智能體建模架構)和視頻生成模型Genie 3等項目作為案例。這些模型已在谷歌內部用于機器人及其他智能體的訓練,被視為實現AGI的核心組件。哈薩比斯預測,世界模型將迎來類似ChatGPT的突破性時刻,但當前仍面臨成本高昂和技術瓶頸的雙重挑戰。他以Genie為例解釋:“使用它的用戶實際上在創造另一個它,這導致成本居高不下。”如何讓模型穩定性維持超過一分鐘,也是亟待解決的問題。
在談及人工智能行業的潛在風險時,哈薩比斯表現出謹慎態度。他直言,私募市場存在明顯泡沫,部分初創企業在尚未推出實質性產品的情況下,種子輪融資估值便高達數百億美元,“這缺乏基本邏輯,難以持續”。不過,他強調谷歌不受此類風險影響。回顧十二年前DeepMind并入谷歌時的戰略構想,哈薩比斯表示,將AI研究打造為谷歌產品的“引擎室”已見成效。如今,Gemini已深度賦能搜索、YouTube和云服務等核心業務,實現快速商業回報。他堅信,無論市場環境如何變化,谷歌都已占據有利位置。
對于AGI的實現時間,哈薩比斯維持此前判斷,認為仍需5至10年。他指出,通往這一目標需要“一到兩項關鍵突破”,尤其在模型可靠性、復雜推理能力和長期記憶機制等方面。他承認,單純擴大模型參數量已出現收益遞減現象,但強調這并不意味著進展停滯。“人們常誤以為收益遞減是零增長或指數增長的二元對立,實際上存在中間態。當前雖不再每代都實現性能翻倍,但仍持續帶來顯著提升,因此持續投入極具價值。”他進一步解釋,谷歌正處在這一階段,投入回報率依然可觀。
與此同時,哈薩比斯也警示了模型能力增強帶來的新型風險。他特別提到,隨著模型接入外部工具的“函數調用”能力提升,網絡安全領域必須“加倍審慎”,防止技術被惡意濫用。他強調,谷歌已在內部建立嚴格的安全審查機制,確保技術發展始終在可控范圍內。




















