谷歌在大模型領(lǐng)域即將迎來一場顛覆性變革。Google DeepMind的Gemini預(yù)訓(xùn)練負(fù)責(zé)人Sebastian Borgeaud在接受采訪時透露,未來一年,長上下文處理效率與上下文長度擴(kuò)展將成為技術(shù)突破的核心方向。這一觀點與Jeff Dean、Oriol Vinyals和Noam Shazeer三位頂尖科學(xué)家的對談內(nèi)容不謀而合,進(jìn)一步印證了谷歌在AI領(lǐng)域的戰(zhàn)略布局。
Sebastian指出,谷歌在注意力機(jī)制方面取得了突破性進(jìn)展,這些發(fā)現(xiàn)可能在未來幾個月內(nèi)重塑研究方向。他強(qiáng)調(diào),Scaling Law并未失效,而是正在經(jīng)歷演變。這一觀點打破了外界對傳統(tǒng)模型擴(kuò)展路徑的質(zhì)疑,為AI發(fā)展提供了新的理論支撐。作為Gemini 3的預(yù)訓(xùn)練負(fù)責(zé)人,Sebastian首次公開分享了實驗室的底層思維邏輯,揭示了從單一模型訓(xùn)練向系統(tǒng)化構(gòu)建的范式轉(zhuǎn)變。
Gemini 3的性能飛躍源于預(yù)訓(xùn)練與后期訓(xùn)練的協(xié)同優(yōu)化。Sebastian解釋稱,團(tuán)隊通過持續(xù)調(diào)整"旋鈕"參數(shù),在龐大系統(tǒng)中實現(xiàn)了無數(shù)細(xì)微改進(jìn)的聚合。這種積累效應(yīng)推動了AI從粗放式數(shù)據(jù)堆砌向精細(xì)化資源利用轉(zhuǎn)型。他特別提到,當(dāng)前數(shù)據(jù)資源正從"無限供給"轉(zhuǎn)向"有限約束",迫使行業(yè)重新思考模型架構(gòu)的核心價值。
混合專家模型(MoE)成為Gemini 3的技術(shù)基石。這種架構(gòu)突破了單純追求規(guī)模的傳統(tǒng)路徑,轉(zhuǎn)而構(gòu)建"大而高效"的智能系統(tǒng)。Sebastian透露,團(tuán)隊正在探索如何讓模型像人類一樣動態(tài)調(diào)用知識庫,而非將所有信息固化在參數(shù)中。這種檢索與推理的原生結(jié)合,可能突破現(xiàn)有參數(shù)規(guī)模的知識容量限制。
在技術(shù)前沿方向上,Sebastian預(yù)測長上下文處理將迎來雙重突破。超長上下文不僅意味著記憶容量的提升,更將構(gòu)建真正的數(shù)字工作臺。模型可同時加載代碼庫、科研論文和對話歷史,實現(xiàn)跨領(lǐng)域的連貫分析。這種能力為復(fù)雜任務(wù)處理和深度研究開辟了新可能,是通往更強(qiáng)大智能體的關(guān)鍵基礎(chǔ)設(shè)施。
三位頂尖科學(xué)家的對談揭示了更深層的戰(zhàn)略轉(zhuǎn)向。Noam Shazeer特別強(qiáng)調(diào)"慢思考"理念,主張將研發(fā)重心從性能峰值轉(zhuǎn)向系統(tǒng)穩(wěn)定性。他指出,當(dāng)前模型缺乏持續(xù)修正能力,單純追求規(guī)模擴(kuò)張已接近邊界。Jeff Dean補(bǔ)充稱,智能正在從抽象能力轉(zhuǎn)化為工程開銷,需要像CPU和硬盤一樣納入成本考量。這種思維轉(zhuǎn)變導(dǎo)致傳統(tǒng)Benchmark指標(biāo)逐漸失效,行業(yè)開始關(guān)注模型的長期運行能力。
Gemini被定義為"系統(tǒng)"而非"模型"的表述引發(fā)關(guān)注。Noam解釋稱,系統(tǒng)思維強(qiáng)調(diào)可擴(kuò)展性和容錯機(jī)制,關(guān)注十年甚至二十年的穩(wěn)健運行。這種定位使谷歌擺脫了與競爭對手的參數(shù)競賽,轉(zhuǎn)而構(gòu)建可迭代的智能工業(yè)體系。對談中未出現(xiàn)任何產(chǎn)品宣發(fā)或?qū)?biāo)言論,凸顯出谷歌對長期技術(shù)價值的堅守。





















