谷歌DeepMind首席執(zhí)行官德米斯·哈薩比斯近日公開表示,將現(xiàn)有AI模型的規(guī)模擴展至極限是實現(xiàn)通用人工智能(AGI)的核心路徑。這位因推出Gemini 3模型備受矚目的技術(shù)領(lǐng)袖在上周的發(fā)言中強調(diào),規(guī)模化發(fā)展不僅是當(dāng)前AI進化的關(guān)鍵組成部分,甚至可能直接構(gòu)成完整的AGI系統(tǒng)框架。
通用人工智能作為人工智能領(lǐng)域的終極目標(biāo),旨在創(chuàng)造具備人類同等或超越性智能的系統(tǒng),能夠自主完成人類認(rèn)知范圍內(nèi)的所有任務(wù)。盡管全球頂尖科技企業(yè)均在此賽道投入重金研發(fā),但目前該技術(shù)仍停留在理論階段。哈薩比斯在闡述觀點時指出,雖然單純依靠模型規(guī)模擴張可能推動AI向AGI演進,但最終突破或許需要額外的一兩個關(guān)鍵技術(shù)革新。
支撐其觀點的"規(guī)模定律"已成為AI行業(yè)的基礎(chǔ)性準(zhǔn)則。這條經(jīng)驗性規(guī)律揭示了模型參數(shù)規(guī)模、訓(xùn)練數(shù)據(jù)量與計算資源投入之間的量化關(guān)系——當(dāng)模型體量與數(shù)據(jù)量呈指數(shù)級增長時,系統(tǒng)性能將出現(xiàn)可預(yù)測的提升。這種"越大越聰明"的邏輯,使得科技巨頭們持續(xù)加碼建設(shè)超算中心,通過堆砌算力與數(shù)據(jù)來訓(xùn)練更大規(guī)模的模型。
然而這種發(fā)展模式正面臨多重挑戰(zhàn)。公開可用的高質(zhì)量訓(xùn)練數(shù)據(jù)總量存在天然上限,而每增加一個數(shù)量級的算力投入,不僅意味著天文數(shù)字級的資金消耗,更將帶來指數(shù)級增長的能源消耗。有環(huán)境研究機構(gòu)警告,若按當(dāng)前速度擴張數(shù)據(jù)中心,到2030年AI訓(xùn)練產(chǎn)生的碳排放可能相當(dāng)于整個阿根廷的年排放量。更令行業(yè)擔(dān)憂的是,部分專家通過實證研究發(fā)現(xiàn),當(dāng)模型規(guī)模突破某個臨界點后,性能提升幅度開始出現(xiàn)明顯衰減。
在硅谷的另一端,前meta首席AI科學(xué)家楊立昆(Yann LeCun)公開質(zhì)疑這種"規(guī)模至上"的路線。這位圖靈獎得主今年4月在新加坡國立大學(xué)演講時直言:"大多數(shù)真正復(fù)雜的認(rèn)知問題,單純依靠擴大規(guī)模根本無法解決。"他以人類學(xué)習(xí)為例指出,嬰兒通過少量互動就能掌握物理世界規(guī)律,而當(dāng)前大模型需要海量數(shù)據(jù)才能達(dá)到類似認(rèn)知水平。
據(jù)知情人士透露,楊立昆離職meta后正在籌建的AI實驗室,將聚焦開發(fā)不依賴語言數(shù)據(jù)的"世界模型"。這種新型架構(gòu)試圖通過模擬物理世界的空間關(guān)系與因果邏輯,讓機器像人類一樣通過觀察理解環(huán)境本質(zhì)。該方案若能突破,或?qū)㈩嵏铂F(xiàn)有以語言處理為核心的大模型技術(shù)路線,為AGI發(fā)展開辟全新路徑。目前已有多個研究團隊在類似方向取得階段性成果,但距離實用化仍存在巨大技術(shù)鴻溝。




















