前特斯拉AI總監、OpenAI聯合創始人安德烈·卡帕西近日在其個人博客中發表深度分析,指出2025年將成為大型語言模型(LLM)發展的關鍵轉折年。他通過系統梳理行業動態,提出六大核心趨勢:RLVR訓練范式革新、智能形態的"鋸齒狀"特征、新型應用層架構、AI交互范式轉移、編程民主化進程以及輸出形態的視覺化演進。
在訓練方法論層面,基于可驗證獎勵的強化學習(RLVR)已取代傳統預訓練+監督微調+人類反饋的組合模式。這種新范式通過數學證明、代碼執行等客觀驗證場景,引導模型自主發展出類似人類推理的策略鏈。卡帕西特別指出,RLVR使模型學會將復雜問題拆解為中間步驟,并通過多輪推敲優化解決方案,這種能力在傳統訓練框架下難以實現。實驗數據顯示,RLVR階段消耗的計算資源已超過預訓練階段,成為提升模型性能的核心投入方向。
關于智能本質的認知顛覆,卡帕西提出"幽靈召喚"理論:大模型本質是通過數據分布與訓練目標塑造的統計實體,既非進化中的生命體,也不具備主觀意識。這種技術棧與人類認知系統的根本差異,導致AI能力呈現獨特的"鋸齒狀"分布——在特定領域可能展現超人類水平,卻在基礎認知任務中表現幼稚。這種特性直接沖擊現有基準測試體系,催生出專門針對測試集的"刷分"訓練現象,使得評估結果可信度大幅下降。
應用生態層面正在形成垂直領域的新層級。以AI編程工具Cursor為代表的解決方案,通過編排多模型調用鏈、整合私有數據與工具接口,構建起專業化的工作流系統。這類平臺不僅處理上下文管理,還提供人工介入接口和自主權限調節機制,形成"通才基座模型+領域專家系統"的協同架構。卡帕西預測,專業應用將通過定制化微調,把通用能力轉化為特定場景的解決方案。
交互范式轉移方面,Anthropic推出的Claude Code開創了本地化智能體新形態。該模型直接運行在開發者終端,可調用私人環境變量、配置文件和實時上下文,通過命令行界面實現低延遲交互。這種設計突破云端容器的局限,使AI成為駐留設備的"數字助手"。卡帕西認為,這種本地化部署策略更符合當前技術成熟度曲線,為漸進式發展提供了可行路徑。
編程領域正經歷民主化革命。Vibe Coding現象的興起,使得自然語言描述即可生成功能完整的應用程序。卡帕西本人通過該技術用Rust開發了BPE分詞器,并快速構建了多個原型項目。這種"代碼即臨時產物"的創作模式,不僅降低技術門檻,更催生出大量原本不存在的創新應用。數據顯示,非專業開發者通過Vibe Coding創造的軟件數量,已超過傳統開發模式的產出總和。
在輸出形態革新領域,谷歌的Nano Banana模型展示了復合型智能的潛力。該模型將文本生成、圖像創作與世界知識深度融合,能夠自動生成信息圖、動態演示和交互式網頁等多媒體內容。這種視覺化輸出趨勢,標志著LLM開始突破純文本交互的局限,向更符合人類認知習慣的方向演進。實驗表明,視覺化呈現使信息吸收效率提升300%,用戶滿意度達到傳統模式的5倍以上。
卡帕西特別強調,當前行業對LLM潛力的開發尚不足10%。盡管模型展現出超越預期的智能水平,但在因果推理、長期規劃等復雜認知任務中仍存在明顯短板。這種矛盾特性既預示著技術突破的巨大空間,也警示著基礎研究的重要性。隨著RLVR范式的深化應用和垂直領域解決方案的成熟,2025年將成為檢驗AI技術邊界的關鍵年份。





















