在備受矚目的Google I/O 2025開發者大會上,谷歌揭曉了其Gemini 2.5系列大型語言模型的最新突破。此次發布的系列包含兩款核心模型:輕量級卻功能強大的Gemini 2.5 Flash,以及性能更為卓越的Gemini 2.5 Pro。據谷歌透露,Gemini 2.5 Flash預計將于六月上旬面世,而Gemini 2.5 Pro則將在稍后時間推出。
Gemini 2.5 Flash在多個維度上實現了對其前代產品的超越。該模型引入了創新的文本轉語音功能,能生成極為自然的聲音效果,甚至能模擬出耳語的細膩質感。更令人稱奇的是,它能在不同語言間無縫切換,且保持聲音的一致性。Gemini 2.5 Flash還具備在多種語言環境下靈活應用的能力。
谷歌方面著重強調,Gemini 2.5 Flash在安全性方面達到了前所未有的高度,同時在效率上較上一代提升了22%,能耗也顯著降低。這款輕量級模型還新增了“展示思考流程”的功能,使用戶能夠直觀看到模型如何解答問題和處理查詢,極大地增強了透明度。
與此同時,谷歌還預告了功能更為強大的Gemini 2.5 Pro。據DeepMind的Demis Hassabis介紹,Gemini 2.5 Pro堪稱全球最智能的AI模型之一,它不僅能夠模擬整個城市的運作,還在學習領域處于領先地位。該模型將引入全新的增強推理模式——“Deep Think”,旨在應對更為復雜的任務挑戰。然而,谷歌表示,為了確保模型的穩定性和可靠性,Gemini 2.5 Pro將在進行額外的安全測試后再向公眾發布。
Gemini 2.5 Flash的一大特色在于其混合推理模式。用戶可以根據實際需求開啟或關閉推理功能,并通過設置“思考預算”來靈活調整推理的深度。這一模式使得用戶能夠在性能、成本和延遲之間找到最佳的平衡點。例如,在處理簡單任務時,可以選擇低預算以保持低延遲和低成本;而在面對復雜任務時,則可以選擇高預算以獲得更準確、全面的答案。
Gemini 2.5 Flash還具備動態推理資源管理能力。它能根據任務的復雜度自動調整資源分配,實現高效的計算。在多項基準測試中,如ME 2025和多模態推理(MMMU),Gemini 2.5 Flash均展現出了卓越的性能,與OpenAI的o4-mini不相伯仲,充分證明了其強大的實力。