谷歌近期震撼發布其最新一代人工智能模型——Gemini 2.0,這款AI模型以其卓越的性能和多模態處理能力,迅速成為業界關注的焦點。與前代產品相比,Gemini 2.0不僅在性能上實現了飛躍,更在多個關鍵基準測試中展現出了令人矚目的表現,其性能幾乎達到了Gemini 1.5 Pro的兩倍,且響應速度更快,延遲更低。
在功能方面,Gemini 2.0同樣帶來了諸多創新。它不僅支持圖像、視頻和音頻等多種形式的輸入,還能夠實現與文本相結合的原生文生圖以及可定制化的文本轉語音(TTS)多語言音頻輸出。這一多模態處理能力,使得Gemini 2.0在應用場景上更加廣泛,能夠滿足更多元化的需求。
Gemini 2.0還引入了原生調用工具的功能,包括Google搜索、代碼執行以及用戶自定義的第三方函數等。這些功能的加入,為開發者提供了極大的便利,使得他們能夠更加高效地利用Gemini 2.0進行開發和創新。
為了探索通用人工智能(AGI)的未來潛力,谷歌還在積極推進一系列原型項目。其中,Project Astra得到了更新,同時推出了全新的Project Mariner以及AI代碼智能體Jules。這些項目旨在通過實踐來驗證和拓展AGI的功能和應用范圍。
目前,開發人員已經可以在AI Studio和Vertex AI平臺上試用Gemini 2.0 Flash的實驗版本。不過需要注意的是,部分功能如文本轉語音和原生圖像生成等,目前仍僅對早期訪問合作伙伴開放。但谷歌方面表示,預計在今年1月,這些功能將向更廣泛的用戶開放。
為了推動AI技術在更多領域的應用和發展,谷歌還發布了全新的多模態實時API。這款API具備實時處理音頻和視頻輸入的能力,并能夠支持多個組合工具的使用。它的推出,將為開發者打造動態和交互式應用提供更加有力的支持。