在科技界的矚目之下,谷歌于2025年I/O開發者大會上震撼發布了其最新研發成果——Gemma 3n,一款專為內存有限設備量身打造的端側多模態AI模型。這款模型不僅能夠處理包括音頻、文本、圖片和視頻在內的多種數據類型,而且其運行需求之低,僅需2GB內存便能在智能手機和平板電腦上流暢運行。
Gemma 3n的核心優勢源自其基于Gemini Nano架構的設計,并融入了谷歌DeepMind團隊研發的Per-Layer Embeddings(PLE)技術。這項技術的一大突破在于,盡管Gemma 3n的參數量分別達到了50億和80億,但其內存占用卻能夠媲美20億和40億參數的模型,極大地拓寬了其在低內存設備上的應用前景。據Gemma 3n的產品經理Gus Martins介紹,這一創新為設備端AI應用帶來了前所未有的表現力。
除了PLE技術,Gemma 3n還集成了KVC共享和高級激活量化等先進技術,這些技術的融合使得模型在移動設備上的運行效率得到了顯著提升,響應速度提高了1.5倍,同時保持了比Gemma 3 40億參數版本更高的質量水平。這一性能優化無疑為移動設備的AI應用注入了新的活力。
值得注意的是,Gemma 3n在非英語語言的處理能力上也取得了顯著進步,特別是在日語、德語、韓語、西班牙語和法語等語言上展現出了卓越的性能。在WMT24多語言基準測試中,該模型以50.1%的高分,充分證明了其強大的多語言處理能力,為全球范圍內的用戶帶來了更加便捷和精準的AI體驗。
對于普通用戶而言,無需進行任何復雜設置,即可通過Google AI Studio在瀏覽器中輕松使用Gemma 3n。而對于開發者來說,他們則可以利用Google AI Edge將Gemma 3n的本地功能無縫集成到自己的應用中,從而為用戶提供更加豐富的文本和圖像理解與生成功能。這一舉措無疑為開發者提供了更加強大的工具,也為AI技術的廣泛應用開辟了新的道路。