騰訊近日震撼發布了其最新研發的AI圖像生成利器——混元圖像 2.0(Hunyuan Image 2.0),并已在混元官方平臺開放注冊體驗。這一創新成果標志著騰訊在AI圖像生成領域的又一重大突破。
混元圖像 2.0采用了突破性的圖像編解碼器技術和全新設計的擴散架構,使得其參數量相比前代實現了質的飛躍。在生成速度方面,該模型更是達到了毫秒級響應,遠遠超越了市面上同類商業產品普遍需要的5至10秒推理時間。用戶現在可以在輸入指令的同時,即時看到生成的圖像,徹底告別了傳統模式下漫長的等待過程。
不僅如此,混元圖像 2.0還通過引入強化學習算法和海量人類美學知識的融合,使得生成的圖像更加細膩且富有真實感。這一進步有效解決了AIGC圖像中常見的“AI痕跡”問題。在權威評測平臺Geneval上,混元圖像 2.0的表現尤為亮眼,準確率高達95%以上,遙遙領先于其他同類模型。
混元圖像 2.0還為用戶帶來了前所未有的實時繪畫板功能。這一功能充分利用了模型的實時生成能力,用戶在進行線稿繪制或參數調整時,預覽區會同步呈現出上色效果,極大地提升了創作效率和體驗。更令人驚喜的是,實時繪畫板還支持多圖融合功能,用戶只需上傳多個草圖,AI便會自動調整透視和光影,根據提示詞生成融合圖像。
除了文字輸入外,混元圖像 2.0還貼心地加入了語音輸入功能。用戶只需通過語音指令,系統便會自動將其轉化為文字,并即時生成相應的圖像。這一創新設計無疑為那些不擅長打字或追求更便捷操作方式的用戶提供了極大的便利。