午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

資訊在沃

阿里云萬相2.1視頻大模型開源,8.2GB顯存輕松駕馭,性能超越Sora等競品

   發(fā)布時(shí)間:2025-02-25 23:16 作者:朱天宇

阿里云近日宣布了一項(xiàng)重大舉措,正式開源其視覺生成基座模型——萬相2.1(Wan)。此次開源行動(dòng)采用了極為寬松的Apache2.0協(xié)議,意味著全球開發(fā)者將能夠無限制地訪問和使用這一前沿技術(shù)。

萬相2.1模型包含14B和1.3B兩種參數(shù)規(guī)格,阿里云不僅開放了全部推理代碼,還提供了相應(yīng)的權(quán)重文件。這一舉措極大地方便了開發(fā)者進(jìn)行文生視頻和圖生視頻等任務(wù)的探索。開發(fā)者可以在Github、HuggingFace和魔搭社區(qū)等多個(gè)平臺上輕松下載并體驗(yàn)這一模型。

據(jù)悉,14B參數(shù)的萬相模型在指令遵循、復(fù)雜運(yùn)動(dòng)生成、物理建模以及文字視頻生成等多個(gè)領(lǐng)域均展現(xiàn)出了卓越的性能。在評測集VBench中,萬相2.1以86.22%的總分力壓群雄,包括Sora、Luma、Pika等國內(nèi)外知名模型,成功登頂。而1.3B版本的測試結(jié)果同樣令人矚目,它不僅超越了更大尺寸的開源模型,還逼近了部分閉源模型的表現(xiàn)。尤為該版本能夠在消費(fèi)級顯卡上流暢運(yùn)行,僅需8.2GB顯存即可生成480P視頻,這對于二次模型開發(fā)和學(xué)術(shù)研究來說無疑是一個(gè)巨大的福音。

萬相視頻模型采用了先進(jìn)的DiT架構(gòu)和線性噪聲軌跡Flow Matching范式,并在此基礎(chǔ)上研發(fā)了高效的因果3D VAE和可擴(kuò)展的預(yù)訓(xùn)練策略等創(chuàng)新技術(shù)。特別是在3D VAE方面,萬相團(tuán)隊(duì)通過實(shí)現(xiàn)特征緩存機(jī)制,成功支持了任意長度視頻的編碼和解碼,實(shí)現(xiàn)了對無限長1080P視頻的高效處理。通過將空間降采樣壓縮提前,萬相模型在不損失性能的前提下,進(jìn)一步減少了29%的推理時(shí)內(nèi)存占用,從而提升了整體運(yùn)行效率。

在多個(gè)維度的測試中,萬相模型均展現(xiàn)出了業(yè)界領(lǐng)先的表現(xiàn)。特別是在運(yùn)動(dòng)質(zhì)量、視覺質(zhì)量、風(fēng)格和多目標(biāo)等14個(gè)主要維度以及26個(gè)子維度的測試中,萬相模型斬獲了5項(xiàng)第一,充分證明了其強(qiáng)大的技術(shù)實(shí)力和廣泛的應(yīng)用潛力。

對于想要深入了解和使用萬相模型的開發(fā)者來說,以下是一些開源地址的鏈接:

Github:https://github.com/Wan-Video

HuggingFace:https://huggingface.co/Wan-AI

魔搭社區(qū):https://modelscope.cn/organization/Wan-AI

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新