近日,阿里巴巴旗下的通義萬(wàn)相技術(shù)平臺(tái)宣布了一項(xiàng)重大開源進(jìn)展,推出了一項(xiàng)名為“首尾幀生視頻14B模型”的前沿視頻生成技術(shù)。
這項(xiàng)AI技術(shù)的核心在于,它可以根據(jù)用戶提供的起始幀和結(jié)束幀畫面,自動(dòng)生成一段720p高清分辨率的過(guò)渡視頻。這一創(chuàng)新為視頻創(chuàng)作者開辟了新的創(chuàng)作路徑。
該模型背后依托的是一套復(fù)雜的深度學(xué)習(xí)算法,它能夠深入解析用戶提供的畫面內(nèi)容、風(fēng)格以及主題元素。一旦用戶上傳了首尾兩幀圖像,模型便會(huì)細(xì)致分析畫面中的各類視覺(jué)細(xì)節(jié),如物體的形狀、色彩搭配以及光影效果,進(jìn)而推理并生成最為合理的中間過(guò)渡幀。
通過(guò)這種方式生成的視頻,不僅保持了物體運(yùn)動(dòng)軌跡的自然流暢,還實(shí)現(xiàn)了光線和色彩的平滑過(guò)渡,最終呈現(xiàn)出一個(gè)邏輯嚴(yán)密、視覺(jué)連貫的高質(zhì)量視頻作品。
值得注意的是,通義萬(wàn)相已經(jīng)將此技術(shù)全面開放給公眾。用戶可以通過(guò)訪問(wèn)通義萬(wàn)相的官方網(wǎng)站直接體驗(yàn)這項(xiàng)服務(wù),同時(shí)也可以通過(guò)GitHub、Hugging Face或魔搭社區(qū)獲取開源代碼,便于本地部署和進(jìn)一步的二次開發(fā)。
這一技術(shù)的推出,尤其對(duì)于需要精細(xì)控制過(guò)渡效果的視頻創(chuàng)作領(lǐng)域,如延時(shí)攝影、特效轉(zhuǎn)換等,提供了更為高效且可控的解決方案。內(nèi)容創(chuàng)作者現(xiàn)在可以利用這一技術(shù),以更少的時(shí)間和精力,實(shí)現(xiàn)更加復(fù)雜的視頻創(chuàng)作需求。