美國人工智能初創(chuàng)企業(yè)Runway近日推出新一代視頻生成模型Gen-4.5,在獨立基準測試中力壓谷歌與OpenAI的同類產(chǎn)品。這款模型通過分析用戶輸入的文字描述,能夠精準捕捉運動軌跡與動作細節(jié),生成分辨率達4K級別的視頻內(nèi)容。據(jù)公司介紹,該模型在物理規(guī)律模擬、人體動態(tài)捕捉、鏡頭運動控制及因果關(guān)系推導(dǎo)等核心指標上實現(xiàn)突破性進展。
在第三方評測機構(gòu)Artificial Analysis發(fā)布的Video Arena排行榜中,Gen-4.5以顯著優(yōu)勢登頂榜首。該榜單采用雙盲測試機制,由測試者對匿名提交的視頻樣本進行質(zhì)量評估,最終結(jié)果顯示谷歌的Veo 3排名第二,而OpenAI的Sora 2 Pro僅位列第七。Runway首席執(zhí)行官克里斯托瓦爾·瓦倫蘇埃拉在技術(shù)發(fā)布會上強調(diào):"這個由120人團隊打造的產(chǎn)品,證明了專注與創(chuàng)新能夠突破規(guī)模壁壘。"
成立于2018年的Runway專注于構(gòu)建視頻生成與世界模擬系統(tǒng),其技術(shù)通過海量視頻數(shù)據(jù)訓(xùn)練,能夠更真實地還原物理世界運行規(guī)律。目前服務(wù)客戶涵蓋媒體機構(gòu)、影視制作公司、品牌方及創(chuàng)意工作者等多元領(lǐng)域,估值已達35.5億美元。投資方包括General Atlantic、Baillie Gifford、英偉達及Salesforce Ventures等知名機構(gòu)。
瓦倫蘇埃拉透露,Gen-4.5內(nèi)部代號"David"取自圣經(jīng)典故,象征以弱勝強的技術(shù)突破。這款耗時七年研發(fā)的模型將于本周全面開放,用戶可通過Runway平臺、API接口及合作伙伴渠道獲取服務(wù)。公司同時宣布,這僅是年度技術(shù)升級計劃的首個成果,后續(xù)還將推出系列重大更新。
在技術(shù)民主化議題上,瓦倫蘇埃拉特別指出:"當前正是效率與研究并重的關(guān)鍵時期,我們致力于打破AI技術(shù)壟斷格局。"據(jù)PitchBook數(shù)據(jù)顯示,Runway憑借差異化技術(shù)路線,在視頻生成領(lǐng)域已形成獨特競爭優(yōu)勢,其模型在復(fù)雜場景還原與動態(tài)捕捉能力方面獲得行業(yè)廣泛認可。






















