一款名為千問(wèn)的移動(dòng)端AI助手近日迎來(lái)重大升級(jí),其接入的阿里萬(wàn)相系列最新模型Wan2.5,讓視頻創(chuàng)作能力實(shí)現(xiàn)質(zhì)的飛躍。這款模型不僅將動(dòng)作精度與肢體協(xié)調(diào)性提升至全新高度,更成為首個(gè)支持音視頻同步輸出的移動(dòng)端工具,為用戶帶來(lái)前所未有的創(chuàng)作體驗(yàn)。
萬(wàn)相2.5的突破性在于其多模態(tài)處理能力。作為業(yè)界少數(shù)具備音畫同步技術(shù)的視頻模型,它能夠同時(shí)完成理解與生成任務(wù),支持文本、圖像、視頻、音頻的跨模態(tài)輸入輸出。在權(quán)威評(píng)測(cè)平臺(tái)LMArena的全球排名中,該模型的圖生視頻能力位列第三,穩(wěn)居國(guó)內(nèi)榜首,彰顯其技術(shù)領(lǐng)先性。
在千問(wèn)APP的實(shí)際應(yīng)用中,用戶僅需上傳一張照片并輸入文字描述,即可生成1080P高清視頻。無(wú)論是真人肖像、萌寵動(dòng)態(tài),還是二次元角色、文物形象,系統(tǒng)都能精準(zhǔn)還原肢體動(dòng)作與口型匹配,最長(zhǎng)支持10秒視頻生成。例如輸入"小貓邊唱歌邊跳舞"的指令,靜態(tài)圖片中的角色立即"活"過(guò)來(lái),呈現(xiàn)自然流暢的表演效果。
該功能上線后迅速引爆社交平臺(tái),網(wǎng)友創(chuàng)作出大量創(chuàng)意作品。從兵馬俑說(shuō)唱到文物合唱團(tuán),從萌寵街舞到卡通角色音樂(lè)劇,千問(wèn)APP讓靜態(tài)形象突破次元壁,以動(dòng)態(tài)形式重新演繹經(jīng)典場(chǎng)景。這種"照片唱跳"的新玩法,正重新定義數(shù)字時(shí)代的創(chuàng)意表達(dá)方式。
數(shù)據(jù)顯示,千問(wèn)APP公測(cè)首周下載量即突破千萬(wàn)次,在AI應(yīng)用領(lǐng)域創(chuàng)下增長(zhǎng)新紀(jì)錄。其技術(shù)突破不僅體現(xiàn)在視頻質(zhì)量提升,更在于通過(guò)智能化操作流程,讓普通用戶也能輕松掌握專業(yè)級(jí)視頻制作技術(shù),為數(shù)字內(nèi)容創(chuàng)作開辟了全新可能。






















