近期,一股名為“吉卜力畫風”的熱潮席卷了網絡世界。這一趨勢的起點,可以追溯至3月26日,OpenAI推出的基于GPT-4o多模態大模型的高精度圖像生成功能——“4o Image Generation”。據OpenAI介紹,用戶只需通過簡單的文字描述,便能輕松實現廣告、平面圖、UI設計、LOGO風格轉換等多種圖像創作需求。
然而,令人意想不到的是,這一技術迅速被廣大網友用于模仿日本著名動畫導演宮崎駿的畫風,一時間,網絡上涌現出大量“賽博宮崎駿”作品。無論是群聊中的頭像、表情包,還是對經典歌曲的MV進行重新繪制,GPT-4o都展現出了驚人的創作能力,讓人嘆為觀止。推特上的國外網友更是樂此不疲,紛紛曬出自己的“吉卜力風”作品。
在國內,類似的功能也并非空白。字節跳動推出的SeedEdit模型,同樣能夠實現“自然語意修圖”。用戶只需輸入自然語言指令,便可對圖片進行多樣化的編輯操作。這一功能無需翻墻,直接在字節跳動的豆包官網上即可使用,且目前完全免費,無任何限制。
為了親身體驗這一功能,我們上傳了一張知名音樂錄像帶的截圖,并指令豆包和GPT-4o將其轉換為吉卜力風格。對比兩者的作品,GPT-4o在衣物還原度和手部形態上表現更佳,但未能保持原圖比例;而豆包則在構圖和配色上更接近原圖,但衣物細節有所變化,手部形態也略有變形。豆包還嘗試為原圖添加了額外的元素——一只抓著麥克風的手。
除了吉卜力風格,豆包還支持多種風格的轉換。例如,將知名企業家馬斯克和喬布斯轉換為吉卜力或迪士尼風格,效果同樣令人驚艷。豆包還嘗試將影視劇集中的名場面進行畫風轉換,雖然與GPT-4o相比,在角色服裝和形態上略有不足,但整體效果依然十分出色。
然而,隨著吉卜力畫風的火爆,也引發了一系列版權問題。早在2016年,宮崎駿就曾公開表示反對AI動畫技術,認為這是對生命本身的侮辱。他堅持認為,AI生成圖像缺乏對生命力的敬畏。如今,技術的進步反而讓這一趨勢愈演愈烈,這無疑是對宮崎駿觀點的諷刺。
盡管如此,我們仍可以嘗試將這一技術視為一種全新的圖像編輯工具。例如,在設計行業中,“讓大象轉個身”這樣的需求,豆包都能輕松實現。生成的大象背面形象邏輯嚴謹,耳朵、腳部、身體顏色等細節都處理得相當到位,周圍環境也保持了一致性。
不過,在海報制作等方面,豆包的表現則稍顯不足。與GPT-4o相比,豆包在審美和細節處理上還有待提升。豆包在圖像生成時仍存在錯字現象,且在人像前后一致性和圖片內容方向性上也有所欠缺。
盡管如此,豆包SeedEdit仍然填補了國產大模型在語義AI修圖應用領域的空白。隨著AI圖像編輯技術的不斷發展,未來這一功能有望被集成到手機、電腦等日常設備中,成為普通人也能輕松上手使用的工具。屆時,無論是專業設計師還是普通用戶,都能通過這一技術將自己的審美理念直觀地展現出來。