經過數月的猜測,Midjourney終于推出了其首款視頻模型。公司稱這一舉措是實現AI系統實時模擬完整3D世界的重要早期里程碑。

全新的"圖像轉視頻"功能允許用戶將任何Midjourney生成的靜態圖像轉化為動畫短片。用戶只需在網頁界面點擊新增的"動畫"按鈕,即可選擇自動模式(由系統決定動畫效果)或手動模式(通過文字描述自定義動畫效果)。

該功能提供兩種主要模式:"低動態"模式適合固定鏡頭和緩慢移動的場景,而"高動態"模式會大幅增強鏡頭和主體的運動幅度——不過Midjourney表示,這可能導致畫面精確度下降。

每段視頻可進行最多四次延長,每次延長約4秒。用戶還能在每次延長時修改原始圖像的提示詞。

非Midjourney生成的圖像也可通過拖拽至提示框并設為"起始幀"來實現動畫效果,用戶只需用文字描述期望的運動軌跡即可。

目前官方尚未公布分辨率、幀率或比特率的具體參數,也未內置畫質提升功能。實測下載的視頻為480p MP4格式,幀率為24fps。

視頻生成成本約為圖像的八倍

該視頻功能目前僅限網頁端使用。生成視頻的消耗約為靜態圖像的八倍,每次可生成四段5秒的短片。實際換算相當于每秒視頻消耗約1張圖像的生成額度。Midjourney聲稱其成本比競品低約25倍。

針對"Pro"及以上等級用戶,公司正在測試"視頻放松模式",允許用戶在不消耗快速生成額度的情況下制作視頻,可能進一步降低單次生成成本。官方表示未來幾周將根據需求量和服務器負載調整定價策略。

技術演進與行業競爭

Midjourney將此次視頻模型的發布視為關鍵過渡步驟。其長期目標是將視頻模型、3D元素與實時處理技術整合為統一平臺。創始人David Holz始終致力于開發能實時模擬世界的系統。視頻模型開發過程中積累的經驗也將反哺現有的圖像工具。

在AI視頻領域,谷歌Veo 3模型目前被普遍視為行業標桿。該模型可直接通過文字提示生成視頻,無需初始圖像,還能添加語音和音效,在當前AI視頻領域獨樹一幟。

法律糾紛持續發酵

與此同時,迪士尼與環球影業已聯合起訴Midjourney,指控其AI圖像生成器未經授權創建了達斯·維德、小黃人等注冊商標角色的圖像。這份提交至加州聯邦法院的訴狀指出,Midjourney在多次警告后仍持續復制受版權保護的內容。

兩家制片公司要求賠償損失、陪審團審判,并申請禁令阻止未來對受保護角色的使用。類似版權糾紛可追溯至2023年。截至目前,Midjourney尚未公開回應,其新視頻模型的訓練數據來源亦不明確。

精選文章:

貝聿銘設計的公寓樓,公租房的天花板

奢華可持續水上住宅:多塞特湖上的現代斯堪的納維亞設計

耐熱設計:城市領導者如何利用建筑材料抵御高溫危機

dobe推出全新移動應用Firefly,讓創意觸手可及

2025年最激勵人心的20位插畫師