在今日舉行的Google I/O 2025大會上,谷歌宣布了涵蓋生成式AI模型的多項重大更新,正式推出新一代視頻生成模型Veo 3和圖像模型Imagen 4。公司在其官方博客中將這兩項技術稱為"重大突破",稱其能"創造令人驚嘆的影像內容,助力藝術家實現創意愿景,同時為大眾提供表達自我的強大工具"。

Veo 3:視頻生成的革命性進化

作為谷歌"最先進的視頻生成模型",Veo 3在Veo 2基礎上實現了質的飛躍——首次為生成視頻添加環境音效和角色對話功能。該模型在文本理解、照片級場景還原及真實物理規律模擬方面表現尤為突出,甚至能精準實現唇語同步。

"只需輸入簡短故事描述,模型就能將其轉化為生動影像,"谷歌技術團隊解釋道。目前Veo 3已面向美國地區的Ultra訂閱用戶通過Gemini應用和Flow工具開放,企業用戶可通過Vertex AI平臺調用。

Imagen 4:細節表現力再攀高峰

最新圖像模型Imagen 4在生成速度與細節處理上全面超越前代產品。無論是復雜織物紋理、水滴飛濺還是動物毛發,都能實現毫米級精度還原,同時支持從超現實到抽象風格的全方位創作。

該模型支持更靈活的畫幅比例和2K分辨率輸出,文字生成能力顯著增強。現已集成至Gemini、Whisk及Vertex AI平臺,并深度對接Workspace辦公套件。谷歌透露,運算速度提升10倍的"高速版"Imagen 4即將發布。

Ultra訂閱服務:高端AI體驗入口

作為Veo 3的獨家使用通道,谷歌今日推出的Ultra訂閱服務(249.99美元/月)囊括了公司最先進的AI模型組合。新用戶可享首三月五折優惠,目前僅在美國地區開放。

Ultra套餐包含Gemini終極版、Veo 3視頻生成、Flow影視工具、Whisk創意套件、NotebookLM智能筆記本、全平臺Gemini集成、Project Mariner智能代理、YouTube Premium會員及30TB云存儲空間。

Flow:AI影視創作中樞

專為Veo 3打造的Flow影視工具現已成為Ultra和現有Pro訂閱的核心組件。這款"谷歌尖端模型專屬創作平臺"提供直觀的自然語言指令輸入、自定義角色導入、專業級鏡頭控制、場景延展等影視工業化功能。

"Flow的設計靈感來源于心流狀態——當時間放緩,創作變得輕松、迭代且充滿可能,"開發團隊表示。其底層整合了VideoFX實驗室技術,目前僅Ultra用戶可解鎖Veo 3的全部潛能。

通過這組創新,谷歌正重新定義生成式AI的行業標準,將技術邊界從靜態圖像擴展到具備多感官體驗的動態敘事領域。對于內容創作者而言,這些工具不僅降低了專業制作門檻,更開辟了前所未有的表達維度。

精選文章:

谷歌以顛覆性AI技術全面超越競爭對手:深度思考、智能購物與對話式視頻生成

Tomorrowland 推出首款家具系列,進軍家居裝飾領域

建筑作為社會創新的工具:以人為本的設計對抗孤獨

海報排版:如何讓你的信息脫穎而出

這些品牌的端午禮盒,把非遺從博物館搬進你的生活里!