Freepik公司推出全新文生圖模型"F Lite",該模型僅采用版權安全素材訓練,旨在成為Midjourney等爭議性生成器的合法替代品,為研究領域提供法律保障。

這款最新生成式AI模型擁有約100億參數,其訓練數據完全來自Freepik自有圖庫的商業授權圖片。據官方宣稱,F Lite是首個完全基于"安全內容"構建的公開可用大規模模型。

F Lite由Freepik與AI初創公司Fal.ai合作開發,在64塊NVIDIA H100 GPU上歷時兩月完成訓練,所用內部數據集包含約8000萬張圖片。

隨著Adobe、Getty Images和Shutterstock等公司相繼推出基于合法審核數據的圖像生成器,Freepik也加入了這一行列。這場"版權安全訓練集"運動興起之際,OpenAI和Midjourney等公司正因使用網絡爬取圖像面臨訴訟浪潮。

與部分競品不同,Freepik將F Lite定位為開發者可二次開發的開放模型。GitHub倉庫已公開代碼(需配備24GB顯存GPU運行),同時提供Hugging Face體驗版。

人類反饋優化圖像質量

得益于Freepik圖庫的訓練數據,F Lite在生成插畫和矢量風格作品時表現優異。但在處理照片級寫實圖像時,該模型仍存在明顯缺陷:皮膚紋理、織物細節經常缺失,復雜解剖結構易出現失真。由于主要使用長文本描述訓練,模型對簡短提示詞響應不佳,圖像內文字渲染仍是當前技術難點。

相同提示詞在Midjourney中生成的圖像具有藝術質感,幾乎看不出AI痕跡 | 圖片來源:THE DECODER測試生成

公司表示這些局限源于訓練數據集規模與算力投入。根據擴散模型的規模效應定律,圖像質量與細節表現將隨數據量和訓練時長顯著提升。

Freepik的素材庫與AI工具布局

這家西班牙公司專注為設計師、企業和創意人士提供授權數字素材,其平臺包含矢量圖、照片、插畫、圖標及演示模板等海量資源,部分內容可免費使用。近年Freepik持續加碼AI工具研發,已推出自動圖像編輯、內容生成等功能,如今又新增合成圖像生成服務。

精選文章:

偉大的認知遷移:人工智能如何重塑人類的目的、工作和意義

人工智能人才:未來就在眼前!

Bolon「出埃及記」:編織地板的奇幻遷徙之旅

經典電影變身復古書封:一場跨媒介的視覺狂歡

單色房間太單調?這些技巧讓它高級感拉滿