圖片來源:VentureBeat,使用BFL Playground生成

由Stable Diffusion熱門模型創造者創立的初創公司Black Forest Labs(BFL)近日推出了名為FLUX.1 Kontext的新圖像生成模型。該模型不僅能生成和編輯照片,還允許用戶通過文字和其他圖像進行修改。

該公司還宣布推出全新的BFL Playground平臺,用戶可在企業應用前先行體驗BFL的模型。

BFL發布了該模型的兩個版本:FLUX.1 Kontext [pro]和FLUX.1 Kontext [max]。第三個版本FLUX.1 Kontext [dev]將作為私有測試版發布。Pro和Max版本現已登陸KreaAI、Freepik、Lightricks、OpenArt和LeonardoAI等平臺,助力企業創意團隊和開發者實現精準高效的圖像編輯。

FLUX.1 Kontext支持上下文生成技術,意味著模型可根據提供的參考素材或場景進行創作,而非完全從零開始生成。

該公司在X平臺的推文中指出Kontext的四大特性:

角色一致性:跨場景保持元素連貫

局部編輯:精準修改特定區域不影響整體

風格參考:基于現有風格生成場景

極低延遲

開發者可通過BFL Playground測試用例并體驗模型,再接入完整BFL API。

Pro與Max版本解析

企業用戶可使用Pro版本進行快速迭代編輯。該版本支持文字與參考圖像雙重輸入及局部修改。BFL表示Kontext [pro]的運行速度"比現有先進模型快一個數量級",且是首批支持多輪編輯的模型之一。

FLUX.1 Kontext [max]則是性能更強的極速版本,在保持響應速度的同時,能更精準遵循指令、優化文字可讀性并確保編輯一致性。

當前市場上,MidJourney的AI圖像編輯器和Adobe Firefly等工具同樣支持基于參考圖的區域編輯功能。

FLUX.1 Kontext [dev]作為該系列第三個版本,是參數達120億的開源權重模型。

生成式流技術

BFL表示FLUX.1 Kontext采用流模型架構,使其能更靈活完成上述任務。這種模型通過持續數據流學習,在噪聲數據與有效信息間建立路徑,不同于Stability AI、MidJourney乃至OpenAI Sora等采用的"去噪"擴散模型。

BFL在博客中強調:"FLUX.1 Kontext突破了文生圖局限。相較于僅支持純文本生成的流模型,它能理解現有圖像并據此創作。用戶通過簡單文字指令即可修改輸入圖像,無需復雜調參或編輯流程。"

在文生圖基準測試中,BFL宣稱FLUX.1 Kontext在美學表現、指令遵循、真實感及文字處理方面均可媲美主流模型。

市場反響

BFL去年十月已發布文生圖模型Flux 1.1 Pro及配套API。目前通過BFL Playground體驗Kontext模型的用戶反饋積極。

當然,該模型仍需與持續迭代的成熟圖像生成工具展開競爭。

精選文章:

Z世代希望AI發揮其實用性,而非噱頭

諾曼·福斯特:如何成就建筑史上最輝煌的職業生涯

首爾攝影藝術博物館啟幕:以扭曲動感立面重塑城市景觀

AI虛擬網紅正在重塑Z世代的消費選擇

埃及創意人為何集體回歸書法藝術?