圖片來源:VentureBeat,使用BFL Playground生成
由Stable Diffusion熱門模型創造者創立的初創公司Black Forest Labs(BFL)近日推出了名為FLUX.1 Kontext的新圖像生成模型。該模型不僅能生成和編輯照片,還允許用戶通過文字和其他圖像進行修改。
該公司還宣布推出全新的BFL Playground平臺,用戶可在企業應用前先行體驗BFL的模型。
BFL發布了該模型的兩個版本:FLUX.1 Kontext [pro]和FLUX.1 Kontext [max]。第三個版本FLUX.1 Kontext [dev]將作為私有測試版發布。Pro和Max版本現已登陸KreaAI、Freepik、Lightricks、OpenArt和LeonardoAI等平臺,助力企業創意團隊和開發者實現精準高效的圖像編輯。
FLUX.1 Kontext支持上下文生成技術,意味著模型可根據提供的參考素材或場景進行創作,而非完全從零開始生成。
該公司在X平臺的推文中指出Kontext的四大特性:
角色一致性:跨場景保持元素連貫
局部編輯:精準修改特定區域不影響整體
風格參考:基于現有風格生成場景
極低延遲
開發者可通過BFL Playground測試用例并體驗模型,再接入完整BFL API。
Pro與Max版本解析
企業用戶可使用Pro版本進行快速迭代編輯。該版本支持文字與參考圖像雙重輸入及局部修改。BFL表示Kontext [pro]的運行速度"比現有先進模型快一個數量級",且是首批支持多輪編輯的模型之一。
FLUX.1 Kontext [max]則是性能更強的極速版本,在保持響應速度的同時,能更精準遵循指令、優化文字可讀性并確保編輯一致性。
當前市場上,MidJourney的AI圖像編輯器和Adobe Firefly等工具同樣支持基于參考圖的區域編輯功能。
FLUX.1 Kontext [dev]作為該系列第三個版本,是參數達120億的開源權重模型。
生成式流技術
BFL表示FLUX.1 Kontext采用流模型架構,使其能更靈活完成上述任務。這種模型通過持續數據流學習,在噪聲數據與有效信息間建立路徑,不同于Stability AI、MidJourney乃至OpenAI Sora等采用的"去噪"擴散模型。
BFL在博客中強調:"FLUX.1 Kontext突破了文生圖局限。相較于僅支持純文本生成的流模型,它能理解現有圖像并據此創作。用戶通過簡單文字指令即可修改輸入圖像,無需復雜調參或編輯流程。"
在文生圖基準測試中,BFL宣稱FLUX.1 Kontext在美學表現、指令遵循、真實感及文字處理方面均可媲美主流模型。
市場反響
BFL去年十月已發布文生圖模型Flux 1.1 Pro及配套API。目前通過BFL Playground體驗Kontext模型的用戶反饋積極。
當然,該模型仍需與持續迭代的成熟圖像生成工具展開競爭。
精選文章: