深度解析創意AI的起源、運作、爭議與未來
2018年,一幅名為《埃德蒙·德·貝拉米》的肖像畫在紐約拍出43.25萬美元高價。令人驚訝的是,這幅畫并非出自人類藝術家之手,而是由學習過數千幅古典肖像的AI算法創作。同年,藝術家馬里奧·克林格曼的《路人記憶I》以4萬英鎊(約5.38萬美元)成交。若你認為AI僅局限于繪畫領域,那就錯了——它已進軍寫作、音樂甚至建筑等創意領域。2018年,羅斯·古德溫的《1號公路》成為首部完全由AI撰寫的小說;音樂領域,OpenAI的Jukebox和SunoAI的Bark即將顛覆行業;建筑方面,機器人建造的3D打印裝置《代達羅斯亭(2016)》同樣引人注目。
這些案例僅是AI在創意產業的初試啼聲。隨著技術持續進化,未來更成熟的AI軟件會帶來什么?它會徹底取代人類創造力嗎?創意AI將走向何方?它如何誕生?我們又面臨哪些爭議?人機協作會催生怎樣的成果?本文將一一探討。
創意AI的起源
歷史上,機械取代的多是重復性勞動,而寫作、藝術等創意工作長期未被技術撼動。但Midjourney、Dall·E等工具并非橫空出世——AI藝術的萌芽可追溯至數十年前。1970年代,藝術家哈羅德·科恩開發了早期藝術生成程序AARON,能創作抽象畫作。1979年,它在舊金山現代藝術博物館完成了百米壁畫。2014年,AI藝術系統迎來突破:計算機科學家伊恩·古德費洛提出生成對抗網絡(GANs),至今仍是許多藝術生成系統的核心。2015年問世的神經風格遷移技術,通過融合圖像風格與內容首次引發公眾關注。2018年,基于GANs的《埃德蒙·德·貝拉米》拍賣成功;2021年,OpenAI推出首個文本生成圖像模型Dall·E,掀起AI圖像革命;2022年,首個開源AI圖像工具Stable Diffusion面世。如今,新舊工具正持續迭代,爭奪市場。
GANs生成的肖像《埃德蒙·德·貝拉米》以43.25萬美元成交。圖片來源:Obvious Collective(教育用途)
創意AI如何運作?(圖像生成模型篇)
創意AI本質上是生成式AI的分支。以最早的GANs系統為例:它由生成器與判別器組成。生成器試圖制造逼真圖像,判別器則區分真實圖像(來自訓練數據)與生成器的"贗品"。通過判別器的持續反饋,生成器不斷優化,直至能以假亂真。
GANs簡化流程:生成器創作→判別器批判→生成器改進
而Stable Diffusion、Dall·E等工具依賴的擴散模型,可用米開朗基羅的名言詮釋:
"每塊大理石都藏著一尊雕像,雕塑家的任務是發現它。"
AI圖像生成器如同畫家,但它的畫布初始布滿電視雪花般的噪點(高斯噪聲)。通過逐步去噪,最終呈現符合文字指令的圖像。這一能力源自訓練——模型學習過數百萬張圖像的加噪與去噪過程。當輸入"海上落日"等指令時,模型便從混沌中雕琢出你想象的畫面。為確保圖像貼合指令,多數擴散模型采用CLIP(對比語言-圖像預訓練)系統作為引導。
用戶指令:"海上落日"(Dall·E 3生成)
創意AI的挑戰、爭議與倫理
AI工具的創造力與日俱增,有人歡呼這場革命,也有人憂心忡忡。當曾被視為人類專屬的創造力被AI挑戰,創意從業者正目睹職業受到威脅。
伴隨強大能力而來的是責任。AI藝術的版權與知識產權首當其沖:模型訓練依賴海量網絡數據。2023年1月,Getty Images起訴Stability AI,指控其擅自使用1200萬張圖片訓練模型;同年,多位視覺藝術家集體訴訟AI公司未經授權使用其作品。
更深層的爭議關乎原創性。嚴格來說,AI藝術并非完全原創——它提取訓練數據中的模式,混合生成"不存在"的新作品。這引發對創造力本質的叩問:當AI能模仿創意時,創造力究竟是什么?當AI完成驚艷作品,真正的創作者是AI還是輸入指令的人類?這些問題尚無定論,值得深思。
創意AI的未來
無人能精準預言AI的進化軌跡,但可確定它將與量子計算、AR/VR、Web3等前沿技術結合,形成"強大到可怕"的合力。當前已有電影人、動畫師借助AI優化流程,若技術完全成熟,行業將迎來巨變。
但AI不會扼殺人類創造力。正如Netflix CEO泰德·薩蘭多斯所言:"AI將降低講好故事的成本,而非取代創意。"未來,AI不僅服務于工作室,更將滲透日常生活——從洗碗機器人到自動洗衣系統,可能性無窮無盡。
結語
AI很可能將創意游戲提升至全新維度,但不會完全取代人類藝術。AI沒有情感、靈魂與真正的想象力,僅能基于模式生成作品,無法傳遞目的性與真情實感;而人類藝術家通過創作表達情緒與意義。
試想當創意人與AI協作:藝術家提供情感內核,AI作為工具精煉作品、激發靈感,二者合力必將誕生非凡之作。
邁向未來時,我們需審慎運用與塑造AI。創意之未來已握于手中,但核心問題仍是:我們將AI視為創作工具,還是任由它重新定義"創意"本身?
精選文章: