卡內基梅隆大學的研究人員近日開發出一款AI模型,能夠根據文字描述自動生成樂高結構設計方案。

卡內基梅隆大學(CMU)的研究團隊為樂高迷們解答了一個存在數十年的疑問:如果任何創意都能瞬間變成樂高套裝會怎樣?

在上周發表的論文《通過文本生成物理穩定且可搭建的樂高設計》中,六位作者共同展示了名為"LegoGPT"的創新成果。這款生成式AI模型能夠接收如"沙漏形原聲吉他"等文字描述,自動確定所需樂高零件清單及組裝方案。

目前LegoGPT的演示版和代碼已通過研究項目頁面公開,意味著樂高愛好者可自由體驗。雖然當前輸出僅限于約20個類別(包括椅子、吉他、船只、火車和汽車等基礎物品),但研究團隊正在擴展模型處理復雜品類的能力。

研究者認為,這類工具未來或將成為建筑與產品設計領域多項實際任務的基礎平臺。

[圖片來源:CMU]

LegoGPT如何預測下一塊積木

LegoGPT是基于Meta公司LLaMA-3.2-Instruct-1B語言學習模型微調而成,可視為開源版ChatGPT。研究人員通過包含47,000個樂高結構和28,000種獨特3D形狀的數據庫訓練模型,每個樣本均配有文字說明。依托這些設計數據,LegoGPT僅憑文字提示就能預測如何搭建虛擬物體。

該模型采用生成式AI平臺常用的自回歸模型架構。

ChatGPT和Llama都屬于自回歸模型,它們根據已輸出的詞語序列預測下一個詞,"論文合著者、CMU博士生Ava Pun解釋道,"比如當系統輸出'今天天氣'后,它會預測后續可能是'晴'或'雨'。而LegoGPT預測的不是詞語,而是下一塊積木。"

當LegoGPT生成3D模型后,還需確保結構實際穩定性。Pun表示這頗具挑戰性,因為現有模擬器無法理解樂高積木的物理特性。為此團隊專門開發了物理驗證算法。

"我們定制了考慮所有物理力的算法:重力帶來的向下作用力、摩擦力,以及相鄰積木間的接觸力,"Pun介紹道,"該算法構建結構受力模型后進行全面評估。若合力為零,則表明結構能保持穩定。"

LegoGPT會自動調用該算法驗證方案可行性。若某塊積木導致模型失衡,系統將持續迭代直至通過穩定性測試。

現實世界的未來應用

目前研究人員已用LegoGPT創建了復古汽車、蒸汽船和電吉他等結構。雖然當前模型僅支持20x20x20體素網格,但團隊計劃擴充積木類型數據庫并提升網格分辨率。

想體驗的樂高愛好者可通過公開演示平臺將簡單描述轉化為可搭建的3D模型及零件清單。由于LegoGPT并非面向普通玩家設計,暫不提供分步搭建指南,用戶需自行摸索組裝順序。

Pun表示選擇樂高作為AI 3D構建能力的測試載體,正是看中其普及性。但團隊相信該技術未來可應用于建筑草圖生成、定制家具設計等現實場景。

"現有生成式AI只能創造圖像或視頻概念,卻不懂實體制造,"Pun強調,"我們希望通過整合物理定律與組裝約束,讓生成模型創造出真正可實現的物體。"

精選文章:

由超過20萬顆鉚釘連接的"球體"在谷歌園區投下戲劇性陰影

奧斯卡·尼邁耶:巴西現代主義建筑指南,從巨作到鮮為人知的瑰寶

數字優先品牌的字體搭配技巧

從咖啡渣到香蕉纖維:五種創新材料重塑可持續照明設計

5個步驟打造奢華極簡主義:永恒優雅與智能科技的完美共生