韓國(guó)電子通信研究院(ETRI)近日研發(fā)出一種超現(xiàn)實(shí)人工智能技術(shù),僅需使用一張人物肖像照片,即可創(chuàng)建出能像真人般自然對(duì)話的數(shù)字頭像。
這項(xiàng)技術(shù)被視為面向全自動(dòng)駕駛時(shí)代的新一代人機(jī)交互界面,預(yù)計(jì)將在數(shù)字人產(chǎn)業(yè)中廣泛應(yīng)用。與傳統(tǒng)辦公場(chǎng)景的語(yǔ)音助手或車(chē)載導(dǎo)航系統(tǒng)僅能執(zhí)行簡(jiǎn)單指令不同,ETRI開(kāi)發(fā)的超現(xiàn)實(shí)AI數(shù)字人具備精細(xì)的面部表情和口型變化,能夠?qū)崿F(xiàn)擬真的人類(lèi)對(duì)話。
該技術(shù)的核心在于其獨(dú)創(chuàng)算法——與傳統(tǒng)生成式AI不同,它會(huì)選擇性學(xué)習(xí)嘴唇、下巴等與發(fā)音直接相關(guān)的面部區(qū)域,通過(guò)減少無(wú)關(guān)信息的學(xué)習(xí)量,實(shí)現(xiàn)包括口型、牙齒乃至皮膚皺紋在內(nèi)的微表情呈現(xiàn)。ETRI表示,該技術(shù)在合成畫(huà)質(zhì)與唇語(yǔ)同步準(zhǔn)確度方面表現(xiàn)優(yōu)異,相關(guān)成果已在CVPR、AAAI等國(guó)際頂級(jí)會(huì)議上發(fā)表。
除自動(dòng)駕駛領(lǐng)域外,這項(xiàng)技術(shù)還可應(yīng)用于自助服務(wù)終端、銀行柜臺(tái)、新聞播報(bào)、廣告模特等多個(gè)場(chǎng)景,有望推動(dòng)AI數(shù)字人產(chǎn)業(yè)的革新。ETRI移動(dòng)用戶體驗(yàn)研究室目前正重點(diǎn)研發(fā)人機(jī)交互(HMI)技術(shù),同時(shí)開(kāi)發(fā)能分析駕駛員、行人情緒狀態(tài)及疲勞度、專(zhuān)注度等指標(biāo)的AI駕駛界面技術(shù)。
研究室主任尹大燮指出:"隨著移動(dòng)技術(shù)日益復(fù)雜,老年群體和社會(huì)弱勢(shì)群體可能面臨技術(shù)鴻溝。我們希望通過(guò)這項(xiàng)AI數(shù)字人技術(shù)提升全民數(shù)字素養(yǎng),讓智能出行服務(wù)真正普惠大眾。"高級(jí)研究員崔大雄補(bǔ)充道:"我們將持續(xù)優(yōu)化生成式AI技術(shù),使數(shù)字人能像真人一樣自然交談和行動(dòng)。未來(lái)目標(biāo)是實(shí)現(xiàn)咨詢、點(diǎn)餐等場(chǎng)景的人力替代。"
目前該技術(shù)已作為"擬真對(duì)話人臉生成框架"在ETRI技術(shù)轉(zhuǎn)讓平臺(tái)注冊(cè)。研究團(tuán)隊(duì)表示將積極推動(dòng)多行業(yè)技術(shù)轉(zhuǎn)移與商業(yè)化落地。
精選文章:
十大斯堪的納維亞風(fēng)格住宅:北歐設(shè)計(jì)與建筑的極致呈現(xiàn)
MAD建筑事務(wù)所以"中國(guó)紙傘"重塑傳統(tǒng)工藝亮相2025威尼斯雙年展
Shutterstock全面押注生成式AI,品牌形象煥新升級(jí)
網(wǎng)頁(yè)設(shè)計(jì)將成為用戶心理剖析的藝術(shù)
從食物垃圾到時(shí)尚,下一代設(shè)計(jì)2025大賽獲獎(jiǎng)?wù)咧匦略O(shè)計(jì)未來(lái)