還記得今年三月英偉達(dá)研究團(tuán)隊的公布的“AI神筆”嗎?這款智能畫筆僅根據(jù)寥寥數(shù)筆草圖即可生成一幅堪比華為P30拍攝的逼真風(fēng)景圖,真實拯救無數(shù)手殘黨。如今這個名為GauGAN的圖片生成器終于上線測試?yán)?,無需注冊、完全免費(fèi),打開網(wǎng)頁即可玩耍~
微博上曾經(jīng)流行過一張圖:如何畫出一匹馬?在此之后又出現(xiàn)了:如何畫一個喬布斯?理想與現(xiàn)實、想法和下筆的差距過于真實,引起手殘黨的極度共鳴。
這叫做“簡單畫幾筆就好”?
怎么玩兒呀?
今年3月英偉達(dá)的新科技GauGAN在GTC 2019上一經(jīng)推出,獲得無數(shù)手殘黨點贊。GauGAN的拼寫與印象派大師高更(Gauguin)僅兩字之差,而前者生成的圖象與大師之作相比也絲毫不輸。最重要的是,使用者并不需要具備很高的繪畫功底,僅通過簡單的點擊、描畫、構(gòu)圖即可生成逼真風(fēng)景圖。
GauGAN具備一個簡易的操作界面,左側(cè)是使用者用鼠標(biāo)控制的畫板,右側(cè)是AI實時生成的預(yù)覽圖。在一個類似PS的工具欄中有包括油漆桶、鋼筆和鉛筆三種繪圖工具。在創(chuàng)作時,首先要選擇最右側(cè)的元素類型(如天空、樹木、山脈等),然后選擇繪圖工具,在畫板上描畫出輪廓,右邊的AI畫板將實時補(bǔ)充輪廓中細(xì)節(jié)。
背后原理SPADE架構(gòu)
使用者的涂鴉在計算機(jī)視覺領(lǐng)域其實被稱為語義布局(Semantic Layout),傳統(tǒng)的語義圖像合成首先將語義布局作為深度神經(jīng)網(wǎng)絡(luò)的輸入,而后通過對卷積、歸一化和非線性層的處理,輸出為合成圖像。
但這種傳統(tǒng)的合成方式存在缺陷,其中的歸一化層通常會讓輸入語義蒙版中的信息流失,導(dǎo)致合成效果變差,無法達(dá)到最佳效果。
為了解決這個問題,英偉達(dá)的研究人員提出了一種新的方法SPADE架構(gòu)——空間自適應(yīng)標(biāo)準(zhǔn)化,能夠通過空間自適應(yīng)學(xué)習(xí)轉(zhuǎn)換使用輸入語義布局來調(diào)制激活,可以在整個網(wǎng)絡(luò)中有效地傳播語義信息。
這篇論文由英偉達(dá)的研究人員Taesung Park、Ming-Yu Liu、Ting-Chun Wang和Jun-Yan Zhu(朱俊彥)共同完成,其中朱俊彥大神近日宣布將于2020年秋季回到CMU擔(dān)任助理教授一職。戳此處回顧朱俊彥在將門做的talk~
國外網(wǎng)友已經(jīng)玩瘋了!
該論文的作者之一Ming-Yu Liu在Twitter上公布了網(wǎng)站地址后,不少網(wǎng)友已經(jīng)按耐不住激動的小手玩嗨了!
真的好好玩,我都佩服我寄幾!
Wow!這也太贊了吧!
別攔著我,我還要玩!
這真的不是攝影+PS嗎?
英偉達(dá)深度學(xué)習(xí)部門的副總裁 Bryan Catanzaro稱,僅通過草圖就能快速生成高保真圖像將大大提高設(shè)計團(tuán)隊頭腦風(fēng)暴的效率。
GauGAN可以成為建筑師、城市規(guī)劃者、景觀設(shè)計師甚至游戲開發(fā)者創(chuàng)建虛擬世界、高保真原型圖的強(qiáng)大工具,幫助專業(yè)人員更快速、更高效、更靈活地完成多種項目需求。而對于我們普通人而言——對專業(yè)繪畫攝影、PS等操作復(fù)雜的修圖神器望而卻步的手殘黨們,GauGAN真實地將完全看不出是什么的“鬼畫符”變成了高度逼真的圖象。
不過歸根結(jié)底,GauGAN只是一種幫助我們將頭腦中的設(shè)計點子實現(xiàn)出來的一種工具,如果腦中沒有任何想法,再厲害的GauGAN也無法憑空創(chuàng)作出大師之作。
-
生成器
+關(guān)注
關(guān)注
7文章
319瀏覽量
21098 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3842瀏覽量
91868 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5512瀏覽量
121468
原文標(biāo)題:英偉達(dá)AI神筆馬良公開測試?yán)?,距離畫家你只剩一步之遙~
文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論