免費用Stable Diffusion「腦補」世界名畫畫框外世界,網友:白嫖真香

Alex 發自 凹非寺
量子位 | 公眾號 QbitAI

人人都可以免費線上試玩的「腦補」畫面神器來了!

它可以打破畫框的桎梏,「想象」(Outpainting)出《戴珍珠耳環的少女》的背景:

這個工具名為Stable Diffusion Infinity,是大火的AI繪圖新星Stable Diffusion的一項子功能。

只需要一兩句話提示,Stable Diffusion就可以畫出你想要的東西,而且和已有部分銜接自然,沒什麼違和感。

由於其「免費可玩」,網友們紛紛豎起大拇指,有人指出:這真的很不容易。

因為先前在8月份DALL·E就幹過「擴畫」這種事兒了,當時不少網友獻上膝蓋,但DALL·E不是免費的,並且其訪問許可權這幾天才逐步放開。

所以現在免費開源的Stable Diffusion也能擴畫了,讓網友們很開心。

還有人表示,這下應該可以看到戴珍珠耳環的那位少女穿上鞋的樣子了。(甚至可以親自為她穿上鞋)

Stable Diffusion新功能:Outpainting

除了「腦補」《戴珍珠耳環的少女》的背景外,還有人用Stable Diffusion來Outpainting了城市風光圖。

好傢伙,這直接把公園、河岸的建築和更遠處的天空給畫出來了:

雖然細節有些經不起推敲,但是總體看起來還是比較和諧的。(再P一下就差不多了)

那麼說到這裡,通過Outpainting「腦補」出來的畫面為什麼和已有部分沒啥違和感?

為了生成圖像更自然,在Outpainting邊界圖片時,AI會將圖像現有的視覺元素,包括陰影、反射和紋理等考慮在內。

另外,雖然在這些擴畫過程中,AI起到主要作用,但是人也是不可或缺的一部分。

因為這需要人為輸入一些句子或者關鍵詞來指導AI作畫。

比如,在為《戴珍珠耳環的少女》補充背景時,告訴AI某個指定區域放一張桌子,然後在牆上放一個帶框的畫等。

另外,在延伸上面那張「城市風光照」時,手動輸入「沿著經過的河流的線性公園和河濱公園,河流和馬尼拉地鐵天際線的景色 」。

(Linear park and esplanade along the passing river, view of the river and metro manila skyline)

當然這也意味著可以DIY了:如果你想加一個花瓶或者為少女穿上鞋的話,告訴AI就行。

不過,測試人員們也發現Stable Diffusion在「腦補」過程中也有翻車的時候。

例如當其繪製「草地上的一隻貓」(a cat on grass)時,前面幾步都很正常,但最後居然畫出了一隻「雙頭貓」……

測試者指出這應該是模組「PIL.Image」中沒有屬性」Resampling」,不過此問題目前只在一個人的電腦上出現過。

DALL·E也「腦補」過同一幅畫

在Stable Diffusion之前,DALL·E同樣也Outpainting了《戴珍珠耳環少女》,最終成品是醬嬸兒滴:

所以你更喜歡DALL·E還是Stable Diffusion的作品?

對了,按Stable Diffusion的傳統,用其來Outpainting的小哥已將相關程式碼開源在Google Colab和GitHub上了,感興趣的友友們可以去仔細看看。

傳送門:

Colab: https://colab.research.google.com/github/lkwq007/stablediffusion-infinity/blob/master/stablediffusion_infinity_colab.ipynb

GitHub: https://github.com/lkwq007/stablediffusion-infinity

參考連結:

[1]https://www.reddit.com/r/MachineLearning/comments/xtd8kc/p_stablediffusioninfinity_outpainting_with_stable/

[2]https://bytexd.com/how-to-use-outpainting-with-stable-diffusion-infinity-colab/

相關文章