大AIGC時代下,從海外的暴雪、育碧、Unity到國內(nèi)的網(wǎng)易、騰訊等行業(yè)領(lǐng)頭羊,全球游戲工業(yè)界已經(jīng)身先士卒,開啟了AI大模型技術(shù)落地的全面探索。
在這其中,又以文生圖技術(shù)最為接近普及。Stable Diffusion等開源文生圖工具如今已經(jīng)成為游戲美術(shù)工作者的左膀右臂,如暴雪等公司也推出自研生成模型,幫助開發(fā)者更便捷地進行美術(shù)創(chuàng)作。工業(yè)界已經(jīng)展開雙臂,普遍接納AIGC技術(shù),但在一些姊妹行業(yè),AIGC的推廣之路依然坎坷。
藝術(shù)家調(diào)研報告:AI還是做不了高端路線
純藝術(shù)行業(yè)就是最具代表性的一個例子。由于近日,一家海外生成式AI藝術(shù)公司Playform AI向500名藝術(shù)家與數(shù)字設(shè)計師發(fā)出了問卷調(diào)查,結(jié)果顯示,有超過一半的藝術(shù)家在嘗試過DALL-E、Midjourney等文生圖AI后認為無法幫助他們進行創(chuàng)作。
Playform AI公司定位于藝術(shù)生成平臺,因此此次受訪的創(chuàng)作者大多數(shù)來自純藝、數(shù)字設(shè)計、攝影等較為傳統(tǒng)的行業(yè)背景。同樣在該調(diào)查中,僅有18%的的創(chuàng)作者表示會每日在創(chuàng)作中使用AI生成工具。另外,6成藝術(shù)家認為AIGC工具生成的圖像質(zhì)量達不到他們的質(zhì)量標準。
一邊是游戲美術(shù)界的熱火朝天,一邊是純藝術(shù)界的相對冷淡。在GameLook看來,這其中的差異相當有趣。表面上看,游戲畫師與數(shù)字藝術(shù)家們均以畫圖為業(yè),但在背后,兩個行業(yè)對最終交付產(chǎn)物的需求大相徑庭。對商業(yè)游戲畫師們來說,產(chǎn)出符合項目需求的美術(shù)資源是第一要務(wù)。而對于藝術(shù)家們來說,他們需要的最終產(chǎn)物更加“高端”,不僅需要精雕細作的作畫質(zhì)量,還要兼顧有個人色彩的藝術(shù)表達與風(fēng)格要更加重要。
目前的AI能夠借由海量的原始訓(xùn)練材料生成出精致的畫面。但從原理上說,AI對畫面中的元素還尚處拼貼的程度,難以形成對畫中元素的“理解”。因此,由AI生成的畫作往往有細節(jié)走線凌亂,光影關(guān)系經(jīng)不起推敲,乃至肢體扭曲的問題。對于對細節(jié)品質(zhì)要求更高的行業(yè)來說,AI無疑還無法滿足藝術(shù)家的需求。
這種理解的缺乏自然也讓畫面構(gòu)圖等技巧的調(diào)整變得十分困難。更多的時候,AI所做的只是集于輸入文本和參數(shù)進行排列組合。從根本上說,AI的作畫難以形成思想性的表達,因而此次接受受訪的藝術(shù)家們也表示,僅有三成認為AI生成的產(chǎn)物可以反映出藝術(shù)家自己的風(fēng)格。
此外,藝術(shù)家們還對AI有著各種各樣的批評。例如,僅有3成藝術(shù)家認為AI畫圖的版權(quán)不存在問題,而過半藝術(shù)家認為依然有版權(quán)隱憂。藝術(shù)家們還不滿稱,眼下的AI模型依然很難對最終產(chǎn)出進行精準控制,AI生成的分辨率與細節(jié)控制也無法滿足他們的需求。
相對于高度流水線化的游戲行業(yè)來說,主打精工細作純藝市場并沒有受到AIGC的太多沖擊。不過,藝術(shù)家們也一定程度地出現(xiàn)了身份危機。
商業(yè)以外的另一個維度
AIGC為我們帶來了生產(chǎn)力的極大進步,但隨之而來的則是無止境的焦慮。諸如“畫家要被取代了!”這樣的言論曾經(jīng)大行其道,也是美術(shù)行業(yè)從業(yè)者對AIGC警惕心理更強的原因。
在失業(yè)焦慮的同時,與其坐以待斃,我們不妨借著這個機會打破固有的認知,重估人類的競爭價值。我們可以看到,眼下的AIGC仍然有太多的缺憾與短板。例如,它無法像人類一樣思考。對藝術(shù)創(chuàng)作來說,這是致命傷,因此優(yōu)秀的創(chuàng)意與人文思想在AI到來的時代只會變得更加珍貴。
Playform AI的創(chuàng)始人Ahmed Elgammal在近期撰寫了一篇文章《為什么AI藝術(shù)的時代已經(jīng)過去了》,向我們分享了他的有趣思考。
Ahmed Elgammal是一名履歷獨特的跨學(xué)科人才——作為羅格斯大學(xué)人工智能藝術(shù)實驗室的負責(zé)人,他既接受了扎實的藝術(shù)教育,也對人工智能技術(shù)有深入淺出的理解。而在Ahmed Elgammal看來,與其說AI時代即將到來,進而取代人類,不如說眼下的AI大模型太熟稔與“模仿人類思考”,這樣反而扼殺了屬于AI的創(chuàng)造力。Ahmed Elgammal認為,“AI藝術(shù)”的時代實際上已經(jīng)結(jié)束。
GameLook編譯了Ahmed Elgammal的這篇好文:
現(xiàn)在每個人都在談?wù)搫?chuàng)造性人工智能和“人工智能藝術(shù)”,談?wù)撘粋€新的創(chuàng)造性AI時代的到來,而它將取代藝術(shù)家的工作。我們看到來自藝術(shù)家和藝術(shù)界的巨大反彈。然而事實恰恰相反:“AI藝術(shù)”時代實際上可能已經(jīng)結(jié)束。
究竟發(fā)生了什么?首先,讓我澄清一下“AI藝術(shù)”的含義。
A.I.并不創(chuàng)造藝術(shù),而是創(chuàng)造圖像。使這些生成的圖像成為藝術(shù)的是AI背后的人類藝術(shù)家——那些向機器輸入數(shù)據(jù)、操縱旋鈕并策劃輸出的藝術(shù)家。因此,我使用“AI藝術(shù)”這個術(shù)語來談?wù)撊祟愃囆g(shù),這些藝術(shù)將AI作為創(chuàng)作過程的一部分,具有不同程度的自主性。我們正在進入一個大量使用此類工具的時代。然而,這些工具激發(fā)出藝術(shù)天才火花的時代可能已經(jīng)過去了。
是什么讓藝術(shù)迸發(fā)出火花?當畢加索在1907年創(chuàng)作《亞維農(nóng)的少女》時,這幅畫曾引起爭議,并遭到了他身邊朋友的反對。就連畢加索的立體主義同事喬治-布拉克(George Braque)也不喜歡這幅畫。直到1939年,當這幅畫在紐約現(xiàn)代藝術(shù)博物館展出時,它才被公眾接受并認可為立體主義的先驅(qū)。喬納森-瓊斯(Jonathan Jones)在《衛(wèi)報》的百年慶典上寫道:“藝術(shù)作品最終會沉淀下來,變得受人尊敬。但是,100年過去了,畢加索的這幅作品仍然是如此新鮮,如此令人不安,稱其為‘杰作’簡直是一種貶低?!?/p>
畢加索《亞維農(nóng)的少女》
科林-馬丁代爾(Colin Martindale)在1990年出版的《The Clockwork Muse》一書中開創(chuàng)的美學(xué)心理學(xué)理論可以很好地解釋令人不安的挑戰(zhàn)在藝術(shù)發(fā)展中的作用。他認為,藝術(shù)進化背后的主要力量是藝術(shù)家通過創(chuàng)新來對抗習(xí)慣。然而,如果藝術(shù)家創(chuàng)新太多,他們的藝術(shù)就會過于震撼,觀眾就會不喜歡。好的藝術(shù)家能夠在創(chuàng)新和不太令人震驚之間找到最佳平衡點。偉大的藝術(shù)家則是那些更進一步的藝術(shù)家。
人工智能能否超越“好”而達到“偉大”的程度?當生成對抗網(wǎng)絡(luò)(GAN)出現(xiàn)時,一些藝術(shù)家注意到了這項新的人工智能技術(shù)。你可以在大量圖像上訓(xùn)練這些模型,它們可以為你生成新的圖像。2017年,當我們對西方藝術(shù)中的經(jīng)典肖像進行GAN訓(xùn)練時,它生成了一些令人不安的變形肖像,這讓我想起了弗朗西斯-培根1963年創(chuàng)作的Henreitta Moraes肖像。然而,這兩者之間有一個根本的區(qū)別:培根的意圖是讓肖像產(chǎn)生變形扭曲的效果,而人工智能只是生成時不聽話而已。
弗朗西斯-培根《Three Studies for Portrait of Henrietta Moraes》
隨著GAN的出現(xiàn),我們進入了機器“失敗美學(xué)”的時代。一些評論家將其與“故障藝術(shù)”聯(lián)系在一起。事實上,GAN所帶來的驚喜讓藝術(shù)家們對其產(chǎn)生了濃厚的興趣。該領(lǐng)域的許多人稱之為“恐怖谷效應(yīng)”。
正是這種恐怖谷和偶然性讓人工智能藝術(shù)在2017年至2020年間變得有趣。2019年,我與藝術(shù)史學(xué)家瑪麗安-馬佐內(nèi)(Marian Mazzone)一起做了一項研究,我們采訪了幾位在創(chuàng)作過程中率先使用人工智能的藝術(shù)家。我們發(fā)現(xiàn),“藝術(shù)家將人工智能理解為自己創(chuàng)作過程的主要推動力”。特別是,藝術(shù)家們發(fā)現(xiàn)AI在兩個方面非常有用:創(chuàng)作靈感和創(chuàng)作數(shù)量。創(chuàng)作靈感是藝術(shù)家們發(fā)現(xiàn)AI給他們帶來新想法、新方向和新的藝術(shù)創(chuàng)作方式的地方。
使用GAN生成的人物肖像,制作于2007年
與當下的一片聲討的氛圍不同,人工智能藝術(shù)在2017年至2020年間受到了藝術(shù)界的歡迎。
2018年10月,佳士得拍賣行拍賣了一幅由GAN生成的人工智能肖像畫,與上述變形肖像畫類似。2019年3月,蘇富比拍賣了藝術(shù)家馬里奧-克林格曼(Mario Klingemann)的作品。曼哈頓的HG Contemporary于2019年2月舉辦了一次展覽,展出了我自己的作品。2019年夏天,倫敦巴比肯中心展出了不同的人工智能藝術(shù)家的作品。人工智能藝術(shù)在2018年邁阿密Scope和2019年紐約Scope等藝術(shù)博覽會上受到歡迎。北京中國國家博物館于2019年11月舉辦了為期一個月的人工智能藝術(shù)展,吸引了100萬觀眾。
在此期間,媒體對人工智能藝術(shù)進行了積極報道。藝術(shù)市場歡迎人工智能藝術(shù)家,也沒有人呼吁禁止人工智能藝術(shù)。但后來究竟發(fā)生了什么?
Mario Klingemann肖像作品《Memories of Passersby》
早期的人工智能模型與今天基于提示的大模型之間的一個根本區(qū)別是,早期的模型是在較小的圖像集上進行訓(xùn)練的。這使得藝術(shù)家可以根據(jù)自己的視覺參考資料訓(xùn)練自己的人工智能模型。而如今的大模型則是在未經(jīng)藝術(shù)家同意的情況下,在從互聯(lián)網(wǎng)上獲取的數(shù)十億張圖片上預(yù)先訓(xùn)練出來的。這帶來了大量的版權(quán)問題。這種龐大的系統(tǒng)會抹去藝術(shù)家的身份。我的作品與您的作品之間的區(qū)別僅僅取決于我們在提示中使用了哪些關(guān)鍵詞來引導(dǎo)系統(tǒng)。無怪乎版權(quán)局拒絕為此類系統(tǒng)生成的藝術(shù)作品授予版權(quán)。捕捉藝術(shù)家身份是攝影作品在19世紀末能夠獲得法院版權(quán)的主要原因。
在過去幾年中,人工智能在生成高質(zhì)量圖像和逼真圖像方面的表現(xiàn)越來越好。它在模仿訓(xùn)練數(shù)據(jù)方面的能力也在不斷提高。一種新的交互方式已被引入,主要是使用文本提示來控制生成。如今,文字prompt已經(jīng)成為人工智能生成圖像的主要方式。人工智能生成技術(shù)的這些進步已經(jīng)使人工智能能夠很好地按照我們在精心制作的文字提示中發(fā)出的指令生成我們想要的任何圖像,無論是照片還是插圖。驚喜僅限于我們可能得到的想法的變化。通過多次重復(fù),我們可以得到我們想要的令人驚嘆的高保真、高分辨率圖像。
文字輸入幫助人工智能走出了“恐怖谷”,但它扼殺了驚喜。這是因為這些模型同時接受了文字和圖像的訓(xùn)練,并學(xué)會了將視覺概念與語言語義聯(lián)系起來。這使得模型更善于創(chuàng)造人物形象和模仿可以用文字描述的風(fēng)格。
Refik Anadol作品《Unsupervised》收藏于紐約現(xiàn)代藝術(shù)博物館
但另一方面,將語言作為訓(xùn)練的一部分會使模型在創(chuàng)建靈感視覺變形時受到很大限制。A.I.現(xiàn)在打造的視覺輸出受限于我們的語言,失去了在視覺上自由操作像素而不受人類語義影響的自由。
從某種意義上說,人工智能正變得越來越像我們,它不再能夠在我們看待世界時提供補充和挑戰(zhàn)。
當然,人工智能在生成過程中仍然會出現(xiàn)令人驚訝的失敗。我們?nèi)匀荒芸吹介L著四只手指和三條腿的人物。然而,這種愚蠢的失敗并不一定有趣。創(chuàng)造性靈感并不是新一代人工智能所失去的唯一東西。使用文本生成圖像的理念可能會限制藝術(shù)家的靈感,因為藝術(shù)家們是視覺型思維者。借助文字描述他們想要的東西會增加一層額外的、不自然的語言抽象。
A.I.正在成為生成大量圖像的工具,而不是讓藝術(shù)家們?yōu)橹d奮的共同創(chuàng)作伙伴。A.I.正變得非常善于循規(guī)蹈矩,但其中的藝術(shù)火花卻蕩然無存。藝術(shù)家必須深入挖掘,超越文字提示詞,以不同的方式使用人工智能,這樣才能找到藝術(shù)的火花。