2022年是AIGC,或生成式AI“Generative AI”爆發(fā)的一年。以O(shè)penAI、Stability AI、Midjourney、NovaAI等為代表的企業(yè)和工具,在全球范圍內(nèi)掀起了一場從消費者到資本市場的狂熱浪潮。
雖然來到2022年年底、2023年年初,AIGC領(lǐng)域也并不太平,爆發(fā)了比如Art Station上“AI vs人類”的戰(zhàn)爭、三位海外藝術(shù)家起訴了Stability AI、Midjourney公司等事件,以及面臨著第一批AIGC公司,比如StockAI,因為數(shù)據(jù)、算力的龐大支出等正式關(guān)停的現(xiàn)狀,但這些挫折和爭議并非不可解決。
Point-E
當(dāng)下AI已經(jīng)在繪畫、音樂甚至是游戲資產(chǎn)的生成方面,展現(xiàn)出了相當(dāng)?shù)臐摿?,OpenAI、谷歌、英偉達(dá)等公司也推出了文字生成3D模型實驗技術(shù)Point-E等工具,未來隨著各國法律的完善、行業(yè)的競爭、自律和規(guī)范,AI作為全新的生產(chǎn)力工具、AIGC作為全新的內(nèi)容創(chuàng)作階段,在2023年及以后在各行各業(yè)繼續(xù)發(fā)展的大趨勢,依舊值得關(guān)注。
近日,騰訊研究院也就AIGC的相關(guān)技術(shù)和應(yīng)用前景,從生態(tài)、趨勢、挑戰(zhàn)等多個維度思考,發(fā)布了《AIGC發(fā)展趨勢報告2023:迎接人工智能的下一個時代》(以下簡稱為《AIGC報告》)。
以下圖片均來自報告中截取的內(nèi)容
消費端:AIGC成未來互聯(lián)網(wǎng)基礎(chǔ)設(shè)施
首先是消費市場,伴隨著現(xiàn)如今全球數(shù)字內(nèi)容消費市場的持續(xù)擴張、升級和轉(zhuǎn)型,數(shù)字內(nèi)容進(jìn)入強需求、視頻化、拼創(chuàng)意的螺旋式升級周期,《AIGC報告》認(rèn)為,“AIGC有望塑造數(shù)字內(nèi)容生產(chǎn)與交互新范式,成為未來互聯(lián)網(wǎng)的內(nèi)容生產(chǎn)基礎(chǔ)設(shè)施”。
得益于過去多年來,大型預(yù)訓(xùn)練語言模型和人類反饋強化學(xué)習(xí)(RLHF)技術(shù)等技術(shù)出現(xiàn)和發(fā)展,當(dāng)下的AIGC技術(shù)已經(jīng)在文字、音樂、圖片、視頻、3D多種媒介形態(tài)的生產(chǎn)中,擔(dān)任了多樣化的助手工作,也已經(jīng)有不少消費者體驗到了AIGC的優(yōu)勢,就比如米哈游在《未定事件簿》實裝的AI配音。
“根據(jù)6pen預(yù)測,未來五年,互聯(lián)網(wǎng)上10%—30%的圖片內(nèi)容將由AI參與生成,有望創(chuàng)造超過600億的市場空間,若考慮到下一代互聯(lián)網(wǎng)對內(nèi)容需求的迅速提升,國外商業(yè)咨詢機構(gòu)Acumen Research and Consulting預(yù)測,2030年AIGC市場規(guī)模將達(dá)到1100億美元?!?/p>
而ChatGPT這種級別的AI問答系統(tǒng)的出現(xiàn),也為數(shù)字人這種元宇宙相關(guān)的領(lǐng)域,提供了全新的可能?!禔IGC報告》中稱,AIGC工具將在制作效能、交互體驗等多方面升級當(dāng)前的數(shù)字人。
“基于AIGC的3D數(shù)字人建模已經(jīng)初步實現(xiàn)產(chǎn)品化,目前精度可以達(dá)到次世代游戲人物級別,通過便捷化地上傳圖片即可生成3D數(shù)字人面部模型?!?/p>
除了數(shù)字人,《AIGC報告》還從技術(shù)、個性化、創(chuàng)作自由等方面,論證了未來“AIGC推動元宇宙發(fā)展”的重要性。
“在元宇宙發(fā)展的過程中,游戲是虛擬世界重要的載體,AIGC可以極大提高數(shù)字原生內(nèi)容的幵發(fā)效率,降低游戲幵發(fā)成本。具體來說,劇情、角色、頭像、道具、場景、配音、動作、特效、主程序未來都可以通過AIGC生成?!?/p>
“同時,AIGC將賦予用戶更多的創(chuàng)作權(quán)力和自由,促進(jìn)創(chuàng)新并提升元宇宙的用戶體驗。AIGC將作為生產(chǎn)力工具為元宇宙用戶提供個性化內(nèi)容體驗。”
產(chǎn)業(yè)端:合成數(shù)據(jù)牽引人工智能的未來
而在產(chǎn)業(yè)端,合成數(shù)據(jù)(synthetic data)領(lǐng)域可以說是當(dāng)下AIGC技術(shù)持續(xù)創(chuàng)新發(fā)展的重點,也是全新的發(fā)展契機所在。
所謂合成數(shù)據(jù),是值得“計算機模擬(computer simulation)技術(shù)或算法創(chuàng)建、生成的自標(biāo)注(annotated)信息,可以在數(shù)學(xué)上或統(tǒng)計學(xué)上反映真實世界數(shù)據(jù)的屬性,因此可以作為真實世界數(shù)據(jù)的替代品,來訓(xùn)練、測試、驗證AI模型。”
《AIGC報告》中指出,數(shù)據(jù)是當(dāng)前制約AI技術(shù)發(fā)展的最大原因,根據(jù)合成數(shù)據(jù)服務(wù)商AI.Reverie的信息,人工標(biāo)注一張圖片可能需要6美元,但人工合成的話只需要6美分。
除了成本和獲取難度上相較于真實世界數(shù)據(jù)存在優(yōu)勢,合成數(shù)據(jù)還在隱私、算法偏見、稀有數(shù)據(jù)場景的生成、AI模型訓(xùn)練速度方面,相較于真實世界數(shù)據(jù)存在優(yōu)勢。特別是在金融、醫(yī)療等數(shù)據(jù)較為敏感的行業(yè),合成數(shù)據(jù)由于是用程序生成,與真實世界無關(guān),能夠更好地在相關(guān)領(lǐng)域規(guī)避風(fēng)險,發(fā)力研究,持續(xù)拓展AIGC的應(yīng)用空間。
當(dāng)然對于市場而言,更大的機遇在于,當(dāng)前合成數(shù)據(jù)領(lǐng)域還處于互聯(lián)網(wǎng)大廠加大投資布局,創(chuàng)業(yè)公司方興未艾、不斷涌現(xiàn)的狀態(tài)。
“在過去的18個月,公眾視野中已知的合成數(shù)據(jù)公司融資總額達(dá)到3.28億美元,比2020年高出2.75億美元?!?/p>
“根據(jù)Cognilytica的數(shù)據(jù),合成數(shù)據(jù)市場規(guī)模在2021年大概是1.1億美元,到2027年將達(dá)到11.5億美元。Grand View Research預(yù)測,AI訓(xùn)練數(shù)據(jù)市場規(guī)模到2030年將超過86億美元。Gartner預(yù)測,到2024年用于訓(xùn)練AI的數(shù)據(jù)中有60%將是合成數(shù)據(jù),到2030年AI模型使用的絕大部分?jǐn)?shù)據(jù)將是人工智能合成的。”
《AIGC報告》表示“合成數(shù)據(jù)有望推動人工智能邁向2.0階段(AI2.0)。”
社會價值和風(fēng)險
正所謂技術(shù)的革新一定會對社會產(chǎn)生影響,《AIGC報告》認(rèn)為“AIGC的社會價值體現(xiàn)為革新數(shù)字內(nèi)容與藝術(shù)創(chuàng)造領(lǐng)域,并將輻射到其他領(lǐng)域和行業(yè),孕育新的技術(shù)形態(tài)與價值模式,甚至?xí)蔀橥ㄓ萌斯ぶ悄艿目赡苄月窂健薄?/p>
就比如在過去一年AIGC中最熱鬧的AI繪畫,以及其代表的AI藝術(shù)領(lǐng)域,AI可以解放人類的創(chuàng)造力,革新藝術(shù)領(lǐng)域。通過對現(xiàn)有藝術(shù)的模仿,在取代大量基礎(chǔ)性的藝術(shù)創(chuàng)作工作的同時,AIGC還可以利用不同于人類思維的模式,為藝術(shù)家的創(chuàng)作提供新的靈感,甚至是新的藝術(shù)風(fēng)格。
“AI雖然不擁有真正的創(chuàng)造力,但是它讓使用者擁有了新的創(chuàng)造力。”
但隨著AIGC帶來的社會文化、生產(chǎn)變革而來的,還有已經(jīng)正在發(fā)生,甚至迫在眉睫的一系列問題?!禔IGC報告》中,主要囊括了“知識產(chǎn)權(quán)挑戰(zhàn)”“信息安全挑戰(zhàn)”“倫理挑戰(zhàn)”“環(huán)境挑戰(zhàn)”四大AIGC領(lǐng)域目前面臨的問題。
知識產(chǎn)權(quán)挑戰(zhàn)是在AI繪畫等領(lǐng)域,目前被各界討論最多的主題之一。對于AI生成內(nèi)容的版權(quán)風(fēng)險,《AIGC報告》表示“目前國內(nèi)國外的通行做法也都是會考慮除了AI之外,是否有人的智力或創(chuàng)造性勞動”
其次安全挑戰(zhàn),主要指的是AI生成的內(nèi)容的安全,以及隱私數(shù)據(jù)的安全。前者最直接的例子就是AI換臉,借助深度偽造的音視頻內(nèi)容以及欺詐勒索等手段,全球各地的不法分子已經(jīng)造成了不小的經(jīng)濟(jì)損失。
而后者在此之前也有過經(jīng)典案例,在GPT-2模型里,只用一段特殊的前綴,AI生成的內(nèi)容就會包括特定個人的姓名、電話等信息。
第三點倫理挑戰(zhàn)則主要體現(xiàn)在AI存在明顯的歧視現(xiàn)象,以及AIGC是否具有自我意識(去年谷歌的工程師曾聲稱旗下的AI已經(jīng)有了自我意識)。
“OpenAI在對DALL-E 2的生成結(jié)果進(jìn)行公平性測試時發(fā)現(xiàn),其表現(xiàn)出顯著的性別和種族歧視。即傾向于更高頻地生成男性和白色人種的人類圖像。”
至于最后的環(huán)境挑戰(zhàn)。作為一個需要強大算力支撐的新興技術(shù)領(lǐng)域,“有研究人員對Transformer、ELMo、BERT、GPT-2、GPT-3等進(jìn)行了碳排放研究。在一天的訓(xùn)練時長里,GPT-3模型訓(xùn)練的二氧化碳排放量為552噸。”
Midjourney的創(chuàng)始人大衛(wèi)?霍爾茲也將算力支持而非用戶量,視作AIGC大規(guī)模的商業(yè)擴展的阻力,“如果(Midjourney)用戶量達(dá)到1000萬人,那么世界上將沒有足夠的算力來支持。”