Stable Diffusion快無敵了?繼圖片音頻之后,發(fā)布短視頻AIGC功能

來源:GameLook
作者:GameLook
時間:2023-11-25
1650
近日,AI初創(chuàng)公司Stability.AI的子公司Stability.AI在其官方網(wǎng)站上宣布推出了最新的AI視頻生成模型——Stable Video Diffusion。這一模型是在Stability.AI之前發(fā)布的AI圖片生成模型Stable Diffusion和AI音頻生成模型Stable Audio基礎(chǔ)上的最新發(fā)布,至此,Stability.AI幾乎實現(xiàn)了對媒體內(nèi)容生成的全覆蓋。

640.jpg

近日,AI初創(chuàng)公司Stability.AI的子公司Stability.AI在其官方網(wǎng)站上宣布推出了最新的AI視頻生成模型——Stable Video Diffusion。這一模型是在Stability.AI之前發(fā)布的AI圖片生成模型Stable Diffusion和AI音頻生成模型Stable Audio基礎(chǔ)上的最新發(fā)布,至此,Stability.AI幾乎實現(xiàn)了對媒體內(nèi)容生成的全覆蓋。

目前該模型已經(jīng)可以在Github和Huggingface上下載。

640.gif

Stable Video Diffusion有兩種模型形式:SVD和SVD-XT。SVD將靜態(tài)圖像轉(zhuǎn)換為14幀的576×1024視頻,而SVD-XT則將幀數(shù)增加到24。據(jù)悉,Stability.AI最初在包含數(shù)百萬個視頻的數(shù)據(jù)集上進行了訓(xùn)練,隨后在包含數(shù)十萬到一百萬個剪輯的較小集合上進行了微調(diào)。然而,關(guān)于訓(xùn)練視頻的確切來源仍然不明確,這引發(fā)了一些關(guān)于版權(quán)問題的擔(dān)憂。

Stability.AI的白皮書指出,Stable Video Diffusion目前處于“研究預(yù)覽”階段,用戶需同意一些使用條款,明確了其預(yù)期應(yīng)用場景(如“教育或創(chuàng)意工具”、“設(shè)計和其他藝術(shù)過程”等)以及非預(yù)期應(yīng)用場景(如“人物或事件的真實陳述”)。這一模型的開源性也引起了一些擔(dān)憂,畢竟類似AI生成的虛假視頻在社媒上流傳此前就造成過麻煩。

盡管Stable Video Diffusion具有一定的局限性,如不能生成沒有運動或快速攝像機移動的視頻,但它在生成高質(zhì)量的四秒片段方面表現(xiàn)出色,與業(yè)界其他主流模型相媲美。

640 (1).jpg

Stability.AI表示,Stable Video Diffusion的未來發(fā)展方向包括推出“一系列”基于SVD和SVD-XT的模型,并計劃推出一個“文本到視頻”工具,將文本提示引入網(wǎng)絡(luò)模型。該公司強調(diào),Stable Video Diffusion具有潛在的廣告、教育和娛樂應(yīng)用。

然而,Stability.AI最近面臨了一些挑戰(zhàn),包括高管的離職和財務(wù)壓力。該公司的音頻副總裁Ed Newton-Rex因為與模型訓(xùn)練數(shù)據(jù)版權(quán)問題產(chǎn)生分歧而辭職。此外,據(jù)報道,Stability AI一度面臨現(xiàn)金流問題,導(dǎo)致AWS威脅要撤銷其對GPU實例的訪問權(quán)限。

在AI領(lǐng)域,Stability.AI并非唯一一家持續(xù)努力推動產(chǎn)品路線圖的初創(chuàng)公司。然而,Stable Video Diffusion的推出標(biāo)志著該公司對生成媒體內(nèi)容領(lǐng)域的持續(xù)投入,并表明其在商業(yè)化上的雄心。

在這個AI熱潮中,Stability.AI的一系列工具和模型,因其普遍開源的特性,對于游戲行業(yè)可能帶來深遠影響。游戲公司可以在Stability.AI公布的基礎(chǔ)模型上進行精細調(diào)整,以快速生成各種場景所需的視頻素材。此外,廣告公司也可以利用Stable Video Diffusion等工具,快速生成各種買量廣告素材,提高廣告創(chuàng)作的效率和創(chuàng)意。

除了Stable Video Diffusion,Stability.AI還推出了Stable Audio,進一步拓展了其影響范圍。Stable Audio由Stability.AI內(nèi)部的聲音實驗室Harmonai研發(fā),采用了與Stable Diffusion類似的擴散模型技術(shù)。該模型在音頻生成領(lǐng)域也取得了一定的成就,但與此同時,公司也面臨一些商業(yè)化和版權(quán)的挑戰(zhàn)。

綜合而言,Stability.AI的一系列工具和模型為媒體內(nèi)容生成領(lǐng)域帶來了新的可能性,在未來,隨著這些模型的不斷發(fā)展和完善,它們可能成為游戲行業(yè)和廣告行業(yè)關(guān)鍵工具。

立即登錄,閱讀全文
原文鏈接:點擊前往 >
文章來源:GameLook
版權(quán)說明:本文內(nèi)容來自于GameLook,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
小游戲公司這么值錢了?游戲月流水才1000萬、成功融資7000萬!
小游戲公司這么值錢了?游戲月流水才1000萬、成功融資7000萬!
小游戲已經(jīng)是國內(nèi)最火爆的市場,不僅吸引了買量大佬的加入,也是中小團隊重要的主賽道,甚至出現(xiàn)了小游戲和App游戲收入倒掛的現(xiàn)象。
小游戲
游戲市場
2024-12-11
一天時間拿下美日韓玩家,《少前2》在海外打了一場最漂亮的翻身仗
一天時間拿下美日韓玩家,《少前2》在海外打了一場最漂亮的翻身仗
這兩天,游戲圈出現(xiàn)一個頗具戲劇性的場面:騰訊、網(wǎng)易、疊紙等多家廠商的主力產(chǎn)品,都在月初5-6號兩天密集上線。
游戲市場
游戲
2024-12-11
騰訊網(wǎng)易Steam龍虎斗:《漫威爭鋒》首日在線44萬,《三角洲》破10萬
騰訊網(wǎng)易Steam龍虎斗:《漫威爭鋒》首日在線44萬,《三角洲》破10萬
行至年末,如果要對2024年的全球游戲市場做一個總結(jié)的話,海外游戲行業(yè)從業(yè)者一定會表示這是無比蕭條的一年,不僅從去年開始的裁員浪潮還未結(jié)束,國外游戲大廠也不斷翻車,這也讓今年成為了游戲行業(yè)數(shù)一數(shù)二的超級小年。
游戲市場
游戲
2024-12-11
《無限暖暖》手游怎么了?姚潤昊內(nèi)部信穩(wěn)軍心,預(yù)估日收入超2000萬
《無限暖暖》手游怎么了?姚潤昊內(nèi)部信穩(wěn)軍心,預(yù)估日收入超2000萬
火藥味直接拉滿的12月初,第一批逆預(yù)期的新游出現(xiàn)了,那就是12月5日在全球范圍內(nèi),多端同步開啟公測的疊紙的《無限暖暖》以及海外上線,殊死一搏的散爆的《少女前線2:追放》。
手游市場
游戲市場
游戲收入
2024-12-11
優(yōu)質(zhì)服務(wù)商推薦
更多