Stable Diffusion快無(wú)敵了?繼圖片音頻之后,發(fā)布短視頻AIGC功能

來(lái)源:GameLook
作者:GameLook
時(shí)間:2023-11-25
1667
近日,AI初創(chuàng)公司Stability.AI的子公司Stability.AI在其官方網(wǎng)站上宣布推出了最新的AI視頻生成模型——Stable Video Diffusion。這一模型是在Stability.AI之前發(fā)布的AI圖片生成模型Stable Diffusion和AI音頻生成模型Stable Audio基礎(chǔ)上的最新發(fā)布,至此,Stability.AI幾乎實(shí)現(xiàn)了對(duì)媒體內(nèi)容生成的全覆蓋。

640.jpg

近日,AI初創(chuàng)公司Stability.AI的子公司Stability.AI在其官方網(wǎng)站上宣布推出了最新的AI視頻生成模型——Stable Video Diffusion。這一模型是在Stability.AI之前發(fā)布的AI圖片生成模型Stable Diffusion和AI音頻生成模型Stable Audio基礎(chǔ)上的最新發(fā)布,至此,Stability.AI幾乎實(shí)現(xiàn)了對(duì)媒體內(nèi)容生成的全覆蓋。

目前該模型已經(jīng)可以在Github和Huggingface上下載。

640.gif

Stable Video Diffusion有兩種模型形式:SVD和SVD-XT。SVD將靜態(tài)圖像轉(zhuǎn)換為14幀的576×1024視頻,而SVD-XT則將幀數(shù)增加到24。據(jù)悉,Stability.AI最初在包含數(shù)百萬(wàn)個(gè)視頻的數(shù)據(jù)集上進(jìn)行了訓(xùn)練,隨后在包含數(shù)十萬(wàn)到一百萬(wàn)個(gè)剪輯的較小集合上進(jìn)行了微調(diào)。然而,關(guān)于訓(xùn)練視頻的確切來(lái)源仍然不明確,這引發(fā)了一些關(guān)于版權(quán)問(wèn)題的擔(dān)憂。

Stability.AI的白皮書指出,Stable Video Diffusion目前處于“研究預(yù)覽”階段,用戶需同意一些使用條款,明確了其預(yù)期應(yīng)用場(chǎng)景(如“教育或創(chuàng)意工具”、“設(shè)計(jì)和其他藝術(shù)過(guò)程”等)以及非預(yù)期應(yīng)用場(chǎng)景(如“人物或事件的真實(shí)陳述”)。這一模型的開(kāi)源性也引起了一些擔(dān)憂,畢竟類似AI生成的虛假視頻在社媒上流傳此前就造成過(guò)麻煩。

盡管Stable Video Diffusion具有一定的局限性,如不能生成沒(méi)有運(yùn)動(dòng)或快速攝像機(jī)移動(dòng)的視頻,但它在生成高質(zhì)量的四秒片段方面表現(xiàn)出色,與業(yè)界其他主流模型相媲美。

640 (1).jpg

Stability.AI表示,Stable Video Diffusion的未來(lái)發(fā)展方向包括推出“一系列”基于SVD和SVD-XT的模型,并計(jì)劃推出一個(gè)“文本到視頻”工具,將文本提示引入網(wǎng)絡(luò)模型。該公司強(qiáng)調(diào),Stable Video Diffusion具有潛在的廣告、教育和娛樂(lè)應(yīng)用。

然而,Stability.AI最近面臨了一些挑戰(zhàn),包括高管的離職和財(cái)務(wù)壓力。該公司的音頻副總裁Ed Newton-Rex因?yàn)榕c模型訓(xùn)練數(shù)據(jù)版權(quán)問(wèn)題產(chǎn)生分歧而辭職。此外,據(jù)報(bào)道,Stability AI一度面臨現(xiàn)金流問(wèn)題,導(dǎo)致AWS威脅要撤銷其對(duì)GPU實(shí)例的訪問(wèn)權(quán)限。

在AI領(lǐng)域,Stability.AI并非唯一一家持續(xù)努力推動(dòng)產(chǎn)品路線圖的初創(chuàng)公司。然而,Stable Video Diffusion的推出標(biāo)志著該公司對(duì)生成媒體內(nèi)容領(lǐng)域的持續(xù)投入,并表明其在商業(yè)化上的雄心。

在這個(gè)AI熱潮中,Stability.AI的一系列工具和模型,因其普遍開(kāi)源的特性,對(duì)于游戲行業(yè)可能帶來(lái)深遠(yuǎn)影響。游戲公司可以在Stability.AI公布的基礎(chǔ)模型上進(jìn)行精細(xì)調(diào)整,以快速生成各種場(chǎng)景所需的視頻素材。此外,廣告公司也可以利用Stable Video Diffusion等工具,快速生成各種買量廣告素材,提高廣告創(chuàng)作的效率和創(chuàng)意。

除了Stable Video Diffusion,Stability.AI還推出了Stable Audio,進(jìn)一步拓展了其影響范圍。Stable Audio由Stability.AI內(nèi)部的聲音實(shí)驗(yàn)室Harmonai研發(fā),采用了與Stable Diffusion類似的擴(kuò)散模型技術(shù)。該模型在音頻生成領(lǐng)域也取得了一定的成就,但與此同時(shí),公司也面臨一些商業(yè)化和版權(quán)的挑戰(zhàn)。

綜合而言,Stability.AI的一系列工具和模型為媒體內(nèi)容生成領(lǐng)域帶來(lái)了新的可能性,在未來(lái),隨著這些模型的不斷發(fā)展和完善,它們可能成為游戲行業(yè)和廣告行業(yè)關(guān)鍵工具。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
文章來(lái)源:GameLook
版權(quán)說(shuō)明:本文內(nèi)容來(lái)自于GameLook,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
三國(guó)SLG的下一代關(guān)鍵詞:文化、立體與長(zhǎng)線陪伴
三國(guó)SLG的下一代關(guān)鍵詞:文化、立體與長(zhǎng)線陪伴
每個(gè)中國(guó)人的心中都藏著一個(gè)戰(zhàn)火紛飛的東漢末年,也許再過(guò)幾百上千年,這份情懷還會(huì)始終如一。
SLG
游戲運(yùn)營(yíng)
游戲設(shè)計(jì)
2025-01-13
2024中國(guó)游戲業(yè)十大新聞,風(fēng)起云涌的一年!
2024中國(guó)游戲業(yè)十大新聞,風(fēng)起云涌的一年!
回顧2024年的中國(guó)游戲行業(yè),今年的中國(guó)游戲產(chǎn)業(yè)出現(xiàn)了太多代表著品類崛起的新紀(jì)錄
游戲市場(chǎng)
2025-01-03
俄羅斯要自研游戲主機(jī)!配置曝光,系統(tǒng)芯片全部自研
俄羅斯要自研游戲主機(jī)!配置曝光,系統(tǒng)芯片全部自研
在索尼諸多的第一方游戲工作室當(dāng)中,有不少是通過(guò)并購(gòu)而來(lái)的。比如打造了《命運(yùn)》系列的Bungie,《地平線》系列的研發(fā)團(tuán)隊(duì)Guerrilla,以及我們今天要說(shuō)的,打造了《古惑狼》、《神秘海域》,以及《最后生還者》等大作系列的頑皮狗。
俄羅斯
游戲市場(chǎng)
2024-12-29
頑皮狗創(chuàng)始人談為何賣公司:游戲研發(fā)費(fèi)漲了千倍,3A太貴是資金黑洞
頑皮狗創(chuàng)始人談為何賣公司:游戲研發(fā)費(fèi)漲了千倍,3A太貴是資金黑洞
在索尼諸多的第一方游戲工作室當(dāng)中,有不少是通過(guò)并購(gòu)而來(lái)的。比如打造了《命運(yùn)》系列的Bungie,《地平線》系列的研發(fā)團(tuán)隊(duì)Guerrilla,以及我們今天要說(shuō)的,打造了《古惑狼》、《神秘海域》,以及《最后生還者》等大作系列的頑皮狗。
游戲市場(chǎng)
游戲
2024-12-29
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開(kāi)掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家