Google推出生成式AI幫創(chuàng)作者制作素材

來源：十輪網(wǎng)

作者：十輪網(wǎng)

時(shí)間：2024-05-16

過去這一年應(yīng)該有很多人看到AI可以取代部分插畫家的工作，通過文本指令創(chuàng)作出完成度相當(dāng)高的手繪圖片，也有不少人應(yīng)用大型語言模型產(chǎn)生出短篇小說，或甚至OpenAI還展示出SORA視頻生成技術(shù)，現(xiàn)在Google也加入這個(gè)戰(zhàn)局，提供用戶AI工具來產(chǎn)生素材。

Google將推出Veo視頻生成模型以及Imagen 3文生圖模型，并展示了Music AI Sandbox協(xié)助創(chuàng)作者錄音的過程。

Veo是Google最新的視頻生成模型，可以產(chǎn)生出不同視覺風(fēng)格的1080p分辨率視頻，視頻長度還可以超過一分鐘，直接對標(biāo)OpenAI推出的Sora視頻模型。

根據(jù)Google表示，Veo可以理解自然語言，甚至還可以理解專業(yè)的拍攝術(shù)語，例如延時(shí)錄像、空拍等等，創(chuàng)造出符合真實(shí)世界的物理原理視頻，同時(shí)可提供連貫而且一致性高的形象。

Google也與了電影制作Donald Glover和其工作室嘗試在某部電影里使用Veo創(chuàng)作：

Veo視頻生成模型結(jié)合了Google多年來的視頻技術(shù)包含生成查詢網(wǎng)絡(luò)（GQN）、DVD-GAN、Imagen-Video、Phenaki、WALT、VideoPoet和Lumiere等，未來會將Veo部分功能開放給YouTube Shorts使用。

既然有AI視頻模型，當(dāng)然也有文本生圖片模型，Google把它取名為Imaen 3，官方表示可以產(chǎn)生細(xì)節(jié)栩栩如生、逼真的照片，跟之前的圖片模型相比，一些不合理的細(xì)節(jié)會少很多。

Google表示Imagen 3可以更準(zhǔn)確地理解自然語言，甚至知道語言背后的意圖，還會融合提示詞中的細(xì)節(jié)，讓創(chuàng)作出的照片可以更精確。

這四張圖都是由Imagen 3生成。

有AI生成視頻、AI生成圖片后，Google也和音樂家、歌曲創(chuàng)作者、制作人合作，發(fā)展AI生成音樂，Google開發(fā)出名為Music AI Sandbox的音樂AI工具，讓創(chuàng)作者可以應(yīng)用AI改變聲音、或是產(chǎn)生出新的樂器音樂等。

Google也提供了一段由AI輔助創(chuàng)作的音樂：

為了要幫助用戶識別出哪些形象、照片、音樂是由AI創(chuàng)作，Google開發(fā)出SynthID，以數(shù)字浮水印的方式嵌入上述這些AI產(chǎn)生的內(nèi)容。

AI Google

上一篇：消息稱大多數(shù) App Store 開發(fā)者不接受蘋果新的外部支付鏈接

原文鏈接：點(diǎn)擊前往 >

版權(quán)說明：本文內(nèi)容來自于十輪網(wǎng)，本站不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn)，不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán)，請聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關(guān)文章