過(guò)去這一年應(yīng)該有很多人看到AI可以取代部分插畫(huà)家的工作,通過(guò)文本指令創(chuàng)作出完成度相當(dāng)高的手繪圖片,也有不少人應(yīng)用大型語(yǔ)言模型產(chǎn)生出短篇小說(shuō),或甚至OpenAI還展示出SORA視頻生成技術(shù),現(xiàn)在Google也加入這個(gè)戰(zhàn)局,提供用戶(hù)AI工具來(lái)產(chǎn)生素材。
Google將推出Veo視頻生成模型以及Imagen 3文生圖模型,并展示了Music AI Sandbox協(xié)助創(chuàng)作者錄音的過(guò)程。
Veo是Google最新的視頻生成模型,可以產(chǎn)生出不同視覺(jué)風(fēng)格的1080p分辨率視頻,視頻長(zhǎng)度還可以超過(guò)一分鐘,直接對(duì)標(biāo)OpenAI推出的Sora視頻模型。
根據(jù)Google表示,Veo可以理解自然語(yǔ)言,甚至還可以理解專(zhuān)業(yè)的拍攝術(shù)語(yǔ),例如延時(shí)錄像、空拍等等,創(chuàng)造出符合真實(shí)世界的物理原理視頻,同時(shí)可提供連貫而且一致性高的形象。
Google也與了電影制作Donald Glover和其工作室嘗試在某部電影里使用Veo創(chuàng)作:
Veo視頻生成模型結(jié)合了Google多年來(lái)的視頻技術(shù)包含生成查詢(xún)網(wǎng)絡(luò)(GQN)、DVD-GAN、Imagen-Video、Phenaki、WALT、VideoPoet和Lumiere等,未來(lái)會(huì)將Veo部分功能開(kāi)放給YouTube Shorts使用。
既然有AI視頻模型,當(dāng)然也有文本生圖片模型,Google把它取名為Imaen 3,官方表示可以產(chǎn)生細(xì)節(jié)栩栩如生、逼真的照片,跟之前的圖片模型相比,一些不合理的細(xì)節(jié)會(huì)少很多。
Google表示Imagen 3可以更準(zhǔn)確地理解自然語(yǔ)言,甚至知道語(yǔ)言背后的意圖,還會(huì)融合提示詞中的細(xì)節(jié),讓創(chuàng)作出的照片可以更精確。
這四張圖都是由Imagen 3生成。
有AI生成視頻、AI生成圖片后,Google也和音樂(lè)家、歌曲創(chuàng)作者、制作人合作,發(fā)展AI生成音樂(lè),Google開(kāi)發(fā)出名為Music AI Sandbox的音樂(lè)AI工具,讓創(chuàng)作者可以應(yīng)用AI改變聲音、或是產(chǎn)生出新的樂(lè)器音樂(lè)等。
Google也提供了一段由AI輔助創(chuàng)作的音樂(lè):
為了要幫助用戶(hù)識(shí)別出哪些形象、照片、音樂(lè)是由AI創(chuàng)作,Google開(kāi)發(fā)出SynthID,以數(shù)字浮水印的方式嵌入上述這些AI產(chǎn)生的內(nèi)容。