Google推出图片生成模型VideoPoet,五大功能产生直式短影音
· 2024-01-01

近来一波波图片生成模型出现,无论是贴近提示要求或在图片处理细节上,许多情况下展现出令人惊艳的高品质。Google也不甘示弱,日前发布自主开发的大型语言模型VideoPoet。


近来一波波图片生成模型出现,无论是贴近提示要求或在图片处理细节上,许多情况下展现出令人惊艳的高品质。Google也不甘示弱,日前发布自主开发的大型语言模型VideoPoet。


为了探索语言模型在图片生成中的应用,Google引进全新大型语言模型VideoPoet,能够执行包括文本转成视频、图片转成视频、视频风格转换、视频修复、视频生成音频等五大功能,而且默认产生直式短影音。


比方说,文本提示输入“两只熊猫打扑克牌”,VideoPoet产生两只熊猫坐在桌边打扑克牌的短片。图片转成视频方面,像是上传一张油画图片,画中一艘驶向大海的船遭遇雷电交加、波涛汹涌,借由VideoPoet可以转变成动图形态。VideoPoet也能为视频产生音频,例如先以模型产生2秒短片,并尝试在没有任何文本提示下配上音频,于是从单一模型就能产生视频和音频。



VideoPoet五大功能概述


VideoPoet是训练一个自回归语言模型,通过使用多个标记器(用于视频和图片的MAGVIT V2,以及用于音频的SoundStream)学习视频、图片、音频、文本形式,像是通过文本和图片输入分解、标记,进而产生复杂的图片。


Google目标希望VideoPoet能够“any-to-any”,根据任何提示任意转换,同时也要扩展至文本转成音频、音频转成视频、产生视频字幕等功能。


VideoPoet将许多图片生成功能无缝集成至单一模型,而不是针对不同任务单独训练模型,特别在产生有趣视频和高品质动作上,展现出大型语言模型具高度竞争力的图片生成品质。


开发团队制作一部由VideoPoet产生不同短影音组合而成的介绍视频。


(图片来源:Google Research Blog)


熱門文章
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
英國確認各垂直行業的賭博稅稅率
合規與政策
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
首頁
遊戲
合作
發現
我的