Google推出图片生成模型VideoPoet,五大功能产生直式短影音
· 2024-01-01

近来一波波图片生成模型出现,无论是贴近提示要求或在图片处理细节上,许多情况下展现出令人惊艳的高品质。Google也不甘示弱,日前发布自主开发的大型语言模型VideoPoet。


近来一波波图片生成模型出现,无论是贴近提示要求或在图片处理细节上,许多情况下展现出令人惊艳的高品质。Google也不甘示弱,日前发布自主开发的大型语言模型VideoPoet。


为了探索语言模型在图片生成中的应用,Google引进全新大型语言模型VideoPoet,能够执行包括文本转成视频、图片转成视频、视频风格转换、视频修复、视频生成音频等五大功能,而且默认产生直式短影音。


比方说,文本提示输入“两只熊猫打扑克牌”,VideoPoet产生两只熊猫坐在桌边打扑克牌的短片。图片转成视频方面,像是上传一张油画图片,画中一艘驶向大海的船遭遇雷电交加、波涛汹涌,借由VideoPoet可以转变成动图形态。VideoPoet也能为视频产生音频,例如先以模型产生2秒短片,并尝试在没有任何文本提示下配上音频,于是从单一模型就能产生视频和音频。



VideoPoet五大功能概述


VideoPoet是训练一个自回归语言模型,通过使用多个标记器(用于视频和图片的MAGVIT V2,以及用于音频的SoundStream)学习视频、图片、音频、文本形式,像是通过文本和图片输入分解、标记,进而产生复杂的图片。


Google目标希望VideoPoet能够“any-to-any”,根据任何提示任意转换,同时也要扩展至文本转成音频、音频转成视频、产生视频字幕等功能。


VideoPoet将许多图片生成功能无缝集成至单一模型,而不是针对不同任务单独训练模型,特别在产生有趣视频和高品质动作上,展现出大型语言模型具高度竞争力的图片生成品质。


开发团队制作一部由VideoPoet产生不同短影音组合而成的介绍视频。


(图片来源:Google Research Blog)


热门文章
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
斯里兰卡博弈产业大转型,官方:剑指南亚拉斯维加斯
游戏风向
灰度在iGB L!VE 2026展位T70和你相约7月,一起点燃伦敦的热情!
灰度头条
巴西颁布新法赋权央行封锁非法博彩账户及 Pix 交易
支付动态
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
越南在线博彩业政策收紧 催生市场新机遇
东南亚资讯
2027 Global Game Connect(GGC)斯里兰卡招商全面开启!业务人脉尽在掌握!
灰度头条
JILI 宣布与全球板球传奇 AB de Villiers(ABD)达成重磅战略合作
体育游戏
新泽西州7月博彩收入创6.06亿美元新高,颁布禁令
游戏风向
灰度世界杯嘉年华狂欢派对吉隆坡站即将开启,业务拓展人脉社交从马来西亚开始
灰度头条
英国确认各垂直行业的赌博税税率
游戏风向
哈萨克斯坦计划对在线赌场促销活动进行处罚
游戏风向
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
越南博彩管控逐步放宽,惟本土需求仍显乏力
东南亚资讯
密西西比州众议院委员会推进提议增加赌场税的法案
游戏风向
首页
游戏
合作
发现
我的