Stability AI发布文本生成声音模型开源版本Stable Audio Open
支付動態 · 2024-06-06

相较于Stable Audio模型可生成3分钟的连贯音乐结构,开源版Stable Audio Open模型则能生成47秒的样本与声音效果

Stability AI周三(6/5)发布了文本生成声音模型的开源版本Stable Audio Open,在用户输入文本描述后,它便能生成长达47秒的样本与声音效果。

Stability AI以超过48万个声音纪录来训练Stable Audio Open模型,其中超过9成的纪录来自Freesound,另有少数来自「免费音乐文件」(Free Music Archive ,FMA),所有的音频档都取得了免费的共享许可,并使用预训练的T5(Text-to-Text Transfer Transformer)文本模型来处理与生成文本。

Stable Audio Open让用户输入简单的文本提示,即可生成最多长达47秒的高品质声音,Stability AI宣称它很适合用来创建鼓点、音乐即兴片段、环境音效、模拟录音,或是其它与音乐及声音有关的样本。开源版本的好处之一还包括用户可以利用自己的声音数据来调整模型,例如鼓手可以加入自己的录音样本来生成新的节奏。

其实该公司在去年9月便先推出了商业版的Stable Audio,同时提供免费与付费方案。Stability AI解释,Stable Audio可生成高品质、完整且长达3分钟的连贯音乐结构,而Stable Audio Open则专注于声音样本、音效与制作元素,尽管Stable Audio Open能够生成简短的音乐,但并未针对完成的歌曲、旋律或人声进行优化。

用户也可迳自利用Stable Audio免费版来测试与Stable Audio Open的差异,Stable Audio Open 1.0现阶段则可通过Hugging Face取得。

热门文章
密西西比州众议院委员会推进提议增加赌场税的法案
游戏风向
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
灰度头条
GGC Awards 2026 璀璨科伦坡:致敬 iGaming 行业的领航者与创新力量
灰度头条
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
印度最高法院受理公益诉讼,要求全国禁封“伪装”成社交游戏的赌博平台
游戏风向
哈萨克斯坦计划对在线赌场促销活动进行处罚
游戏风向
巴西颁布新法赋权央行封锁非法博彩账户及 Pix 交易
支付动态
越南博彩管控逐步放宽,惟本土需求仍显乏力
东南亚资讯
巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域
游戏风向
2027 Global Game Connect(GGC)斯里兰卡招商全面开启!业务人脉尽在掌握!
灰度头条
张侨伟参议员排除全面禁止,敦促菲律宾规范网络赌博
东南亚资讯
灰度世界杯嘉年华狂欢派对吉隆坡站即将开启,业务拓展人脉社交从马来西亚开始
灰度头条
超级PAC筹资4800万美元:体育博彩势力加码
游戏风向
英国确认各垂直行业的赌博税税率
游戏风向
首页
游戏
合作
发现
我的