ElevenLabs公佈AI音效、人聲生成模型
支付動態 · 2024-06-03

開發語音生成模型的ElevenLabs與知名圖庫和音訊平臺Shutterstock合作,發布可根據文字提示生成音效的Text to Sound Effects服務

ElevenLabs專門從事語音和聲音應用研究,去年公佈AI聲音生成的AI平臺Text to Speech,可讓用戶在文字對話中設定性別、年齡、口音和說話風格合成逼真人聲,並於同年募得近2,000萬美元的A輪資金。ElevenLabs今年2月搭上OpenAI影片AI生成模型Sora列車,預告可為影片配音的AI聲音模型,並在上週正式向大眾公開Text to Sound Effects,包括免費版及付費版。

Text to Sound Effects目的在為電影或電視節目、電玩開發商,甚至社群內容創作者、個人提供工具,使其得以快速且大規模生成豐富、沈浸式聲音場景,而且不需大成本。只要在提示視窗輸入文字,就可以生成音效、22秒的樂器演奏音訊、聲音場景或各種角色聲音。該公司網頁並提供多種範例說明輸入的文字提示和生成音效,包括動物叫聲、打雷、爆炸聲、恐怖電影音效,或是吉他等樂器演奏。

為訓練這新工具,ElevenLabs和知名圖庫和音訊平臺Shutterstock合作,以其多樣化及高品質的合法聲音檔微調其AI模型。

Text to Sound Effects並提供用戶微調工具,讓用戶能針對一種物件再細分出不同類別,例如「腳步聲」可以文字再微調成是高跟鞋、靴子或球鞋,或是走在沙地、雪地或葉子上的聲音。完成後,用戶可選擇下載聲音或儲存在ElevenLabs平臺上。

Text to Sound Effects提供免費及付費版。付費版是透過在付費帳號供用戶使用。免費版用戶需要在生成的音樂加上elevenlabs.io,以說明來自ElevenLabs。付費帳號用戶則不需註明。不過不論是哪個版本,版權責任都由使用者自付。

收費標準是根據生成音訊的長度控制參數計算。若用戶設定為最適長度,會被收取200字元的費用,如果用戶想自行控制長度,則會被設定該長度每秒40字元的費用。收費是每執行4次生成計算一次。收費是每次呼叫(而非下載),即每按一次「Generate」就多一次費用。但若用戶認為計算結果有誤,需自行向業者([email protected])反映。

根據ElevenLabs說明,付費帳號分成3類。Creator為0.30美元/1,000字元,Pro為 0.24美元/1,000字元,Scale則為 0.18美元/1,000字元。

熱門文章
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
英國確認各垂直行業的賭博稅稅率
合規與政策
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
首頁
遊戲
合作
發現
我的