AWS推EC2容量區塊新功能,讓用戶指定時間預留GPU資源
· 2023-11-02

AWS的Amazon EC2容量區塊新功能,讓用戶可以事先指定時間,預留需要的GPU執行個體數量,確保在需要的時候有足夠的GPU資源可供使用

有鑒於目前GPU資源的稀缺性,AWS新推出Amazon EC2容量區塊(Capacity Blocks)功能,這是一項適用於機器學習模型開發的EC2使用模型,用戶可以在EC2 UltraCluster特殊叢集中預留需要的Nvidia GPU資源,藉由指定叢集大小、開始時間和持續時間,便能夠以可預測的方式存取GPU資源。

全世界掀起一陣人工智慧應用熱潮,不少組織開始開發機器學習模型,而AWS提到,企業對在機器學習模型的GPU容量需求,已經超過全產業的供應量,使得GPU成為稀缺資源。而這對於需要大量GPU資源,用以訓練基礎模型和大型語言模型的用戶來說,是一項需要解決的問題。

面對這樣的問題,企業可能會需要長期購買大量的GPU容量,確保在需要的時刻,有足夠GPU運算資源可以使用,但是這可能造成資源浪費,導致在未使用時出現GPU資源閒置。因此AWS現在推出EC2容量區塊模式,來解決GPU資源搶奪的問題,這是一種安排GPU執行個體的新方法,用戶可以在指定時間內保留所需要的執行個體數量。

用戶可以提前8周指定日期,存取預留的EC2容量區塊並啟動P5執行個體,持續時間可為1到14天,叢集大小為1到64個執行個體,並且只需要支付所需要的GPU時間費用。而當EC2容量區塊持續時間結束後,任何執行中的執行個體都會被終止。

這項新功能在用戶需要容量保證,以訓練和微調機器學習模型、執行實驗,或是計畫性地增加機器學習應用程式需求時特別有用。用戶可以從AWS控制臺、命令列介面和開發工具包預留可用的容量區塊,目前可以先在AWS美東地區,預留搭載Nvidia H100 Tensor Core GPU的EC2 P5執行個體,官方計畫之後也會在其他地區推出該項功能。

熱門文章
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
英國確認各垂直行業的賭博稅稅率
合規與政策
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
首頁
遊戲
合作
發現
我的