新版GKE可管理最多6.5萬叢集節點,超越AWS、Azure 10倍
支付動態 · 2024-11-14

Google Cloud公佈最新Google Kubernetes Engine版本,號稱可支援最高達65,000個節點的伺服器叢集,以執行超大型AI模型

Google Cloud

Google Cloud公佈最新Google Kubernetes Engine版本,號稱可支援最高達65,000個節點的伺服器叢集,以執行超大型AI模型。

生成式AI技術演進及應用普及,推升了大型語言模型(LLM)規模及參數量也愈來愈大,目前許多已突破千億參數,甚至有些來到2兆。而訓練這些大型模型的加速器,需要超過1萬個節點的運算基礎架構。

Google Kubernetes Engine(GKE)向來可支援多節點叢集,以執行AI模型訓練任務。先前版本GKE可支援1.5萬個叢集節點,隨著新版推出,現在GKE可支援高達6.5萬個節點的叢集。Google認為最新GKE支援的節點規模,是Amazon和微軟的10倍以上。

Google Cloud而言,現在單一節點提供了多個加速器,像是搭載4顆晶片的Cloud TPU v5e節點,因此單一叢集使用最新版GKE後,最多可管理超過25萬顆加速器。

Google說明新版GKE較前代的創新。首先,該公司將Key-Value資料庫由etcd換成了以Google Spanner為基礎的key-value資料庫,後者幾乎規模無上限,可改善叢集運作(如啟動和更新)延遲性,及無狀態叢集控制層(control plance)。Google並實作etcd API以提供回溯相容性,使核心Kubernetes無需變更。

其次,Google改善了管理Kubernetes控制層的GKE基礎架構,使GKE現在擴充速度更快,改善的控制層有多重效益,包括能執行高一致性的大容量運算。控制層現在能自動因應運算調節,並使延遲性維持在可預測範圍。這點對執行大型動態應用如SaaS、災難復原和備援、批次部署以及測試環境來說尤其重要。

有了新版GEK,Google Cloud強調更能支援AI模型任務。訓練AI模型時企業需要分配運算資源給多個工作負載,因此將任務集中在少量叢集可提供最大調度彈性,執行推論、研究和訓練的作業。Google說,由於支援6.5萬個節點,現在GKE允許單一叢集執行5種任務,每種任務的執行效能,都足以媲美2023年Google Cloud以5萬餘顆TPU v5e,締造的10 exa-FLOPs的LLM訓練速度世界紀錄。

熱門文章
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
英國確認各垂直行業的賭博稅稅率
合規與政策
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
首頁
遊戲
合作
發現
我的