GKE用戶現在也可以選用Cloud TPU訓練AI模型
· 2023-09-04

Google的Kubernetes服務GKE現支援Cloud TPU,配合多項工具與自動化功能,以及TPU的高效擴展能力,可助用戶處理大規模人工智慧工作負載

Google宣布在其Kubernetes服務GKE中加入Cloud TPU支援,也就是說現在用戶可以在GKE中,使用TPU處理大規模人工智慧負載,可選用的型號包括Cloud TPU v4或是最新的Cloud TPU v5e。GKE也提供了許多實用工具,供用戶更好地運用TPU執行機器學習模型,以及進行日誌記錄、監控與自動配置等任務。

Cloud TPU是Google設計專門用於機器學習工作負載的硬體加速器,其特別設計的晶片,可以加速模型運算,像是大型語言模型、Vision Transformer模型或是其他擴散生成模型。用戶過去要使用Cloud TPU大規模處理人工智慧工作負載,需要自己手動操作繁瑣的程序。

透過在GKE提供Cloud TPU支援,用戶不只可以使用GPU加速模型運算,現在還可以選用TPU,並且在GKE一致的操作環境中,執行各種類型的工作負載,並且獲得自動擴展、自動配置、自動修復和自動升級等一系列自動化功能,降低營運負擔。

Cloud TPU節點池可以自動配置並擴展,簡化用戶調度工作,Cloud TPU上的水平擴展能力極高,透過新的Multislice技術,用戶可以在單次訓練中使用數萬個晶片,更快速且大規模地訓練模型。

官方特別強調,Cloud TPU高效擴展的能力,能夠在增加資源的同時,獲得幾乎等比例的加速,有效率地執行工作負載。另外,Google還推出JobSet API來抽象Multislice的操作,能夠對跨數千個TPU晶片的工作負載,提供故障處理機制。

GKE用戶也可以透過Kueue等API在團隊中共享TPU資源,Google解釋,雖然用戶的工作負載仍透過Kubernetes調度,但是在Kueue中,用戶可以建立不同優先等級的工作負載,並且將空閒資源先分配給高優先等級的任務。此外,用戶只要啟用GKE系統指標,便可以在Cloud Monitoring查看Cloud TPU基礎設施指標,在Google雲端控制臺的GKE區塊,監控TPU資源使用。


熱門文章
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
英國確認各垂直行業的賭博稅稅率
合規與政策
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
首頁
遊戲
合作
發現
我的