

雙強合作,Google Gemma 經過最佳化,已可在 NVIDIA GPU 上運行!
Google 近日推出開放式模型 Gemma,NVIDIA 亦宣布與 Google 展開多項合作關係,包括:在所有 NVIDIA AI 平台上(包括本地端 RTX AI PC、雲端、資料中心)針對 Gemma 進行最佳化。同時,NVIDIA 自家的 Chat With RTX 也將很快加入支援 Gemma 的行列。
Gemma 是 Google 在本週稍早推出的開放式模型(open model),分別有兩種規模,包括:Gemma 2B 和 Gemma 7B。NVIDIA 與 Google 雙方團隊共同合作,透過用來最佳化 LLM 模型推論能力的開源函式庫 NVIDIA TensorRT-LLM,針對在資料中心或雲端環境運行的 NVIDIA GPU,以及在搭載 NVIDIA RTX GPU 的 AI PC 上,加速 Gemma 的運行效能。
NVIDIA 在新聞稿中表示,如此一來,開發者便能鎖定 AI PC 進行開發。此外,還能以雲端環境裡的 NVIDIA GPU 運行 Gemma 模型,包括在搭載 H100 Tensor 核心 GPU 的 Google Cloud A3 實體,以及 Google 未來將引入的 NVIDIA H200 Tensor Core GPU(該 GPU 擁有 141GB HBM3e 記憶體,每秒執行速度為 4.8 TB)。
企業開發者也可以運用 NVIDIA 的工具生態系統,包括配備 NeMo 框架和 TensorRT-LLM 的 NVIDIA AI Enterprise,來微調 Gemma 並且在其生產力應用程式中部署經過最佳化調整的模型。
Chat With RTX 是 NVIDIA 在本月稍早推出的個性化聊天 AI 機器人,可以讓使用者將資料連接到有 RTX 支援的 PC 的大型語言模型,並且從自己的檔案和內容快速地獲取量身打造的個性化資訊,Chat with RTX 最大的亮點就是可以在本地執行。
NVIDIA 表示,這項工具也將加入支援 Gemma。
:Jocelyn
快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!
: