

根據Google公布的測試數據,Gemma 7B在推論、數學、撰寫程式上,超越Llama 2 7B以及Mistral 7B
_Google
Gemma預訓練模型及依指示微調(instruction-tuned)後的模型,可直接執行於開發人員的筆電或工作站、桌機、或者Google Cloud的Vertex AI和Google Kubernetes Engine(GKE)上。VertexAI上有廣泛MLOps工具,內建多種微調選項及一鍵部署。Google表示,不論是代管的Vertex AI工具或自行管理的GKE,都支援客製化,包括能部署到各種GPU、TPU、和CPU等基礎架構平臺上。
Gemma支援多種工具和系統,允許開發人員和企業以自有資料微調Gemma。Google提供的推論和監督式微調參考實作工具支援多種主要框架,包括Kera 3.0、原生PyTorch、JAX和Hugging Face Transformers。
在硬體方面,Gemma已針對多種AI硬體平臺進行過優化,除了Google Cloud TPU外,Google也和Nvidia合作,以便確保Nvidia GPU為基礎的雲端、本地部署資料中心、到RTX AI PC上具備高執行效能。
Google強調Gemma是根據其安全與負責任的AI原則設計。為了確保Gemma預訓練模型的安全與穩定,研發團隊使用自動化方法篩選掉資料集中的個資及其他敏感資訊,也使用微調及基於人類反饋的強化式學習(reinforcement learning from human feedback,RLHF)確保模型符合負責任行為。同時為了解及降低Gemma模型的風險,Google也實行嚴謹的評估,包括紅隊演練、自動化威脅測試及模型的危險活動能力評估。為讓外部用戶進行負責任AI的評估,Google昨日也公布新的負責任生成式AI工具包,包括可以簡單範例建立安全分類器的工具、模型除錯及Google分享的負責任模型開發與部署指引。

為方便開發人員開始使用Gemma,Gemma可整合Kaggle、Colab notebook常見工具如Hugging Face、MaxText、Nvidia MeMo及TensorRT-LLM。為吸引開發人員使用Gemma,Google提供Kaggle notebook、Colab免費方案,以及300美元Google Cloud點數。Google甚至提供高達50萬美元等值Google Cloud點數,供研究人員申請執行專案。