IBM開源Granite 3.0 8B、2B系列多個模型,強調效能優於大其10倍的競爭模型
支付動態 · 2024-10-22

IBM公佈Granite 3.0模型家族,涵括護欄能力、邊緣運算及高效能型

Hugging Face

IBM週一公佈其大型語言模型(large language model,LLM)Granite 3.0版多個版本及工具,涵括護欄能力、邊緣運算及高效能型,後者效能超越Google及Alibaba等公司10倍大的競爭模型。

這是IBM繼5月Granite系列首次亮相後,Granite系列最新成員。本次釋出的Granite 3.0有11個,主要有8B與2B版本,分成4種用途類型。第一是密集、通用LLM,Granite 3.0 8B及Granite 3.0 2B各有Instruct及Base版本,共4模型。第二有4模型,是輸出-輸入護欄(guardrail)模型,Granite 3.0 Guardian 8B與Granite 3.0 Guardian 2B,Instruct及Base版本各一,可提供護欄能力,確保回應內容安全和可信賴。

第三類有2個,為現最小延遲性的專家混合(mixture of expert,MoE)模型,Granite 3.0-3B- A800M-instruct及Granite 3.0-3B- A400M-instruct,適合在CPU為底層的環境及端點運算執行。第四類是1個新的時間序列(Time Series)模型Granite-3.0-8B-Instruct-Accelerator,為提升推論速度和效率的推測解碼器,適合零/少量樣本預測,效能超過10倍大的模型。

Granite 3.0版是以來自12種自然語言及116種程式語言文字,超過12兆字詞,運用二階段訓練方法,並結合數千項以提升資料品質、資料選擇及訓練參數訓練而成。預計到年底Granite 3.0 8B及2B模型可支援128K脈絡長度及多模態檔案理解能力。

IBM指出,許多企業資料卻仍未善用,結合小型Granite及企業資料有助於發揮企業資料的價值,Granite模型結合了IBM和RedHat 5月開源的一致化技術InstructLab,可以更少的成本獲致大型模型的效能,估計成本可省3倍到23倍。

Granite 3.0 8B和2B LLM可供企業執行大負載任務的模型,以高效能支援擷取增強生成(retrieval augmented generation,RAG)、分類、重點摘要、實體擷取等任務。這些模型允許以企業資料微調,整合到各種企業環境或工作流程中。

IBM同時也公開Granite為底層的Code Assistant(程式撰寫助理)提供給一般程式開發用途,這項工具可在watsonx.ai平臺用以開發和部署AI應用及代理程式。

IBM已將整個Granite 3.0模型系列都以Apache 2.0授權在Hugging Face供下載。其中Granite Guardian 3.0 8B和2B已上架IBM watsonx平臺供商業用途。部份Granite 3.0模型可作為Nvidia NIM微服務推出,或在Google Cloud Vertex AI Model Garden上架。並有一些Granite 3.0模型透過Ollama和Replicate平臺提供給開發人員。

熱門文章
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
英國確認各垂直行業的賭博稅稅率
合規與政策
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
首頁
遊戲
合作
發現
我的