Hugging Face公佈手機執行的小型語言模型SmolLM2
支付動態 · 2024-11-04

Hugging Face強調1.7B參數版本的SmolLM2在多項標竿測試上,優於Llama-1B及阿里巴巴的Qwen2.5-1.5B,但SmolLM2現階段只支援英文

Hugging Face

Hugging Face上週公佈可在手機上執行的最新一代語言模型SmolLM2家族。

這是繼7月首次問世後,SmolLM家族最新版本,包括參數量135M、360M與1.7B三種規模,其中135M參數模型分成基礎及Instruct版,而360M與1.7B參數模型則分成基礎、Instruct及GGUF(GPT-Generated Unified Format)版,共11個模型,皆以Apache 2.0授權開源。

135M、360M與1.7B都是以公開資料集和Hugging Face編排的資料集如FineWeb-Edu、DCLM和The Stack,以監督式微調(supervised fine-tuning)方法訓練,1.7B版本還多了些數學與程式碼資料集。資料集的量分別為2兆、4兆與11兆字詞。Hugging Face還應用直接偏好優化(Direct Preference Optimization,DPO)演算法來強化。

三個規模的模型訓練的軟體架構皆是Transformer decoder,硬體架構而言,其中135M與360M模型執行於64顆H100的伺服器,而1.7B版本則為256顆H100的環境。

一如第一代,SmolLM2也是可執行在裝置上的輕量級模型,但在指令遵從、知識與理解能力優於第一代。而拜Argilla的資料集如Synth-APIGen-v 0.1之賜,Instruct模型另外還支援改寫、重要摘要、與函式呼叫等任務。

根據Hugging Face的數據,在多項標竿測試上,以SomlLM2-1.7B而言,不但優於第一代,也超過參數量更多的Llama-1B-Instruct及阿里巴巴的Qwen2.5-1.5B-Instruct。

雖然能力更提升,但新一代SmolLM還是有些不足。目前SmolLM2模型只能理解和生成英文內容。此外也還存在事實準確性、邏輯一致性以及偏差等問題。Hugging Face建議使用者只能用於輔助工具,且應格外小心評估其產出內容。

熱門文章
英國確認各垂直行業的賭博稅稅率
合規與政策
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
首頁
遊戲
合作
發現
我的