微軟發表效能優於Google Gemini Nano 2的Phi-2語言模型
· 2023-12-14

微軟強調基於27億個參數的Phi-2語言模型,在許多測試上超越具備70億參數的Mistral、擁有130億參數的Llama-2,也凌駕了Google基於32億參數的Gemini Nano 2

微軟

微軟於周二(12/12)發表了Phi-2,這是一個小型語言模型(Small Language Model,SLM),僅具備27億個參數,但它在許多測試上超越了具備70億參數的Mistral、擁有130億參數的Llama-2,也凌駕了Google剛發表的、基於32億個參數的Gemini Nano 2。

微軟是在今年6月發表了基於深度學習模型Transformer的Phi-1模型,這是為了撰寫基本Python程式碼而設計的小型語言模型,僅使用13億個參數,當時微軟強調用來訓練Phi-1的素材全都是教科書品質,以期在更小的參數規模下達到更好的效能。9月登場的Phi-1.5則擴展至常識推理及語言理解,其效能可媲美5倍的模型。

最新的Phi-2則號稱效能可媲美25倍的模型,微軟認為它將是研究人員理想的遊樂場,可用來探索機制可解釋性,安全性的改善,或是針對各種任務進行微調實驗。

Phi-2的訓練素材同樣基於「教科書等級」的概念,涵蓋科學、日常活動與心理學等,再加上篩選過且具有教育價值的高品質網路內容,並將參數量從13億擴大至27億。

有別於Phi-1僅在8個A100 GPU上,以540億個Token進行6天的訓練,Phi-2則是在96個A100 GPU上,以1.4兆個Token進行了14天的訓練。

微軟以完成訓練的Phi-2進行各種基準測試,並與其它模型進行比較,包括用來評估語言模型處理複雜及具挑戰性任務的Big Bench Hard(BBH)、常識推理、語言理解、數學及撰寫程式碼等。發現Phi-2在上述類別的表現全都優於擁有130億個參數的Llama-2,也優於具備70億個參數的Mistral。

此外,微軟也比較了Phi-2與Google專替行動裝置設計的Gemini Nano 2,顯示它在BBH、BoolQ、MBPP與MMLU等類別的評測表現勝過Gemini Nano 2。不過,根據Google Gemini的技術報告,除了上述4項之外,Gemini Nano 2的評測類別還包括TydiQA、NaturalQuestions與MATH,而微軟並未公布相關比較。

熱門文章
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
英國確認各垂直行業的賭博稅稅率
合規與政策
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
首頁
遊戲
合作
發現
我的