微軟發表效能優於Google Gemini Nano 2的Phi-2語言模型
· 2023-12-14

微軟強調基於27億個參數的Phi-2語言模型,在許多測試上超越具備70億參數的Mistral、擁有130億參數的Llama-2,也凌駕了Google基於32億參數的Gemini Nano 2

微軟

微軟於周二(12/12)發表了Phi-2,這是一個小型語言模型(Small Language Model,SLM),僅具備27億個參數,但它在許多測試上超越了具備70億參數的Mistral、擁有130億參數的Llama-2,也凌駕了Google剛發表的、基於32億個參數的Gemini Nano 2。

微軟是在今年6月發表了基於深度學習模型Transformer的Phi-1模型,這是為了撰寫基本Python程式碼而設計的小型語言模型,僅使用13億個參數,當時微軟強調用來訓練Phi-1的素材全都是教科書品質,以期在更小的參數規模下達到更好的效能。9月登場的Phi-1.5則擴展至常識推理及語言理解,其效能可媲美5倍的模型。

最新的Phi-2則號稱效能可媲美25倍的模型,微軟認為它將是研究人員理想的遊樂場,可用來探索機制可解釋性,安全性的改善,或是針對各種任務進行微調實驗。

Phi-2的訓練素材同樣基於「教科書等級」的概念,涵蓋科學、日常活動與心理學等,再加上篩選過且具有教育價值的高品質網路內容,並將參數量從13億擴大至27億。

有別於Phi-1僅在8個A100 GPU上,以540億個Token進行6天的訓練,Phi-2則是在96個A100 GPU上,以1.4兆個Token進行了14天的訓練。

微軟以完成訓練的Phi-2進行各種基準測試,並與其它模型進行比較,包括用來評估語言模型處理複雜及具挑戰性任務的Big Bench Hard(BBH)、常識推理、語言理解、數學及撰寫程式碼等。發現Phi-2在上述類別的表現全都優於擁有130億個參數的Llama-2,也優於具備70億個參數的Mistral。

此外,微軟也比較了Phi-2與Google專替行動裝置設計的Gemini Nano 2,顯示它在BBH、BoolQ、MBPP與MMLU等類別的評測表現勝過Gemini Nano 2。不過,根據Google Gemini的技術報告,除了上述4項之外,Gemini Nano 2的評測類別還包括TydiQA、NaturalQuestions與MATH,而微軟並未公布相關比較。

热门文章
英国确认各垂直行业的赌博税税率
游戏风向
斯里兰卡博弈产业大转型,官方:剑指南亚拉斯维加斯
游戏风向
2027 Global Game Connect(GGC)斯里兰卡招商全面开启!业务人脉尽在掌握!
灰度头条
BETFAIR 网络攻击80万用户资料泄露
游戏风向
巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域
游戏风向
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
巴西颁布新法赋权央行封锁非法博彩账户及 Pix 交易
支付动态
印度最高法院受理公益诉讼,要求全国禁封“伪装”成社交游戏的赌博平台
游戏风向
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
亚洲游戏市场观察:15大市场热门游戏与用户趋势
线上游戏
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
GGC Awards 2026 璀璨科伦坡:致敬 iGaming 行业的领航者与创新力量
灰度头条
越南在线博彩业政策收紧 催生市场新机遇
东南亚资讯
新泽西州7月博彩收入创6.06亿美元新高,颁布禁令
游戏风向
密西西比州众议院委员会推进提议增加赌场税的法案
游戏风向
首页
游戏
合作
发现
我的