Mistral AI釋出開源模型Mixtral 8x22B
· 2024-04-11

Mistral AI以Apache 2.0授權釋出Mixtral 8x22B模型,Mixtral 8x22B支援1,760億個參數,以及6.5萬個Token的脈絡長度,成為目前最大的開源模型之一

Hugging Face

去年4月才於法國成立的AI業者Mistral AI周三(4/10)釋出了新的開源模型Mixtral 8x22B,它採用稀疏混合專家(Sparse Mixture of Experts,SMoE)架構,支援1,760億個參數,以及6.5萬個Token的脈絡長度,已藉由Mistral AI的官方X帳號、Together API及Hugging Face發布,成為目前最大的開源模型之一。同一天,就有開發者透過Hugging Face公布了Mixtral 8x22B的基準測試結果。

迄今Mistral AI已釋出3款開源模型,包括去年9月發表的Mistral 7B(Mistral-tiny),去年12月發表的Mixtral 8x7B(Mistral-small),以及本周推出的Mixtral 8x22B,它們皆採用Apache 2.0授權,允許開發者免費下載,並在自己的設備或伺服器上執行。

在Mixtral 8x22B的基準測試中,其MMLU(大規模多工語言理解)成績為77.3,勝過前一代Mixtral 8x7B的71.88,也凌駕GPT-3.5的70、Claude 3 Haiku(Claude 3低階版)的75.2、Gemini 1.0 Pro的71.8,但仍不及GPT-4的86.4,或是Claude 3 Sonet/Opus,也不及Gemini 1.0 Ultra與Gemini 1.5 Pro。

而在基礎常識推論(HellaSwag)測試中,Mixtral 8x22B得分為88.9,僅不及GPT-4、Claude 3 Sonet/Opus與Gemini 1.5 Pro;但它在GSM8K數學測試中的得分為76.5,明顯不及GPT-4、Claude 3的各種模型,以及Gemini的各種模型。

由於Mixtral 8x22B是開源的,開發者可以重新訓練或改善它,以讓它能夠處理更多的專門任務。

儘管成立才一年,但Mistral AI在去年12月完成4.15億美元的增資活動時,其公司估值已達到20億美元

热门文章
越南博彩管控逐步放宽,惟本土需求仍显乏力
东南亚资讯
JILI 宣布与全球板球传奇 AB de Villiers(ABD)达成重磅战略合作
体育游戏
横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
灰度头条
BETFAIR 网络攻击80万用户资料泄露
游戏风向
巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域
游戏风向
超级PAC筹资4800万美元:体育博彩势力加码
游戏风向
新泽西州7月博彩收入创6.06亿美元新高,颁布禁令
游戏风向
巴西颁布新法赋权央行封锁非法博彩账户及 Pix 交易
支付动态
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
密西西比州众议院委员会推进提议增加赌场税的法案
游戏风向
GGC Awards 2026 璀璨科伦坡:致敬 iGaming 行业的领航者与创新力量
灰度头条
越南在线博彩业政策收紧 催生市场新机遇
东南亚资讯
印度最高法院受理公益诉讼,要求全国禁封“伪装”成社交游戏的赌博平台
游戏风向
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
斯里兰卡博弈产业大转型,官方:剑指南亚拉斯维加斯
游戏风向
首页
游戏
合作
发现
我的