Mistral AI釋出開源模型Mixtral 8x22B
· 2024-04-11

Mistral AI以Apache 2.0授權釋出Mixtral 8x22B模型,Mixtral 8x22B支援1,760億個參數,以及6.5萬個Token的脈絡長度,成為目前最大的開源模型之一

Hugging Face

去年4月才於法國成立的AI業者Mistral AI周三(4/10)釋出了新的開源模型Mixtral 8x22B,它採用稀疏混合專家(Sparse Mixture of Experts,SMoE)架構,支援1,760億個參數,以及6.5萬個Token的脈絡長度,已藉由Mistral AI的官方X帳號、Together API及Hugging Face發布,成為目前最大的開源模型之一。同一天,就有開發者透過Hugging Face公布了Mixtral 8x22B的基準測試結果。

迄今Mistral AI已釋出3款開源模型,包括去年9月發表的Mistral 7B(Mistral-tiny),去年12月發表的Mixtral 8x7B(Mistral-small),以及本周推出的Mixtral 8x22B,它們皆採用Apache 2.0授權,允許開發者免費下載,並在自己的設備或伺服器上執行。

在Mixtral 8x22B的基準測試中,其MMLU(大規模多工語言理解)成績為77.3,勝過前一代Mixtral 8x7B的71.88,也凌駕GPT-3.5的70、Claude 3 Haiku(Claude 3低階版)的75.2、Gemini 1.0 Pro的71.8,但仍不及GPT-4的86.4,或是Claude 3 Sonet/Opus,也不及Gemini 1.0 Ultra與Gemini 1.5 Pro。

而在基礎常識推論(HellaSwag)測試中,Mixtral 8x22B得分為88.9,僅不及GPT-4、Claude 3 Sonet/Opus與Gemini 1.5 Pro;但它在GSM8K數學測試中的得分為76.5,明顯不及GPT-4、Claude 3的各種模型,以及Gemini的各種模型。

由於Mixtral 8x22B是開源的,開發者可以重新訓練或改善它,以讓它能夠處理更多的專門任務。

儘管成立才一年,但Mistral AI在去年12月完成4.15億美元的增資活動時,其公司估值已達到20億美元

熱門文章
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
英國確認各垂直行業的賭博稅稅率
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
首頁
遊戲
合作
發現
我的