蘋果公布裝置上執行的AI模型OpenELM
· 2024-04-26

蘋果釋出可在自家裝置端執行的OpenELM模型家族以及訓練/推論框架,OpenELM最小版本僅2.7億參數

在訓練方面,OpenELM模型是以CoreNet函式庫作為訓練框架,其預訓練資料集包含了RefinedWeb、去除重覆資料的PILE、RedPajama和Dolma v1.6各一個子資料集,共1.8兆token。蘋果說明,OpenELM融合了分層擴展策略,能將模型參數有效分配到transformer模型各層,以提升準確率。舉例而言,11億參數版本的OpenELM準確率較(12億參數版本的)OLMo準確率高出2.36%,但預訓練資料token僅其一半。

蘋果也列出在一臺Nvidia GPU/Ubuntu筆電上進行提示執行及程式碼生成二個任務上,和其他開源模型的效能比較(如下圖)。數據顯示OpenELM 4.5億參數版本在提示執行效能已超過MobiLama,2.7億參數版本比起OPT也相差不遠,但在程式碼生成任務上,各個版本都還有待加強。蘋果也列出了在Apple Silicon-based MacBook Pro上各版本OpenELM的執行數據。

這是蘋果繼去年十月悄悄開源多模語言模型Ferret及3月的MM1之後,再度公布的AI研發成果。但這次更為特別的是,OpenELM是可在蘋果裝置上執行的語言模型。本周稍早微軟也釋出了可在筆電上執行的小語言模型(SLM)Phi-3系列,最小版本為38億參數。微軟強調Phi-3在語言理解、推理、數學及寫程式等能力上,比更多參數的模型如GPT-3.5 Turbo、Mistral還強大

蘋果與其他晶片業者包括英特爾、AMD、高通等,都可望在今年推出為AI模型執行設計的第一代或新一代晶片。最新Apple Silicon為M4,預計今年稍後問世,並在年底推出搭載M4晶片的Mac產品。

熱門文章
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
英國確認各垂直行業的賭博稅稅率
合規與政策
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
首頁
遊戲
合作
發現
我的