Meta开源5款小型语言模型MobileLLM
支付動態 · 2024-11-05

Meta发布能在智能型手机上运行的语言模型MobileLLM,提供125M、350M、600M、1B参数规模版本

GitHub

在7月发表之后,Meta上周宣布正式开源能在智能型手机上运行的小语言模型MobileLLM系列。

Meta 4个月前发表这2个参数量小于10亿的语言模型MobileLLM 125M及MobileLLM 350M,现在Meta又开发出更大参数量的模型版本,包括MobileLLM-600M/1B/1.5B。

Meta指出,团队全面考虑了多项设计因素,并集成了SwiGLU激活函数(activation function)、「深而精简」(deep-and-thin)架构、内嵌共享(embedding sharing)、以及群组查找注意力(grouped-query attention)机制来开发出MobileLLM模型。

从成果来看,MobileLLM 125M/350M零样本常识理解任务的准确率,比Cerebras、OPT、BLOOM等State of the Art(SOTA)模型,分别高2.7%和4.3%。根据Meta提供的数据,添加的模型成员如MobileLLM-1.5B,更是打挂GPT-neo-2.7B、OPT-2.7B、BLOOM-3B、Qwen 1.5-1.8B与Pythia-2.8B等较大参数量的其他模型。

Meta也强调MobileLLM训练快速。在32颗Nvidia A100 80G GPU的服务器环境下,以1T字词(token)训练不同参数量的MobileLLM所需天数,1.5B版本只要18天,最小的125M更只需3天。

这些模型都已通过GitHub与Hugging Face开源。

随着智能型手机性能日渐强大,以及用户对高速回应、低延迟、安全性的需求,愈来愈多模型开发商提供小模型。Google有Gemma 2、微软有Phi 3、OpenAI则有GPT-4o mini,苹果有DCLM。Hugging Face上周也公布小语言模型SmolLM 2家族。

热门文章
巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域
游戏风向
张侨伟参议员排除全面禁止,敦促菲律宾规范网络赌博
东南亚资讯
亚洲游戏市场观察:15大市场热门游戏与用户趋势
线上游戏
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
英国确认各垂直行业的赌博税税率
游戏风向
横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
灰度头条
超级PAC筹资4800万美元:体育博彩势力加码
游戏风向
JILI 宣布与全球板球传奇 AB de Villiers(ABD)达成重磅战略合作
体育游戏
BETFAIR 网络攻击80万用户资料泄露
游戏风向
越南在线博彩业政策收紧 催生市场新机遇
东南亚资讯
越南博彩管控逐步放宽,惟本土需求仍显乏力
东南亚资讯
新泽西州7月博彩收入创6.06亿美元新高,颁布禁令
游戏风向
灰度在iGB L!VE 2026展位T70和你相约7月,一起点燃伦敦的热情!
灰度头条
灰度世界杯嘉年华狂欢派对吉隆坡站即将开启,业务拓展人脉社交从马来西亚开始
灰度头条
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
首页
游戏
合作
发现
我的