Hugging Face公布可在手机上运行的语言模型SmolLM家族
支付動態 · 2024-07-18

Hugging Face研究人员公布小语言模型家族SmolLM,强调是以谨慎策画的高品质数据集训练而成,同时发布该数据集并说明其内容及规画方法

其中在合成数据集中,团队产生了3,900万笔合成文档,包含280亿token的大学与高中课本、故事、文章和代码,涵括主题超过3.4万。FineWeb-Edu则是Hugging Face的大型英语网页数据集FineWeb的一部分,是利用Llama3-70B-Instruct标注挑选出的1.3T token教育类网页信息,几个月前已发布。Stack-Edu-Python则是由The Stack数据集中,根据Llama 3标注挑选的50万笔python范例。团队指出,经过挑选的数据集,在训练模型的速度都会更快,其中,以Python-Edu-Python数据集训练的速度提升了3倍。

最终团队以SmolLM-Corpus 6,000亿token数据,分别训练了1.35亿及3.6亿版本模型,并以1TB token数据训练17亿版本模型。

Hugging Face团队将开发出的SmolLM模型和参数量相当的其他模型进行标竿测试。其中SmolLM-135M在多项测试中超越小于200M(2亿)参数的其他模型,包括Meta才刚公布的小型LLM MobileLLM(以1TB数据集训练)。SmolLM-360M测试成绩优于所有500M参数以下的模型,不过某些项目逊于MobileLLM-350M。至于SmolLM-1.7B模型则超越所有参数量小于2B的模型,包括微软Phi-1.5、MobileLLM-1.5B及Qwen2。此模型在Python程序撰写性能尤其强大。

/Hugging Face

热门文章
灰度在iGB L!VE 2026展位T70和你相约7月,一起点燃伦敦的热情!
灰度头条
巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域
游戏风向
超级PAC筹资4800万美元:体育博彩势力加码
游戏风向
张侨伟参议员排除全面禁止,敦促菲律宾规范网络赌博
东南亚资讯
越南在线博彩业政策收紧 催生市场新机遇
东南亚资讯
斯里兰卡博弈产业大转型,官方:剑指南亚拉斯维加斯
游戏风向
新泽西州7月博彩收入创6.06亿美元新高,颁布禁令
游戏风向
越南博彩管控逐步放宽,惟本土需求仍显乏力
东南亚资讯
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
BETFAIR 网络攻击80万用户资料泄露
游戏风向
哈萨克斯坦计划对在线赌场促销活动进行处罚
游戏风向
GGC Awards 2026 璀璨科伦坡:致敬 iGaming 行业的领航者与创新力量
灰度头条
横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
灰度头条
JILI 宣布与全球板球传奇 AB de Villiers(ABD)达成重磅战略合作
体育游戏
印度最高法院受理公益诉讼,要求全国禁封“伪装”成社交游戏的赌博平台
游戏风向
首页
游戏
合作
发现
我的