微软发布3款Phi-3.5模型
支付動態 · 2024-08-21

微软小型语言模型Phi家族添加三个Phi-3.5成员,其中基于混合专家(MoE)架构的Phi-3.5-MoE模型,微软表示其推论能力超越了许多比它还大的模型,能力还逼近GPT-4o-mini

Hugging Face

微软本周借由Hugging Face发布了3款Phi-3.5模型,它们分别是Phi-3.5-mini 、Phi-3.5-MoE,以及Phi-3.5-vision,且当中的Phi-3.5-MoE在推论能力上超越了许多比它还大的模型,能力还逼近GPT-4o-mini。

Phi系列是微软所开发的小型语言模型(SLM),期望能够在最大化AI能力的状况下降低资源的使用,以于应用程序中实现具成本效益的生成式AI部署。最早的Phi-1主要用来撰写Python代码,Phi-1.5着重于推论及理解,Phi-2强调对语言的理解,Phi-3则支持语言理解、推论任务,且在撰写代码的基准测试上也有不错的表现。

在新的Phi-3.5家族中,Phi-3.5-mini拥有38亿个参数,以3.4兆个Token进行10天的训练,支持12.8万个Token的脉络长度。

Phi-3.5-MoE则是个基于混合专家(Mixture of Experts,MoE)架构的模型,内含16个专家及每个专家的38亿个参数,MoE的特性就是它并非每次都会激活所有专家,而Phi-3.5-MoE每次只会激活两个专家。它所支持的脉络长度亦为12.8万个Token,是以4.9兆个Token进行23天的训练。

上述两个模型都是输入文本提示,而Phi-3.5-vision则是个多模态模型,它拥有42亿个参数,内含图像编码器、连接器、投影机,以及Phi-3 mini语言模型,支持12.8万个Token的脉络,可同时输入文本及图像,是以5,000亿个Token的数据进行6天的训练而成。

有别于Phi-3.5-mini及Phi-3.5-MoE都支持包括中文与英文在内的十多种语言,目前Phi-3.5-vision仅支持英文。

在微软此次发布的Phi-3.5模型中,最受瞩目的是Phi-3.5-MoE,它在许多基准测试中击败了Llama 3.1 8B与Gemini 1.5 Flash。

热门文章
超级PAC筹资4800万美元:体育博彩势力加码
游戏风向
横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
灰度头条
英国确认各垂直行业的赌博税税率
游戏风向
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
越南博彩管控逐步放宽,惟本土需求仍显乏力
东南亚资讯
越南在线博彩业政策收紧 催生市场新机遇
东南亚资讯
巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域
游戏风向
印度最高法院受理公益诉讼,要求全国禁封“伪装”成社交游戏的赌博平台
游戏风向
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
GGC Awards 2026 璀璨科伦坡:致敬 iGaming 行业的领航者与创新力量
灰度头条
亚洲游戏市场观察:15大市场热门游戏与用户趋势
线上游戏
巴西颁布新法赋权央行封锁非法博彩账户及 Pix 交易
支付动态
哈萨克斯坦计划对在线赌场促销活动进行处罚
游戏风向
BETFAIR 网络攻击80万用户资料泄露
游戏风向
灰度世界杯嘉年华狂欢派对吉隆坡站即将开启,业务拓展人脉社交从马来西亚开始
灰度头条
首页
游戏
合作
发现
我的