Anthropic发表Claude 3.5 Sonnet,评测凌驾Claude 3 Opus与GPT-4o
支付動態 · 2024-06-21

Anthropic更新Claude家族中阶模型Sonnet,强调新版Claude 3.5 Sonnet的性能与效率已超越高级模型Opus,在多项评测上也胜过OpenAI最新GPT-4o模型

Claude 3.5 Sonnet的运行速度是Claude 3 Opus的两倍,Anthropic内部以自然语言描述要求不同模型修补开源代码臭虫或添加功能,发现Claude 3.5 Sonnet解决了64%的问题,超越了Claude 3 Opus的38%。在提供指示与相关工具之后,Claude 3.5 Sonnet得以独立撰写、编辑与运行代码,展现了复杂的推论及故障排除能力,可轻松处理代码的转换,令它能够更有效率地更新老旧应用程序并迁移代码库。

此外,Claude 3.5 Sonnet不仅在所有基准评测上都凌驾Claude 3 Opus,它在GPQA、HumanEval、MGSM、DROP、BIG-Bench-Hard或是与视觉有关的MathVista、AI2D、Relaxed accuracy及ANLS score等评测上也超越了GPT-4o,只于MMLU、MATH及MMMU上略逊GPT-4o。

Anthropic亦开始于Claude.ai上预览新的Artifacts功能,在激活Artifacts之后,当用户与Claude模型对话时,旁边会出现一个新窗口,同步呈现模型所生成的所有内容,不管是代码、文本文件或是网站设计。该功能替用户创造了一个动态的工作空间,允许用户即时视图、编辑及建置源自Claude模型的内容,以无缝将AI生成的内容整合到用户的项目或工作流程之中。

Anthropic指出,Artifacts功能意味着Claude将从对话式AI转至协作工作环境,且很快就会支持团队协作,最终令整个组织能够在一个共用空间中集中其知识、文档,或是正在进行中的任务,让Claude扮演一个在用户有需要时就可出现的团队成员。

一般用户通过Claude.ai及Claude iOS程序就可免费存取Claude 3.5 Sonnet,至于 Claude Pro与Claude Team 方案的订阅用户则有更高速率的存取权限。开发者亦可通过Anthropic APIAmazon Bedrock及Google Cloud的Vertex AI存取该模型,输入100万Token的费用为3美元,输出100万个Token的费用为15美元,且支持20万个Token的脉络长度。

Anthropic表示,该公司的目标是每几个月就会大幅改善智能、速度与成本之间的权衡曲线,今年也会发表低级的Claude 3.5 Haiku 与高级的Claude 3.5 Opus。且除了下一代模型之外,该公司亦正在建置新模型来支持企业的应用,包括集成企业应用程序;亦正在探索诸如Memory等功能,以让Claude能够记忆用户的偏好与交流纪录,以让它更个人化及更有效率。

/Anthropic

热门文章
张侨伟参议员排除全面禁止,敦促菲律宾规范网络赌博
东南亚资讯
JILI 宣布与全球板球传奇 AB de Villiers(ABD)达成重磅战略合作
体育游戏
横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
灰度头条
超级PAC筹资4800万美元:体育博彩势力加码
游戏风向
巴西颁布新法赋权央行封锁非法博彩账户及 Pix 交易
支付动态
GGC Awards 2026 璀璨科伦坡:致敬 iGaming 行业的领航者与创新力量
灰度头条
越南在线博彩业政策收紧 催生市场新机遇
东南亚资讯
BETFAIR 网络攻击80万用户资料泄露
游戏风向
密西西比州众议院委员会推进提议增加赌场税的法案
游戏风向
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
斯里兰卡博弈产业大转型,官方:剑指南亚拉斯维加斯
游戏风向
越南博彩管控逐步放宽,惟本土需求仍显乏力
东南亚资讯
灰度在iGB L!VE 2026展位T70和你相约7月,一起点燃伦敦的热情!
灰度头条
哈萨克斯坦计划对在线赌场促销活动进行处罚
游戏风向
首页
游戏
合作
发现
我的