Anthropic发表Claude 3.5 Sonnet，评测凌驾Claude 3 Opus与GPT-4o-灰度官网

Anthropic发表Claude 3.5 Sonnet，评测凌驾Claude 3 Opus与GPT-4o

支付動態 · 2024-06-21

Anthropic更新Claude家族中阶模型Sonnet，强调新版Claude 3.5 Sonnet的性能与效率已超越高级模型Opus，在多项评测上也胜过OpenAI最新GPT-4o模型

Claude 3.5 Sonnet的运行速度是Claude 3 Opus的两倍，Anthropic内部以自然语言描述要求不同模型修补开源代码臭虫或添加功能，发现Claude 3.5 Sonnet解决了64%的问题，超越了Claude 3 Opus的38%。在提供指示与相关工具之后，Claude 3.5 Sonnet得以独立撰写、编辑与运行代码，展现了复杂的推论及故障排除能力，可轻松处理代码的转换，令它能够更有效率地更新老旧应用程序并迁移代码库。

此外，Claude 3.5 Sonnet不仅在所有基准评测上都凌驾Claude 3 Opus，它在GPQA、HumanEval、MGSM、DROP、BIG-Bench-Hard或是与视觉有关的MathVista、AI2D、Relaxed accuracy及ANLS score等评测上也超越了GPT-4o，只于MMLU、MATH及MMMU上略逊GPT-4o。

Anthropic亦开始于Claude.ai上预览新的Artifacts功能，在激活Artifacts之后，当用户与Claude模型对话时，旁边会出现一个新窗口，同步呈现模型所生成的所有内容，不管是代码、文本文件或是网站设计。该功能替用户创造了一个动态的工作空间，允许用户即时视图、编辑及建置源自Claude模型的内容，以无缝将AI生成的内容整合到用户的项目或工作流程之中。

Anthropic指出，Artifacts功能意味着Claude将从对话式AI转至协作工作环境，且很快就会支持团队协作，最终令整个组织能够在一个共用空间中集中其知识、文档，或是正在进行中的任务，让Claude扮演一个在用户有需要时就可出现的团队成员。

一般用户通过Claude.ai及Claude iOS程序就可免费存取Claude 3.5 Sonnet，至于 Claude Pro与Claude Team 方案的订阅用户则有更高速率的存取权限。开发者亦可通过Anthropic API、Amazon Bedrock及Google Cloud的Vertex AI存取该模型，输入100万Token的费用为3美元，输出100万个Token的费用为15美元，且支持20万个Token的脉络长度。

Anthropic表示，该公司的目标是每几个月就会大幅改善智能、速度与成本之间的权衡曲线，今年也会发表低级的Claude 3.5 Haiku 与高级的Claude 3.5 Opus。且除了下一代模型之外，该公司亦正在建置新模型来支持企业的应用，包括集成企业应用程序；亦正在探索诸如Memory等功能，以让Claude能够记忆用户的偏好与交流纪录，以让它更个人化及更有效率。

／Anthropic

热门文章

张侨伟参议员排除全面禁止，敦促菲律宾规范网络赌博

东南亚资讯