

Anthropic更新Claude家族中阶模型Sonnet,强调新版Claude 3.5 Sonnet的性能与效率已超越高级模型Opus,在多项评测上也胜过OpenAI最新GPT-4o模型
Claude 3.5 Sonnet的运行速度是Claude 3 Opus的两倍,Anthropic内部以自然语言描述要求不同模型修补开源代码臭虫或添加功能,发现Claude 3.5 Sonnet解决了64%的问题,超越了Claude 3 Opus的38%。在提供指示与相关工具之后,Claude 3.5 Sonnet得以独立撰写、编辑与运行代码,展现了复杂的推论及故障排除能力,可轻松处理代码的转换,令它能够更有效率地更新老旧应用程序并迁移代码库。
此外,Claude 3.5 Sonnet不仅在所有基准评测上都凌驾Claude 3 Opus,它在GPQA、HumanEval、MGSM、DROP、BIG-Bench-Hard或是与视觉有关的MathVista、AI2D、Relaxed accuracy及ANLS score等评测上也超越了GPT-4o,只于MMLU、MATH及MMMU上略逊GPT-4o。

Anthropic亦开始于Claude.ai上预览新的Artifacts功能,在激活Artifacts之后,当用户与Claude模型对话时,旁边会出现一个新窗口,同步呈现模型所生成的所有内容,不管是代码、文本文件或是网站设计。该功能替用户创造了一个动态的工作空间,允许用户即时视图、编辑及建置源自Claude模型的内容,以无缝将AI生成的内容整合到用户的项目或工作流程之中。

Anthropic指出,Artifacts功能意味着Claude将从对话式AI转至协作工作环境,且很快就会支持团队协作,最终令整个组织能够在一个共用空间中集中其知识、文档,或是正在进行中的任务,让Claude扮演一个在用户有需要时就可出现的团队成员。
一般用户通过Claude.ai及Claude iOS程序就可免费存取Claude 3.5 Sonnet,至于 Claude Pro与Claude Team 方案的订阅用户则有更高速率的存取权限。开发者亦可通过Anthropic API、Amazon Bedrock及Google Cloud的Vertex AI存取该模型,输入100万Token的费用为3美元,输出100万个Token的费用为15美元,且支持20万个Token的脉络长度。
Anthropic表示,该公司的目标是每几个月就会大幅改善智能、速度与成本之间的权衡曲线,今年也会发表低级的Claude 3.5 Haiku 与高级的Claude 3.5 Opus。且除了下一代模型之外,该公司亦正在建置新模型来支持企业的应用,包括集成企业应用程序;亦正在探索诸如Memory等功能,以让Claude能够记忆用户的偏好与交流纪录,以让它更个人化及更有效率。
/Anthropic