Anthropic發表Claude 3.5 Sonnet,評測凌駕Claude 3 Opus與GPT-4o
支付動態 · 2024-06-21

Anthropic更新Claude家族中階模型Sonnet,強調新版Claude 3.5 Sonnet的效能與效率已超越高階模型Opus,在多項評測上也勝過OpenAI最新GPT-4o模型

Claude 3.5 Sonnet的執行速度是Claude 3 Opus的兩倍,Anthropic內部以自然語言描述要求不同模型修補開源程式碼臭蟲或新增功能,發現Claude 3.5 Sonnet解決了64%的問題,超越了Claude 3 Opus的38%。在提供指示與相關工具之後,Claude 3.5 Sonnet得以獨立撰寫、編輯與執行程式碼,展現了複雜的推論及故障排除能力,可輕鬆處理程式碼的轉換,令它能夠更有效率地更新老舊應用程式並遷移程式碼庫。

此外,Claude 3.5 Sonnet不僅在所有基準評測上都凌駕Claude 3 Opus,它在GPQA、HumanEval、MGSM、DROP、BIG-Bench-Hard或是與視覺有關的MathVista、AI2D、Relaxed accuracy及ANLS score等評測上也超越了GPT-4o,只於MMLU、MATH及MMMU上略遜GPT-4o。

Anthropic亦開始於Claude.ai上預覽新的Artifacts功能,在啟用Artifacts之後,當使用者與Claude模型對話時,旁邊會出現一個新視窗,同步呈現模型所生成的所有內容,不管是程式碼、文字檔案或是網站設計。該功能替使用者創造了一個動態的工作空間,允許使用者即時檢視、編輯及建置源自Claude模型的內容,以無縫將AI生成的內容整合到使用者的專案或工作流程之中。

Anthropic指出,Artifacts功能意味著Claude將從對話式AI轉至協作工作環境,且很快就會支援團隊協作,最終令整個組織能夠在一個共用空間中集中其知識、檔案,或是正在進行中的任務,讓Claude扮演一個在使用者有需要時就可出現的團隊成員。

一般使用者透過Claude.ai及Claude iOS程式就可免費存取Claude 3.5 Sonnet,至於 Claude Pro與Claude Team 方案的訂閱用戶則有更高速率的存取權限。開發者亦可透過Anthropic APIAmazon Bedrock及Google Cloud的Vertex AI存取該模型,輸入100萬Token的費用為3美元,輸出100萬個Token的費用為15美元,且支援20萬個Token的脈絡長度。

Anthropic表示,該公司的目標是每幾個月就會大幅改善智慧、速度與成本之間的權衡曲線,今年也會發表低階的Claude 3.5 Haiku 與高階的Claude 3.5 Opus。且除了下一代模型之外,該公司亦正在建置新模型來支援企業的應用,包括整合企業應用程式;亦正在探索諸如Memory等功能,以讓Claude能夠記憶使用者的偏好與交流紀錄,以讓它更個人化及更有效率。

/Anthropic

熱門文章
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
英國確認各垂直行業的賭博稅稅率
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
首頁
遊戲
合作
發現
我的