OpenAI 推出 GPT-4o Mini:最具成本效益的小型模型,更快速回應的文字與視覺模型
支付動態 · 2024-07-19

OpenAI 推出 GPT-4o Mini:最具成本效益的小型模型,更快速回應的文字與視覺模型

OpenAI 宣佈推出 GPT-4o mini,它表示 GPT-4o mini 是至今為止最具成本效益的小型模型。這一突破預計將大幅擴展使用 AI 構建的應用範圍,讓智慧技術變得更加經濟實惠。

內容目錄

以合理價格提供卓越效能

GPT-4o mini 的定價為每百萬個 input token 15 美分,每百萬個 output token 60 美分。這比之前的模型便宜了一個數量級,並且比 GPT-3.5 Turbo 便宜超過 60%。儘管價格低廉,GPT-4o mini 在 MMLU 基準測試 (Multi-task Language Understanding) 中得分達到 82%,並且在 LMSYS 排行榜的聊天偏好中表現優於 GPT-4.1。

GPT-4o Mini 更快速的聊天回應

GPT-4o mini 的低成本和低延遲使其適用於廣泛的任務,包括連結或並行多次模型調用的應用,例如調用多個 API,向模型傳遞大量上下文 (如:整個代碼庫或對話歷史),或透過快速的即時文字回應與客戶互動(如:客服聊天機器人)。

廣告 - 內文未完請往下捲動

支援文字和視覺功能,未來將更強大

目前,GPT-4o mini 支援 API 中的文字和視覺功能。

未來的更新將包括對文字、圖像、影片和音訊輸入和輸出的支援。憑藉 128K 標記的上下文視窗和每次請求最多支援 16K output token 的能力,GPT-4o mini 能夠處理各種任務。該模型還擁有截至 2023 年 10 月的知識,並且透過與 GPT-4o 共享新的 tokenizer,可以更具成本效益地處理非英語文字。

文字智慧和多模態推理超越 GPT-3.5 Turbo

GPT-4o mini 在學術基準測試中超越了 GPT-3.5 Turbo 和其他小型模型,無論是文字智慧還是多模態推理方面。它支援與 GPT-4o 相同範圍的語言,並在函數調用方面表現出色,使開發人員能夠構建能夠從外部系統獲取數據或採取行動的應用。此外,與 GPT-3.5 Turbo 相比,它在長上下文效能方面也有所改善。

主要基準測試表現亮點

  • 推理任務: GPT-4o mini 在 MMLU 中得分 82.0%,優於 Gemini Flash(77.9%)和 Claude Haiku(73.8%)。
  • 數學和編碼能力: 在數學推理和編碼任務中,GPT-4o mini 分別在 MGSM 和 HumanEval 中得分為 87.0% 和 87.2%,相比之下,Gemini Flash 和 Claude Haiku 的得分較低。
  • 多模態推理: 在 MMMU 這個多模態推理評估中,GPT-4o mini 得分 59.4%,超越了 Gemini Flash(56.1%)和 Claude Haiku(50.2%)。

內建安全措施:審查政策、抗破解

OpenAI 表示,在預訓練階段,我們過濾掉了有害內容,例如仇恨言論和垃圾資訊。訓練後,使用人類反饋強化學習 (RLHF) 等技術來使模型的行為與政策保持一致。

GPT-4o mini 繼承了 GPT-4o 的安全緩解措施,並根據 OpenAI 的準備框架透過自動和人工評估進行評估。超過 70 位外部專家的見解幫助改進了 GPT-4o 和 GPT-4o mini 的安全性。

不用怕指令被破解

GPT-4o mini 是首個在 API 中應用我們的指令層次方法的模型,增強了其抵抗破解、提示 (prompt) 注入和系統提示提取的能力,這使得模型的回應在大規模應用中更加可靠和安全。

免費版也可以用 GPT-4o mini

OpenAI 表示,在 ChatGPT 中,免費、Plus 和 Team 用戶將從今天開始獲得 GPT-4o mini 的使用權,取代 GPT-3.5。企業用戶將在下週獲得使用權。未來,強大的 AI 將更便宜!

熱門文章
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
英國確認各垂直行業的賭博稅稅率
合規與政策
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
首頁
遊戲
合作
發現
我的