OpenAI 推出 GPT-4o Mini:最具成本效益的小型模型,更快速回應的文本與視覺模型
支付動態 · 2024-07-19

OpenAI 推出 GPT-4o Mini:最具成本效益的小型模型,更快速回應的文本與視覺模型

OpenAI 宣布推出 GPT-4o mini,它表示 GPT-4o mini 是至今為止最具成本效益的小型模型。這一突破預計將大幅擴展使用 AI 構建的應用範圍,讓智能技術變得更加經濟實惠。

內容目錄

以合理價格提供卓越性能

GPT-4o mini 的定價為每百萬個 input token 15 美分,每百萬個 output token 60 美分。這比之前的模型便宜了一個數量級,並且比 GPT-3.5 Turbo 便宜超過 60%。儘管價格低廉,GPT-4o mini 在 MMLU 基準測試 (Multi-task Language Understanding) 中得分達到 82%,並且在 LMSYS 排行榜的聊天偏好中表現優於 GPT-4.1。

GPT-4o Mini 更快速的聊天回應

GPT-4o mini 的低成本和低延遲使其適用於廣泛的任務,包括連結或並行多次模型調用的應用,例如調用多個 API,向模型傳遞大量上下文 (如:整個代碼庫或對話歷史),或透過快速的即時文本回應與客戶互動(如:客服聊天機器人)。

廣告 - 內文未完請往下捲動

支持文本和視覺功能,未來將更強大

目前,GPT-4o mini 支持 API 中的文本和視覺功能。

未來的更新將包括對文本、圖像、影片和音訊輸入和輸出的支持。憑藉 128K 標記的上下文窗口和每次請求最多支持 16K output token 的能力,GPT-4o mini 能夠處理各種任務。該模型還擁有截至 2023 年 10 月的知識,並且透過與 GPT-4o 共享新的 tokenizer,可以更具成本效益地處理非英語文本。

文本智能和多模態推理超越 GPT-3.5 Turbo

GPT-4o mini 在學術基準測試中超越了 GPT-3.5 Turbo 和其他小型模型,無論是文本智能還是多模態推理方面。它支持與 GPT-4o 相同範圍的語言,並在函數調用方面表現出色,使開發人員能夠構建能夠從外部系統獲取數據或採取行動的應用。此外,與 GPT-3.5 Turbo 相比,它在長上下文性能方面也有所改善。

主要基準測試表現亮點

  • 推理任務: GPT-4o mini 在 MMLU 中得分 82.0%,優於 Gemini Flash(77.9%)和 Claude Haiku(73.8%)。
  • 數學和編碼能力: 在數學推理和編碼任務中,GPT-4o mini 分別在 MGSM 和 HumanEval 中得分為 87.0% 和 87.2%,相比之下,Gemini Flash 和 Claude Haiku 的得分較低。
  • 多模態推理: 在 MMMU 這個多模態推理評估中,GPT-4o mini 得分 59.4%,超越了 Gemini Flash(56.1%)和 Claude Haiku(50.2%)。

內建安全措施:審查政策、抗破解

OpenAI 表示,在預訓練階段,我們過濾掉了有害內容,例如仇恨言論和垃圾信息。訓練後,使用人類反饋強化學習 (RLHF) 等技術來使模型的行為與政策保持一致。

GPT-4o mini 繼承了 GPT-4o 的安全緩解措施,並根據 OpenAI 的準備框架透過自動和人工評估進行評估。超過 70 位外部專家的見解幫助改進了 GPT-4o 和 GPT-4o mini 的安全性。

不用怕指令被破解

GPT-4o mini 是首個在 API 中應用我們的指令層次方法的模型,增強了其抵抗破解、提示 (prompt) 注入和系統提示提取的能力,這使得模型的回應在大規模應用中更加可靠和安全。

免費版也可以用 GPT-4o mini

OpenAI 表示,在 ChatGPT 中,免費、Plus 和 Team 用戶將從今天開始獲得 GPT-4o mini 的使用權,取代 GPT-3.5。企業用戶將在下週獲得使用權。未來,強大的 AI 將更便宜!

Popular articles
British gambling levy rates confirmed for each vertical
Regulation
JILI Partners with Cricket Legend AB de Villiers (ABD) to Launch Exclusive Branded Game Series 100% 11
Sports Game
GGC Awards 2026 Shines in Colombo: Honoring Leaders and Innovators in the iGaming Industry
HUIDU Focus
B2B Tech Infrastructure Gains Momentum in Philippine Gaming Sector
Southeast Asia
Institutional Academy that exceeded expectations marked the opening of GAT CDMX
Online Game
1spin4win releases unique slot Don Catleone Hold and Win featuring gangster cats
Online Game
Vietnam's tightening online gaming policy creates new market opportunities
Southeast Asia
PropellerAds Shared a New iGaming Case Study: 97,674 Installs and 12,701 Deposits in 3 Months
Marketing
Brazil Proposes Raising Gambling Tax Rate to 24%, With Revenue Allocated to Social Security and Healthcare
Regulation
Vietnam’s Controlled Gaming Shift Gains Ground, But Domestic Demand Still Lags
Southeast Asia
SBC Summit Canada to Make Player Safety a Key Pillar of 2026 Agenda
Marketing
GAT CDMX 2025 Institutional Academy: Leaders and Experts Analyze the Present and Future of the Gaming Industry in Mexico and Lat
Sports Game
Online gambling, crypto pose ongoing money laundering risks in Philippines, analyst says
Southeast Asia
Full House at GAT Expo Cartagena 2026 Academic Agenda
Online Game
UK MPs reopen 2025 gambling inquiry as reform stalls
Regulation
Home
Game
Cooperation
Find
My