迎戰 Google Gemini，OpenAI 傳即將端出 GPT-Vision 以及多模態 AI「Gobi」-HUIDU Official Website

迎戰 Google Gemini，OpenAI 傳即將端出 GPT-Vision 以及多模態 AI「Gobi」

· 2023-09-22

據報導，OpenAI 正準備推出 GPT-4 的圖像理解能力，這是曾經在 GPT-4 發布時引發軒然大波的能力。目前除了少部分測試用戶之外，一般 GPT-4 用戶無法使用這項能力。

隨著 Google 即將發布多模態（multimodal）語言模型挑戰 OpenAI 的 GPT-4，OpenAI 也正摩拳擦掌準備迎擊，據報導，OpenAI 正準備推出 GPT-4 的圖像理解能力，這是曾經在 GPT-4 發布時引發軒然大波的能力——可以僅憑一張手繪網頁圖，就能產生整個網頁的程式碼。目前除了少部分測試用戶之外，一般 GPT-4 用戶無法使用這項能力。

現在 GPT-4 最大競爭對手之一，就是秋季即將發表的 Google AI 模型 Gemini。為了對抗 Gemini，OpenAI 可能會以「GPT-Vision」這個名字，正式向公眾推出 GPT-4 圖像理解能力。在 OpenAI 剛發布的 DALL-E 3 中整合了 ChatGPT，讓使用者可以用聊天機器人來產生提示詞，而不用親自輸入複雜詳細的提示。GPT-Vision 也有可能與 DALL-E 3 相互整合。

GPT-4 這些新功能可能會在 OpenAI 將於 11 月首次舉辦的開發者大會上公布。先前，OpenAI CEO Sam Altman 曾暗示他將在那天宣布一個「很棒的東西」，但預計應該不會是 GPT-4.5 或者 GPT-5。

此外，根據 The Information 報導，OpenAI 內部還有一個全新的 AI 模型，代號為 Gobi，該模型從一開始就被設計為多模態，未來有可能成為 GPT-5。

：Chris

快加入 INSIDE Google News 按下追蹤，給你最新、最 IN 的科技新聞！