

據報導,OpenAI 正準備推出 GPT-4 的圖像理解能力,這是曾經在 GPT-4 發布時引發軒然大波的能力。目前除了少部分測試用戶之外,一般 GPT-4 用戶無法使用這項能力。
隨著 Google 即將發布多模態(multimodal)語言模型挑戰 OpenAI 的 GPT-4,OpenAI 也正摩拳擦掌準備迎擊,據報導,OpenAI 正準備推出 GPT-4 的圖像理解能力,這是曾經在 GPT-4 發布時引發軒然大波的能力——可以僅憑一張手繪網頁圖,就能產生整個網頁的程式碼。目前除了少部分測試用戶之外,一般 GPT-4 用戶無法使用這項能力。
現在 GPT-4 最大競爭對手之一,就是秋季即將發表的 Google AI 模型 Gemini。為了對抗 Gemini,OpenAI 可能會以「GPT-Vision」這個名字,正式向公眾推出 GPT-4 圖像理解能力。在 OpenAI 剛發布的 DALL-E 3 中整合了 ChatGPT,讓使用者可以用聊天機器人來產生提示詞,而不用親自輸入複雜詳細的提示。GPT-Vision 也有可能與 DALL-E 3 相互整合。
GPT-4 這些新功能可能會在 OpenAI 將於 11 月首次舉辦的開發者大會上公布。先前,OpenAI CEO Sam Altman 曾暗示他將在那天宣布一個「很棒的東西」,但預計應該不會是 GPT-4.5 或者 GPT-5。
此外,根據 The Information 報導,OpenAI 內部還有一個全新的 AI 模型,代號為 Gobi,該模型從一開始就被設計為多模態,未來有可能成為 GPT-5。
:Chris
快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!