GPT-4競爭者報到:Gemini 1.5、Mistral Large、Claude 3 Opus與Inflection-2.5
· 2024-03-11

在幾周前尚無對手的OpenAI GPT-4,最近忽然冒出4個與之競爭的大型語言模型,這些新模型皆宣稱足以比美GPT-4,其中研究人員覺得最有實力的則是Anthropic發表的Claude 3家族頂級模型Opus

/geralt on pixabay

在幾周前尚無對手的OpenAI GPT-4,最近忽然冒出了4個競爭對手,它們分別是Google的Gemini 1.5、Mistral AI的Mistral Large、Anthropic的Claude 3,以及Inflection AI的Inflection-2.5,這些在這一個月以來陸續現身的新模型皆宣稱足以比美GPT-4,當中令研究人員覺得最有希望的則是Claude 3。

開發Bito AI程式碼撰寫工具的Bito曾比較了Gemini 1.5 Pro與GPT-4 Turbo,發現Gemini 1.5 Pro在一般推論及理解任務,影片理解,以及音訊處理上勝過GPT-4 Turbo。而GPT-4 Turbo則在解決複雜數學問題的能力,程式碼生成或圖像理解上優於Gemini 1.5 Pro,認為它們的最佳應用將取決於當前任務的特定需求。

而在Mistral AI發表Mistral Large之後,即在OpenAI論壇掀起了討論,有研究人員提出,Mistral Large幾乎在所有基準測試上都不如GPT-4 ,但它的價格只有GPT-4的8成,詢問是否值得切換。底下的回應分成兩派,一派認為GPT-4 Turbo不管是在推論或解決複雜問題上都大勝Mistral Large,所生成的答案也更為精確,很值得那多出的20%,另一派則是推崇Mistral AI的開源政策。

至於鎖定資料科學、機器學習與AI的內容網站KDnuggets認為,Anthropic所發表的Claude 3在所有LLM基準測試中都優於GPT-4和Gemini Ultra,已是AI領域新的領導者,而且3.0版最明顯的改善為視覺能力,使得它可以處理包括照片、圖表、圖像與技術圖等各種視覺格式。

/Anthropic

只不過,即使基準測試領先GPT-4,但Claude 3的速度仍不如GPT-4和Gemini Ultra。

Reddit上也有GPT-4 Turbo與Claude 3 Opus比較的討論,多數人贊成Claude 3 Opus的寫作與處理文章的能力勝過GPT-4 Turbo,有人說GPT-4 Turbo對複雜問題的處理能力優於Claude 3 Opus,有人說Claude 3 Opus所生成的程式碼品質與GPT-4 Turbo相當,但更人性化。

總之,不少人認為Claude 3 Opus很有前途。

而Inflection AI所推出的Inflection-2.5模型則是應用在Pi聊天機器人上,是個強調同理心的聊天機器人。Inflection-2.5的基準測試都只是接近GPT-4水平,並未超越,但其進行訓練所使用的運算量,只有GPT-4的40%。目前並未特別有人比較Inflection-2.5與GPT-4。

上述的AI新創每家都有實力堅強的背景,例如Mistral AI的多名共同創辦人分別曾是Google DeepMind與Meta的AI研究人員;Anthropic則是由曾擔任OpenAI研究副總裁的Dario Amodei,以及其妹妹、同樣身為OpenAI資深員工的Daniela Amodei共同創立;Inflection AI的共同創辦人暨執行長Mustafa Suleyman也是DeepMind的共同創辦人,之後於Google負責將AI整合到各種Google產品中。

多款足以與GPT-4比美的模型在短時間內相繼問世,令外界訝異AI世界的成長速度,也相信現在最強大的GPT-4很快就會成為大型語言模型的平均值。

Popular articles
Vietnam's tightening online gaming policy creates new market opportunities
Southeast Asia
UK MPs reopen 2025 gambling inquiry as reform stalls
Regulation
British gambling levy rates confirmed for each vertical
Regulation
1spin4win releases unique slot Don Catleone Hold and Win featuring gangster cats
Online Game
Gaming & Technology Expo Makes a Powerful Entrance in CDMX
Marketing
JILI Partners with Cricket Legend AB de Villiers (ABD) to Launch Exclusive Branded Game Series 100% 11
Sports Game
Indiana online casino bill stalls in House committee
Regulation
HUIDU Invites You to Booth T70 at iGB L!VE 2026 — Let’s Ignite London This July!
HUIDU Focus
B2B Tech Infrastructure Gains Momentum in Philippine Gaming Sector
Southeast Asia
Across 6 Cities: HUIDU Invites You to 8 World Cup Parties Redefining High-Value Social Networking
HUIDU Focus
Brazil Proposes Raising Gambling Tax Rate to 24%, With Revenue Allocated to Social Security and Healthcare
Regulation
SBC Summit Canada to Make Player Safety a Key Pillar of 2026 Agenda
Marketing
GGC Awards 2026 Shines in Colombo: Honoring Leaders and Innovators in the iGaming Industry
HUIDU Focus
Vietnam’s Controlled Gaming Shift Gains Ground, But Domestic Demand Still Lags
Southeast Asia
GAT CDMX 2025 Institutional Academy: Leaders and Experts Analyze the Present and Future of the Gaming Industry in Mexico and Lat
Sports Game
Home
Game
Cooperation
Find
My