Deepmind人工智慧系統在2024國際數學奧林匹亞競賽達銀牌標準
支付動態 · 2024-07-26

DeepMind結合AlphaProof和AlphaGeometry 2系統,解決2024國際數學奧林匹亞競賽4道題目達銀牌水準,展現人工智慧系統的先進數學推理能力

DeepMind展示了其在數學領域最新的人工智慧研究,透過結合AlphaProof與AlphaGeometry 2兩個系統,解決了2024年國際數學奧林匹亞競賽(IMO)6道數學難題中的4道題目,達到了與銀牌得主一樣的水準。

由於推理技能和訓練資料的限制,目前人工智慧系統仍然苦手於解決一般數學問題,而擁有先進數學推理能力的通用人工智慧,將有助於發展尖端科學和科技。DeepMind在2024年初的時候,於《自然》期刊發表了能夠解決數學難題的人工智慧模型AlphaGeometry。AlphaGeometry是一個以Gemini語言模型為基礎的神經符號(Neuro-Symbolic)混合系統,透過結合神經網路和符號推理人工智慧技術,解決幾何和數學複雜問題。

DeepMind持續推進在數學領域的人工智慧研究,並透過整合AlphaProof和第二代AlphaGeometry,在2024年國際數學奧林匹亞競賽解題中表現優異。

AlphaProof是一個自訓練並使用形式語言(Formal Language)Lean證明數學陳述的系統,其結合了預訓練語言模型和AlphaZero增強學習演算法。在數學推理任務中,AlphaProof執行自動化證明,生成解答候選方案,並且透過在Lean語言中搜尋可能的證明步驟,來證明或是反駁這些方案。AlphaProof透過每次成功找到並驗證的證明,來持續強化自身能力,以解決更具挑戰的數學問題。

AlphaGeometry 2則是AlphaGeometry的改良版本,其符號引擎比第一代快兩個數量級,麵對新問題的時候,AlphaGeometry 2能夠採用新的知識共享機制,實現不同搜尋樹的進階組合,解決更複雜的問題。AlphaGeometry能夠解決IMO 25年歷史考題中的53%,而AlphaGeometry 2能力大幅提升,可以解決其中的83%。

IMO 2024的題目被手動翻譯,以形式化語言Lean表示,提供給DeepMind的人工智慧系統。該系統耗時三天解出其中4道題目,AlphaProof解決了兩個代數問題和一個數論問題,其中有一道是今年最難的題目,所有參賽者僅有5名答對,而AlphaGeometry 2則證明瞭一道幾何問題,但有兩個組合數學題目沒有解決。

每道題目答對可得7分,而今年IMO金牌門檻分數為29分,有58位參賽者達成,而DeepMind的人工智慧系統則得到28分,每個解決的問題都拿到滿分。在正式比賽共有兩節解題時間,每節4.5小時總共9小時,人工智慧系統則花費了三天的時間解出4題。

熱門文章
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
首頁
遊戲
合作
發現
我的