Deepmind人工智慧系統在2024國際數學奧林匹亞競賽達銀牌標準-灰度官网

Deepmind人工智慧系統在2024國際數學奧林匹亞競賽達銀牌標準

支付動態 · 2024-07-26

DeepMind結合AlphaProof和AlphaGeometry 2系統，解決2024國際數學奧林匹亞競賽4道題目達銀牌水準，展現人工智慧系統的先進數學推理能力

DeepMind展示了其在數學領域最新的人工智慧研究，透過結合AlphaProof與AlphaGeometry 2兩個系統，解決了2024年國際數學奧林匹亞競賽（IMO）6道數學難題中的4道題目，達到了與銀牌得主一樣的水準。

由於推理技能和訓練資料的限制，目前人工智慧系統仍然苦手於解決一般數學問題，而擁有先進數學推理能力的通用人工智慧，將有助於發展尖端科學和科技。DeepMind在2024年初的時候，於《自然》期刊發表了能夠解決數學難題的人工智慧模型AlphaGeometry。AlphaGeometry是一個以Gemini語言模型為基礎的神經符號（Neuro-Symbolic）混合系統，透過結合神經網路和符號推理人工智慧技術，解決幾何和數學複雜問題。

DeepMind持續推進在數學領域的人工智慧研究，並透過整合AlphaProof和第二代AlphaGeometry，在2024年國際數學奧林匹亞競賽解題中表現優異。

AlphaProof是一個自訓練並使用形式語言（Formal Language）Lean證明數學陳述的系統，其結合了預訓練語言模型和AlphaZero增強學習演算法。在數學推理任務中，AlphaProof執行自動化證明，生成解答候選方案，並且透過在Lean語言中搜尋可能的證明步驟，來證明或是反駁這些方案。AlphaProof透過每次成功找到並驗證的證明，來持續強化自身能力，以解決更具挑戰的數學問題。

AlphaGeometry 2則是AlphaGeometry的改良版本，其符號引擎比第一代快兩個數量級，麵對新問題的時候，AlphaGeometry 2能夠採用新的知識共享機制，實現不同搜尋樹的進階組合，解決更複雜的問題。AlphaGeometry能夠解決IMO 25年歷史考題中的53%，而AlphaGeometry 2能力大幅提升，可以解決其中的83％。

IMO 2024的題目被手動翻譯，以形式化語言Lean表示，提供給DeepMind的人工智慧系統。該系統耗時三天解出其中4道題目，AlphaProof解決了兩個代數問題和一個數論問題，其中有一道是今年最難的題目，所有參賽者僅有5名答對，而AlphaGeometry 2則證明瞭一道幾何問題，但有兩個組合數學題目沒有解決。

每道題目答對可得7分，而今年IMO金牌門檻分數為29分，有58位參賽者達成，而DeepMind的人工智慧系統則得到28分，每個解決的問題都拿到滿分。在正式比賽共有兩節解題時間，每節4.5小時總共9小時，人工智慧系統則花費了三天的時間解出4題。

熱門文章

西班牙監管機構警告在線賭博平臺存在身份盜竊行為

合規與政策