Deepmind人工智能系统在2024国际数学奥林匹亚竞赛达银牌标准
支付動態 · 2024-07-26

DeepMind结合AlphaProof和AlphaGeometry 2系统,解决2024国际数学奥林匹亚竞赛4道题目达银牌水准,展现人工智能系统的先进数学推理能力

DeepMind展示了其在数学领域最新的人工智能研究,通过结合AlphaProof与AlphaGeometry 2两个系统,解决了2024年国际数学奥林匹亚竞赛(IMO)6道数学难题中的4道题目,达到了与银牌得主一样的水准。

由于推理技能和训练数据的限制,目前人工智能系统仍然苦手于解决一般数学问题,而拥有先进数学推理能力的通用人工智能,将有助于发展尖端科学和科技。DeepMind在2024年初的时候,于《自然》期刊发表了能够解决数学难题的人工智能模型AlphaGeometry。AlphaGeometry是一个以Gemini语言模型为基础的神经符号(Neuro-Symbolic)混合系统,通过结合神经网络和符号推理人工智能技术,解决几何和数学复杂问题。

DeepMind持续推进在数学领域的人工智能研究,并通过集成AlphaProof和第二代AlphaGeometry,在2024年国际数学奥林匹亚竞赛解题中表现优异。

AlphaProof是一个自训练并使用形式语言(Formal Language)Lean证明数学陈述的系统,其结合了预训练语言模型和AlphaZero增强学习算法。在数学推理任务中,AlphaProof运行自动化证明,生成解答候选方案,并且通过在Lean语言中搜寻可能的证明步骤,来证明或是反驳这些方案。AlphaProof通过每次成功找到并验证的证明,来持续强化自身能力,以解决更具挑战的数学问题。

AlphaGeometry 2则是AlphaGeometry的改良版本,其符号引擎比第一代快两个数量级,面对新问题的时候,AlphaGeometry 2能够采用新的知识共享机制,实现不同搜索树的进阶组合,解决更复杂的问题。AlphaGeometry能够解决IMO 25年历史考题中的53%,而AlphaGeometry 2能力大幅提升,可以解决其中的83%。

IMO 2024的题目被手动翻译,以形式化语言Lean表示,提供给DeepMind的人工智能系统。该系统耗时三天解出其中4道题目,AlphaProof解决了两个代数问题和一个数论问题,其中有一道是今年最难的题目,所有参赛者仅有5名答对,而AlphaGeometry 2则证明了一道几何问题,但有两个组合数学题目没有解决。

每道题目答对可得7分,而今年IMO金牌门槛分数为29分,有58位参赛者达成,而DeepMind的人工智能系统则得到28分,每个解决的问题都拿到满分。在正式比赛共有两节解题时间,每节4.5小时总共9小时,人工智能系统则花费了三天的时间解出4题。

热门文章
巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域
游戏风向
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
超级PAC筹资4800万美元:体育博彩势力加码
游戏风向
英国确认各垂直行业的赌博税税率
游戏风向
横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
灰度头条
密西西比州众议院委员会推进提议增加赌场税的法案
游戏风向
越南在线博彩业政策收紧 催生市场新机遇
东南亚资讯
灰度世界杯嘉年华狂欢派对吉隆坡站即将开启,业务拓展人脉社交从马来西亚开始
灰度头条
2027 Global Game Connect(GGC)斯里兰卡招商全面开启!业务人脉尽在掌握!
灰度头条
斯里兰卡博弈产业大转型,官方:剑指南亚拉斯维加斯
游戏风向
印度最高法院受理公益诉讼,要求全国禁封“伪装”成社交游戏的赌博平台
游戏风向
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
哈萨克斯坦计划对在线赌场促销活动进行处罚
游戏风向
亚洲游戏市场观察:15大市场热门游戏与用户趋势
线上游戏
灰度在iGB L!VE 2026展位T70和你相约7月,一起点燃伦敦的热情!
灰度头条
首页
游戏
合作
发现
我的