OpenAI新一代具关联思考能力的模型o1,可逐步分析推理精确解答问题
支付動態 · 2024-09-16

OpenAI推出全新大型语言模型o1,其能够运用关联思考(Chain of Thought)技巧,解决需要深度推理的问题,无论是数学还是编程基准测试皆表现出色,目前已在ChatGPT开放测试

/OpenAI

OpenAI o1是一个针对复杂推理问题设计的新一代大型语言模型,相较于之前的模型,o1通过强化学习来增强其推理能力,能够对问题进行深度思考。官方解释,o1关联思考(Chain of Thought)的能力模拟人类解题时逻辑推理过程,借由分步骤分析问题,再做出回应。而这种能力大幅提升o1处理复杂任务的准确性和可靠性。

在数学以及编程领域,o1的表现尤为亮眼,展现了解决高难度问题所需要的强大推理能力。以2024年的AIME数学考试为例,o1单次尝试就可解决74%的题目,而通过共识决方法,也就是经多次解法的综合判断,准确度可以提高至93%。在编程领域,o1在Codeforces竞技程序测试表现也相当优异,针对国际信息奥林匹亚(International Olympiad in Informatics,IOI)调校的模型变体o1-ioi,其Elo评分达到1807,超过93%的人类竞争者。

/OpenAI

o1有能力逐步分析问题,拆解复杂步骤并自动修正错误,而通过强化学习,则又能从每次的尝试中学习改进,持续优化其解题技巧,这让o1模型在解决需要深度推理的问题时,具备更高的准确性、效率和稳定性。

目前OpenAI已经发布o1早期版本OpenAI o1-preview,用户已经可以在ChatGPT中进行测试,并开放给部分受信任的API用户。GitHub也展示了o1模型在编程的能力,包括o1-preview如何协助开发者优化复杂算法,甚至找出并解决造成应用程序性能低落的问题代码。GitHub官方预计之后会将o1-preview和轻量级o1-mini加入到可选模型的行列,目前开发者需要先通过Azure AI申请早期存取。

除了OpenAI o1在编程和数学问题上的先进发展,其他组织也在推进类似的技术进步。DeepMind在今年7月的时候,也展示了其能够解决数学难题的人工智能模型AlphaGeometry 2,该模型可解决了2024年国际数学奥林匹亚竞赛(IMO)6道数学难题中的4道题目,达到了银牌得主的水准。不过,AlphaGeometry 2并非典型的大型语言模型,而是基于Gemini语言模型的神经符号(Neuro-Symbolic)混合系统,专门为处理复杂数学问题的推理和解答而设计。

热门文章
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
哈萨克斯坦计划对在线赌场促销活动进行处罚
游戏风向
英国确认各垂直行业的赌博税税率
游戏风向
灰度在iGB L!VE 2026展位T70和你相约7月,一起点燃伦敦的热情!
灰度头条
JILI 宣布与全球板球传奇 AB de Villiers(ABD)达成重磅战略合作
体育游戏
灰度世界杯嘉年华狂欢派对吉隆坡站即将开启,业务拓展人脉社交从马来西亚开始
灰度头条
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
越南在线博彩业政策收紧 催生市场新机遇
东南亚资讯
GGC Awards 2026 璀璨科伦坡:致敬 iGaming 行业的领航者与创新力量
灰度头条
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
亚洲游戏市场观察:15大市场热门游戏与用户趋势
线上游戏
横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
灰度头条
巴西颁布新法赋权央行封锁非法博彩账户及 Pix 交易
支付动态
新泽西州7月博彩收入创6.06亿美元新高,颁布禁令
游戏风向
2027 Global Game Connect(GGC)斯里兰卡招商全面开启!业务人脉尽在掌握!
灰度头条
首页
游戏
合作
发现
我的