OpenAI揭露可用来发现ChatGPT生成代码臭虫的CriticGPT模型
支付動態 · 2024-06-30

CriticGPT扮演模型训练人员的AI助手角色,辅助审查ChatGPT所生成的代码并找出错误

OpenAI

OpenAI周四(6/27)揭露一个奠基于GPT-4的新模型CriticGPT,它目前扮演人类训练师的AI助手角色,可用来审查ChatGPT所生成的代码,并找出错误。

现阶段的ChatGPT也是基于GPT-4模型,它借由人类反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)来调整其输出表现,亦即由人类训练师根据模型的行动来提供反馈或意见,而CriticGPT也能用来审核ChatGPT输出代码时的表现,OpenAI正在将CriticGPT整合到RLHF的标签管道中,以替人类训练师提供明确的AI说明。

OpenAI指出,随着模型行为与推论的进步,ChatGPT变得更加精确,错误也变得更为微妙,令人类的AI训练师更难找出其错误之处,并对RLHF方法造成了挑战,使得模型的调整愈来愈困难,这使得他们训练CriticGPT来进行评论,以突显ChatGPT输出的错误。

根据OpenAI的测试,人类训练师在取得CriticGPT的协助之后,审核ChatGPT生成代码的表现在大多数时候(60%),优于没有CriticGPT帮忙的时候。

总之,OpenAI发现,在CriticGPT的协助下,人类训练师不仅得以发现更多的问题,而且还能借由CriticGPT强化人类的技能,提出更全面的批评,还能减少幻觉错误。

只是CriticGPT现阶段仍有其局限性,例如所支持的答案很短,也还会产生幻觉,尚未能解决分散的错误,也还无法处理过于复杂的任务或回应。

热门文章
英国确认各垂直行业的赌博税税率
游戏风向
张侨伟参议员排除全面禁止,敦促菲律宾规范网络赌博
东南亚资讯
新泽西州7月博彩收入创6.06亿美元新高,颁布禁令
游戏风向
密西西比州众议院委员会推进提议增加赌场税的法案
游戏风向
GGC Awards 2026 璀璨科伦坡:致敬 iGaming 行业的领航者与创新力量
灰度头条
BETFAIR 网络攻击80万用户资料泄露
游戏风向
越南在线博彩业政策收紧 催生市场新机遇
东南亚资讯
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
JILI 宣布与全球板球传奇 AB de Villiers(ABD)达成重磅战略合作
体育游戏
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
超级PAC筹资4800万美元:体育博彩势力加码
游戏风向
巴西颁布新法赋权央行封锁非法博彩账户及 Pix 交易
支付动态
灰度在iGB L!VE 2026展位T70和你相约7月,一起点燃伦敦的热情!
灰度头条
斯里兰卡博弈产业大转型,官方:剑指南亚拉斯维加斯
游戏风向
首页
游戏
合作
发现
我的