OpenAI揭露可用来发现ChatGPT生成代码臭虫的CriticGPT模型-灰度官网

OpenAI揭露可用来发现ChatGPT生成代码臭虫的CriticGPT模型

支付動態 · 2024-06-30

CriticGPT扮演模型训练人员的AI助手角色，辅助审查ChatGPT所生成的代码并找出错误

OpenAI

OpenAI周四（6/27）揭露一个奠基于GPT-4的新模型CriticGPT，它目前扮演人类训练师的AI助手角色，可用来审查ChatGPT所生成的代码，并找出错误。

现阶段的ChatGPT也是基于GPT-4模型，它借由人类反馈的强化学习（Reinforcement Learning from Human Feedback，RLHF）来调整其输出表现，亦即由人类训练师根据模型的行动来提供反馈或意见，而CriticGPT也能用来审核ChatGPT输出代码时的表现，OpenAI正在将CriticGPT整合到RLHF的标签管道中，以替人类训练师提供明确的AI说明。

OpenAI指出，随着模型行为与推论的进步，ChatGPT变得更加精确，错误也变得更为微妙，令人类的AI训练师更难找出其错误之处，并对RLHF方法造成了挑战，使得模型的调整愈来愈困难，这使得他们训练CriticGPT来进行评论，以突显ChatGPT输出的错误。

根据OpenAI的测试，人类训练师在取得CriticGPT的协助之后，审核ChatGPT生成代码的表现在大多数时候（60%），优于没有CriticGPT帮忙的时候。

总之，OpenAI发现，在CriticGPT的协助下，人类训练师不仅得以发现更多的问题，而且还能借由CriticGPT强化人类的技能，提出更全面的批评，还能减少幻觉错误。

只是CriticGPT现阶段仍有其局限性，例如所支持的答案很短，也还会产生幻觉，尚未能解决分散的错误，也还无法处理过于复杂的任务或回应。

热门文章

斯里兰卡博弈产业大转型，官方：剑指南亚拉斯维加斯

游戏风向