OpenAI训练CriticGPT模型，以检索输出内容错误

Yu | 2024-06-28

6月28日消息，据外媒报道，OpenAI宣布基于GPT-4训练了一个名为CriticGPT的模型，用来查找ChatGPT输出内容中的错误。

人工智能工具可以帮助人类训练师审查由ChatGPT生成的编程代码。基于GPT-4系列大模型，CriticGPT有助于检查代码并识别潜在错误，从而帮助人们发现可能被忽视的错误。

新功能旨在通过利用“从人类反馈中强化学习”来改善“人工智能校准”，一个确保人工智能系统按照人类期望行事的过程。这种方法有助于人类审稿人提高大模型输出的准确性。

从人类反馈中强化学习是一种用于机器学习的技术，其中人类反馈被纳入人工智能模型的训练过程。

为了训练该模型，人类开发人员被要求编辑ChatGPT生成的代码，故意引入错误并提供样本反馈。然后利用这些数据训练CriticGPT来检测常见和新的编码错误。