6月28日消息,据外媒报道,OpenAI宣布基于GPT-4训练了一个名为CriticGPT的模型,用来查找ChatGPT输出内容中的错误。
人工智能工具可以帮助人类训练师审查由ChatGPT生成的编程代码。基于GPT-4系列大模型,CriticGPT有助于检查代码并识别潜在错误,从而帮助人们发现可能被忽视的错误。
新功能旨在通过利用“从人类反馈中强化学习”来改善“人工智能校准”,一个确保人工智能系统按照人类期望行事的过程。这种方法有助于人类审稿人提高大模型输出的准确性。
从人类反馈中强化学习是一种用于机器学习的技术,其中人类反馈被纳入人工智能模型的训练过程。
为了训练该模型,人类开发人员被要求编辑ChatGPT生成的代码,故意引入错误并提供样本反馈。然后利用这些数据训练CriticGPT来检测常见和新的编码错误。