OpenAI已训练CriticGPT模型:基于GPT-4 用于发现ChatGPT生成内容错误

baiya2024-06-28 11:31:45TechWeb.com.cn

6月28日消息,据外媒报道,随着GPT系列大模型的不断升级,OpenAI所训练的ChatGPT也在拥有更强的能力,但这也带来了一些挑战,它所生成的内容中存在的错误也越来越隐蔽,逐渐到了AI训练师难以发现的程度。

而为了应对这一挑战,OpenAI也想出了新招,他们基于GPT-4模型,训练了一个用于发现ChatGPT输出代码错误的模型。

OpenAI当地时间周四,已在官网宣布了这一消息,他们训练的模型名为CriticGPT,从名称来看就是用于发现不足,以便让相关的应用变得更好。

从OpenAI在官网公布的消息来看,CriticGPT在他们的应用中有不错的效果,他们发现在新模型的辅助下,使用者在检查ChatGPT的输出代码时,比没有CriticGPT的协助要好60%。

在官网上,OpenAI提到,他们也是通过RLHF (从人类反馈中强化学习,Reinforcement Learning from Human Feedback)来训练CriticGPT,与训练ChatGPT类似。但与训练ChatGPT不同的是,他们在训练CriticGPT时,看了大量包含错误的输入。

虽然CriticGPT能帮助发现更多的问题,但也存在不足,还有改进的空间。OpenAI在官网上就提到,并不是所有的发现都是准确的,用于训练的ChatGPT生成内容也普遍很短,还需要开发新的方式,以协助训练师理解更长和更复杂的任务。

此外,OpenAI在官网上也提到,在研发CriticGPT的过程中,他们发现将RLHF应用于GPT-4时,能帮助生成更好的RLHF数据,他们计划扩大这一项工作的规模,并付诸实践。(海蓝)

TechWeb微晚报:华为回应“牛肉进口商”谣言,AI大模型填报高考志愿靠谱吗

今日要闻一览:AI大模型填报高考志愿靠谱吗?苹果CarPlay,正在被车企弃用华为是国内最大的牛肉进口商?官方回应马斯克在特斯拉股东大会讲了什么苹果再次成为全球市值第一大公司比亚迪方程豹豹3官图发布年内上市Visi...

投资者只想看 AI 赚钱,不想听 AI 烧钱

作者|郑玥编辑|郑玄2024开年,海外互联网巨头开始兑现AI业务的商业化潜力。过去一周,谷歌、微软、Meta相继公布2024年一季度财报,三者有喜有忧。微软、谷歌财报发布后分别上涨4%、15%,后者更是触及历史新高;相比...

OpenAI正式推出GPT商店

1月11日消息,在经历了领导层的动荡之后,人工智能初创企业OpenAI重新启动了产品和服务的推广计划,于美国当地时间周三推出了两大重要产品,分别是GPT商店和ChatGPT团队。GPT商店旨在模仿苹果应用商店,为用户提供了...

OpenAI发布新模型GPT-4o,TechWeb实测来了!

5月14日消息,今日凌晨,OpenAI正式发布了新一代的旗舰模型GPT-4o,可以利用语音、视频和文本信息进行实时推理。据介绍,GPT-4o在英文文本和代码中的表现与GPT-4Turbo相当,但在非英文文本上的能力大幅提升,在视频...

马斯克:研发先进AI风险非常高 OpneAI应公布解雇奥特曼的原因

11月20日消息,特斯拉首席执行官埃隆·马斯克(ElonMusk)表示,由于研发先进人工智能(AI)技术的潜在危险非常高,作为目前世界上最强大的人工智能公司,OpenAI应该解释其解雇其首席执行官萨姆·奥特曼(SamAltman...

上一篇:OpenAI与《时代》杂志达成协议 将其101年来的档案内容引入ChatGPT
下一篇:不只ChatGPT,消息称iOS 18“苹果牌AI”今秋将接入谷歌Gemini