研究发现,OpenAI的GPT-4o道德推理能力胜过人类专家

yuyizhixia2024-06-24 09:43:29IT之家

6 月 24 日消息,近期的一项研究表明,OpenAI 最新的聊天机器人 GPT-4o 能够提供道德方面的解释和建议,且质量优于“公认的”道德专家所提供的建议。

据 The Decoder 当地时间周六报道,美国北卡罗莱纳大学教堂山分校和艾伦 AI 研究所的研究人员进行了两项研究,将 GPT 模型与人类的道德推理能力进行比较,以探讨大语言模型是否可被视为“道德专家”。

汇总研究内容如下:

研究一

501 名美国成年人对比了 GPT-3.5-turbo 模型和其他人类参与者的道德解释。结果表明,人们认为 GPT 的解释比人类参与者的解释更符合道德、更值得信赖、更周到。

评估者也认为人工智能的评估比其他人更可靠。虽然差异很小,但关键发现是 AI 可以匹配甚至超越人类水平的道德推理。

研究二

将 OpenAI 最新的 GPT-4o 模型生成的建议与《纽约时报》“伦理学家”专栏中著名伦理学家 Kwame Anthony Appiah 的建议进行了比较。900 名参与者对 50 个“伦理困境”的建议质量进行了评分。

结果表明,GPT-4o 在“几乎每个方面”都胜过人类专家。人们认为 AI 生成的建议在道德上更正确、更值得信赖、更周到、更准确。只有在感知细微差别方面,人工智能和人类专家之间没有显著差异。

研究人员认为,这些结果表明 AI 可以通过“比较道德图灵测试”(cMTT)。而文本分析显示,GPT-4o 在提供建议时使用的道德和积极语言比人类专家更多。这可以部分解释为什么 AI 的建议评分更高 —— 但不是唯一因素。

需要注意的是,这项研究仅仅针对美国参与者进行,后续仍需进一步研究人们如何看待 AI 生成的道德推理的文化差异。(清源)

AI PC,是联想们的销量解药吗?

4月16日,AMD推出了适用于商用笔记本电脑和台式机的AI芯片;英特尔去年底就推出了CoreUltra芯片,今年还计划推出新一代英特尔酷睿Ultra客户端处理器家族,并预计年出货4000万台AIPC。随着全球芯片制造商的AI技术越来...

研究显示GPT-4在预测公司盈利方面超越人类分析师

IT之家5月27日消息,芝加哥大学的一项新研究表明,大型语言模型GPT-4在预测公司未来盈利增长方面能够胜过人类分析师,而且该人工智能模型仅使用了公司的财务报表,并没有额外的信息辅助。以往,财务分析师依靠专业知...

大佬说AI|李开复亲授“从0到1大模型创业”方法论 别胡乱烧钱

大模型创业公司该用什么姿势开启长跑拉力赛?听李开复讲。1年时间、从0到1打造一家大模型创业企业,其中:旗舰大模型Yi-Large能力跻身全球第一梯队、海外toC产品营收过亿元、开源Yi-1.5系列模型、面向国内外发布多款...

马斯克霸气提25%特斯拉投票权要求,否则剥离AI和机器人技术

5月21日消息,埃隆・马斯克简单的“Yes”回帖,引发了外界的广泛关注。附上消息源@Teslaconomics推文截图,表示埃隆・马斯克希望掌控特斯拉25%的投票权,要求国内公司在得克萨斯州重新注册成立,而且要求批准此前的...

周鸿祎:360将发布安全大模型

8月8日消息,在ISC2023第十一届互联网安全大会上,360创始人周鸿祎发表“安全即服务”主题演讲,并透露,360将发布“安全大模型”。周鸿祎称,360不仅有通用大模型,还将发布360安全大模型。据悉,该安全大模型将于...

上一篇:没有授权也没关系,多家AI公司绕过网络标准抓取新闻出版商网站内容
下一篇:聊天机器人胡言乱语?牛津研究人员利用语义熵来识破 AI“幻觉”