AI 搜索“毒化”现实:模型崩溃隐忧,从神器到“垃圾输出”

benniaoxiansheng2025-05-29 09:52:33IT之家

5 月 29 日消息,科技媒体 theregister 昨日(5 月 28 日)发布博文,报道称以 Perplexity 为代表的 AI 搜索工具虽然表现要优于谷歌等传统搜索引擎,但在不断地版本更迭后,搜索结果质量不升反降,AI 模型崩溃(model collapse)现象正在显现。

该媒体指出以 Perplexity 为代表的 AI 搜索工具曾被视为传统搜索引擎的强力替代品,其搜索结果一度比谷歌更精准。

不过近期不少用户发现,AI 搜索反馈的硬数据(如市场份额或财务数据等),并未来自权威的美国证券交易委员会(SEC)要求的 10-K 年度报告,常常引用不可靠来源。用户若不明确指定数据来源,得到的结果往往令人费解。

援引博文介绍,这种问题并非 Perplexity 独有,主流 AI 搜索机器人均存在类似“可疑”结果的现象。

该媒体认为 AI 搜索质量下降的根源,在于“模型崩溃”(model collapse),即 AI 系统因依赖自身输出训练,导致准确性、多样性和可靠性逐步丧失。错误累积、稀有数据(tail data)丢失以及反馈循环是三大主因。

错误累积让每一代模型继承并放大前代的缺陷;稀有数据丢失使罕见事件和概念逐渐模糊;反馈循环则强化狭窄模式,输出重复或偏见内容。

为提升 AI 表现,检索增强生成(RAG)技术被广泛应用,让大型语言模型(LLMs)从外部数据库提取信息,减少“幻觉”(hallucination)现象。

然而,彭博社研究发现,即便采用 RAG,包括 GPT-4o、Claude-3.5-Sonnet 等 11 个领先模型在处理 5000 多个有害提示时,仍会输出错误结果。更糟糕的是,RAG 增加了泄露客户隐私数据、生成误导性市场分析及偏见投资建议的风险。

AI 模型崩溃的后果正在加速显现。用户和企业为追求效率,倾向于依赖 AI 生成内容,而非投入人力创作高质量内容。从学生作业到伪造科研论文,甚至虚构小说,AI 的“垃圾输入、垃圾输出”(Garbage In / Garbage Out,GIGO)现象无处不在。(故渊)

周鸿祎预告:今天下午发布神秘产品“360AI甄选”

6月6日消息,360创始人周鸿祎微博号发布视频,预告今天下午将发布系列重磅产品,包括最新版本的360AI搜索、360AI浏览器,还会发布一款神秘产品360AI甄选。周鸿祎称:“360AI甄选听起来和东方甄选有点像,别想歪了,...

黄仁勋对话扎克伯格,还互赠了皮夹克

7月30日消息,在美国丹佛举行的第51届SIGGRAPH图形大会上,英伟达创始人CEO黄仁勋和Meta创始人CEO马克·扎克伯格举行炉边谈话,他们讨论了人工智能和仿真模拟的未来。上周,Meta发布了最新AI开源大模型Llama3.1系列...

扎克伯格:Meta AI 全球月活跃用户逼近 6 亿

IT之家12月10日消息,Meta首席执行官马克・扎克伯格(MarkZuckerberg)于3天前在Threads上发布动态,表示在Llama3.3模型的帮助下,目前MetaAI的月活用户数量逼近6亿。MetaAI服务于2023年秋季推出,于今年10月宣布月...

消息称社交平台Reddit与大型AI公司达成数据授权协议 每年6000万美元

IT之家2月18日消息,据彭博社昨日报道,社交平台Reddit将与一家未透露名称的“大型AI公司”达成一项数据授权协议,允许后者访问其用户生成内容平台。该协议的年价值约为6000万美元(IT之家备注:当前约4.32亿元人民...

Meta开源大模型Llama-4-Maverick基准测试排名暴跌,此前被质疑刷榜作弊

4月14日消息,LMArena更新了Meta最新发布的开源大模型Llama-4-Maverick的排名,其从此前的第2名直线下降至第32名。这证实了此前开发者对Meta为刷榜向LMArena提供“特供版”Llama4大模型的质疑。4月6日,Meta发布了最...

TAG:AI 大模型
上一篇:消息称苹果重塑六大系统:iOS 26 领衔,命名向年份看齐
下一篇:DeepSeek R1模型完成小版本试升级 网友:媲美OpenAI最高o3模型