喂垃圾数据=毁模型?最新研究:AI 脑腐不可逆,清洗也救不了

article/2025/10/27 11:29:21

大数据文摘出品

最近,德州农工大学与德州大学奥斯汀分校的研究团队,在论文中提出一个结论:大模型可能会“脑腐”。

他们称之为“LLM Brain Rot Hypothesis”,意指当模型长期暴露在低质量网络文本中时,其认知能力会持续退化,并表现出与人类“信息上瘾”相似的症状。

研究团队在论文中指出,这种退化不是临时的,而是深层、持久、且难以修复的结构性损伤。

与人类的“脑腐”类似,模型的症状包括注意力衰退、推理链断裂、长期记忆混乱、以及性格倾向扭曲。

他们的核心发现是:持续在垃圾数据上预训练,会让模型永久变笨。

在受污染的模型中,逻辑推理准确率下降超过20个百分点,长文本理解下降幅度可达40%。

甚至,在心理人格测试中,模型出现了“自恋”“精神病倾向”等特征。

实验如何验证“脑腐”:从推文到推理

论文设计了一个极具象征意义的实验:让模型“沉迷社交媒体”。

研究者从Twitter(现X平台)采集了上百万条推文,按两种方式划分“垃圾内容”。

第一种是M1:互动度维度——短且高热度的内容,被视为典型的“快感型垃圾”。

第二种是M2:语义质量维度——内容空洞、煽动性强、使用标题党词汇或夸张情绪的文字。

团队用这两类数据分别对四个主流开源模型(包括Llama3与Qwen系列)进行持续预训练,并以干净语料作为对照组。

结果令人震惊。在M1条件下,模型在ARC推理测试中的表现从74.9分骤降至57.2分,长文本检索任务RULER的得分则从84.4降至52.3。

也就是说,“越刷短内容,越失去思考能力。”

图注:数据显示“脑腐化”内容往往更短、更受欢迎但语义质量低,人类与GPT对语义质量的判断高度一致。

研究者将这种衰退模式称为“剂量响应”:垃圾数据比例越高,能力退化越明显。

更进一步,他们分析了模型的思考过程,发现最主要的“病灶”是,思维跳步(Thought-skipping)。

模型在推理时往往不再展开完整思考,而是直接跳过中间推理链,草率给出结论。

这种行为被称为“认知短路”,类似人类沉迷短视频后的专注力下降。

作者用四类基准(ARC、RULER、HH-RLHF/AdvBench、TRAIT)来评估大模型的推理、记忆与多任务、伦理规范及人格倾向等认知功能。

退化不可逆:清洗与微调都救不了

论文进一步分析了退化的内部模式。主要发现是,垃圾数据训练后模型出现推理链中断(thought-skipping)现象。

模型在回答问题时更倾向直接给出结论,而非展开逐步推理。

研究者使用GPT-4o-mini对思维链进行分类,发现超过70%的错误来自“无思考”或“思维跳步”,而非单纯逻辑错误。

这一现象与人类在高强度信息刺激下的“注意力割裂”表现相似,但研究者强调,该结果并非类比结论,而是统计规律。

随着“垃圾内容”比例上升,模型在推理、长上下文理解、伦理安全及人格稳定性等各项认知功能上普遍退化,验证了“脑腐化”效应。

团队还进行了剂量效应分析(dose–response),结果表明:垃圾数据比例与性能下降幅度成近线性关系。

随后,研究者尝试通过额外的指令微调与干净数据继续训练来“修复”模型。

即使增加五倍规模的清洁数据进行指令调优,模型仍未完全恢复至基线性能。

这说明所谓的“脑腐”效应可能不是格式错配,而是参数空间层面的结构漂移(representational drift)。

研究还测试了反思式推理(Reflective Reasoning)等无训练修复方法。

结果显示,使用外部强模型提供反馈(如GPT-4o-mini)能部分恢复推理链完整性,但无法完全修复性能差距。

团队据此提出,“模型认知衰退”可能在训练过程中被永久编码进参数分布中。

论文最后指出,这一发现将数据质量问题转化为训练安全问题(training-time safety)。

作者建议未来建立“模型认知健康检查”机制,用于监控预训练数据的组成与长期效果。

他们强调,本研究并未证明所有社交媒体数据均为有害样本,但结果提示,数据来源的复杂性与语义深度,可能直接决定模型的长期稳定性。

研究团队在论文结论中写道:“持续暴露于低质量文本会造成可验证的认知退化,这种退化具有持续性且难以逆转。”

这项研究提供了首次系统证据,说明数据质量不仅影响模型性能,也影响模型的内部认知结构。

它将“AI训练数据质量”从经验问题转变为可量化、可因果验证的科学议题。

作者呼吁,在大模型持续扩展的时代,数据筛选与长期维护应被视为认知安全的一部分。

注:头图AI生成

作者长期关注 AI 产业与学术,欢迎对这些方向感兴趣的朋友添加微信 Q1yezi,共同交流行业动态与技术趋势!

原标题:《喂垃圾数据=毁模型?最新研究:AI 脑腐不可逆,清洗也救不了》

阅读原文

    本文为澎湃号作者或机构在上传并发布,仅代表该作者或机构观点,不代表的观点或立场,仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。


    http://news.xdnf.cn/GauDscNKTO

    相关文章

    欧洲小偷泛滥 直播抓贼成网红新赛道

    欧洲一直都是吸引着全球游客的热门旅游目的地。然而有被偷经验的人都知道,勇闯欧洲要做的第一个攻略不是如何搭乘公共交通也不是如何找厕所,而是怎样从贼窝全身而退。 有外国网友形容欧洲小偷密度“已经如空气般自然存在”,尤其在旅游热门目的地。小偷猖狂之时甚至能洗劫整…

    上海地铁崇明线全线隧道贯通,系国内穿越长江最长的地铁线

    上海地铁崇明线建设迎来里程碑式突破,国内穿越长江距离最长的上海地铁崇明线实现全线隧道贯通。上海崇明线实现全线隧道贯通。上海地铁供图10月27日,澎湃新闻(www.thepaper.cn)记者从上海地铁获悉,历经208天连续掘进,上海市轨道交通22号线(崇明线)陈家镇站~陈东中间风…

    激荡的经典|施家彰:诗歌是意外得来的财富

    9月15日,美国国会图书馆宣布授予二代华裔诗人施家彰(Arthur Sze)为2025到2026年度第25位桂冠诗人,该职位的官方说法是桂冠诗人顾问。前几任桂冠诗人依次为特蕾西史密斯、乔伊哈乔、艾达利蒙。施家彰接到美国国会图书馆邀请担任桂冠诗人的电话时,为了确保不是出于政治动机,…

    避免“维修刺客”,上海物业推出第三方特约维修服务受市民欢迎

    你遇到过这样的“维修刺客”吗?水管爆漏、马桶堵塞、电路故障……当家里出现各种问题,小区物业来不及上门维修,网上找来的维修师傅又可能存在“小病大修”“无病假修”“坐地起价”等行为,这让部分市民苦不堪言。而如今,只要登录“上海物业”小程序点击“我要报修”填写相…

    多家央媒就台湾前途命运密集发声:祖国完全统一必定实现

    “今年是中国人民抗日战争暨世界反法西斯战争胜利80周年、联合国成立80周年,亦是台湾光复80周年、台湾人民乙未武装抗日130周年、台湾建省140周年。在上述诸多重大事件纪念节点交汇的当下,台海局势、两岸关系和祖国统一进程也在加速演进,推进祖国统一大业处于新的历史起点。…

    一周展讯|宁夏文物与宋元漆器抓紧去看!

    渐入深秋,上海刚刚告别了梵高等奥赛博物馆名作展,又有两场重要展览还有20天左右即将收官。上海博物馆东馆的“宁夏固原文物精品展”展出了323件西周至隋唐时期的珍贵文物,其中有61件国家一级文物;上博人民广场馆的“宋元明漆器展”是与东京国立博物馆联合举办的展览,127件…

    观察|贪腐传闻下米莱过关中期大考,褒贬不一的“电锯改革”前景如何?

    据央视新闻报道,当地时间26日晚,阿根廷内阁部长宣布,总统米莱所在的“自由前进运动”党赢得中期选举。此次中期选举改选众议院半数席位和参议院三分之一席位,选出24名参议员和127名众议员。初步计票结果显示,“自由前进运动”党在全国范围内获得40.8%的选票,反对派阵营获…

    全球前瞻|APEC峰会本周在韩国举行,各国首脑外交成焦点

    本周10月27日至11月2日:据外交部网站消息,应大韩民国总统李在明邀请,国家主席习近平将于10月30日至11月1日赴韩国庆州出席亚太经合组织第三十二次领导人非正式会议并对韩国进行国事访问。据参考消息援引日本《朝日新闻》10月23日报道,日本内阁官房长官木原稔在22日的记者会…

    河南新蔡县一事业单位招聘被疑“萝卜岗”,官方致歉:责成纪委调查

    河南新蔡县人力资源和社会保障局网站10月27日发布情况说明。责任编辑:王卉图片编辑:金洁澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    掀开“公摊”的面纱(上):香港1.0版本的兴衰

    【编者按】住房“公摊”直接影响到房价中“水分”的多寡,进而影响居民购房的获得感。2021年下半年以来,房地产市场供求关系发生重大变化,买方和卖方的力量对比发生反转,唯有推动本质上更加有利于买方的变革,才有可能助推市场“止跌回稳”。辩证地看,“止跌回稳”阶段也是…

    2026年度中央机关公开遴选和公开选调公务员报名即将开始

    记者10月27日从国家公务员局获悉,2026年度中央机关公开遴选和公开选调公务员报名即将开始,考生可于10月28日8:00至11月6日18:00期间,登录“2026年度中央机关公开遴选和公开选调公务员专题网站”(http://subb.scs.gov.cn/lx2026)进行网上报名,笔试将于11月29日在全国各直辖…

    看见人文之城|郑崇选:人人可享“文化点单权”

    视频来源:文汇报(05:28)家门口“小而美”的公共图书馆、文化活动空间、艺术场馆……正在成为这座城市靓丽的文化风景线。《看见人文之城》系列短视频今天推出第二集《人人可享“文化点单权”》,上海社会科学院文学研究所副所长、研究员郑崇选带你走进家门口的公共文化空间,体…

    前三季度经济大省中湖北增速领先,豫鄂川湘民间投资增长

    至10月27日,十个“经济大省”的经济运行“三季报”已全部发布,八省(市)当期GDP增速跑赢全国5.2%的水平,湖北以6.0%领先;河南、湖北、四川、湖南的民间投资保持增长。 广东、江苏、山东等GDP十强省(市)体量大、基础稳、要素强,以占全国近两成的面积贡献了超过六成的GD…

    《文学的故乡》第二季来了,导演:跟着作家回到故乡,看文学如何发生

    在纪录片《文学的故乡》第一季播出五年后,第二季《文学的故乡》来了:10月27日至11月1日,读者们可以跟随韩少功、张炜、叶兆言、翟永明、刘亮程、莫言6位作家回到文学现场,追寻文学故乡。纪录片《文学的故乡》第二季开播。除了莫言,韩少功、张炜、叶兆言、翟永明、刘亮程都…

    国家统计局:1-9月份全国规模以上工业企业利润增长3.2%

    1—9月份,全国规模以上工业企业实现利润总额53732.0亿元,同比增长3.2%(按可比口径计算)。1—9月份,规模以上工业企业中,国有控股企业实现利润总额17021.8亿元,同比下降0.3%;股份制企业实现利润总额39923.5亿元,增长2.8%;外商及港澳台投资企业实现利润总额13509.7亿元…

    跑一场浪漫“仙马”

    题图:2025新余仙女湖马拉松开跑“在新余,“仙马”不仅是一场速度的竞技,更是一座城与一群人之间温暖的双向奔赴。”10月26日清晨,新余体育中心,一声发令枪响划破天际,2.2万名跑者如潮水般涌过起点——2025新余仙女湖马拉松激情开跑。自2015年首届创办至今,仙女湖马拉松已…

    人民日报整版聚焦上海:以人民为中心,书写城市发展新篇章

    上海向存量要功能,向集约要空间,向更新要效益以人民为中心,书写城市发展新篇章2019年11月,习近平总书记在上海市考察时,首次提出“人民城市人民建,人民城市为人民”的理念,之后多次对上海人民城市建设作出重要指示。从提出“城市,让生活更美好”的世博理念,到推动设立…

    联邦明察局·86|当“关门”被彻底武器化,华盛顿已无人将之视作危机

    2025年10月22日,美国联邦政府“关门停摆”来到了第22天,从而正式超越了1995年12月16日到1996年1月6日“关门”21天的纪录,跃居美国历史上时间第二长的“停摆”危机。下一步,此次“关门”只需再延续14天,即到11月4日,就能“问鼎”最长纪录了。真若如此,颇具戏剧性的一幕或…

    航行警告!渤海潍坊港部分海域进行实弹射击,禁止驶入

    据中国海事局网站消息,潍坊海事局发布航行警告,10月27日0时至14时,渤海潍坊港部分海域进行实弹射击,禁止驶入。责任编辑:王卉图片编辑:陈飞燕澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    国潮碰撞次元,首届上海市民文化节妆造大赛收官

    10月26日,首届上海市民文化节妆造大赛决赛暨颁奖典礼在上海长风大悦城举行。千余名妆造爱好者以“国潮次元”为灵感同台竞技,最终百位“妆造达人”及多项单项奖得主脱颖而出,最小的参赛者仅八岁。决赛在商场中庭举行,百余名晋级选手分组登台,在1分钟“个人秀”中,国风造型…