DeepSeek-R1登上Nature封面:朝着AI透明化迈出的可喜一步

article/2025/9/18 10:22:29

开源人工智能(AI)的价值正获得更广泛的认可。

刚刚,DeepSeek-R1 论文以封面文章的形式登上了权威科学期刊 Nature,DeepSeek 创始人兼 CEO 梁文峰为该论文的通讯作者。

论文链接:

https://www.nature.com/articles/s41586-025-09422-z

研究团队假设,人类定义的推理模式可能会限制模型的探索,而无限制的强化学习(RL)训练可以更好地激励大语言模型(LLM)中新推理能力的涌现。

他们通过实验证明,LLM 的推理能力可以通过纯 RL 来提升,从而减少增强性能所需的人类输入工作量,且在数学、编程竞赛和 STEM 领域研究生水平问题等任务上,比经传统方法训练的 LLM 表现更好。

DeepSeek-R1 推出后,得到了全球开发者的广泛好评,截至发文前,其在 GitHub 上的 star 数已经达到了 91.1k。

在一篇同期发表的观点与评论文章中,卡内基梅隆大学助理教授 Daphne Ippolito 和他的博士生张益铭(现为 Anthropic 的 LLM 安全和对齐研究员)评价道:

“DeepSeek-R1 已从一个强大但不透明的解决方案寻找者,发展成一个能够进行类人对话的系统。这一历程反映了(人类)对 AI 系统的需求,这些系统不仅要准确地解决问题,还要成为人类可以理解、信任并能进行有意义协作的工具。”

文章链接:

https://www.nature.com/articles/d41586-025-02703-7

此外,Nature 也在 Editorial 文章中肯定了这项工作,“DeepSeek-R1 是第一个在经过同行评审后发表的主流 LLM,这是朝着透明化迈出的可喜一步”。

文章链接:

https://www.nature.com/articles/d41586-025-02979-9

他们一针见血地指出,经同行评审的论文发表有助于澄清 LLM 的工作原理,并帮助评估它们是否“货真价实”(whether they do what they purport to do)。

DeepSeek-R1 背后的科学

人类定义的推理模式可能会限制模型的探索,而无限制的 RL 训练可以更好地激励 LLM 中新推理能力的涌现。

让机器像人类一样进行通用推理,一直是 AI 领域的核心难题。

尽管思维链(CoT)等方法能够有效提升 LLM 的推理表现,但严重依赖人工标注,不仅扩展性差,还可能因人类的认知偏差而限制模型自身的潜能,使其无法探索更优的、非人类的推理路径。

DeepSeek-R1 的重要意义在于,它证明了通过纯粹的 RL 即可激发 LLM 的推理能力,而无需依赖人工标注的推理过程(数据)。

不同于基于提示的方法和监督学习等早期方法,研究团队提出了一种新范式——在 RL 框架中,以最小化对人工标注的依赖,探索 LLM 通过自我演化来发展推理能力的潜力。

基于提示的方法 vs. 监督学习 vs. RL

正如 Ippolito 等人所比喻的,RL 算法的工作方式类似于人类玩家学习玩电子游戏的过程:玩家在游戏世界中操作角色,通过不断试错发现哪些行为会带来奖励——例如“收集金币”可以增加分数,而“撞到敌人”则会让分数归零。

相比之下,基于提示的方法更像是让他们通过阅读说明书来学会玩游戏,而监督学习则像让他们观察其他玩家玩游戏数百次,试图通过模仿掌握游戏技巧。

他们发现,当 LLM 通过 RL 的试错过程被训练以产生正确答案时,它会自然而然地学会输出其推理过程。

考虑到数学和编程问题通常有可验证的答案,他们通过创建一个评分系统来帮助 DeepSeek-R1 在训练过程中进行改进——回答正确得高分,反之得低分。

在具体实现上,他们提出了一个名为“群体相对策略优化”(GRPO)的 RL 算法,并基于基础模型 DeepSeek-V3 Base 训练了 DeepSeek-R1-Zero、DeepSeek-R1 等模型。

图|RL 框架

从 DeepSeek-V3 Base 开始,通过涉及拒绝采样、RL 和监督微调(SFT)的多阶段 pipeline,研究团队先后训练了 DeepSeek-R1-Zero、DeepSeek-R1 Dev1、DeepSeek-R1 Dev2、DeepSeek-R1 Dev3 和最终的 DeepSeek-R1。

图|DeepSeek-R1 的多阶段 pipeline

据论文描述,DeepSeek-R1-Zero 自然演化出了多样且复杂的推理行为。在解决推理问题时,模型倾向于生成更长的响应,其中包含验证、反思和替代方案的探索。这表明,模型通过 RL 能够成功地学会更优的推理策略。

然而,DeepSeek-R1-Zero 依然存在一些局限,比如“输出可读性差”和“语言混用”等。而且,由于其基于规则的 RL 训练阶段仅聚焦于推理任务,在写作和开放域问答等更广泛场景中的表现较差。

为此,研究团队通过随后的多个训练阶段进一步强化了 DeepSeek-R1 系列模型的综合能力。具体而言:

DeepSeek-R1 Dev1:相较于 DeepSeek-R1-Zero,指令遵循能力提升;

DeepSeek-R1 Dev2:在代码、数学和 STEM 等领域,高级推理能力进一步增强;

DeepSeek-R1 Dev3:引入大规模非推理语料和代码工程数据,推理与通用语言生成能力得到提升;

DeepSeek-R1:推理能力强,且行为与人类偏好对齐。

最后,他们在 MMLU、MMLU-Pro、C-Eval、GPQA Diamond、SimpleQA、SWE-bench Verified、LiveCodeBench 和 AIME 2024 等 21 个主流 benchmark 上分别对 DeepSeek-R1 等模型进行了评估。

如下表,DeepSeek-R1 几乎在所有 benchmark 上均取得了更好的成绩。这些结果验证了这一 RL 框架的有效性。

图|DeepSeek-R1 每个训练阶段的评测结果

此外,研究团队还表示,这一 RL 框架有助于形成一些高级的、涌现的推理模式,如自我反思、验证和动态策略适应。而且,这些涌现出的推理模式还可以被系统地用于指导和增强小型模型的推理能力。

启示:亟需遏制 AI 行业的过度炒作

考虑到这项技术已无处不在,未经证实的言论对社会而言是切实的风险。

除了 DeepSeek-R1 的在科学层面的研究意义,Nature 在 Editorial 文章中着重探讨了一个业内讨论不够多的问题:

绝大多数被广泛使用并正在迅速颠覆人类获取知识方式的 LLM,都尚未经过独立同行评审,这是一个值得注意的「缺失」。

他们称,DeepSeek-R1 论文的发表“是朝着透明化迈出的可喜一步。”

据介绍,DeepSeek-R1 的原创性、方法论和鲁棒性,已接受八位人类专家的评审。论文将与评审报告及作者回复一同发表。“在一个常常充斥未经验证主张和炒作的行业中,这无疑是迈向透明性与可重复性的重要一步。”

Nature 方面认为,与在预印本 arXiv 发表论文不同,参与同行评审的外部专家不再是单向接收信息,而是在一个由独立第三方监督和管理的协作过程中提问并请求更多信息。“虽然这不总能带来重大改变,但可以增加研究的信任度。对于 AI 开发者而言,这意味着他们的工作得到了‘权威背书’,从而在不同社区中更具公信力。”

同时,同行评审还起到了制衡作用,避免 AI 开发者通过挑选最有利于自己模型的基准测试而“自我打分”。这是因为,基准测试是可以被操控的。例如,如果训练数据中包含测试题目和答案,模型就可能提前学会正确回答,从而导致其能力被高估。

此外,同行评审还可以促成论文的其他重要修改,其中之一是确保作者对模型的安全性有所回应。AI 的安全性意味着要避免意料之外的有害后果,包括缓解输出中的固有偏见,以及增加防护措施以避免 AI 被用于网络攻击。

一些人认为开源模型比专有模型更不安全,因为一旦用户下载,它们就脱离了开发者的控制。不过,开源模型也让更广泛的社区能够理解并修复缺陷。

例如,DeepSeek-R1 的审稿人指出,论文缺少关于安全性测试的信息——并未评估基于 R1 构建一个不安全模型的难易程度。作为回应,研究团队在论文中添加了重要细节,包括一个专门的章节,介绍了他们如何评估模型的安全性并将其与竞争模型进行比较。

鉴于 DeepSeek-R1 是一个开放权重模型,任何研究人员和公众都可以不受限制地自由下载、使用、测试和在其基础上进行开发,因此其安全问题不容忽视。

在 Editorial 文章的最后,Nature 呼吁道,希望更多的 AI 公司将其模型提交给出版物评审。“评审并不意味着让外界接触公司的秘密,而是要准备好用证据支持你的言论,并确保相关主张得到验证和澄清。”

如今,伴随着国内外 AI 行业的白热化竞争,一些模型厂商在投入巨大资金的同时,忽视了数据偏见、模型安全等问题,甚至存在主动刷榜、夸大模型能力的行为,“对社会而言是切实的风险”(a real risk for society)。

或许正如 Nature 所言,依赖独立研究者的同行评审,是缓解 AI 行业炒作的一种方式。

对此,你怎么看?

作者:学术君

如需转载或投稿,请直接在公众号内留言

原标题:《刚刚,DeepSeek-R1登上Nature封面:朝着AI透明化迈出的可喜一步》

阅读原文

    本文为澎湃号作者或机构在上传并发布,仅代表该作者或机构观点,不代表的观点或立场,仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。


    http://news.xdnf.cn/FMQoJEsnVe

    相关文章

    电影《731》首映破纪录

    电影《731》9月18日全球上映。据网络平台数据,截至上午9点18分,电影《731》上映首日综合票房达1.3亿。该片也成为中国影史单片单日总场次榜冠军。责任编辑:王卉澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    2025中国服务业企业500强发布,平均营收规模首破千亿

    9月18日,中国企业联合会、中国企业家协会在重庆发布“2025中国服务业企业500强”。入围企业2024年营业收入总规模迈上新台阶,达到51.1万亿元,平均营业收入规模首次突破千亿元大关,达到1022.2亿元。最新榜单显示,服务业“500强”企业营业收入增速加快,利润水平较快增长,经…

    慈善家案例发布 | 王石:善行万里,归来还是企业家

    编者按今年“中华慈善日”当天,《中国慈善家》影响力慈善研究院正式发布《王石:善行万里,归来还是企业家》研究报告。报告首次全面梳理王石的慈善历程,深度研究其慈善实践的十个典型案例,并与王石本人进行了深度访谈。为什么研究王石?作为改革开放以来最具代表性的企业家…

    深圳垃圾分类条例发布五周年成效显著 盐田区建成全国首个全量黑水虻处理厨余垃圾示范区

    9月17日,《深圳市推进垃圾分类工作白皮书(2020—2025 年)》研讨会——《深圳市生活垃圾分类管理条例》实施五周年系列活动,在深圳市盐田区资源化利用环境园成功举办。研讨会由深圳市城市管理和综合执法局指导,深圳市环境卫生协会、清华大学深圳国际研究生院共同主办,多家…

    男子无证驾驶发生交通事故,民警一问发现连身份证也是假的

    当民警询问是否无证驾驶时,男子反问“叉车证算不算?”据“警民直通车上海”微信公众号9月18日消息,9月4日早高峰期间,虹口区周家嘴路保定路路口发生一起两车碰擦的交通事故。视频显示,行驶途中,一辆黑色小轿车忽然变道,撞上隔壁车道的出租车。虹口分局民警到场处置时发现…

    “2025中国服务业企业500强”发布,平均营收规模首破千亿元

    9月18日,中国企业联合会、中国企业家协会在重庆发布“2025中国服务业企业500强”。入围企业2024年营业收入总规模迈上新台阶,达到51.1万亿元,平均营业收入规模首次突破千亿元大关,达到1022.2亿元。最新榜单显示,服务业“500强”企业营业收入增速加快,利润水平较快增长,经…

    《奔流》第二季上海场系列活动专家咨询会举办

    《奔流:从上海出发——全球城市人文对话》(下简称《奔流》)第二季上海伦敦双城对话即将于2025年9月至11月举办上海场系列活动,并计划于11月中旬在上海静安苏河湾举办《奔流》第二季上海论坛。9月17日下午,为推动上海苏州河、黄浦江与伦敦泰晤士河的多元对话与深度合作,《…

    未见于史载的西周古国倗国,最近又确认一座国君墓

    倗(png)国,是一个在传世历史文献中完全没有记载的西周时期诸侯国,它的存在、它的文化、它的历史,完全依赖于现代考古学的发现才得以重见天日。9月17日,山西省考古研究院正式公布了山西省绛县横水西周墓地M1006的发掘资料,确认该墓墓主为一代倗国国君,墓葬年代属西周中期…

    警钟14响,勿忘九一八!辽宁沈阳举行撞钟鸣警仪式

    发生于1931年的九一八事变不仅是中华民族十四年抗战的起点,也揭开了世界反法西斯战争的序幕。在九一八事变爆发94周年之际,今天上午,在九一八事变的发生地——辽宁沈阳,举行勿忘九一八撞钟鸣警仪式。仪式在沈阳“九一八”历史博物馆的残历碑广场进行,社会各界人士代表约10…

    未见于史载的西周古国倗国,最近又发现一座国君墓

    倗(png)国,是一个在传世历史文献中完全没有记载的西周时期诸侯国,它的存在、它的文化、它的历史,完全依赖于现代考古学的发现才得以重见天日。9月17日,山西省考古研究院正式公布了山西省绛县横水西周墓地M1006的发掘资料,确认该墓墓主为一代倗国国君,墓葬年代属西周中期…

    上海赛艇世锦赛蓄势待发,520名高校志愿者全情投入

    2025世界赛艇锦标赛开赛在即,位于淀山湖畔的比赛地上海市水上运动中心当下汇聚了全世界最优秀的赛艇运动员,连日来运动员们对于场地条件和赛事服务都赞不绝口,这其中志愿者的辛勤付出无法回避。本次赛事的志愿者团队由团市委和市体育局团委共同负责招募,上海外国语大学、华…

    广西书记佩戴的“广西生产”AI眼镜爆火,媒体介绍售价3999元

    “大家注意到,今天我没有带讲稿,而是戴了一副广西企业生产、具有实时清晰提词功能的智能眼镜,讲稿就在我的眼镜里。大家看不到,我能看到。”据中新社报道,9月17日,第22届中国—东盟博览会、中国—东盟商务与投资峰会开幕式在广西南宁举行。广西壮族自治区党委书记陈刚说,…

    首个接受同行评审的大语言模型!DeepSeek-R1论文登《自然》封面,作者包括梁文锋

    9月18日,梁文锋带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。今年1月份,国产大模型公司深度求索(DeepSeek)在预印本平台arxiv公布论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,创始人梁文锋…

    一年50余部剧,陕西清涧人生影视城成影视拍摄“新宠”

    清涧人生影视城影视产业蓬勃发展清涧宣传 2025年09月16日 17:33 陕西短剧《重生1990,八岁的我偷钱开奶茶店》在人生影视城拍摄中。近日,记者从清涧县相关部门获悉,今年已经在清涧人生影视城拍摄各类剧目50余部,自影视城建成投运以来已累计拍摄70余部。这座以20世纪80年代风…

    “全过程视角”看历史人物,学者韩昇新作解读隋文帝与武则天

    9月13日,复旦大学历史学系教授韩昇的两本新书《隋文帝传》(增订版)与《武则天传》,在北京举行的新书分享会现场,将听众的思绪引向了一千四百多年前的激荡岁月。发布会海报《隋文帝传》(增订版)与《武则天传》,这两部个人传记合起来恰似一部宏大的时代双翼,试图托举读者…

    多地将从今秋起试行中小学“春秋假”,湖北恩施明确春季和秋季学期放假均不少于1周

    9月16日,商务部等9部门对外发布了《关于扩大服务消费的若干政策措施》(下称《措施》),提出五方面19条举措。其中,第十三条指出:优化学生假期安排,完善配套政策。在放假总天数和教学时间总量保持不变的情况下,鼓励有条件的地方结合气候条件、生产安排、职工带薪休假制度…

    “四连板”上海建工再发风险提示:黄金收入营收占比较低,股票换手率高,存在短期大跌风险

    “四连板”上海建工再发股票交易异常波动暨风险提示公告。9月17日晚间,上海建工集团股份有限公司(上海建工,600170.SH)发布公告,公司股票于2025年9月16日、9月17日连续两个交易日内日收盘价格涨幅偏离值累计达20%,属于股票价格异常波动。经公司自查并向控股股东核实,公司…

    侵华日军第59师团中将师团长藤田茂:日本的侵华战争是一场持续溃败的彻底败北

    藤田茂(1889.09.17-1980.04.11),男,日本广岛县人。日本陆军士官学校第23期毕业。在日本侵略中国期间,任日本陆军第20师团骑兵第28联队大佐联队长、第12军骑兵第4旅团少将旅团长、第59师团中将师团长等职;日本侵华战争结束后,1945年8月25日在朝鲜咸兴被苏军俘虏,1950年7…

    抗战回望53︱九一八事变后的一周

    今年是抗日战争胜利暨世界反法西斯战争胜利80周年,澎湃新闻私家历史与抗战文献数据平台合作,推出“抗战回望”系列,选取抗战期间的报纸、图书、日记等史料加以介绍,希冀带领读者前往历史现场,触碰抗战时中国军民的精神与生活。九一八事变后,日本一步一步在军事、政治上蚕…

    张文元的“漫画抗战”与“国画抗战”

    张文元(1910-1992),江苏太仓毛市乡人。家中世代务农,生活清贫。小学毕业后因家贫无法升学,在太仓县城免费的艺徒学校半工半读,学习漆科。该校清末由教育家唐文治(太仓人,时任邮传部上海高等实业学堂即现交通大学前身监督)等创设,专收贫民子弟之有志习艺者。毕业后张文…