DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?

article/2025/6/3 8:51:41

DeepSeek低调升级,引发科技圈热议。

5月28日,DeepSeek 在官方微信群发布消息称,DeepSeek R1模型已完成“小版本试升级”,欢迎前往官方网页、APP、小程序测试(打开深度思考),API 接口和使用方式保持不变。

不过,记者查询官方网站等,发现没有对此次更新的详细信息。记者咨询了一位DeepSeek内部人士,对方回复称是“小升级”。

根据Hugging Face,DeepSeek-R1此次开源版本为0528。

从宣传来看,此次升级十分低调,不过,根据网友测评,此次升级可不是简单的“小升级”。

有科技媒体分析称,时隔4个月,DeepSeek-R1完成了超进化,编码能力强到离谱,而且思考时间更长了。据称,新模型基于DeepSeek-V3-0324训练(参数为660B)。在LiveCodeBench基准上,DeepSeek-R1-0528性能几乎与o3-mini(High)和o4-mini(Medium)实力相当,一举超越了Gemini 2.5 Flash。

科技类网站“AIGC开放社区”的评论称,在著名代码测试平台Live CodeBench中显示,其性能可以媲美OpenAI最新的o3模型高版本。也有网友对新版R1的风格进行了测试,几乎和OpenAI的o3差不多。

从社交媒体的反馈来看,网友最为关注的是此次DeepSeek R1更新后的思考时间变长。据测评显示,此次DeepSeek单任务处理时长可达30-60分钟。

此外,有网友通过实验对比了Claude-4-Sonnet与DeepSeek-R1-0528的实际表现。可以看到,DeepSeek-R1生成的代码在模拟物理碰撞方面表现更好。

值得注意的是,此前有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。

有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

不过,当时有内部人士向记者坦言,该传言真实度不高。从目前的情况分析,DeepSeek或许将用此次R1版本的升级,取代R2版本的推出。

尽管网友评测得出的结论十分惊喜,但是也有业内人士向记者表示,建议理性客观看待,也期待更为权威的测评结果。

在DeepSeek R1发布更新后,远在大洋彼岸的AI巨头英伟达(Nasdaq:NVDA)发布截至4月27日的2026财年第一财季财报,期内实现营收440.62亿美元,同比上涨69%,高于市场预期的432.8亿美元;美国通用会计准则(GAAP)下净利润187.75亿美元,同比上涨26%。在财报电话会上,英伟达CEO黄仁勋再次谈到DeepSeek所引发的市场对于推理模型的关注,以及推理模型会需要更大的算力支持,这将驱动推理算力需求。

    责任编辑:孙扶
    图片编辑:沈轲

    http://news.xdnf.cn/IsDFrThHSb

    相关文章

    他们为何支持特朗普的电影关税政策?

    不知不觉,距离美国总统特朗普宣布要对非本土拍摄制作的电影加征百分百关税,已过去了近一个月的时间。好莱坞也由最初的震惊、错愕、不解,发展到如今的不再关心此事。正如美国导演韦斯安德森在戛纳电影节参加新片《腓尼基计划》的记者见面会时,被问到相关问题所回答的:这样…

    2025黎里真实影像大会开幕,设置5大创作空间

    5月28日,2025新鲜提案黎里真实影像大会在苏州黎里古镇正式拉开帷幕。本届大会以“生命力拾光”为年度主题,意为站在十周年这个富有纪念意义的时间节点上,回望过去,放眼未来,不断激活“纪实+”的生命力。黎里真实影像大会启幕为纪念大会启幕10周年,本届活动还创新设置了“…

    唐弢奖在上海颁出,评委代表陈思和:评论看质不看量

    上海是我国文艺评论重镇,也是90多年前唐弢先生文学起步的地方。上海长期高度关注青年评论家的成长。“唐弢青年文学研究奖”的颁奖活动落地上海,至今已举办四届。5月29日,第十四届“唐弢青年文学研究奖”在上海颁出:李静、王雪松、韩松刚、王炳中、李壮5位青年学者,分别凭…

    尤恩·卡梅隆:理解苏格兰及其历史

    在相当漫长的一段历史时期内,国内外英国史研究普遍以“英格兰”为核心,对联合王国中苏格兰、威尔士和爱尔兰等区域的历史关注不足。然而,自20世纪70年代以来,美国约翰斯霍普金斯大学著名史学家J. G. A. 波考克(J. G. A. Pocock)相继发表了两篇开创性的论文,即《不列颠史…

    “失望”马斯克离开特朗普政府,媒体称当天两人未交谈

    在批评特朗普政府“大而美”税收与支出法案一天后,美国企业家、政府效率部负责人埃隆马斯克28日在社交媒体上宣布,他作为“特殊政府雇员”的任期结束。有媒体称,马斯克宣布离职前未同特朗普进行过正式交谈。当晚离职马斯克在帖文中说:“在我作为特殊政府雇员的任期即将结束…

    重庆武陵山天池底部为304不锈钢?景区回应:无奈之举

    近日,重庆武陵山森林公园天池景区被加装不锈钢底引发网络关注。“为何要给天池底部加装不锈钢?”“六百多吨的不锈钢成本几何?谁来承担?”不少网民就此事提出疑问,相关话题也登上热搜。29日,武陵山国家森林公园景区相关工作人员回应记者称,采用不锈钢底也是无奈之举,因…

    韩国总统选举提前投票开始,民调显示李在明继续领跑

    韩国新一届总统选举定于6月3日举行。当地时间29日早上,选举提前投票开始举行。韩国总统选举正式投票将于6月3日进行总台记者 唐鑫:当地时间29日早上6时,韩国第21届总统选举提前投票开始进行。提前投票将持续2天,选民可以不分居住地在韩国各地共3568个投票站中的任意一个进行…

    湖北应城公安通报一起故意伤害案:2人死亡,嫌疑人已被控制

    5月29日,湖北应城市公安局发布警情通报:责任编辑:刘雯澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    具身智能的哲学反思②|闫宏秀、宋胜男:基于“认知—语言—价值”三重对齐的具身智能构建

    近期,大模型和人形机器人备受社会各界关注,很多人在思考:如何让二者有效“融合”切实推动具身智能的发展?顾名思义,具身智能是具有“身体”的人工智能。具身智能为大模型的应用提供了更广阔的平台,使之从“赛博空间”走向物理世界;具身智能让机器人变得更“聪明”,与人…

    具身智能的哲学反思⑤|李恒威、秦书渊:庄子的身心论对当代具身心智理论的启示

    近期,大模型和人形机器人备受社会各界关注,很多人在思考:如何让二者有效“融合”切实推动具身智能的发展?顾名思义,具身智能是具有“身体”的人工智能。具身智能为大模型的应用提供了更广阔的平台,使之从“赛博空间”走向物理世界;具身智能让机器人变得更“聪明”,与人…

    湖南慈利再次通报“粪水排溶洞”,称已立案调查,村民:望彻底解决

    近日,有博主发布视频称,张家界一地有人往溶洞里排污,导致宝贵的溶洞变成粪坑。视频显示,溶洞内出现黄绿色液体,视频发布者呼吁“好好查查”。溶洞排污。图/社交媒体截图5月29日,慈利县环境风险隐患调查处置工作专班对此发布情况说明称,慈利县某溶洞被污染相关视频引发社…

    火出圈后,武汉杨泗港长江大桥下“圈地收费”?城运集团回应争议

    连日来,武汉杨泗港长江大桥因陷入“圈地收费”争议,备受关注。此前开放的桥下空间不仅搭建了一家商业音乐社,甚至连江岸边的通道两侧也装上了围挡。那么,围挡是由政府搭建还是商家所为,收的到底是什么费用,此举是否合法合规?5月28日下午,大皖新闻记者现场看到,江岸边通…

    广东河源市源城区发生3.5级地震,震源深度11公里

    据中国地震台网正式测定,5月29日13时17分在广东河源市源城区发生3.5级地震,震源深度11公里,震中位于北纬23.71度,东经114.69度。基础背景附近村镇:本次地震周边5公里内的村庄有马落塘、第三村、风光村、庄田、双下、墩头村、庄田渡头村、墩头村牌坊、第五村、第四村,20公…

    再访委内瑞拉公社:从公社全民公投到食物主权斗争

    2025年5月25日,委内瑞拉选举国会议员与州长的全民投票,在美国施加“二级关税”的阴霾下进行。“二级关税”这个词,最近引起了公众的关注。二级关税是特朗普第二届政府出台的一种类似于二级制裁的新贸易政策。与针对特定国家的一级关税不同,二级关税是惩罚与目标国家进行贸易…

    “降维打击”成就大满贯,被看低的切尔西走在收复失地的路上

    从英超前五摇摇欲坠,到左手欧协联冠军,右手欧冠正赛门票,或许只需要一个星期。继上周日英超收官战力克诺丁汉森林锁定第四后,迎来赛季最后一次一周双赛的切尔西,在弗罗茨瓦夫再度展现了阵容厚度,在先丢1球的不利局面下,连入4球完成超级逆转。自此,蓝军不但终结了此前西…

    国内首个“液氧甲烷+不锈钢+海上软着陆回收”火箭成功回收

    今天凌晨,国内首个“液氧甲烷+不锈钢+海上软着陆回收”火箭“元行者一号”验证型火箭,在海阳东方航天港成功完成了首次海上飞行回收试验。“元行者一号”验证型火箭为全尺寸薄壁不锈钢火箭,直径4.2米,总高度约26.8米,起飞质量约57吨,试验飞行时长125秒,飞行高度约2.5公里…

    用下架优惠券骗补、谣言致营业额下降……今年上海侦破涉企网络犯罪140余起

    利用技术手段获取已下架优惠券后刷单骗取平台补贴;利用AI“洗稿”,杜撰涉企不实文章以博流量、涨粉丝获取广告收益……为全力打造安全有序的清朗网络空间,今年以来,上海警方深入推进“净网”“清朗”“砺剑”等专项行动。截至目前,上海公安网安部门已累计侦破涉企网络犯罪…

    美国切断部分对华半导体技术出口,涉三家公司

    派生万物AI 图据英国《金融时报》28日报道,美国政府已实质性切断了部分美国企业向中国出售半导体设计软件的渠道。报道援引知情人士称,受影响企业包括Cadence、Synopsys及Siemens EDA。上述三家公司未对置评请求作出回应。《纽约时报》随后报道称,美方还暂停了与喷气式飞机发…

    横跨沪苏浙,全国首个跨省域房建项目方厅水院是如何建成的?

    【编者按】推动长三角一体化发展,是习近平总书记亲自谋划、亲自部署、亲自推动的重大国家战略。6月初,2025年度长三角地区主要领导座谈会将在江苏南京召开。过去一年,长三角一体化取得了哪些新成果?澎湃新闻(www.thepaper.cn)走进长三角多地的“一体化地标”,深入探访各…

    DeepSeek更新了

    5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本试升级。用户可在官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528)。有网友对新版R1模型进行了测试,并表示Deepseek-…