DeepSeek V3.1再更新:缓解中英文混杂,智能体输出更稳定

article/2025/9/23 10:25:25

DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。

9月22日晚间,据DeepSeek介绍,此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括:语言一致性:缓解中英文混杂、偶发异常字符等情况。在Agent(智能体)能力方面,进一步优化Code Agent与Search Agent的表现,DeepSeek-V3.1-Terminus的输出效果相比前一版本更加稳定。

目前,官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。不过,记者看到这款大模型名为Terminus,意思是“终极版”,或许这也是V3.1最后一次更新。外界观望下一次大版本更新到底是V4还是R2的到来。

在公开的基准测试成绩中,V3.1-Terminus整体较V3.1有所提升,不过其中部分分数也有下滑,不过在“人类最后考试”(Humanity’s Last Exam)基准上进步较为突出,分数从 15.9大幅提升至21.7,根据官网数据,这一成绩仅次于 Grok 4(25.4)和GPT-5(25.3),并略微超越 Gemini 2.5 Pro(21.6)。

值得注意的是,DeepSeek在中英文混杂方面的改进尤为受到欢迎。记者在社交媒体上看到,不少用户点赞:“中英文混杂问题在思考时间很长的时候确实会出现,遇到过几次,还在想这是什么问题,这下子正好给解决了。”

资深AI投资人郭涛向记者分析称,本次DeepSeek-V3.1-Terminus版本更新聚焦工程化落地与场景适配,核心突破体现在两大核心竞争提升:一方面,通过语义层降噪技术显著改善语言一致性,有效抑制中英文混杂、异常字符等干扰,提升文本生成纯净度;另一方面,深度重构Agent执行框架,针对Code Agent的语法解析精度、Search Agent的信息检索召回率进行专项优化,使智能体输出稳定性提升。

此次全渠道(App/网页/小程序/API)同步升级,展现国产大模型从算法创新向工程可靠性演进的关键跨越,标志着国产模型在复杂任务处理、多模态协同等工业化应用层面迈出重要一步,为后续垂直领域深度赋能奠定更坚实基础。

作为国产大模型的风向标,DeepSeek的动态都广泛被外界关注。

此前9月18日,梁文锋带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。

今年1月份,国产大模型公司深度求索(DeepSeek)在预印本平台arxiv公布论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,创始人梁文锋位于署名之列。

《自然》杂志指出,如此总结DeepSeek-R1带来的进步:如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。

DeepSeek的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型,并使其进行推理。DeepSeek-R1模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。

DeepSeek团队也首次对外回应“蒸馏”相关质疑。论文中表示,对于深度求索V3基础版(DeepSeek-V3-Base)的训练数据仅使用普通网页和电子书,未纳入任何合成数据,“不过,我们注意到部分网页包含大量由OpenAI模型生成的答案,这可能会让基础模型间接地从其他强大模型获取知识。但在预训练冷却阶段,我们并未刻意加入由OpenAI生成的合成数据;该阶段使用的所有数据都是通过网络爬取自然获取的。预训练数据集包含大量与数学和代码相关的内容,这表明深度求索V3基础版接触到大量的推理轨迹数据。”

今年1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1引爆AI行业,作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAIo1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。春节假期后,国内多个行业龙头公司均宣布接入DeepSeek。

伴随AI大模型行业的日新月异,DeepSeek已经更新出R1以外的新版本,但万众期待的R2尚未面世。此前8月21日DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的第一步”。

    责任编辑:孙扶
    图片编辑:乐浴峰

    http://news.xdnf.cn/fyFPYOYvSa

    相关文章

    上海迪士尼“飞越地平线”承载量将扩建约50%,扩建期间持续开放

    上海迪士尼翱翔飞跃地平线项目。 上海迪士尼供图上海迪士尼乐园热度最高的项目之一,“翱翔•飞跃地平线”将迎来扩建。9月23日,澎湃新闻(www.thepaper.cn)记者从上海迪士尼获悉,扩建后的“翱翔飞越地平线”的游客承载量将在现有基础上扩充约50%。扩建完成后,游客还将会在…

    金科地产:控股股东拟变更为京渝星筑和京渝星璨,公司无实控人,将启动董事会改选

    9月22日,*ST金科(金科地产,000656.SZ)发布关于股东权益变动暨控股股东、实际控制人拟发生变更的提示性公告。公告显示,本次权益变动系因执行重整计划所致,不触及要约收购。金科股份通过资本公积转增股本,累计转增5294365816股。转增股票不向原股东分配,其中30亿股用于引…

    业主私挖地下室导致河道被挖通,地下车库被淹?温州龙港回应:正在勘验调查

    近日,有网友在社交媒体平台上发布视频称,温州一小区业主私挖地下室,导致小区旁的河道被挖通,出现河水倒灌进地下车库,多辆汽车被积水浸泡。9月22日,温州龙港市综合执法局回应封面新闻,该局执法一队与属地城南中队正在事发小区进行现场勘验,重点调查网友反映的“违规装修…

    业主私挖地下室导致河道被挖通,地下车库被淹

    近日,有网友在社交媒体平台上发布视频称,温州一小区业主私挖地下室,导致小区旁的河道被挖通,出现河水倒灌进地下车库,多辆汽车被积水浸泡。9月22日,温州龙港市综合执法局回应封面新闻,该局执法一队与属地城南中队正在事发小区进行现场勘验,重点调查网友反映的“违规装修…

    盐城赶潮

    位于江苏省盐城市的中国海油“绿能港”项目。截至目前,项目已累计接卸784万吨液化天然气,为长三角及周边地区供应天然气超98亿立方米。 郜野/摄(中经视觉)龙源大丰海上风电项目。严正东/摄 地处黄海之滨的江苏盐城,是一片一直向海生长的土地。南边的长江,北边的淮河,穿过…

    同济大学生命科学与技术学院副院长张敬逝世,年仅57岁

    澎湃新闻记者从相关方面获悉,中国共产党党员,同济大学生命科学与技术学院党委委员、副院长、教授、博士生导师张敬同志,因病医治无效,于2025年9月21日6时43分在上海逝世,年仅57岁。张敬,女,出生于1968年3月11日,1990于东南大学医学院获学士学位,1996年于同济大学获硕士…

    当爱优腾开始比拼“长尾效应”

    撰 文丨马 良编 辑丨美 圻文娱价值官解读:ID:wenyujiazhiguan最近,一份《2025云合长尾数据分析》榜单在豆瓣各大影视小组和微博流传,统计了今年开播的剧集在热播期之后的“长尾集均”数据,也让“长尾剧”再度成为剧粉圈的热门话题。文娱价值官发现,不仅观众群体开始关注一…

    国家海洋预报台发布风暴潮红色警报和海浪红色警报

    国家海洋预报台根据《海洋灾害应急预案》发布风暴潮红色警报。受今年第18号台风“桦加沙”(超强台风级)的影响,预计:9月23日上午至24日上午,福建泉州到漳州沿海将出现40到100厘米的风暴增水,广东潮州到惠州沿海将出现90到150厘米的风暴增水,广东深圳到江门沿海将出现120…

    人流量之外,上海光影节为夜经济还带来什么?

    第二届上海国际光影节已于9月19日晚开幕,刚刚过去的周末(20日、21日),西岸梦中心的雾森灯光秀、外滩的“星星人”等吸引了大量游客,在社交媒体刷屏。这场光影盛宴的流量,为周边商圈带来了什么?9月22日晚,上海市绿化市容局景观处副处长乐嘉骅接受媒体采访时透露,19日开…

    广州、深圳回应台风前蔬菜被“抢空”:储备充足,“别担心!菜管够!”

    超强台风“桦加沙”来袭,广州、深圳部分商超出现蔬菜等物资被“抢空”现象。对此,广州、深圳两地表示,当地物资储备充足,大家按需选购,无需过度囤货。9月22日下午,在广州、深圳的部分商超、菜市场,货架上的菜等物资已销售一空。22日18时许,广州番禺区的一位居民告诉澎湃…

    超强台风桦加沙预计24日登陆广东沿海,气象部门提醒防海水倒灌

    中央气象台今早6点继续发布台风橙色预警:今年第18号台风“桦加沙”的中心今早5点位于广东省阳江市东偏南方向约750公里的南海北部海面上,中心附近最大风力有17级。预计“桦加沙”将以每小时20公里左右的速度向西偏北方向移动,将于明天在广东深圳到徐闻一带沿海登陆(强台风级…

    南昌风洞原址广场项目拟于国庆前对外开放,将与八一广场等景点串联起来

    9月22日,江西省委常委、南昌市委书记、赣江新区党工委书记李红军深入一线,调研南昌风洞原址广场项目建设情况。市委常委、市委宣传部部长李松殿,市委常委、市委秘书长赵捷,副市长江新洪参加。马悦/图南昌15英尺大口径风洞工程建于1936年,毁于1938年,地址位于老飞行场南侧…

    秋分时节,煨一碗鲜菱

    秋分时节,凉风渐生。古人称农历八月为仲秋,这两日江南天气从暑热换为凉爽。秋分在秋季九十天之中间,平分秋色。秋天是带着思念的愁绪,比如莼鲈之思。那是《世说新语》中的故事:“张季鹰辟齐王东曹掾,在洛,见秋风起,因思吴中莼菜羹﹑鲈鱼脍。”莼菜鲈鱼是好,而我的馋虫…

    二十四节气与民间艺术|一刀一刻里的秋分诗韵

    一刀一刻,一雕一琢,千百年来,秋分时节的诗意与智慧一直在文物上静静流淌。“漏钟仍夜浅,时节欲秋分。泉聒栖松鹤,风除翳月云。”唐代诗人贾岛诗中这样描述秋分时节的静谧夜景,秋分时节,“阴阳相半,故昼夜均而寒暑平”,天地万物进入平衡状态。古人将这一时节的自然景象…

    江西赣州警方:多人餐饮店深夜斗殴被采取强制措施

    原标题:《警情通报》责任编辑:王韡澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    特朗普称自闭症与泰诺有关联,美专家指责其“不负责任”

    当地时间9月22日,美国总统特朗普表示,美国食品药品监督管理局(FDA)将通知医生,孕期服用泰诺会增加儿童患自闭症的风险,并强烈建议除非有医疗需要,女性孕期应限制泰诺的使用。特朗普还表示,他认为麻腮风疫苗(MMR)应该单独接种,并建议孩子等到12岁发育成熟后再接种乙肝…

    张文宏:通过优化治疗方案,结核病短程治疗费用可降低90%以上

    未来健康:全球健康与发展论坛现场 本文图片主办方供图9月22日,2025浦江创新论坛——未来健康:全球健康与发展论坛在上海举办。国家传染病医学中心主任、复旦大学附属华山医院感染科主任张文宏在论坛上分享了国家传染病医学中心团队在中国结核病高发地区的实践成果:通过优化…

    美国对参加联合国大会的伊朗代表团实施出行限制

    当地时间22日,美国国务院表示,美国对参加在纽约举行的联合国大会的伊朗代表团实施严格出行限制,并限制其进入批发商店购物和购买奢侈品。声明称,美国国务卿鲁比奥下令,将伊朗代表团限制在往返联合国总部区域进行联合国公务所需的“严格必要区域”。据悉,鲁比奥下令,伊朗…

    特朗普签署命令,将美国左翼激进势力“反法西斯主义运动”列为恐怖组织

    资料图白宫当地时间22日称,美国总统特朗普签署命令,正式将该国左翼激进势力“反法西斯主义运动”(ANTIFA)列为国内“恐怖组织”。此前,在查理柯克遇刺后,特朗普承诺将针对左翼团体采取行动。ANTIFA并非统一组织,而是由一些左翼和无政府主义团体组成的松散网络,主要反对…

    银川一国家级城市湿地公园被指“水泥封树坑”,当地自然资源局回应

    近日,有网友在社交平台发布视频称,在宁夏回族自治区银川市宝湖国家城市湿地公园停车场内,不少树木根部上方的树坑存在被水泥封盖现象,网友质疑此举影响树木存活,此事引发关注。9月22日下午,银川市金凤区自然资源局就此事回应记者称,此事系该公园管理公司所为,已进行清理…