迈向智能体时代的第一步!DeepSeek V3.1发布,上下文扩展至128K,影响有多大?

article/2026/2/7 11:52:43

国产大模型公司深度求索旗下DeepSeek低调上新,多领域能力提升。

8月21日下午,DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的第一步”。8月20日晚间,DeepSeek低调上线DeepSeek V3.1,此次升级推出的新功能引发广泛关注,V3.1已在HuggingFace趋势榜排名第三。

据介绍,V3.1包含三大主要变化。首先,V3.1采用混合推理架构,一个模型同时支持思考模式与非思考模式;其次,V3.1具有更高的思考效率,相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;另外,V3.1具有更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

在技术架构层面,V3.1继承了DeepSeekV3系列的关键技术,包括MLA、MoE等,参数量与V3版本相同。

DeepSeekV3.1最引人注目的升级之一是将上下文窗口从原有的64k扩展至128k,意味着其可以处理更长篇幅的文档和代码,并在回答内容上进一步增加信息,提供更多细节,语气更为活泼。

从官方APP和网页端的显示来看,DeepSeek去掉了“深度思考(R1)”中的“R1”标识。同时,与V3-base相比,DeepSeekV3.1新增了四个特殊Token。虽然目前DeepSeek官方尚未发布任何关于这一改动的消息,有推测认为,这可能暗示着推理模型R系列与非推理模型V系列的融合,以此实现GPU资源复用。

同时,V3.1在编程任务中表现突出。根据社区使用Aider测试数据,V3.1在AiderPolyglot多语言编程测试中,拿下了71.6%的高分,超越了Claude4Opus和DeepSeekR1等模型。在SVGBench基准测试中,其实力仅次于GPT-4.1-mini,远超DeepSeekR1。

DeepSeek方面表示,V3.1在多项搜索评测指标上也取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1 性能已大幅领先 R1-0528。

在多语言支持方面,V3.1也进行了明显的能力优化,目前能处理超过100种语言,尤其优化了亚洲语言和资源较少语种的运用。

此外,V3.1在Token使用量方面较0324版本下降约13%,每次完整编程任务仅需1.01美元,成本仅为专有系统的六十分之一,具有节约成本的优势。

值得注意的是,DeepSeek也宣布,9月6日凌晨起,对DeepSeek开放平台 API 接口调用价格进行调整并取消夜间时段优惠。输入:0.5元/百万tokens(缓存命中),4元/百万tokens(缓存未命中);输出:12元/百万tokens。今年2月,DeepSeek曾经宣布,北京时间每日 00:30 至 08:30 的夜间空闲时段,DeepSeek开放平台推出错峰优惠活动。在此期间,API 调用价格大幅下调:DeepSeek-V3 降至原价的 50%,DeepSeek-R1 更低至 25%。V3标准时间段收费为:输入:0.5元/百万tokens(缓存命中),2元/百万tokens(缓存未命中);输出:8元/百万tokens。

DeepSeek新模型一经推出,便在技术社区拥有超高人气和受关注度,一举冲到HuggingFace趋势榜第三。

不过,虽然V3.1在多个方面有进步,但部分功能体验也受到网友诟病。多名测试者反馈,V3.1在数学推理、逻辑分析等综合推理任务中无明显进步,甚至在部分场景下表现不及旧版,也未看到“幻觉”问题的改善迹象,还出现了“中英文混杂”的新问题。在一些特定领域,如研究生级基准问答、软件工程的某些复杂场景中,与顶尖模型如GPT-5相比仍有一定差距。

在其他大模型方面,市场竞争依然激烈,动作频出。OpenAI筹划万亿级AI基建、Meta计划再次重组其AI业务、智谱发布手机AgentAutoGLM2.0……根据ArtificialAnalysis最新大模型排名榜单,DeepSeek已从昔日“领跑”变为“中游”水平,OpenAI、Google、阿里巴巴等竞争对手跃至前位。

虽然自DeepSeek-R1推理大模型发布后,圈内始终对DeepSeek保持高度关注,期待其继续成为国产“黑马”,但其长期的“沉默”,也确实带来了用户的流失,QuestMobile在《2025年二季度AI应用价值榜》中提到,DeepSeek月均下载量从第一季度的8111.3万猛降至2258.9万,下滑超过70%。活跃用户规模方面,从2025年3月的1936.1万降至6月的1629.5万,下滑趋势明显。

近日,有市场传言称,DeepSeek R2有望在8月15日至30日期间发布。8月13日,DeepSeek内部人士向记者表示,上述消息不属实。

尽管官方流量下滑,但DeepSeek仍有市场潜力,其开源模型被腾讯、字节跳动、阿里、百度等众多第三方平台广泛接入,据估算有超过70%的DeepSeek模型调用量发生在这些第三方平台。Token消耗量上,DeepSeek系列7月31日单日总Token用量达到70.5B,6月29日单日总Token用量达到54B,环比增长接近31%。

第三方机构onelittleweb分析显示,就其全球市场表现而言,DeepSeek模型以3.96%的市场份额在全球AI聊天机器人中综合评分排名第五,年度访问量达27.4亿次。

    责任编辑:郑景昕
    图片编辑:施佳慧
    校对:张艳

    http://news.xdnf.cn/LxPSyeYgRI

    相关文章

    秦洪看盘|高位股急跌,或推动A股风格转换

    李晶昀 AI图周四A股市场出现了冲高受阻的态势。其中,近期表现活跃的高位股相继回落,市场近期热门主线也随之走低,如此就抑制了跟风资金的追涨意愿。故,小盘股以及科技成长股集中的北证50指数、科创100指数的跌幅较大。不过,大市值金融股继续高歌猛进,说明热钱交易意愿虽降…

    云南一男子凌晨逼问妻子“是否出轨”并施暴,被警方行拘4日

    张芳称这是此前被丈夫家暴后的照片 本文图均为 受访者 供图“我要起诉离婚,他家暴过我很多次,已经忍无可忍了。”据云南文山西畴县36岁女子张芳(化名)讲述,8月17日凌晨,她与朋友聚餐后归家,酒后的丈夫王某逼问其是否出轨,在她否认后对方情绪失控,用拳头顶其脑门并将其…

    “一城一塔一河”间,全球青年用数字创意唤醒南京城市记忆

    坐落于城市之中的历史遗迹,如何与当下城市交融共生,继续发挥文化影响力?8月,“永不消失的遗产2025”全球创客大赛在南京大报恩寺遗址博物馆举行。这场以南京为起点、连接全球的创客竞赛,自2024年开启首届赛事以来,致力于通过跨文化合作与数字创意,邀请青年创客共同探索文…

    泽连斯基:成功试射“火烈鸟”远程导弹,飞行距离超3000公里

    当地时间2025年8月14日,乌克兰,展出“火烈鸟”导弹。视觉中国 图据乌克兰国际文传电讯社21日报道,乌总统泽连斯基表示,乌克兰已成功试射“火烈鸟”远程导弹,该导弹飞行距离超过3000公里,是“目前乌克兰拥有的最成功的导弹”。责任编辑:陈建慧图片编辑:李晶昀澎湃新闻报…

    甘肃警方再通报“越野车逼停摩托”:越野车驾驶员被罚200记3分

    8月21日,甘肃卓尼县公安局再通报“越野车超车逼停摩托”:责任编辑:陈建慧图片编辑:李晶昀澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    闯出一条煤城转型发展突围之路:鹤岗新时代城市治理实践探索与创新启示

    鹤岗,百年煤城。当“资源诅咒”来临时,一度深陷矿业经济凋敝、矿山千疮百孔、矿城残破不堪、矿工生活艰难的“四矿”困局,步入收缩型城市行列。在新时代东北振兴开启新程的大背景下,一些网友以“房子白菜价”开始唱衰这座城市,抹黑本来举步维艰的资源型地区。面对“无煤活…

    法国博主在12天极限挑战直播中死亡,官员不满平台监管不力

    一名热门主播在12天的直播过程中死亡,在法国引发热议。据环球网援引多家媒体报道,法国视频博主拉斐尔格拉文(Raphal Graven)当地时间18日在直播中死亡,据称他死前遭受了长时间的折磨和睡眠剥夺。法国视频博主拉斐尔格拉文现年46岁的格拉文是法国Kick平台上最知名的流媒体主…

    梁廷波再度入围中科院院士增选有效候选人名单,系施一公推荐

    中国科学院、中国工程院8月20日公布2025年院士增选有效候选人名单,中国科学院院士增选有效候选人639人,中国工程院院士增选有效候选人660人。后续将进行外部同行专家评选、院士增选大会选举,选出新增选院士。澎湃新闻记者注意到,浙江大学医学院附属第一医院院长梁廷波入围中…

    关于俄乌领导人会晤地点,泽连斯基给出三个选项

    总台记者当地时间21日获悉,乌克兰总统泽连斯基在20日与记者的见面会上表示,关于乌克兰与俄罗斯举行会晤的可能地点,乌方认为会晤地点应选择中立欧洲国家,如瑞士或奥地利,也不排除土耳其。但莫斯科不可接受,布达佩斯目前也不现实。泽连斯基重申,乌克兰不会在法律上承认俄…

    “80后”陆朝阳成中国工程院院士增选有效候选人,曾被称为“量子鬼才”

    8月20日,中国科学院、中国工程院公布2025年院士增选有效候选人名单。澎湃新闻(www.thepaper.cn)记者注意到,一度被誉为“量子鬼才”的中国科学技术大学上海研究院执行院长、上海量子科学研究中心副主任陆朝阳,出现在中国工程院院士增选有效候选人名单之中。陆朝阳陆朝阳出…

    广东惠州警方通报女子大闹麦当劳:因纠纷辱骂拍打他人,行拘5日

    广东省惠州市公安局惠城区分局发布警情通报:责任编辑:陈建慧图片编辑:施佳慧澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    跳远临考受伤后换文化课赛道圆梦清华的女生:韧带会断裂,但意志不会

    8月20日,清华大学2025级本科新生开学报到。在这一批新生中,来自四川的女生苟曾妮的圆梦清华之旅显得颇具戏剧性。苟曾妮高中时定下的目标是:借助自己在田径跳远方面的特长,走“普通高校高水平运动队招生”赛道进清北,读法学专业。然而,作为高水平运动队考生的苟曾妮,在今…

    一换季就涕泪齐飞?专家支招破解“敏感季”

    参考文献: [1]周三女,刘丽清,吴先辉,田妍基,潘斌.生鲜焯煮及不同采摘期马齿苋中草酸的含量差异[J].农产品加工,2016(23) :52-54.DOI:10.16693/j.cnki.1671-9646(X).2016. 12.014.[2]赵学志,徐惠,张俊倩,等.栽培型和野生型马齿苋茎叶营养成分分析[J].农产品加工,2021,(08):43-…

    广东惠州警方:女子就餐时因纠纷辱骂、拍打他人,被行拘5日

    广东省惠州市公安局惠城区分局发布警情通报:责任编辑:陈建慧图片编辑:施佳慧澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    国话重排萨特《死无葬身之地》,直面人性真实

    发布会宣传片: 28年间先后四个版本,三代艺术家共塑经典(03:01)8月20日,中国国家话剧院重排大戏《死无葬身之地》在北京举行新闻发布会。该剧将于9月2日至7日登上国家话剧院剧场,向始终追求永不妥协的自由意志与世界和平的人们献上诚挚礼赞。总导演查明哲携海清、邢佳栋、查…

    人民币对美元中间价创9个月新高,即期汇率盘中升破7.17

    人民币对美元中间价升至9个多月新高。8月21日,人民币对美元即期汇率一度升破7.17关口,最高升至7.1682。中间价方面,8月21日,人民币对美元中间价报7.1287,调升97个基点,创2024年11月7日以来新高。8月15日发布的《2025年第二季度中国货币政策执行报告》在阐述下一阶段货币政…

    “上海有降雪”? 假的!涉事自然人传播主体被立案查处并行政处罚

    近日,“上海有降雪”等虚假天气信息在互联网传播,引发社会关注。上海市气象部门与市公安部门迅速联动,依法处置相关案件。市公安部门已对涉事自然人传播主体立案查处并作出行政处罚,及时遏制虚假气象信息扩散,有效降低了对公共秩序的潜在风险。今年以来,上海市气象部门持…

    799美元起!谷歌发布Pixel 10系列新手机,AI功能升级后能否挑战三星苹果们?

    谷歌在手机领域发力,试图利用AI(人工智能)增强对苹果的竞争力。当地时间8月20日,谷歌在年度硬件发布会上,宣布推出最新的Pixel系列智能手机,重点介绍了AI助手Gemini与手机的结合。Pixel 10系列包含多个型号,拥有更强大的摄像头、更轻薄的重量以及更多可选配色,各款均于…

    宇航员当摄影师,中国首部8K拍摄太空电影9月5日公映

    中国首部8K拍摄太空电影《窗外是蓝星》将于9月5日全国上映。影片主要画面由神舟十三号航天员翟志刚、王亚平、叶光富在中国空间站拍摄,中央广播电视总台影视剧纪录片中心导演朱翌冉执导,故事以神舟十三号飞行乘组首次执行在轨驻留6个月任务为蓝本,向观众呈现一场充满中国式太…

    首映|电影《再见,坏蛋》:说最狠的话,做最暖的事

    由俞钟编剧、导演,陈明昊、陈宇喆、陶慧主演的电影《再见,坏蛋》即将于8月22日上映。8月20日,影片主创团队来上海,与观众近距离分享影片背后的创作故事。观众被“幸福里”的烟火气与小人物的善意深深打动。虽然这是一个发生在武汉的故事,但人间烟火气是共通的。《再见,坏…