梁文锋等来及时雨

article/2025/7/16 7:13:11

原创 赵晋杰 字母榜

被梁文锋靠着DeepSeek抢走风头近180天后,杨植麟正借助Kimi更新试图卷土重来。

近期,Kimi K2新模型发布后,引来外部试用高潮。Perplexity CEO阿拉温德发文称,内部将很快用K2进行后训练,以对外提供服务。此前DeepSeek R1上市后,也被第一时间引入Perplexity。

试图通过模型更新从DeepSeek手中抢回注意力的不止Kimi一家。据字母榜(ID:wujicaijing)获悉,7月底,“AI六小龙”中的阶跃星辰、智谱AI,都将发布自研的新一代基础大模型,科大讯飞也将赶在月底推出自家全新模型。

当一众大模型玩家都在比拼模型更新和产品体验之际,迟迟没有大动作的DeepSeek,不出意外迎来了自身流量和产品使用率的下滑。

DeepSeek自1月以来的爆发式增长,仅持续了2个月时间。从4月份开始,DeepSeek月活跃用户数便掉头向下。QuestMobile数据显示,截至5月份,DeepSeek月活跃用户规模为1.69亿,环比下滑5.1%。

随着月活用户规模下降,DeepSeek的下载量排名也急速下坠。曾经一度在中美两地的苹果App Store 免费应用下载榜上夺冠的DeepSeek,如今已经被挤到了30名开外。

来自SemiAnalysis半导体研究机构的一份报告,更是直观展现了DeepSeek在用户使用率方面的下降态势——从年初7.5%的峰值,回落至5月底的3%,官网访问量也同期下降了29%。

梁文锋并非没有准备。早在2月份,媒体就曾爆料,DeepSeek内部正在加速推出R2模型,该模型原计划在5月初发布,但现在官方希望能尽早发布。

但直到7月中旬,R2模型仍迟迟未见。

年初R1模型爆火后,梁文锋的低成本大模型训练方法,还意外带火了H20芯片在国内的需求。

自2023年以来,H20芯片是英伟达可合法出口至中国的最强AI芯片。但在DeepSeek影响之下,4月份,美国对其实施新的出口管制许可,其被禁止卖入中国市场。

如今,上述禁令终于迎来转机。7月15日,在黄仁勋年内第三次访华之际,英伟达官方公告,公司正在提交重新销售H20芯片的申请,且美国政府已向英伟达保证将授予许可证,接下来,公司将尽快启动交付程序。

面对被同行抢跑的竞争格局,高端算力遇阻的梁文锋,意外等来了黄仁勋送来的一场及时雨。

R1发布近半年来,动作寥寥的DeepSeek,不可避免陷入不进则退的现实困境之中。

在国内其他大模型玩家卯足劲头追平乃至超过DeepSeek模型性能之际,梁文锋只是带领团队出着一些小招式,如DeepSeek V3模型完成小版本升级,上线新版本DeepSeek-V3-0324,随后又更新了以DeepSeek-V3为基础模型微调而来的DeepSeek-Prover-V2——一款数学定理证明模型。

最近的一次动作还要数5月底完成的DeepSeek R1小版本升级。但值得注意的是,DeepSeek-R1-0528仍然使用的是2024年12月所发布的DeepSeek V3 Base模型微调而来,并非基于新一代的V4模型。

官方介绍中,DeepSeek-R1-0528更多是在后训练过程中投入了更多算力,以此来提升模型的思维深度与推理能力,其在数学、编程等方面的整体表现,逼近OpenAI o3与谷歌 Gemini-2.5-Pro等国际顶尖模型。

但缺乏大版本升级,只是在小版本上修修补补的DeepSeek,遭遇的直观后果之一便是,外界给其贴上的性价比标签,正在一点点被重新撕下。

一贯以性价比开道的DeepSeek,在过去近半年内,正在被阿里、字节、百度等科技大厂夺走自身的性价比标签,科技大厂纷纷推出了API价格更低的同类模型。

百度创始人李彦宏更是贴脸开大,吐槽DeepSeek除了没有多模态之外,使用起来还慢且贵,“中国市场上绝大多数的大模型API调用价格都比DeepSeek满血版要低,而且速度也更快。”

现在,蓄足实力的“AI六小龙”们,通过新的模型更新,也开始在性能和价格上纷纷挑战起DeepSeek的性价比。

7月份新上线的Kimi K2模型,同样选择了开源,并成为国内开源领域首个总参数量达到1万亿的MoE架构基础模型。

官方介绍,在SWE Bench Verified、Tau2、AceBench等一系列基准性能测试中,Kimi K2 均取得开源模型中的SOTA成绩,在DeepSeek擅长的代码、数学推理任务上实现了反超。

价格上,Kimi K2每百万输入tokens收费4元,每百万输出tokens收费16元,对齐了DeepSeek在标准时段(8点半到夜间12点半)的API价格体系。

Kimi之外,6月中旬更新的MiniMax-M1模型,号称世界上第一个开源的大规模混合架构推理模型,其号称整个强化学习阶段只用到512块H800三周的时间,租赁成本只有53.47万美金。对比DeepSeek,其V3模型训练是在2048块H800上实现的,总花费约为557万美元。

摸着DeepSeek过河的一众国产大模型玩家,纷纷在模型性价比上完成了抢跑。对比国外的OpenAI,尽管各家也都在推出各类平替模型,但OpenAI的总调用量依然保持稳定的秘诀,主要在于其在基础模型能力上依然保持着行业头部的水平,始终领先着竞争对手将近一代的差距。

相比之下,DeepSeek爆火出圈的R1,也只是做到了比肩o1的水平,而非彻底超越OpenAI的存在。所以,这也能部分解释为什么短短半年内,DeepSeek官方应用和管网流量就相继迎来了下跌,而ChatGPT却依然维持稳定增长。

不过,需要注意的是,尽管DeepSeek自身流量在下滑,但在第三方平台,R1和V3模型的总使用量仍在持续快速增长。SemiAnalysis给出的数据显示,第三方平台托管的 R1 与 V3 使用量,自R1发布以来已增长近 20 倍。

之所以会造成上述反差局面,SemiAnalysis认为DeepSeek更多是败在了Token经济学上。

虽然外界一般都以每百万 tokens的价格来衡量各个模型的性价比,但这一方法并不总是有效或合理,“因为这忽略了具体工作负载和用户需求。”SemiAnalysis分析师指出。

包括延迟(模型生成首个 token 所需时间)、吞吐率(每个token的生成速度)、上下文窗口等因素的差异,都会对最终的token消耗成本产生直接影响。

典型如 DeepSeek 为了在推理资源有限的情况下提供便宜模型,其上下文窗口严格控制在了64K,是一众主要模型提供商中最小的之一。

与之对比,近期更新的Kimi K2,支持最长128K上下文。更早之前更新的MiniMax-M1,更是支持业内最高的100万上下文输入,是DeepSeek R1的8倍。

当然,这更多是 DeepSeek主动选择的结果。在一众大模型玩家中,梁文锋不仅主动选择了开源,且还直接表现出了对C端应用毫不在意的商业考量。追求并实现AGI,才是梁文锋视野中的头等大事。

但DeepSeek终究不是一家慈善机构,梁文锋尽管追求模型开源,他最终想要的也是借助开源生态实现预期的商业化。

基于此,维持开发者群体的活跃,和自家产品的用户使用率,不仅必要,而且对大模型玩家来说更是多多益善。

如何重新激活外界对DeepSeek的兴趣,最直接的解决办法,无疑便是尽快推出新模型V4和R2。

这方面,奥特曼已经为梁文锋做了最佳现身说法。在DeepSeek抢走行业热度后,奥特曼几乎以每周都有新产品的更新频率,让OpenAI牢牢定在了AI热搜榜上:在模型侧推出了GPT 4.5、o3-mini/o4、GPT 4.1;在产品侧上线了Operator、Deep Research、Codex;在体验侧,学习DeepSeek开放思维链,并主导了吉卜力风格图片的流行。

上述动作背后,都藏着奥特曼对OpenAI模型调用度规模的追求。全球最大的大模型整合应用平台Poe,在此前发布的《2025年春季人工智能模型使用趋势》报告中指出,OpenAI的GPT-4.1系列发布后几周内,份额迅速增加到了约10%,位列第一。对比DeepSeek,其R1模型使用率,已从2月中旬的峰值7%下降到了4月底的3%,整体使用率下降超过50%。

在通用Agent大爆发的当下,除了推出新模型之外,梁文锋或许还该考虑如何补上模型调用工具的能力短板,以满足更多AI开发者的新需求。

晚点LatePost 就曾爆料称,字节扣子团队开发扣子空间时,他们曾考虑优先使用DeepSeek-R1,但测试后发现其调用工具的能力不太理想,最终还是用了自家的豆包模型。

环比市面上主流的AI助手类应用,DeepSeek是唯一暂不支持多模态功能的产品。1月15日应用上线至今,6个月过去,如语音对话、图片生成、音乐生成、视频生成等,DeepSeek仍未提供支持服务。

作为通向AGI重要途径的多模态,其重要性正随着Agent生态的发展日益凸显。如果梁文锋再不向外界亮大招,其还将迎接更加现实的竞争挑战,即可能会将更多模型调用需求推向对手。

毕竟,现实环境中,从MiniMax到Kimi,其在最新更新的模型中,无一例外都强调了调用工具来构建Agent的特性。

借助R1开启深度思考浪潮后,梁文锋还能为Agent时代创造出新的惊喜吗?

欢迎在评论区留言~

原标题:《梁文锋等来及时雨》

阅读原文

    本文为澎湃号作者或机构在上传并发布,仅代表该作者或机构观点,不代表的观点或立场,仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。


    http://news.xdnf.cn/CcPbgUgDWm

    相关文章

    AI有味觉了:分辨可乐和咖啡,只需“尝一尝”丨Nature

    时令 发自 凹非寺 量子位 | 公众号 QbitAI AI现在有味觉了! 近日,科学家研发出一种人工味觉系统,不仅感知酸、甜、苦、咸准确率高达90%,甚至能分辨可乐和咖啡。 相关研究已发表于《美国国家科学院院刊》(PNAS),并作为新闻报道登上了《Nature》官网。这是一种基于石墨…

    从换乘到二搭,长剧为何陷入熟面孔循环

    原创 GuDuo骨朵编辑部 骨朵网络影视 文|李蛋 从开播前的摩拳擦掌到上线后的热搜刷屏,赵今麦与张凌赫二搭的《樱桃琥珀》是否能播成爆款暂且不论,但是“牛麦”CP的再续前缘,绝对是极具吸睛的卖点之一。而这种既熟悉又新鲜的二搭模式,实则预示着长剧市场的另一种新风向:前…

    美国及盟友将8月底定为与伊朗达成核协议的最后期限

    当地时间7月15日,央视记者获悉,美国及其盟友一致认为,如果8月底前美伊未能就伊核问题达成协议,伊朗将面临严厉制裁。责任编辑:王晓峰澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    泰国总理佩通坦向宪法法院申请延期提交“录音门”案申辩材料

    7月15日,泰国总理秘书长彭民勒素里亚德透露,总理佩通坦钦那瓦已向宪法法院申请延期提交“录音门”案申辩材料15天,理由是在此前法院规定的15天期限内无法完成全部申辩材料的准备工作。彭民表示,此类延长期限的申请属于被诉人依法享有的权利,是法律程序中的正常行为,是否批…

    特朗普宣布对印尼征收19%关税

    当地时间7月15日,美国总统特朗普在社交媒体平台上发文称,刚刚与印尼达成了一项对各方来说都很棒的协议。根据协议,印尼承诺购买价值150亿美元的美国能源产品、45亿美元的美国农产品以及50架波音飞机。美国牧场主、农民和渔民将首次完全进入印尼市场。此外,印尼将对所有出口…

    特朗普:乌克兰不应将莫斯科作为打击目标

    当地时间2025年7月15日,美国华盛顿,美国总统特朗普在白宫南草坪回答媒体提问。视觉中国 图新华社华盛顿7月15日消息,美国总统特朗普15日在白宫南草坪接受媒体记者采访时说,乌克兰不应将俄罗斯首都莫斯科作为打击目标。此前,有报道称特朗普曾鼓动乌总统泽连斯基用远程武器袭…

    特朗普称与印尼达成贸易协议

    当地时间7月15日,美国商务部长卢特尼克称,美国商品在印尼不会被征收关税,而印尼输美商品则需缴纳关税。卢特尼克没有透露税率以及两国之间协议的细节。当天早些时候,美国总统特朗普在社交媒体平台上发文称,刚刚与印尼达成了一项对各方来说都很棒的协议。当地时间7月7日,特…

    特朗普称与印尼达成贸易协议,美商务部长称印尼输美商品需缴纳关税

    当地时间7月15日,美国商务部长卢特尼克称,美国商品在印尼不会被征收关税,而印尼输美商品则需缴纳关税。卢特尼克没有透露税率以及两国之间协议的细节。当天早些时候,美国总统特朗普在社交媒体平台上发文称,刚刚与印尼达成了一项对各方来说都很棒的协议。当地时间7月7日,特…

    上海合作组织成员国外长理事会会议在天津举行

    2025年7月15日,中共中央政治局委员、外交部长王毅在天津主持上海合作组织成员国外长理事会会议。白俄罗斯外长雷任科夫、印度外长苏杰生、伊朗外长阿拉格齐、哈萨克斯坦副总理兼外长努尔特列乌、吉尔吉斯斯坦外长库鲁巴耶夫、巴基斯坦副总理兼外长达尔、俄罗斯外长拉夫罗夫、塔…

    美国智库披露美打击伊核设施背后隐情

    上个月,美军对伊朗的三处核设施发动袭击,引发伊朗的报复和多方强烈谴责。美国一家智库近期发表一篇文章,披露了该事件背后的一些隐情。美智库披露军火商如何推动美国与伊朗开战美国智库昆西治国方略研究所近期发表一篇文章,题为《军火商如何推动特朗普与伊朗开战》。文章说…

    长沙警方通报记者采访设备被摔毁:已刑拘涉事男子

    责任编辑:王晓峰澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    长沙警方通报男子摔毁记者设备:已刑拘

    责任编辑:王晓峰澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    长沙警方通报记者设备被摔毁

    责任编辑:王晓峰澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    警方通报记者设备被摔毁

    责任编辑:王晓峰澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    媒体:古镇村民引导游客逃票,尴尬了谁?

    景区有运营成本,要求所有景区都免费开放还不现实,但景区不能一味在门票上做文章。适当让利,吸引更多游客光顾,才能更有前景。瑶里古镇。视觉中国 图“本村村民反对强制收费,建议游客绕行,从别的路进入古镇。”据报道,近日,江西景德镇市浮梁县瑶里古镇景区,运营方因门票…

    2026年冬奥会和冬残奥会奖牌发布

    新华社罗马7月15日消息,15日,2026年米兰-科尔蒂纳冬奥会和冬残奥会奖牌在意大利威尼斯的威尼托大区政府总部正式发布。 ​​​责任编辑:王晓峰澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    “九天揽月——中国探月工程20年”展览在上海世博会博物馆举办

    澎湃新闻(www.thepaper.cn)从国家航天局获悉,7月15日,由国家航天局探月与航天工程中心和上海世博会博物馆共同主办的“九天揽月——中国探月工程20年”展览在世博会博物馆对公众展出。图左一:载回月球样品的嫦娥五号返回器。本文图片均为“世博会博物馆”微信公号 图展览现…

    西藏60载辉煌变迁有哪些?近百名记者将赴7地市采访报道

    7月15日,由中央宣传部、中央统战部组织开展的“辉煌60载 魅力新西藏”集中采访活动正式启动。接下来的十天里,中央主要媒体和部分省市媒体30家单位的近百名记者将分3条线路赴西藏七地市开展采访报道。启动仪式现场。“西藏卫视+”微信公号 图西藏自治区党委宣传部常务副部长、…

    金价上涨叠加产能扩张,黄金矿企上半年业绩集体预喜:最高预增141%

    尽管黄金市场近期跌宕起伏,但黄金矿企在今年上半年已是赚得盆满钵满。国内黄金企业近日密集发布2025年上半年业绩预告。中金黄金(600489.SH)预计今年上半年实现归属于母公司所有者的净利润为26.14亿元-28.75亿元,与上年同期相比(同比)将增加8.71亿元-11.33亿元,同比增加…

    跟着VR触摸记忆,走进95岁上海音乐厅的前世今生

    《寻找秘谱:穿越上海1930》(01:40)上海音乐厅原名南京大戏院,始建于1930年,1959年更名为上海音乐厅,是全国第一座专业音乐厅。1930年的南京大戏院长什么样?上海音乐厅借助VR技术,带领观众穿越到过去,触摸95年前的记忆。7月18日-8月31日,沉浸声VR体验《寻找秘谱:穿越上…