你的AI越来越蠢?因为它学会见人下菜碟了

article/2025/9/17 7:40:07

以下文章来源于差评前沿部 ,作者江江

差评前沿部.

站在科技的前列线,关注AI、机器人等前沿科技。

大伙有没有感觉,现在各家的AI,好像越来越蠢了?

事情是这样的,前几天我心一狠,给 OpenAI 充了个200刀的会员,想着试试现在的 ChatGPT 强到啥程度了。

结果,我给他丢了个算术题,求解 5.9 = x+5.11,哥们直接给我算崩了。。

《这题真是幼儿园级别》?

堂堂200刀人工智能,还不如我20块的计算器啊?

但,我记得GPT-4刚出那会儿,我还让它算过高数啊?难道模型升级还会砍智力吗?于是我给它丢了个微寄分过去。

结果,哥们还会换元法,一通操作下来,看着还真没啥问题,评论区的大学生可以验验真假。

所以,两次算数用的都是GPT-5,咋还给我见人下菜碟?

本以为是OpenAI飘了,结果我上网一查发现,这事儿还不是 GPT 一家干的,甚至有点行业趋势的意思。

前几天美团发布的开源模型LongCat,其中就提到自己用一个路由器提高效率。

DeepSeek V3.1发布时,也说过自己一个模型可以有两种思考模式。

而同样是AI巨头的Gemini,在Gemini 2.5 flash发布时,就引入了相似的模式,让模型自己决定怎么用脑。

总的来说,大伙都在让自己的模型“该思考时再思考”,该偷懒的时候偷懒。

这么做的动机,也很好理解,那就是省钱。从OpenAI发的资料来看,通过这种“让模型自己决定要不要思考”的方式省掉的tokens还真不少,GPT5输出token数就少了50%-80%。

DeepSeek官方发的图表中也显示,新模型tokens消耗也下降了大概20%-50%。

省一半token,这是什么概念?咱普通人可能体会不到,但对OpenAI这样的大公司来说,可能就是一大笔开销。

去年央视就有报道,ChatGPT每天耗电超过50万度,在如此庞大的基数下,省出来的部分,够一个上万户家庭的小镇用上一天了。

这也难怪奥特曼在网上跟网友说,你们跟GPT说声谢谢都要花我上千万美元。之前的高级模型,一句谢谢也能让它思考几分钟,还真有点浪费在里面。

所以,AI这看题下菜的能力,到底咋练成的呢?OpenAI 没公布具体原理,但 2023 年有篇论文叫《Tryage: Real-time, Intelligent Routing of User Prompts to Large Language Models》,专门分析了这个问题。

在GPT-3.5出来那阵,大模型还不会自己调节思考能力,每个问题都能让AI无限烧脑。

为了提高效率,研究者就想出来了一种叫“感知路由器”的模块,它本质上,就是在混合模型里塞了一个小巧的语言模型。

在前期训练时,路由器就和刷题一样,对“使用哪个模型最佳”,做出自己的预测。

哪个模型适合深度研究,哪个模型适合快速思考,当然有标准答案。系统就会将这个预测分和标准答案进行比对,计算出两者间的误差。接着通过微调路由器内部的参数,来减小这个误差。

当它刷数百万道题之后,就逐渐学会怎么给你的提示词,分配合适的模型了。

当一个新提示词进来,AI内部的路由小模型就会先扫一眼,评估一下这问题配不配我动脑。因为路由器比较轻量级,所以这个评估过程几乎是瞬时的。

而除了OpenAI这法子,AI还有一种偷懒的思路,那就是把不同的token,导向不同的神经网络。

像美团的LongCat就采用了这种方法,从报告来看,他们采用了一种叫“零计算专家”的机制。

通常来说,在你输入提示词之后,你的提示词会拆分成一个又一个的tokens,交给模型内部的神经网络去处理。

但Longcat在处理之前,会先把它交给一个叫“Top-k Router”小路由器,它就像一个流水线上的调度员,在收到token的时候,会判断这个token处理起来是复杂还是简单。

同时在它的内部,有很多不同分工的神经网络,我们把它们叫做专家。

这些专家,有的喜欢做难题,有的喜欢做简单题,当然,也有摸鱼界专家。

比如“请用Python写一个快速排序”这句话,“Python”和“快速排序”就是重点,“请”和“一个”就没那么重要。

像这些没啥用的token,咱就可以丢给那些摸鱼大王了,因为它们根本不需要怎么处理。这下,你就知道“零计算专家”这个名字是怎么来的了。

这也能解释为啥大伙都在吹这个模型“太快了”。

总的来说,这种设计对模型厂商来说算好事,不仅省钱还能提升训练效率。

从用户角度讲,模型更快了,价格更便宜了。但我感觉,这玩意是把双刃剑。如果用不好,还真是实打实影响用户体验。。

记得GPT-5刚上线,这路由器就翻车了。用户发现自己怎么都调不出来它的思考模式,问什么它都懒得思考,像摆烂一般只会“啊对对对”,连“blueberry里有几个b?”都数不明白。

而且,这也算剥夺了用户的选择权。OpenAI一刀切掉了4o,搞得很多网友在网上哭诉说自己失去了一位朋友。

这又让奥特曼又暂时为Plus用户把GPT-4o端了上来,并允许Pro用户继续访问其他旧模型。

那这个操作,不就变相说明,在发布的时候,这个路由模型就没调好嘛。

咱再说LongCat,它的确很快,但在思维上限上,还是打不过其他大模型的。像我就同时给LongCat和DeepSeek丢了一个同样的问题:什么叫“但丁真不是中国人,但丁真是中国人”?

LongCat这边刷刷出答案,但没解读出来这句话的幽默感;而DeepSeek虽然慢了点,笑点解析得却很清楚。

LongCat

DeepSeek

就像我问你114*514是什么,你说当然是58596啊,算得确实很快啊,但其实我只想让你配合我搞抽象。

当然,对路由器罢工,咱也有些解决办法,那就是在提示词里加入“深度思考”“ultra think”这些字眼,路由器收到后会尽量调用更强大的模型。

不过也只能说治标不治本了,多用几次可能就叫不醒了。。

这就说明 AI 确实罢工了,咱只能等几个小时再来了。

所以说到底,方向是好的,技术是新的,但现阶段的体验也确实只是“还行”的。当然,大模型成长速度比我们想的更快,咱还能坐等更快更好的模型出世。

撰文:不咕

编辑:江江 & 面线

美编:萱萱

图片、资料来源:

LongCat、DeepSeek、Reddit、Chat GPT、央视网

部分图源网络

原标题:《你的AI越来越蠢?因为它学会见人下菜碟了。》

阅读原文

    本文为澎湃号作者或机构在上传并发布,仅代表该作者或机构观点,不代表的观点或立场,仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。


    http://news.xdnf.cn/QWhoKOOaGq

    相关文章

    明查|“批评以色列”就要被吊销护照?美国会这条议案说了啥?

    速览- 网传“美国会议案拟吊销批评以色列的美国公民的护照”的说法存在误导信息。相关议案没有包含专门针对“发表批评以色列言论”的相关条款,但拟赋予美国国务卿以“向外国恐怖组织提供物质支持相关的理由吊销或拒绝向美国公民发放护照”的权力。批评人士认为,该法案的措辞…

    解读|以色列72小时袭击6国动摇地区和平信心,阿拉伯国家构建反以“统一战线”

    据央视新闻报道,当地时间9月15日,阿拉伯-伊斯兰国家紧急峰会在卡塔尔首都多哈落幕,峰会发表公报谴责以色列袭击卡塔尔,并呼吁阿拉伯和伊斯兰国家团结一致应对共同挑战和威胁。当地时间2025年9月15日,卡塔尔多哈,2025年阿拉伯-伊斯兰国家紧急峰会现场。视觉中国 图同一天,…

    专访|马凯硕:地缘政策不求最好但求避免最糟,亚洲表现更佳

    马凯硕(Kishore Mahbubani)。视觉中国 资料图“竞争永远存在,对抗永远存在。因此,我们所有地缘政治政策的目标,不应是把我们带往天堂,而是要把我们从地狱中拯救出来。亚洲的表现相对更好。”在今年9月联合国大会召开期间,新加坡学者马凯硕(Kishore Mahbubani)接受了澎…

    曼·雷的人体小提琴又在展出了

    在20世纪20年代初,照片作为一种现代艺术形式有着怎样的可能?从家用器具到人物,艺术家曼雷将他所见的一切,都视为可以进行美学创作的对象。近日,在美国纽约大都会艺术博物馆展出的“曼雷”大展中,一系列物影摄影(Rayographs)作品讲述了他是如何“用光本身来进行创作”的…

    他是路易十三的御用画家,他的烛光曾被遗忘了数百年

    致敬“明暗对比大师”——这场刚刚在法国开幕的展览以全新视角呈现了17世纪法国画家拉图尔的画作,他笔下的烛火总是让人念念不忘。他曾是路易十三的御用画家,作品曾一度沉寂,20世纪初又再次获得关注,甚至成为电影镜头的灵感来源。澎湃新闻获悉,巴黎雅克马尔-安德烈博物馆这…

    他是个画家,但靠摄影谋生

    在20世纪20年代初,照片作为一种现代艺术形式有着怎样的可能?从家用器具到人物,艺术家曼雷将他所见的一切,都视为可以进行美学创作的对象。近日,在美国纽约大都会艺术博物馆展出的“曼雷”大展中,一系列物影摄影(Rayographs)作品讲述了他是如何“用光本身来进行创作”的…

    以方首次披露:曾在伊朗部署百名外国特工,摧毁其导弹系统

    总台记者当地时间9月16日获悉,在今年6月份以伊冲突开始时,以色列情报和特勤局(摩萨德)在伊朗部署了100名外国特工。以色列第13频道当天报道称,根据以色列摩萨德首次对外披露的消息,今年6月以伊冲突开始时,该部门在伊朗建立了一支由100名外国特工组成的“小型军队”,其任…

    美国总统特朗普抵达英国,进行国事访问

    当地时间9月16日,美国总统特朗普所乘飞机在英国降落。特朗普携夫人梅拉尼娅抵达英国,展开国事访问。这是特朗普继今年7月访问英国后,两个月内的第二次访英。根据行程安排,将有温莎城堡迎接、皇家马车游行、仪仗队检阅、皇家空军“红箭”飞行表演队表演、盛大国宴等。同时,…

    特朗普第二任期内第四度会晤,内塔尼亚胡将再访白宫

    当地时间9月16日晚间,以色列总理内塔尼亚胡表示,美国总统特朗普邀请他在纽约联合国大会上发表讲话的三天后,于9月29日到白宫与其会面。据媒体此前报道,内塔尼亚胡办公室要求举行此次会议。随后,内塔尼亚胡在当天的新闻发布会上宣布了此次会面。内塔尼亚胡当天还表示,自以…

    巴西前总统博索纳罗因身体不适被紧急送医

    巴西前总统博索纳罗(资料图)总台记者获悉,当地时间9月16日下午,巴西前总统博索纳罗因身体原因被紧急送往巴西利亚一家医院。其子、参议员弗拉维奥博索纳罗称其出现打嗝、呕吐和低血压等症状。9月11日,巴西联邦最高法院宣布,巴西前总统博索纳罗策划政变罪名成立,获刑27年…

    国际观察丨多哈紧急峰会:阿拉伯国家能否握指成拳

    新华社多哈9月16日报道,阿拉伯-伊斯兰紧急峰会15日在卡塔尔首都多哈落幕。峰会发表公报谴责以色列袭击卡塔尔,并呼吁阿拉伯和伊斯兰国家团结一致应对共同挑战和威胁。同一天,以色列把坦克开入加沙城,并借美国国务卿访以大秀“以美同盟”。中东国家专家认为,多哈峰会凸显阿…

    欧盟委员会将提出对以色列的制裁措施

    欧盟外交与安全政策高级代表卡拉斯9月16日在社交媒体发文表示,以色列对加沙的地面进攻将使本已严峻的局势更加恶化。卡拉斯称,欧盟委员会将于17日提出措施,向以色列政府施压,要求其改变对加沙战争的立场。卡拉斯还称,措施将包括暂停贸易优惠,对极端主义的部长以及暴力定居…

    普京身着军装出席俄白“西方-2025”联合军演

    当地时间9月16日,克里姆林宫新闻局发布消息称,俄罗斯总统普京身着军装出席了俄白“西方-2025”联合军演。当天,普京抵达位于下诺夫哥罗德州的穆利诺靶场,观摩“西方-2025”演习的完结阶段。普京表示,在制定演习计划中借鉴了特别军事行动的经验。普京表示,有10万名军人参加…

    联合国提交最新预算报告,拟削减15%开支和近2900个岗位

    当地时间9月16日,据央视记者了解,联合国秘书处在15日向大会提交了一份长达256页的预算报告。这份报告首次将常规预算、特别政治事务预算以及维和支助账户总部部分合并呈现。根据提案,常规预算和特别政治事务将削减超15%,即从38亿美元降至32亿美元,涉及裁撤2680个岗位,约占…

    多家电商平台现“胖东来优选”商品真假难辨,胖东来店长回应

    许昌胖东来天使城 视觉中国 资料图近日,有消费者向澎湃公众互助平台“服务湃”(https://tousu.thepaper.cn)反映,他在网购平台购物,发现一些标签含“胖东来”“胖东来优选”等关键词的商品,想买却又心存疑虑。对此,有律师向澎湃新闻指出,只要没有获得商标使用授权,无…

    一个传奇离场了,电影人缅怀罗伯特·雷德福

    当地时间9月16日,罗伯特雷德福去世的消息传出后,众多好莱坞的业内人都在社交媒体上发文怀念。罗伯特雷德福畅销书作家斯蒂芬金发文称:“罗伯特雷德福走了。他是1970年代到1980年代那个崭新且令人振奋的好莱坞的一部分。很难相信他已经89岁了。”斯蒂芬金发文缅怀雷德福。曾凭…

    光明网评论员:让消费者买到真“纯牛奶”

    对于食品等关涉民生的消费品,应该通过更为精细化的管理和强制性规定,让消费者便捷放心地购买,这同样也是国家治理体系和治理能力现代化的题中之义。农业农村部消息,自9月16日起,生产灭菌乳,即常温纯牛奶,只能以生乳为唯一原料,禁止使用复原乳。这一规定源于《食品安全国…

    养老院里的AI课堂:老人们学做动态照片,把豆包当“搭子”

    一张全家福照片里,人物突然动了起来,微笑着开口说话:“幸福美满的祖孙三代,一代比一代强。”创造这个神奇画面的是89岁的贺储兴——一位在养老院里学习AI技术的上海老兵。“我学习了许多科技知识,学会让彩色照片动起来,让照片说话,很有意思。”贺储兴老人笑着说。这位转…

    努力在“科技-产业-金融”高水平循环中发挥样板作用!龚正调研上海国投

    上海市委副书记、市长龚正今天(9月16日)在上海国有资本投资有限公司调研时指出,要深入贯彻落实习近平总书记考察上海重要讲话精神和关于国有企业改革发展的重要论述,全面贯彻市委全会精神,保持战略敏捷和战略主动,切实发挥战略资本作用,努力在“科技-产业-金融”高水平循…

    对话刘强东:民营企业不要“想太多”,企业家没有个人恩怨不要变成仇人

    “希望用米其林的标准去做外卖。”9月16日,在京东品酒会现场,京东创始人、董事局主席刘强东在接受澎湃新闻记者采访时谈到了对于京东外卖的下一步规划。刘强东表示,京东外卖将从三个方向发展:首先希望用户花25块钱,就能吃到米其林三星级厨师的外卖;其次,京东计划提供更多…