特斯拉AI前成员卡帕西给Agent泼冷水:真正成熟还需十年

article/2025/10/20 14:36:21

2025年被称为智能体Agent之年,当行业的热潮席卷全球之际,OpenAI创始成员、特斯拉前AI总监安德烈·卡帕西(Andrej Karpathy)近日在接受播客节目“Dwarkesh Patel Show”采访时给这股热潮泼下一盆冷水,他直言,当前AI Agent技术尚处早期,还存在“无法持续学习、非真正的多模态、不能自如操作电脑”等核心缺陷,要实现真正的实用化还需要十年左右。

OpenAI创始成员、特斯拉前AI总监安德烈·卡帕西(Andrej Karpathy)近日在接受播客节目采访。

AGI为何还需要十年

卡帕西认为,尽管当前大语言模型展现出令人惊叹的能力,但Agent真正能够使用的标志是它成为一个员工或实习生,人类愿意雇佣它和自己一起干活、工作。显然,Agent当前还做不到这一步。

原因在于Agent还存在三大核心缺陷:无法持续学习、非真正的多模态、不能自如操作电脑。现在的AI无法记住和用户的每一次互动,当关掉对话窗口后,它就会忘掉。它无法像人类一样,通过日常经历持续学习巩固。

AI虽然能看图写字,但无法真正理解并完成复杂任务。卡帕西举例,AI能写代码,但无法制作一张精美的PPT,因为超出了本质是文本处理器的能力范围。同时,AI操作电脑、点击软件的能力还非常初级和不可靠。

卡帕西借用其在特斯拉开发自动驾驶的经验提出,从“演示”到“产品”有着巨大的鸿沟,“这是一场向数字‘9’的进军,一个在90%的情况下能工作的演示达成了第一个9,但要达到99.99999%的可靠性,还有更多的‘9’需要走。这就是为什么这些事情要花这么长时间。”

强化学习很糟糕

谈及强化学习(Reinforcement Learning),卡帕西直言,“强化学习很糟糕,只是碰巧之前的其他方法更糟糕。”

在强化学习中,试图找到一个问题的解决方案,AI可能会进行数百种不同的尝试。“就像做选择题,它蒙了100次,只有最后1次对了,但它会把整个蒙题过程都当成‘正确经验’,这种学习方式存在严重的效率问题。而⼈类永远不会这样做。”其中的原因是第一,现实世界⼈类不会进行数百次试运行;第二,当人类找到解决⽅案时,会有⼀个相当复杂的反思复盘过程。

另一个深层问题是模型坍塌(model collapse)。模型生成的内容多样性会悄然减少,分布范围变窄,即使单个输出看起来仍然合理。卡帕西举例,你可以让 ChatGPT讲个笑话,但它反复输出的可能只是少数几个模式化的笑话。这一特性阻碍了AI实现持续学习,而如果让AI使用自己产出的数据,就会导致模型在自有数据上产生更加同质化的内容,陷入恶性循坏。

虽然人类也会存在类似的思维定式,但可以通过交流、阅读等方式来对抗这一趋势。儿童之所以是高效的学习者,正因为他们不擅长记忆,反而被迫去发现通用模式。当前AI缺乏这种主动寻求并整合多样性的内在机制,必须依赖人类产生的真实数据,这是个很大的瓶颈。

但卡帕西同时也深刻认识到,强化学习仍是当前AI发展道路上不可或缺的一环。原因在于,传统的监督学习(Supervised Learning)存在明显的天花板。监督学习严重依赖大量、高质量的标注数据。但对于“好代码”、“好决策”这类无法明确定义、无法通过标注数据学习的概念,只能通过设计一个奖励函数来让模型自己摸索什么是“好”。这正是强化学习的应用场景。

AGI的渐进式路径

卡帕西坚持AGI的早期定义——能执行任何具有经济价值任务的人类水平系统。但目前AI的实际影响仍有限,其应用高度集中在编码等高度结构化、文本驱动的领域。“人们把物理的东西都拿走了,只是在讨论数字知识工作,这是一个相当重大的让步。原始定义是人类可以做的任何任务,包括举起一件东西。”

与很多人对AGI“奇点”时刻的想象不同,卡帕西认为,AGI不会在某一天突然降临并引爆智能爆炸,而是会像蒸汽机、电力和互联网等历史上的通用技术一样,缓慢地融入并延续过去2.5个世纪来约2%的年度GDP增长趋势。

卡帕西一直试图在GDP(Gross Domestic Product,国内生产总值)的增长趋势中找到AI对其产生的明显影响,理论上GDP应该显著上升。“但后来我看了⼀些我认为⾮常具有变⾰性的其他技术,⽐如计算机或移动电话等。你在GDP中找不到它们,GDP是同样的指数。” 他进一步举例,即使人们认为2008年iPhone 推出是个重⼤的地震式变化,而实际上不是,一切都如此分散、如此缓慢地扩散,以⾄于⼀切最终都被平均到同样的指数中。

这种渐进性源于技术革命的本质:新技术从演示到成熟产品的扩散需要时间。就像自动驾驶关于一场向数字“‘9’的进军”,每一个“9”的可靠性提升都需要付出巨大努力。AGI的发展同样会遵循这条路径,先自动化一些封闭、结构化的任务,再逐步攻克更复杂的工作,其间社会需要时间来调整基础设施、法律和技能体系。

卡帕西相信未来将会是多个AI实体逐渐增强自主性,与人类社会协同演进。因此人们拥有宝贵的窗口期进行准备,可以系统地调整教育、社会保障和法律法规,以确保人类在AGI时代能够持续繁荣。

    责任编辑:喻琰
    图片编辑:沈轲

    http://news.xdnf.cn/xNXjPuixvN

    相关文章

    范锐君已任退役军人事务部办公厅主任,此前在宁夏工作

    据河南省退役军人事务厅官网消息,2025年10月15日至17日,省退役军人事务厅在郑州市成功举办全省退役军人事务系统办公室业务能力培训班。消息披露,范锐君已任退役军人事务部办公厅主任。此前,范锐君担任宁夏回族自治区退役军人事务厅党组书记、厅长。公开资料显示,范锐君,…

    观察丨完美谢幕的无锡队,其实从未停下追求进步的征程

    点球大战结束后,南通体育会展中心成了红色的欢乐海洋。但无锡队的那抹白色没有显得格格不入,相反,在我看来就像一朵白色的杜鹃花,优雅地向观众谢幕。无锡队客战南通队。本文图片均来自无锡市委网信办、无锡日报差点就成功了。90分钟内,无锡队的小伙子们通过合理高效的战术…

    叩问“黑夜”漫长,导演张彤这样解读尤金·奥尼尔的遗作

    雾气弥漫,一方占据半个舞台的水池在灯光映照下泛着粼粼波光,静静映照着一个家庭压抑而漫长的一天;高低错落的三面回廊围合成表演区,如同一个无形的困境,让人物徘徊往复,却始终寻不到出口……《进入黑夜的漫长旅程》本轮演出剧照 龙一仪(前)饰演母亲玛丽10月15日晚,《…

    答·辩|雷震回应书评:传播即政治

    【按】“答辩”是一个围绕文史类新书展开对话的系列,每期邀请青年学人为中英文学界新出的文史研究著作撰写评论,并由原作者进行回应,旨在推动研究成果的交流与传播。本期邀请北京大学科学技术与医学史系助理教授John Alekna(雷震)与两位年轻学人一同讨论其新著Seeking New…

    纪念邹韬奋诞辰130年,学术研讨会在福建永安举行

    近日,以“邹韬奋与文化抗战——纪念韬奋130周年诞辰”为主题的第十一届韬奋学术研讨会在韬奋先生的出生地福建永安举行。第十一届韬奋学术研讨会邹韬奋是我国近现代史上伟大的爱国者、卓越的文化战士,杰出的出版家和新闻记者。福建永安是东南抗战文化名城,抗战时期福建省会内…

    卢浮宫大劫案背后:安保人员遭削减设施陈旧,法国博物馆屡遭盗窃

    10月19日,在法国巴黎,警察聚集在卢浮宫博物馆外。新华社 图据新华社援引法国媒体10月19日报道,9件“文物价值不可估量”的展品当天上午在卢浮宫博物馆遭抢劫,已有两件珠宝被找回,其中包括一顶皇后皇冠。法国总统马克龙当晚在社交媒体发文,承诺追回文物并将作案者绳之以法…

    答·辩|传播是政治的延续:“国家”“大众”与“新闻景观”

    【按】“答辩”是一个围绕文史类新书展开对话的系列,每期邀请青年学人为中英文学界新出的文史研究著作撰写评论,并由原作者进行回应,旨在推动文史研究成果的交流与传播。本期邀请北京大学科学技术与医学史系助理教授John Alekna(雷震)与两位年轻学人一同讨论其新著Seeking…

    答·辩|当无线电广播来到中国:新闻与通信下的社会革命

    【按】“答辩”是一个围绕文史类新书展开对话的系列,每期邀请青年学人为中英文学界新出的文史研究著作撰写评论,并由原作者进行回应,旨在推动研究成果的交流与传播。本期邀请北京大学科学技术与医学史系助理教授John Alekna(雷震)与两位年轻学人一同讨论其新著Seeking New…

    《2025版中国女性健康粉红报告》发布,乳腺结节检出率七年增长超过一倍

    数据显示,我国平均每88秒就有一人确诊乳腺癌①,女性的乳腺健康,正面临严峻挑战。10月20日,爱康集团发布由北京大学中国卫生经济研究中心指导的《2025版中国女性健康粉红报告》(以下简称“粉红报告”),这份坚持发布十四年的粉红报告,旨在通过多维数据解锁最新女性乳腺健…

    罗云熙新剧饰演异境高手

    罗云熙领衔主演的玄侠剧《水龙吟》,将于10月24日18:00在芒果TV、咪咕视频全网首播,10月30日登陆湖南卫视黄金档。该剧由陈宙飞任总导演,钱敬午联合导演,罗云熙、肖顺尧、敖子逸、方逸伦等出演。《水龙吟》海报《水龙吟》改编自藤萍知名连载小说《千劫眉》,以一场灭门血案为…

    澎湃思想周报|硅谷的战争牟利者;屏幕革命与全球民粹的崛起

    硅谷的战争牟利者在多年夸大外国威胁、渲染全球冲突风险之后,硅谷的军事初创公司终于迎来了属于它们的“战利品”——来自五角大楼的数十亿美元投资。这些公司将从近一万亿美元的国防预算中分得巨额拨款,用于研发无人机和人工智能武器系统。美国国会的两院——众议院与参议院…

    李公明|一周画记:谁点燃了马达加斯加?

    开栏小语:涂鸦小分队的人有一句口号:画什么才重要!怎么画和画成什么,没那么重要!图1 谁点燃了马达加斯加?纸本 彩墨65cm X 45cm 李公明 作 2025年10月16日据“澎湃新闻澎湃世界观”报道(2025年10月13日),自9月25日以来,马达加斯加首都塔那那利佛等多座城市爆发大规模…

    艺术科学的焦虑

    从19世纪中后期到20世纪初,以德语为主要语言的艺术史学者集中地表现出对确立艺术史学科独立性的热切诉求。其体现在寻求艺术研究的特有方法论、具有普遍解释效力的艺术法则、艺术演变发展的历史模式以及艺术史获得能够比肩其他现代学科的严谨科学性,尽管这种意愿的强烈程度因…

    14.85万元/平方米,上海徐汇滨江成交楼面单价再创新高

    成交楼面单价14.85万元,上海徐汇滨江地价再创新高。10月20日,上海2025年第八批次集中土拍举行。澎湃新闻(www.thepaper.cn)记者从上海市规划和自然资源局获悉,当天上午,位于徐汇滨江的WS5单元188N-I-21地块已成功拍卖。徐汇滨江地块周边情况,该地块距离黄浦江六七百米。…

    马上评|飞机客舱里的充电宝,到底该怎么管

    10月18日,由杭州飞往韩国仁川的国航CA139航班,一名旅客存放在行李架上手提行李内锂电池自燃,机组按程序立即处置,未出现人员受伤。据媒体报道,国航将分别补偿经济舱和公务舱旅客每人现金200元和300元。视频截图这起意外事件也提醒监管部门和航司、乘客高度关注机舱内充电宝…

    新任江苏省省长刘小涛首次部署“苏超”:持续扩大溢出效应

    据《新华日报》10月19日报道,近日,江苏省政府召开常务会议,指出要持续扩大城市足球联赛溢出效应,增强优质体育赛事供给,促进赛事与消费深度融合。省长刘小涛主持会议。这是刘小涛履新江苏省省长后,首次主持召开省政府常务会议,也是自6月以来,江苏省政府召开的会议第四次…

    城事|最强冷空气发力:北京气温首破冰点,南方直坠深秋

    这两天,一股冷空气让北方多地寒意阵阵。据中央气象台预报,未来几天较强冷空气将继续影响我国,大部地区将出现今年下半年以来最低气温。10月19日,黑龙江哈尔滨下起大雪,纷纷扬扬的雪花从空中飘落。冷空气席卷全国,南北冷暖急转本周,今年下半年以来最强冷空气持续影响我国…

    魔都眼|步行街上玩拳击!周末张园打造城市运动场景新体验

    “这是一个很好的活动,可以拉近很多运动项目和普罗大众之间的距离。”黄女士和朋友朱女士在张园逛街时看到这个活动,体验了一把拳击,“平时我们要去拳馆,打网球需要花钱花时间去预约,现在逛个街就能在马路上体验了。”2025年10月19日,上海张园,黄女士(右)和朋友朱女士…

    明糖易躲暗糖难防,不想老得快,小心食物中的“伪装者”

    很多人觉得,我不喝可乐雪碧奶茶,红烧菜吃的也不多,每天没吃多少糖呀,这糖的摄入量肯定达标了。殊不知,明糖易躲,暗糖难防,生活中的隐形糖还真不少! 01 哪些食物中暗藏“隐形糖”? 你可能在不知不觉中吃下了不少添加糖。 “添加糖”是在食品生产和制备过程中被添加…

    文旅部财务司副司长魏冀已赴江西景德镇履新

    据微信公众号“景德镇文旅发布”消息,10月18日,由江西省景德镇市政府主办,市委宣传部、市文旅游局承办的“探馆、看展、寻宝”——“千馆之城”文旅融合创新成果宣发活动举行。消息称,市委常委、市政府党组成员、副市长提名人选魏冀宣布第三批“千馆之城”创建场馆评选结果…