刘知远:大模型到专业Agent的跃迁必须解决的三大核心挑战

article/2025/9/16 7:07:17

在日前举行的2025外滩大会“智能体时代进化论”分论坛上,清华大学长聘副教授、面壁智能首席科学家刘知远系统剖析了AI从大模型向Agent跃迁的必然趋势,并深入探讨了“专业智能体”与“多智能体系统”所面临的核心技术挑战与未来愿景。

刘知远认为,AI发展的下一阶段,必然是让模型走出虚拟世界进入到真实的环境中实现交互,即实现从大模型向智能体的跃迁。而这一过程跃迁的核心在于,AI不再仅仅是一个具备知识的“大脑”,而要成为一个能通过使用工具、自主学习来探索世界的行动者。

刘知远的分享极具启发性,以下是澎湃科技整理后的演讲实录: 

人工智能的能力图谱包括四方面的能力

刘知远演讲的PPT

今天主题是智能体,这个智能体应该说在社会上获得广泛的关注,应该是从去年开始。我想从人工智能发展角度,这个智能体它都有什么样的核心问题,关键技术是什么,以及接下来它的发展过程中,我们需要解决的挑战以及一旦这个挑战如果被解决了,然后它可能产生一个怎样的巨大应用,我想通过这样一个引导发言,然后来给各位进行一个分享。

人工智能有一个我们可以定义出来的能力图谱,我们认为它大致包括这四个方面的能力。

第一,它要有基座大模型,像大脑一样来高效思考这个世界。我们也需要有一个非常好的敏锐感官,也就是多模态智能,能够敏锐感知这个世界。第二,从2018年随着大模型的发展,应该说已经形成包括文本基座模型和多模态模型一个非常前瞻式的应用。我们认为人工智能的能力图谱除了这两个部分,接下来还有两个非常重要的组成部分。第三,探索能力,它能够像一个专业的智能体一样,专业探索这个世界、改造这个世界。第四,这些专业的智能体如何能够互相进行协作,形成群体智能,这是我们人工智能第四个非常重要的板块。

从图谱的组成,其实我们就可以非常清晰地看到,人工智能发展非常显著的脉络。2018年一直到2025年,当然随着接下来的这几年,我们肯定还会去见证模型随着预训练的技术,从一个非常小的,只有几千万的参数模型,现在增长到上万亿的规模,其实是一个类似于我们脑容量越来越大的一个过程,它具有更强对这个世界认知方面的能力。

但是我们会认为再进一步,其实我们就不只是把这个模型本身能力进行一个具备。我们其实还需要进一步让这个模型进入到真实的环节、真实的世界,然后来进行交互,这个过程其实就是一个智能体的过程。也就是通过工具的使用、自主学习,能让这个智能体变成在相关专业领域自主探索的专业智能体。它们再进一步能够形成群体智能,我们认为人工智能应该会在最近这几年里面实现从大模型向智能体跃迁的这么一个过程。

这个过程的外在体现就能够让我们看到,从2022年开始,国内外陆续有非常多和智能体相关的探索工作。相当于在这个浪潮里面,应该说我们国内非常多学者和科技工作者所从事的工作站在世界的前沿。这些其实都是表象,我们要深入到人工智能未来发展的趋势,然后来去看待智能体核心挑战是什么。这个角度来讲,我们认为人类社会的发展,我们人类社会本身是人类智能一个非常高度发达的阶段,我们可以想象,人工智能未来发展的这一态势,应该说人类社会的发展会对它有一个非常重要的启示。

AI发展两大方向:个体专业化和协作专业化

过去的这几百年,人类的社会发展有什么重要的特点?在社会学领域有两个非常重要的观点,我们会认为这体现了人类社会从生产力、效能等方面的特点。第一,社会学的奠基人涂尔干曾经提出,“个体的专业化是群体效能提升的基础”。也就是说,在过去的这几百年的时间里面,我们会见证我们人类社会的每一个人都在呈现一个专业化的程度和规模,然后变得非常的壮大的过程,这个会成为我们人工智能要进行发展的非常重要方向,也就是要去构建相关各行各业、各个领域的专业智能体。

另外一个非常重要的特点,马克思在社会学方面提出的一个观点,协作社会化是生产力发展的必然结果,科技革命为这种扩张提供了技术可能。我们会看到过去的这几百年的时间,随着技术的发展,随着互联网的出现,信息社会的出现,我们整个人类社会协作的社会化广度和效率都大为地提升,而从这个角度来讲,我们也可以预期未来人工智能的发展也一定会构建一套更加高效、广泛的多智能体系统,这将构成接下来两个非常重要的组成部分。

专业智能体的三大核心挑战

首先我们来看一下专业智能体这个角度核心技术与主要挑战是什么?我们认为专业智能体将是下一代人工智能非常重要的发展方向。也就是说,要让这个模型进入到一个多样多变复杂的真实世界中进行交互,来完成相关的复杂任务。从这个角度来讲,我们就可以设想,当大模型放到一个真实的环节,它所面临的挑战是什么,挑战就是环境的多样性、环境的多变性,以及任务的复杂性。

针对这些挑战,我们认为我们所需要解决的,其实就是智能体的三个性的问题。

第一个是智能体的泛化性(Generalization)。在真实的世界里面,智能体其实需要能够面对多样化的环境,它就需要具备在那些训练过程中能够接触过的环境中,这个模型能不能做出合理的决策,完成这些复杂的任务。我们可以设想,当我们把大模型放到不同的领域,它有可能是编程领域、数据库领域、系统环境领域,也有可能是物理环境领域,或者是其他各种各样专业。我们预期这个大模型、智能体就能够成为软件开发、数据分析、系统触控、机械控制的各个方面专业智能体,而这件事情体现的就是智能体背后的大模型泛化能力。

 泛化性方面,最近国际上这两年的时间,其实是能够看到非常日新月异的发展。刚才我们的主持人,其实提到了其中一个非常重要的关键词,就是要让这个智能体能够使用各种各样专业工具,我们就可以设想各种各样不同领域其实都有相应专业工具的,所以这个是一个非常重要的方面。但是我们也会认为,相关的专业领域也会有它各自的一些知识,也会有它自己的一些所谓SOP(标准化工作流程)。所有的这些专业领域,如何让这个智能体能够掌握使用会成为这个智能体泛化的一个非常重要体现。

 在这方面有一个非常重要的特点,要让智能体能够从一个动态环境中具备学习能力,所以我们现在会看到有非常多的科技工作者在提世界模型,其实就是要构建多样化的环境,来为这个智能体提供一个学习泛化能力的过程,这件事情其实是智能体泛化性的一个非常重要体现。

 第二个挑战,智能体的自主性(Autonomy)。我们认为智能体要进入到一个动态的环境里面,它就要像人一样在使用中适应环境,主动探索,不断学习。它其实会需要能够实现一个感知自主、决策自主和学习自主,我们认为这是非常重要的一个发展范式。

在过去的一年时间里面,包括DeepSeek的R1和OpenAI的o1,虽然表面上看是深度思考的能力,它更重要的技术,其实是背后的大规模强化学习,这其实体现了大模型或者人工智能学习。从过去大模型里面的模仿学习范式要推广到或者说跃迁到探索式的学习,甚至再进一步它能够进入到完全开放的环境进行自主的探索和学习,我们认为将会在未来2-3年内实现这样一种自主性构建。

如何让大模型或者智能体具备自主探索和自主演化的能力,其实是一个非常值得探索的话题。国内外有非常多的学者在探索这个方面的工作,最近的半年时间有一个非常突飞猛进的发展,如果大家去搜Reverse Learning(反向学习)会有一个非常清晰的感受。

第三个非常核心的挑战,其实是智能体的长程性(Long-Horizon-Capability)。它能不能去解一个越来越复杂的任务,而这个任务的复杂性体现的是完成步骤足够长,甚至可能是一个持续更长,甚至终生的相关任务。刚才主持人也有提到,我们如何保持在环路里(in the loop)。这个环路(loop)是什么?其实就是一个越来越长的解决问题的链条。在这个方面,过去的这两年时间有非常多的探索,其实就是要让这个模型具备更长的上下文感知和经验复用的能力。

而在这个方面核心的技术或者动态,第一在模型内部要能够设计高效架构,让这个模型具备处理更长上下文的能力;第二要在智能体层面设计能更好管理历史信息的记忆架构,突破当前上下文的“窗口”局限,这个突破将会让这个模型能够在更多复杂场景里面具备更强的记忆能力和经验复用的能力。

如何把上下文冗余消除掉?如何能够让计算成本极具下降?如何能让推理效率极具提升?如何实现对历史重要信息的主动记忆,其实是非常重要的核心技术,这是构成第三方面的关键技术。

 我们总体来看,专业智能体它还有一个共同的技术基石,就是我们所谓的自主强化学习。刚才提到过去一年的时间,我们其实看到大模型学习范式从模仿学习到探索学习的跃迁,而我们会认为智能体三大核心能力,包括泛化性、自主性和长程性,其实都是高度依赖自主强化学习的提升。从人工智能科技发展来讲,它的一个核心问题。

以上是专业智能体方面,我们认为核心技术与挑战。

多智能体系统:迈向群体智能的“第二次涌现”

接下来就是多智能体系统,当我们在各行各业构建足够专业的智能体之后,我们接下来就需要让这些智能体互相之间能够进行通信和协作。如何实现智能体的自主协作和动态演化,从而形成全球范围内的智能体互联网,其实是实现人机协同群体智能第二次涌现的非常重要基础。这个方面其实有大量的成果,我相信一会儿会有非常多的科技工作者来给大家进行分享,我就不做详细的介绍。

智能体系统面临的非常关键挑战在于,当我们把多个智能体让它有不同的专业背景,让它们合作起来,显然是可以去完成它们每个单个智能体所没有办法完成的更加复杂的任务,但是当你让多个智能体合作的过程,本身会引入非常大的额外计算,所以我们会看到一个非常重要的挑战,这个挑战就是多智能体系统能力提升与资源消耗之间其实是产生非常大的矛盾。我们需要做的事情,就是如何有效发挥群体智能的同时,能够降低群体协作的资源开销,提升协作的效率。也就是我们刚才所提到的,协作的社会化效率问题。

在这个方面非常核心需要解决的三大问题,第一个方面,高效的交互。在国际上来讲,非常重要的动态,我们看到会看到包括Anthropic、Google在内的非常多团队,其实都在尝试着提出面向多智能体的标准化通信协议,不管是A2A(智能体对智能体),还是我们团队提出来的internet of agents(智能体互联网),其实都在尝试着构建一个更加高效的交互协议。这个显然会像历史的互联网协议标准化过程一样,也是争夺话语权非常重要的方面。而在这个方面,一个非常重要值得做的工作,如何研发一个标准化、最小化交流协议和互操作验证平台,能够降低通信开销,提升智能体高效协同。

第二个方面,从国际上来看,各大公司其实都在构建多模态研究团队,并且推出自己的多智能体协作系统框架。这个事情其实就是要用于探索智能体组织化、自动化编排和动态协作,这也是我们国内在这个方面比较有前景的一个地方。这个方面非常核心的一个问题,其实就是如何能够让多智能体进行分布式自主编排,能够让它路由的过程更加的高效,这件事情由于时间关系,我就不再特别多的介绍,应该说国内外已经有非常多的案例。

第三个方面,非常前沿的问题,其实也是对应前面所谓的自主强化学习。我们可以想象,面向专业智能体,我们当然需要它能够具备自主的学习能力。面向一个团队,我们也可以设想,任何一个优秀的团队都是善于向历史去进行学习的。所以我们可以想象,一个多智能体的群体团队,它也应该具备从历史工作经验中总结经验、总结教训,这件事情其实就涉及多智能体的群体演化与学习的能力。目前来讲,这个方面多集中在学术界进行前沿探索,其实我们也能够看到,最近这两年非常重要的特点,学术界与产业界边界没有那么清晰,我们在非常快速地把最前沿技术突破应用到前沿相关应用中去,这是我们特别值得关注的一个非常重要方面。如何实现智能体集群经验共享与知识迁移,会是这个里面非常关键的问题。

下一代群体智能的目标:实现专业Agent的规模化和专业化

我适当d地总结一下,我们会认为下一代群体智能非常重要的目标,是要能够实现这种专业智能体的规模化和专业化,实现群体智能的合作协作社会化的广度和效率,从而能够实现面向人工智能的第二次涌现。

因为我们看到的是过去这5年的时间,大模型越来越大、能力越来越强,它更像是个体智能的涌现,我们接下来想要迎来的就是由众多专业智能体合作的群体智能涌现。面向未来一个非常重要值得探索的底层问题,就是群体智能的涌现激励到底是什么,我们如何能够做到任何一个群体智能团队新加一个智能体,都能让它合作效能比之前更高,我们能够做到寻找到给定一个智能体的团队,我们能够找到一个最优让它通信合作机制,这些都是我们未来值得探索的方面。

展望未来,我们整个人类社会都是由一个又一个人类专家所构成的,我们未来一定会实现通过构建岗位孪生的专业智能体和组织孪生的智能体群,从而形成群体智能的涌现,这就是我们对迈向下一代通用人工智能阶段的关键问题,以及相应的愿景。

    责任编辑:宦艳红
    图片编辑:施佳慧

    http://news.xdnf.cn/ihjbjhbTZZ

    相关文章

    新质观察|AI拍电影:好莱坞会死?人类会哭吗?

    2026年,一部AI动画电影将在全球上映。它不来自皮克斯,不来自梦工厂,而来自OpenAI。据《华尔街日报》9月8日报道,OpenAI希望通过一部电影证明,生成式AI能够让电影制作比好莱坞目前的方式更快、更省钱。他们要拍一部叫做《Critterz》的AI动画电影。预算不到3000万美元,制作…

    一母生两族:新研究揭示蚂蚁“异种生殖”奇观

    在演化的长河中,物种间的界限并非不可逾越。“龙生龙,凤生凤”是生物学的一条基本法则,生物体产生的后代必然属于同一物种。近日一项研究发现,一种名为伊比利亚收获蚁(Messor ibericus)的蚂蚁可能颠覆了这个常识:它们的蚁后可以产下两个不同物种的蚂蚁。该研究由来自法国…

    思维导图|云计算打开万亿市场

    责任编辑:是冬冬图片编辑:蒋立冬澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    万亿云市场为何大爆发:巨头涌入AI基础设施竞赛,算力需求打开空间

    近日,云服务供应商甲骨文(Oracle)对云业务的积极展望,给本就火爆的全球AI(人工智能)产业链又一次“加柴添火”。过去一周,在甲骨文最新财报的催化下,不仅甲骨文股价一度大涨30%,英伟达等算力芯片厂商股价也跟着上涨。这并非个例,几天前,AI ASIC(专用集成芯片)龙头…

    释新闻|英国爆发大规模反移民抗议,为何美国右翼人士“现身”?

    移民问题正在撕裂英国社会。据新华社9月15日报道,13日下午,英国伦敦市中心同时爆发了反移民抗议和反对右翼群体的集会。抗议现场部署大批警察,负责分隔两派对立的抗议人群。当地时间2025年9月13日,英国伦敦,当地爆发大规模抗议游行,示威者与英国警方发生激烈冲突。视觉中…

    明查|波兰正式宣布向乌出兵?派遣4万军队援乌参战?

    点击进入澎湃新闻全球事实核查平台速览- 截至发稿前,波兰并未宣布向乌克兰出兵。网传说法没有证据,可能与近期波兰领空遭到疑似来自俄罗斯的无人机入侵有关。波兰总理此前表示,“波兰不打算向乌克兰派兵。即使战争结束后也不会。”- 网传有关“26国同意向乌克兰出兵”的说…

    起猛了!这个国家任命AI为“部长”:全球首个,手握实权,招标100%透明

    新智元报道 编辑:定慧 【新智元导读】AI正在以意想不到的方式进入现实政治舞台:阿尔巴尼亚成为全球首个任命「AI部长」的国家,虚拟系统Diella将全面负责公共采购项目,以对抗长期困扰该国的腐败问题。 起猛了,AI成功当上了一个国家的「部长」! 阿尔巴尼亚,一个位于欧…

    影视公司年中考,为什么赢家是它们?

    撰 文丨陈 桐编 辑丨美 圻文娱价值官解读:ID:wenyujiazhiguan近日,各大上市影视公司陆续交出“年中考”成绩单。尽管市场大环境仍面临挑战,但与去年同期多数公司业绩不佳相比,今年行业整体呈现回暖态势,多家公司交出了亮眼的成绩。13家A股影视上市公司中,7家预计盈利,6家…

    委内瑞拉内政部长:委美关系已经破裂

    委内瑞拉内政、司法与和平部部长迪奥斯达多卡韦略(资料图)当地时间9月15日,委内瑞拉内政、司法与和平部部长迪奥斯达多卡韦略在新闻发布会上表示,委内瑞拉与美国的关系早已破裂,并非近期才如此,奥巴马时期就曾将委内瑞拉列为“迫在眉睫的威胁”。他指出,美国一边针对委内…

    英国皇家空军战机将在波兰上空执行防空任务

    英国皇家空军战机(资料图)当地时间9月15日,英国政府宣布,英国皇家空军战斗机将在波兰上空执行防空任务。英国防部表示,英国战斗机将加入来自丹麦、法国和德国的同盟部队,以加强北约防御能力。本月9日夜间,大量无人机进入波兰领空,波军方紧急处置并击落部分无人机。波兰…

    波兰总统纳夫罗茨基会见王毅

    当地时间2025年9月15日,波兰总统纳夫罗茨基在华沙会见中共中央政治局委员、外交部长王毅。纳夫罗茨基请王毅转达对习近平主席的诚挚问候,赞赏中国取得举世瞩目的发展成就。纳表示,波兰是最早同中国建交的国家之一,两国之间一直保持良好友谊。作为历史学家,我深知中国当年为…

    阿拉伯-伊斯兰国家紧急峰会发表联合声明,谴责以色列袭击卡塔尔

    当地时间9月15日,为期一天的阿拉伯-伊斯兰国家紧急峰会发布联合声明,对以色列袭击卡塔尔的侵略行为予以强烈谴责。峰会由卡塔尔埃米尔(国家元首)塔米姆主持,来自阿拉伯国家联盟和伊斯兰合作组织成员国的国家元首、政府首脑或代表出席峰会,重点就以色列对卡塔尔袭击事件进…

    乌克兰加入欧盟谈判审查全部结束

    当地时间9月15日,乌克兰经济、环境与农业部宣布,乌克兰与欧盟在布鲁塞尔完成了关于《农业与农村发展》章节的审查会议,这也是乌克兰加入欧盟谈判中最后一个集群的最终议题,标志着审查阶段全部结束。据介绍,在为期三天的会议中,乌克兰方面介绍了农业改革、数字化进展、国家…

    外交部亚洲事务特使访问泰国就柬泰边境冲突做工作

    2025年9月15日,外交部亚洲事务特使邓锡军访问泰国,分别会见泰国防部次长萨尼查诺,泰柬边境总委员会秘书处泰方共同主席、泰军司令部边境事务局局长纳塔鹏。此前,邓锡军特使在马来西亚出席东亚合作系列高官会期间会见泰国外交部次长艾斯丽。邓锡军表示,泰国和柬埔寨是搬不走…

    中美马德里经贸会谈成果公布

    中国商务部国际贸易谈判代表兼副部长李成钢15日说,过去两天,中美双方在西班牙马德里举行会谈。双方积极落实中美两国元首通话重要共识,充分发挥中美经贸磋商机制作用,在相互尊重、平等协商的基础上,就TikTok等双方关注的经贸问题进行了坦诚、深入、建设性的沟通。李成钢说…

    中美经贸会谈中方新闻发布会在马德里举行

    新华社记者 彭子洋 摄当地时间9月15日,中美经贸会谈中方新闻发布会在西班牙马德里举行。中国商务部国际贸易谈判代表兼副部长李成钢、国家互联网信息办公室副主任王京涛出席发布会。商务部新闻发言人何亚东主持发布会。责任编辑:王晓峰澎湃新闻报料:021-962866澎湃新闻,未经…

    杭州通报女子误踩氢氟酸中毒身亡:已完成现场无害化处置,正在善后

    责任编辑:王晓峰澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    官方通报女子误踩氢氟酸中毒身亡:已完成现场无害化处置,正在善后

    责任编辑:王晓峰澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    正厅级段肖磊已赴黑龙江履新,曾长期在农行任职

    近日,黑龙江省委金融委员会办公室(省委金融工作委员会/省地方金融管理局)官网“机构领导”栏目更新显示,段肖磊已任黑龙江省委金融办副主任、省委金融工委副书记、省地方金融管理局局长(正厅长级)。此前,段肖磊长期在中国农业银行系统任职。段肖磊公开资料显示,段肖磊先…

    国际观察丨加勒比海上的美国霸权主义阴霾

    新华社加拉加斯9月15日报道,美国与委内瑞拉之间军事紧张持续,加勒比海域剑拔弩张。美军持续增加在加勒比海域军事部署,5架F-35战机13日抵达与委内瑞拉隔加勒比海相望的波多黎各一处军事基地。委内瑞拉则加强国内战备,以应对可能的入侵。拉美专家认为,美国以“缉毒”为名对…