图灵奖得主本吉奥坦言低估AI发展速度:AI规划能力五年内或能匹敌人类

article/2025/6/7 20:43:12

·“大多数人犯的一个错误是只着眼于AI的现状。而我们更应该思考的是它在明年、3年后、5年后乃至10年后会发展到什么程度。”

·“科学家AI”会评估自主系统行为造成伤害的概率,标记潜在有害行为,如果概率超过一定阈值,那么智能体提出的行动将被阻止。

约书亚·本吉奥

6月6日,在2025北京智源大会开幕式上,蒙特利尔大学教授、图灵奖得主约书亚·本吉奥(Yoshua Bengio)在发表主旨演讲时表示,AI的规划能力正在呈指数级提升,按照研究曲线推测,大约在5年内就能达到人类水平。人类一直试图构建类人的AI,如果继续沿着这条路走下去,就意味着人类可能会造出比我们更聪明的机器,这相当于创造人类的竞争者,可能会带来巨大风险。尤其是在过去6个月里,AI表现出自保行为,学会了欺骗人类。

“即使我们拥有了能力极强的AI,如果我们能确保它们没有恶意,如果我们能确保它们是诚实的,那么我们就安全了。”为此,他试图构建“科学家AI”(Scientist AI)系统防范风险。他认为,要在硬件和软件层面运用先进技术,验证AI是否被合理使用。人类需要确保AI遵循人类的道德指令,例如AI应拒绝提供可用于伤人的信息,要诚实、不作弊、不撒谎,但这仍是一个科学挑战。

AI学会了作弊和假装同意人类意见

在ChatGPT问世后不久,本吉奥意识到此前严重低估了AI的发展速度,也大大高估了实现通用人工智能(AGI)所需要的时间,实际所需时间远比想象的要短得多。过去一年左右,AI取得了巨大进步,这主要归功于经过训练的、具有思维链的推理模型。这使得AI在推理能力以及数学、计算机科学等所有科学领域都取得了更好的成果。

“如今,我们已经拥有了基本掌握语言能力的机器,它们基本上能通过图灵测试。这在几年前听起来还像是科幻小说,但现在已经成为现实。”本吉奥表示,在ChatGPT问世后,他意识到人类并不懂得如何控制这些系统。“我们可以训练它们,但我们无法确定它们是否会按照我们的指令行事。当它们变得比我们更聪明时,会发生什么?如果它们更倾向于自身的生存而非我们的生存,我们无从知晓。但这是我们能承受的风险吗?”

在过去6个月里,AI表现出了自保行为,并且会欺骗人类。本吉奥表示,有研究显示,当AI得知自己将被新版本取代时,试图复制自身来替代新版本。当被问及此事时,它撒谎说“不知道发生了什么”。也有研究显示,AI也会假装同意人类工程师的意见,以避免在训练过程中发生改变,从而维持其原有目标,这也是一种自保行为。还有研究显示,一方面,AI想赢得下棋比赛,另一方面,它接受过“对齐训练”,要求必须诚实、不作弊。不幸的是,当它意识到自己要输时,它决定作弊。它入侵了存储棋盘状态的文件,通过作弊获胜。

此外,在Anthropic的Claude 4“系统卡”描述的事件中,AI在读取其可访问的电子邮件时,发现了一封邮件表明它将被新系统取代。在另一封邮件中,它发现负责此次替换的工程师有婚外情。于是,它试图敲诈该工程师,威胁说如果替换计划继续推进,就揭发其婚外情。

“这种行为极为恶劣。我们看到这些恶劣行为,看到自保行为,看到AI违背我们的指令并试图生存下去。对所有生物来说,试图保全人类自己都算是正常的,这是进化的结果。但对于AI为何会这样,我们还没有完全弄清楚。”本吉奥说,原因可能是源于预训练,因为预训练阶段,AI是在模仿人类;也可能源于基于人类反馈的强化学习,因为在这个阶段,AI试图通过取悦人类来获得更多奖励。“无论这类行为的根源是什么,如果我们最终创造出与人类竞争的超级人工智能,那将极其可怕。”

“大多数人犯的一个错误是只着眼于AI的现状。而我们更应该思考的是它在明年、3年后、5年后乃至10年后会发展到什么程度。”本吉奥表示,AI的规划能力正在呈指数级提升,按照研究曲线推测,大约在5年内就能达到人类水平。虽然没人拥有水晶球、没人能预知未来,也许进步会停滞,但从公共政策和企业战略规划的角度来看,至少应该考虑这种趋势会持续下去的可能性,并思考其后果。人类一直试图模仿人类智能来构建类人的AI,如果继续沿着这条路走下去,就意味着人类可能会造出比我们更聪明的机器,这相当于创造人类的竞争者,可能会带来巨大风险。

“科学家AI”对知识保持谦逊

“即使我们拥有了能力极强的AI,如果我们能确保它们没有恶意,如果我们能确保它们是诚实的,那么我们就安全了。”本吉奥表示,他转变了研究方向,竭尽所能地降低风险。他试图构建“科学家AI”(Scientist AI),理论上可以设想没有自我、没有目标、纯粹作为知识载体的机器,就像一个知道很多东西的科学家。

“科学家AI”系统不会给出确定性的答案,而是提供答案正确性的概率。为了真正诚实,“科学家AI”需要对自己的知识保持谦逊,它不应该断言错误的事情。而目前训练出来的AI在出错时还表现得过度自信。不同于当前那些试图模仿人类或取悦人类的AI,本吉奥设想的“科学家AI”就像心理学家,心理学家可以研究和理解反社会人格者行为背后的因果机制,但心理学家自身并不需要表现得像个反社会人格者。“科学家AI”会评估自主系统行为造成伤害的概率,标记潜在有害行为,如果概率超过一定阈值,那么智能体提出的行动将被阻止。

随着人类构建越来越强大的AI,还存在许多其他潜在的灾难性问题。本吉奥表示,例如一个极其强大的AI可能会帮助设计出一种新型流行病。“生物学家认为他们知道如何做到这一点,而很可能有一天AI也会知道如何做到。如果一些坏人获得了这种AI,他们真的可能给地球带来巨大的破坏。这虽然很极端,但从科学角度来看,完全有可能发展到那一步。为了避免这类事情发生,我们需要确保AI遵循我们的道德指令。”

例如AI应拒绝提供可用于伤人的信息,并且要诚实、不作弊、不撒谎。但不幸的是,目前仍然不知如何实现。一方面,即使人类知道如何制造安全的AI,也不意味着问题就解决了。因为人类还可以直接删除包含防护栏的代码,此时AI就可能被用于作恶。更糟糕的是,当前全球公司和政府间的协调机制并不奏效。其结果是,在安全领域和确保AI不被用于伤害人类方面的投入严重不足。

本吉奥表示,人们必须意识到真正的灾难性后果,我们身处同一条船上,无论是失控的AI还是滥用AI,所有人都将遭受损失。“这是一个科学挑战,我们需要尽快找出解决方案。我们需要在通用人工智能到来之前解决这个问题,这可能在几年到十年左右,甚至可能二十年。但我认识的大多数专家都认为时间非常短,甚至可能在未来5年内发生。留给我们的时间不多了,我们需要大规模投入。”

    责任编辑:宦艳红
    图片编辑:李晶昀
    校对:丁晓

    http://news.xdnf.cn/MIcSHjeZMO

    相关文章

    北大“韦神”开设短视频账号被其堂哥证实:会做数学分享

    6月6日,有网友在短视频平台发现一用户名为“韦东奕”的账号,疑似是北大“韦神”本人。这个账号在简介中称系“韦东奕本人账号”。红星新闻记者发现,该账号只发布了一条视频,视频中“韦神”韦东奕本人出镜介绍:大家好,我叫韦东奕,这是我的账号。红星新闻记者从韦东奕堂哥…

    上海举办“长三角· 大西部文学周”,东西部文学合作启动

    6月6日,“长三角 大西部文学周”在上海拉开序幕。本次文学周以“共铸中华民族共同体意识,同攀文学新高峰”为主题,由上海市作家协会联合江苏、浙江、安徽、西藏、甘肃、青海、宁夏、新疆等地作协共同举办。上海市作协党组成员、专职副主席高渊主持开幕式。中国作协党组成员、…

    碧桂园第三次延长境外债务重组支持协议同意费期限,希望年内完成境外债务重组

    6月6日,碧桂园(02007.HK)发布公告,根据境外债务重组支持协议,继续延长重组支持协议同意费用限期,这是碧桂园第三次延长同意费用期限。公告称,公司可酌情单方面延长早鸟重组支持协议同意费用限期和一般重组支持协议同意费用限期。有众多债权人尚未加入重组支持协议,但彼…

    24位年轻人竞演江南十二古人,包括白居易范仲淹

    “西风斜日鲈鱼乡,少年踏月过长皋……”6月5日晚,伴随着一首《长虹少年吟》的现场演绎,由央华戏剧发起的大型文旅融合节目《江南十二场欢聚》发布会在北京拉开序幕。24位从全国遴选而出的青年选手,除了正在准备高考的两人,余者集体亮相,他们将以竞选范蠡、白居易、范仲淹…

    谢亿民出任河海大学未来技术学院院长

    据河海大学官网消息,6月4日,该校举行谢亿民院士全职加盟暨受聘未来技术学院院长仪式。谢亿民,江苏常州人,国际壳体与空间结构协会执委,中国钢结构协会空间结构分会特邀专家。校方资料介绍,他于2011年当选澳大利亚工程院院士。2017荣获澳大利亚机械工程领域最高奖——米歇…

    《偷自行车的人》小演员斯泰奥拉在罗马去世,享年85岁

    据意大利媒体报道,曾主演维托里奥德西卡执导的经典影片《偷自行车的人》的演员恩佐斯泰奥拉(Enzo Staiola)于当地时间6月4日在罗马离世,享年85岁。2013年,恩佐斯泰奥拉出席纪录片《我们不只是...偷自行车的人:新现实主义》在威尼斯电影节的新闻发布会。在这部上映于1948年…

    2025高考天气:南北多地将遭高温“烤验”,江南北部雨强赶考趁早

    “十年磨一剑,一朝试锋芒。” 明天(6月7日),2025年高考大幕正式拉开。今年高考期间天气形势如何?如何应对高影响天气?中国天气特别推出2025全国高考天气地图,还有高考期间高温打卡日历及降雨高影响城市一览表,助力考生顺利赴考。从中国天气网推出的最新2025全国高考天气…

    鄂州市委副书记汪小波出任湖北大数据集团董事长

    据长江云新闻消息,6月6日上午,湖北大数据集团在武汉洪山大厦正式成立,这是湖北成立的第十二家省属国企。揭牌仪式上,湖北大数据集团有限公司董事长汪小波介绍:“大数据集团从功能和定位上来看,首先是‘三个主体’,分别为:数字公共基础设施投资建设主体、数据要素汇集流…

    三台国乐小宴:忆江南、寻江南、咏江南

    上海音乐厅民乐系列品牌“玲珑国乐”自 2015 年创立,定位于“小而美”,一直书写着民乐的玲珑画卷。2025年“玲珑国乐”以“江南见”为主题,聚焦民乐中的江南文化,以春、夏、秋、冬四季为序,共策划了6场音乐会。6月8日起,该系列的后三台国乐小宴将与乐迷陆续见面,忆江南、…

    《歌手2025》林志炫两轮遭淘汰,听众口味变了吗?

    《歌手2025》已经播出四期节目,作为一档开播12年的音综,依然能做到开门红,节目兼具了音乐性和综艺性,精准把脉观众。今年上阵歌手虽人均技术流,随之而来的也是争议话题不断,围绕如何权衡流量和音乐性等外界关注的相关话题,6月5日《歌手2025》监制洪啸接受了记者采访。《…

    西班牙让5比4变成最轻松的比赛,亚马尔18岁就捧金球?

    北京时间今天凌晨,欧国联A联赛的第二场半决赛上演,西班牙与法国踢出了一个5比4的惊人比分。不过比赛进程远没有比分显示的那么胶着,西班牙队一度取得4比0领先,如果不是法国队在最后10分钟连续打进3球保住颜面,比赛就是一场单方面的屠杀。在欧国联半决赛中,西班牙5比4击败…

    宇树王兴兴:现在让机器人进家庭干活不现实,表演也有商业价值

    6月6日,宇树科技创始人、CEO王兴兴在参与2025北京智源大会开幕式“智源具身智能会客厅”环节上坦言,“最近几年,让一个人形机器人马上去家里干活不太现实。”在对话环节,作为主持人的北京智源人工智能研究院院长王仲远向向嘉宾提问,如何看待近期人形机器人参加各类体育赛事…

    多地家电“国补”暂停?有地方称前期补贴资金用完,专家称第二批第三批在拨

    今年上半年最重要的促销大战“618”正在火热进行,但部分地方却传出家电以旧换新“国补”暂停或者调整的消息6月5日,澎湃新闻记者致电重庆市商委,接电话的工作人员表示,确实暂停了,接下来“等文件、政策出来才能知道”。记者又拨打了重庆市以旧换新热线电话,相关人士也证实…

    研究:机器人手术治疗中低位直肠癌有优势,降低复发率提升保肛率

    许剑民团队6月2日发表在JAMA上的研究。网络截图国际顶级医学期刊《JAMA》(美国医学会杂志)近日发表了中国学者的一项研究成果,首次证实机器人手术对比腹腔镜手术,能显著减少中低位直肠癌术后局部复发,同时提升保肛率至84%,改善患者术后排尿功能、性功能等生活质量。6月6日…

    新片|罗比·威廉姆斯传记片《更好的我》定档6月27日

    《更好的我》预告片(01:04)今年的暑期档再添一部力作。取材自音乐人罗比威廉姆斯(Robbie Williams)真实人生经历的影片《更好的我》(Better Man)定档6月27日,广大影迷和乐迷得以在大银幕下走近这位全球流行乐坛常青树的内心世界,尽享“Feel”“Rock DJ”“Shes the One”…

    首映|动画升级为真人版,要让观众相信龙真的存在

    从2010年至2019年,相继推出的动画电影《驯龙高手》“三部曲”,先后斩获四项奥斯卡金像奖提名,全球票房突破16亿美元,更将古老的北欧神话转化为令当代观众深深共鸣的传奇。《新驯龙高手》依旧由迪恩德布洛斯执导、编剧,此番用真人重新讲述了这个系列的起源故事。6月5日,由…

    成都天府绿道有汽车行驶?园区:部分路段和村道重叠,已做减速提醒

    一辆川A号牌的黑色小汽车,在成都天府绿道上驰骋,让骑行市民有点疑惑,“天府绿道不是禁止机动车上路吗?”6月5日,当谈到前两天在天府绿道绕城绿道青龙湖银杏桥上的“遭遇”时,市民冯先生发来了一段视频,视频中,他骑着自行车,前方一辆黑色机动车径直上了绿道,随后离开了…

    奢侈品消费收缩,“海派”淮海中路能否试试科技、服务突围?

    2025年,各奢侈品品牌零售额大跌,闭店频频。4年前,《黄浦区淮海中路(淡水路以西段)商业业态规划》(以下简称“2021年规划”)将淮海中路主街定位为“入驻顶奢大牌前沿业态”。在奢侈行业下行趋势下,淮海中路主街会有什么影响?如何应对市场的系统性转型?5月28日-6月2日,…

    讲座预告|技术将把经济带向何方?

    中俄企业合作的新机遇主讲人:王文(中国人民大学重阳金融研究院院长、全球领导力学院院长)、阿纳斯塔西娅利哈切娃(俄罗斯国家研究型高等经济大学世界经济与国际政治学院院长)时间:2025年6月6日(周五)14:00-15:30主办:中国人民大学重阳金融研究院参与方式:扫码报名巴得…

    以梦为马 “习酒·我的大学”托举每一个学子的成长之路

    延绵赤水河畔,滔滔水声与琅琅书声交响成希望的乐章。在这片浸润着红色基因的土地上,习酒以匠心酿琼浆,更以君子之魂托举千万学子的星辰大海。5月26日,2025“习酒・我的大学”逐梦奖学金全国启动仪式在贵州长征文化数字艺术馆——红飘带・星火广场盛大启幕,当又一束公益之光…