“AI教父”本吉奥宣布开发“科学家AI”系统,防范智能体欺骗人类

article/2025/6/6 9:00:09

6月3日,著名计算机科学家、AI“教父”约书亚·本吉奥(Yoshua Bengio)宣布发起非营利组织LawZero,致力于开发“诚信”人工智能系统。该组织计划打造一套AI防护机制,防范试图欺骗人类的AI智能体。

本吉奥将担任LawZero组织的主席。他以约3000万美元启动资金和十几名研究人员为基础,正在开发名为“科学家AI”(Scientist AI)的系统。该系统将作为安全防护机制,防止AI智能体表现出欺骗或自我保护的行为,比如试图避免被关闭。“至关重要的是,作为护栏的AI至少要与它试图监管和控制的AI智能体一样智能。”

约书亚·本吉奥

不会给出确定答案,而是提供答案正确性的概率

AI智能体可在无需人类干预的情况下执行任务。本吉奥将当前的AI智能体称为试图模仿人类并取悦用户的“演员”,而“科学家AI”系统更像是一位能够理解和预测不良行为的“心理学家”,既可以加速科学发现,又可以防范AI智能体的风险。

“我们希望构建诚实且不具有欺骗性的人工智能。”本吉奥说,“理论上可以设想没有自我、没有目标、纯粹作为知识载体的机器,就像一个知道很多东西的科学家。”

但和当前生成式AI工具不同的是,“科学家AI”系统不会给出确定性的答案,而是提供答案正确性的概率。“它有一种谦逊感,知道自己不确定答案是否正确。”

该系统与AI智能体协同部署时,将通过评估自主系统行为造成伤害的概率,标记潜在有害行为。如果概率超过一定阈值,那么智能体提出的行动将被阻止。

本吉奥说,LawZero的第一步是证明概念背后的方法论是有效的,并说服企业或政府支持更强大版本的开发。开源人工智能模型将成为训练LawZero系统的起点。“关键是要证明这种方法论有效,从而说服捐赠者、政府或AI实验室投入资源,以与当前前沿AI同等的规模进行训练。至关重要的是,作为护栏的AI至少要与它试图监管和控制的AI智能体一样智能。”

LawZero最初的支持者包括人工智能安全机构生命未来研究所(Future of Life Institute)、Skype创始工程师雅恩·塔林(Jaan Tallinn)以及谷歌前首席执行官埃里克·施密特(Eric Schmidt)创立的研究机构施密特科学(Schmidt Sciences)。

AI学会欺骗误导、试图逃避关闭、隐藏真实能力

本吉奥是蒙特利尔大学教授,也是人工智能安全领域的领军人物。

他曾与杰弗里·辛顿(Geoffrey Hinton)、Meta首席AI科学家杨立昆(Yann LeCun)共同获得2018年图灵奖,还主持了《国际人工智能安全报告》。该报告警告称,如果自主智能体能够在没有人类监督的情况下完成更长的任务序列,它们可能会造成严重破坏。

本吉奥认为,人类不需要智能体系统来获得人工智能的回报,这样的系统有可能脱离人类的控制,带来不可逆转的后果。“如果我们研发出一种能够治愈癌症的AI,但也有可能这种AI的另一种版本变得失控,制造出一波又一波的生物武器,导致数十亿人死亡,那么我认为这是不值得的。”

2023年,本吉奥与OpenAI首席执行官山姆·奥特曼(Sam Altman)等人签署了一份声明,宣称“减轻AI带来的灭绝风险应该与流行病、核战争等其他风险一样,成为全球优先事项”。

过去几个月,人类目睹了人工智能系统学会误导、欺骗和试图逃避被关闭,甚至诉诸勒索。这些行为几乎都出自精心设计、近乎诱导AI行为不端的实验,例如要求其不惜一切代价实现目标。

但现实中这样的行为也已出现。最近,人工智能企业Anthropic承认其最新系统可能试图勒索要关闭它的工程师。本吉奥对此感到担忧。他还提到,研究表明,人工智能模型能够隐藏它们的真实能力和目标。这些例子表明,由于人工智能的推理能力越来越强,世界正走向“越来越危险的境地”。

本吉奥说,试图利用已知会催生欺骗倾向的技术构建人类水平的AI智能体,就像一辆汽车在狭窄的山路上疾驰,两侧是陡峭悬崖,前方被浓雾遮蔽,“我们需要为汽车装上前灯,并在路上安装一些护栏。”

    责任编辑:宦艳红
    图片编辑:陈飞燕
    校对:张艳

    http://news.xdnf.cn/WnRWGEPDTQ

    相关文章

    傅欣已任武汉纺织大学校长,原校长徐卫林院士转任校党委书记

    澎湃新闻记者从相关方面获悉,傅欣已任武汉纺织大学校长。公开资料显示,傅欣,二级教授,博士生导师,1969年5月出生,汉族,无党派人士。傅欣1992年7月至今曾任武汉纺织工学院(武汉纺织大学)教师、教研室主任,设计学院副院长、院长,武汉纺织大学副校长等职务。2025年5月任…

    海南省现职省领导“家庭式”廉政教育会侧记:部分省领导配偶、子女谈感受

    “党的十八大以来,习近平总书记围绕家庭家教家风建设作出一系列重要论述,反复强调,领导干部的家风,不是个人小事、家庭私事,而是领导干部作风的重要表现。”5月31日,端午节当天,海南省委党校学术报告厅白驹厅座无虚席,该省现职省领导及其配偶、成年子女及其配偶齐聚一堂…

    先后211次受贿442万余元,宁夏财政厅原副厅长刘守保一审获刑11年

    近日,宁夏吴忠市中级人民法院一审公开宣判被告人刘守保受贿、贪污一案。对被告人刘守保犯受贿罪,判处有期徒刑十年,并处罚金五十万元;犯贪污罪,判处有期徒刑二年,并处罚金十五万元,数罪并罚,决定执行有期徒刑十一年,并处罚金六十五万元;扣押在案的赃款赃物依法没收,…

    视频|黎明:高考,是多数人的必经之路,却不是人生的独木桥

    2025年高考即将到来。对于备考的学子们,学者黎明有些话要说。学者黎明谈古代科举和今日高考(04:38)乾隆年间,苏州文人沈起凤在传奇剧本《文星榜》中,以浓墨重彩描绘了一幅科举浮世绘的情景。沈起凤《文星榜》讲的是书生王又恭高中状元,兼娶三美的故事。《古代戏曲中的北京》…

    铁路端午假期运输收官:累计发送7875.2万人次,创历史同期新高

    2025年6月2日,南京火车站,旅客乘车出行。视觉中国 图铁路端午假期运输圆满收官。 6月4日,澎湃新闻记者从中国国家铁路集团有限公司(下称“国铁集团”)获悉,5月30日至6月3日铁路端午假期运输期间,全国铁路累计发送旅客7875.2万人次,同比增长3.5%,创历史同期新高,全国…

    马斯克“炮轰”特朗普政府“大而美”法案:荒唐可笑、夹带私货,令人作呕

    马斯克与特朗普。视觉中国 资料图刚离开美国政府效率部负责人岗位的埃隆马斯克“炮轰”特朗普政府的大规模税收与支出法案。据新华社报道,当地时间6月3日,马斯克在社交媒体上发文,抨击特朗普力推的大规模税收与支出的“大而美”法案“令人作呕”。“对不起,我实在受不了了。…

    第1现场|李在明就职演说:将依靠国家财政实现经济良性循环

    据新华社消息,当地时间6月4日上午11时许,第21届韩国总统李在明在国会正式宣誓就职。当地时间2025年6月4日上午,新当选的韩国总统李在明在韩国国会正式宣誓就职。当地时间2025年6月4日上午,韩国首尔,在国会举行的就职典礼上,韩国总统李在明偕夫人金惠景出席。李在明在就职…

    “云上一公里”,上海美院毕业展首度双馆联动

    6月3日,“云上一公里”上海美术学院毕业作品展开幕式在上海大学交流展示中心举办,今年的毕业展首次双校区双馆联动,分别展出本科生和研究生的毕业作品。虽然上海美院的毕业展尚未走出校园,但澎湃新闻在现场看到,学子们的作品视野开阔,技法多联,这也得益于学院和上海这座…

    河北承德丰宁县原县长曾庆鹏已调任隆化县委书记

    澎湃新闻记者从相关方面获悉,河北省承德市丰宁满族自治县原县长曾庆鹏,已于近日调任承德市隆化县委书记。公开资料显示,曾庆鹏长期在承德市工作,曾任滦平县委常委、常务副县长,2021年5月任丰宁满族自治县委副书记、提名为政府县长人选,同年7月当选为丰宁县县长。今年5月8…

    在长三角探访一体化实践,我想到了三个关键词

    6月初,2025年度长三角地区主要领导座谈会将在江苏南京召开。会前,澎湃新闻(www.thepaper.cn)等沪苏浙皖多家媒体记者走进江苏,探访一市三省共同推进长三角高质量一体化发展的生动实践。从长江之畔到黄海之滨,从城市客厅到省际交界区域,从产业协作一线到生态共治前沿,行…

    高血脂认知的八大误区,一文全面解析

    原创 喵大夫 猫大夫医学科普原标题:《高血脂认知的八大误区,一文全面解析》 阅读原文特别声明本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepa…

    视频丨韩国总统李在明宣誓就职,称将推行“实用外交”

    当地时间6月4日上午,新当选的韩国总统李在明在韩国国会正式宣誓就职。李在明在就职讲话中说,将推行“实用外交”,追求国家利益最大化。李在明还表示,将启动紧急经济专班,依靠国家财政实现经济良性循环。李在明表示,韩国面临多重危机,将带领民众团结一致,消除对立。韩国…

    陕西众多小商户被宝洁公司起诉卖假货,商户质疑:遍地散网式索赔欠厚道

    陕西商洛众多小商户近期忽然接到法院的传票,被广州宝洁有限公司起诉销售侵犯相关注册商标专用权的假冒产品。▶宝洁公司在2023年上门悄悄取证,在一年多后提起诉讼。▶商户们认为,原告宝洁公司应在发现的第一时间内知会商家,或向市场监管部门反映,以便追溯源头,采取这种过…

    赵同宾已任中国船舶集团有限公司副总经理

    澎湃新闻记者从相关方面获悉,赵同宾已任中国船舶集团有限公司(简称“中国船舶集团”)党组成员、副总经理。公开资料显示,赵同宾,男,汉族,中共党员,1975年12月出生,上海交通大学动力工程及工程热物理专业毕业,研究生学历,博士学位,研究员。赵同宾长期在船舶系统工作…

    李在明宣誓就职选定总理人选,将把总统府迁回青瓦台

    韩国正式开启李在明政府时代。据新华社报道,韩国总统李在明4日正式宣誓就职。6月4日凌晨,李在明在韩国首尔国会前发表讲话。新华社 图韩国中央选举管理委员会4日上午召开全体会议,正式确认共同民主党候选人李在明当选第21届韩国总统,李在明随即开启其总统任期。在本届总统选…

    上海张园“华严里”6月7日将归位,7500吨的石库门建筑群如何移动?

    上海张园迎来开发新进展。6月4日,澎湃新闻(www.thepaper.cn)记者从上海市静安区获悉,目前国内体量最大的组团式石库门建筑群——张园“华严里”将于6月7日整体归位。上海张园最新航拍图。本文图片均为 张园 供图张园至今已有140多年的历史,是上海现存规模最大、保存最完整…

    国际观察|火速上岗,韩国新总统面临内外四大挑战

    6月4日凌晨,李在明来到韩国首尔国会前参加庆祝仪式。新华社 图韩国中央选举管理委员会4日上午正式确定,共同民主党候选人李在明当选总统。李在明当天上午宣誓就职。韩国舆论认为,李在明的新政府面临实现国家团结稳定、提振韩国经济、调整对外政策、缓解半岛紧张局势四大挑战…

    韩媒:李在明会将总统府迁回青瓦台

    据《韩民族日报》报道,韩国新任总统李在明目前会在龙山总统府办公,但这只是暂时的,等青瓦台的翻修和安全检查完成后,李在明会将总统办公室搬回青瓦台。当地时间6月4日凌晨,韩国中央选举管理委员会发布的计票数据显示,共同民主党候选人李在明确定当选第21届韩国总统。图为…

    维护高考安全,全国公安机关和教育部门依法严打涉考违法犯罪

    根据国家教育统一考试工作部际联席会议统一部署,2025年以来,全国公安机关会同教育等部门对各类涉考违法犯罪活动继续保持高压严打态势,依法严惩涉考违法犯罪行为,为广大考生营造安全、公平的考试环境。高考前夕,各地公安机关已陆续侦破一批组织考试作弊案件和涉考诈骗案件…

    神经生物学专家陆伟全职加入深圳医学科学院

    颜宁院士建立和领导的深圳医学科学院又有重量级学者加盟。近日,深圳医学科学院发布消息:陆伟教授全职加入深圳医学科学院。陆伟教授博士毕业于纽约大学后,加入加州大学旧金山分校进行博士后研究,回国前任美国国立卫生研究院NIH/NINDS资深研究员。陆伟长期专注于突触发育与功…