75年后,图灵设想成真!总台这一次全网热议的AI测试如何诞生?

article/2025/8/20 23:28:43

近日,一场别开生面的人机辩论“图灵测试”引发全网热议——国产AI大模型MiniMax以42%的“人类认同率”通过图灵测试,远超75年前“人工智能之父”图灵设定的30%基准线,标志着国内首个通过人机辩论“图灵测试”的大模型诞生。

在由中央广播电视总台精心打造的《2025中国·AI盛典》舞台上,这场特别的思想实验,不仅让观众惊叹于AI的辩论能力,更引发广泛好奇:这场颠覆传统的测试究竟如何诞生?从创意萌芽到技术实现,背后藏着怎样的谋划与突破?

一场恰逢其时的AI思想测验

从舞台上灵动的机器人,到生活中贴心的AI助手,人工智能技术正以前所未有的速度重塑着我们的生活图景。在这个技术变革的关键时刻,“AI盛典”应运而生,它源于总台台长慎海雄在编务会上提出的一个创意:总台能不能举办一场Al晚会盛典之类的活动,既交流国内人工智能发展成果,也推进广电业与AI的融合探索。总台视听新媒体中心负责人当场“揭榜”领命。在总台台长的提议下,总台基于自身资源和技术优势,以“大象也要学会跳街舞”的精神风貌,拥抱人工智能,策划举办“AI盛典”。

最初,节目组计划打造一场以“胜负”为导向的“人机辩论”赛,希望通过直观的输赢结果展现AI的能力。与传统认知中机械呆板的形象不同,在多次彩排中,AI辩手展现出令人刮目相看的辩论智慧。它不仅能够精准拆解人类辩手的论点,更能运用类比、归谬等辩论技巧进行反击。辩论过程中,AI 辩手会利用预训练的模型和实时计算能力,在接收到问题的瞬间,迅速在知识库中查找相关信息,并根据已有的语言模型和逻辑推理规则生成回答。整个过程犹如行云流水,响应速度甚至快于人类思考的时间阈值,使得现场观众完全感受不到任何延迟,而这种表现完全超出了节目组的预期。

就在大模型训练调试的关键阶段,慎海雄台长对总台人工智能发展提出明确要求,打造AI创新实践标杆,让“思想+艺术+技术”合力生光,让更多“从0到1”的突破在这里诞生,为盛典注入了全新维度。节目组意识到,当AI的辩论能力已经达到与人类顶尖选手平分秋色的程度时,简单的胜负评判反而显得狭隘。真正的价值在于展现两种智能如何相互启发、优势互补。正是这种认知的跃升,让节目最终超越了竞技对抗的层面,成为一场探讨“相AI相生”时代命题的深度思想实验,为观众呈现了人机协同发展的无限可能。

“说到人工智能,相信大家脑海中都会立刻浮现出图灵测试这个概念。”节目组回忆道。75年前,图灵提出了著名的设想:如果一台机器在自然语言对话中能“骗过”超过30%的人类参与者,那就可以被视作具有智能。于是,在《2025中国·AI盛典》进行一场图灵测试的想法应运而生。

与传统的对话测试不同,节目组最终决定延续“人机辩论”这一形式。这一决策基于双重考量:从技术层面看,辩论是对智能水平一次“更高维度的检验”。传统图灵测试更注重对话的流畅性,而辩论则要求参与者具备深度理解、即时反应、知识整合和策略博弈等全方位能力。在节目组看来,辩论像一场思维的全方位压力测试,能更深刻地揭示AI是否真正理解了议题的本质,而不仅仅是检索或复述信息。从传播效果看,辩论天然具有的对抗性和戏剧张力,正反双方你来我往,更易碰撞出思维的火花,也能让抽象的智能测试变得可视、可感、可评。

当人机辩论“图灵测试”的创意雏形初现,节目组迅速与中国工程院院士、之江实验室主任王坚,清华大学基础科学讲席教授、清华大学心理与认知科学系主任、北京智源人工智能研究院首席科学家刘嘉,复旦大学特聘教授、上海科学智能研究院院长漆远,人工智能学者、工学博士高庆一以及辩手陈铭都进行了深入研讨。

在辩题设计层面,刘嘉提出应选择带有情感、能激发观众情绪反应、涉及伦理和人文色彩且无标准答案的话题。他认为,此类话题能展现AI与人类在理性和感性方面的差异,引发观众讨论,且能体现AI是工具、人类应发挥创造力和情感优势与之合作的观点。经过数轮思想碰撞,团队最终聚焦于两个颇具哲学张力的命题:“按下一个按钮可以删除痛苦的回忆,该不该按”和“AI会不会真的爱上人类”。前者因其直指人类敏感的情感神经,更能展现人机思维的互补性与差异性,最终被选定为测试的核心议题。

在辩手人选层面,刘嘉建议邀请复旦大学国际关系与公共事务学院副教授蒋昌建作为“老一代”辩手代表参与节目,增加节目话题性和情感共鸣。经过慎重考虑,蒋昌建最终婉拒了这次人机辩论的邀请。节目组尊重这位资深辩手的决定,转而邀请正值当打之年的知名辩手陈铭,与AI展开一场跨越物种的思想对话。节目组还创造性地采用了“双陈铭”对决的形式,由真实的人类辩手陈铭与AI辩手“陈铭”同台竞技。为确保测试的严谨性,节目组对两位辩手使用相同的虚拟形象和语音合成技术,让观众在不知情的情况下进行判断。这样的“真假陈铭”设置,还增强了测试的话题性,吸引更多观众网友见证AI的发展。

盛典现场,当人机辩论落下帷幕,蒋昌建向观众袒露了自己婉拒参赛的心路历程。“人和机器的交互是需要勇气的。”他说,“节目组当初也让我跟机器来一场博弈,我婉拒了。”作为一名曾在辩论舞台上取得荣誉的辩手,蒋昌建坦言自己面临着一个时代性的抉择:在反应速度和知识储备都不复当年的情况下,是否要与一个不知疲倦、拥有海量数据的AI对手同台竞技。这个看似简单的选择背后,实则折射出智能时代人类面临的不确定性。蒋昌建补充道:“通过刚才短短的这场较量,我发现人和机器是相互成就的。如果,我能够赢得机器,就能够促进人工智能向前进一步的发展。如果,我输给了机器,没有关系,我可以向我大脑的纵深处进一步来挖掘我还有哪些赋予人类尊严的新的发展可能。”这番感悟,生动诠释了节目“相AI相生”的深层立意。

AI辩手的“备赛”之路

“骗过”42%观众,AI辩手的“首次突破”并非偶然。作为以线性注意力混合架构(文本模型)为骨、实时语音生成(多模态模型)为翼的智能体,MiniMax多模态大模型学习了万亿条人类数据,拥有4560亿参数,单次激活459亿参数生成智能响应。它在多个基准测试中取得出色成绩,具备强大的数学推理、复杂的问题求解,以及长文本处理能力。

尽管拥有出色的“出厂设置”,这位AI辩手也经历了漫长而艰辛的“备赛”之路。首先,AI辩手需要构建广博的知识体系。它的“学习”过程分为两步:第一步是预训练,让大模型掌握海量知识,理解人类语言规律;第二步是对齐,即让模型学会如何与人类进行有效对话,理解人类意图,并以类人的思维方式回应。其次,AI辩手需要经历“千锤百炼”的模拟演练。研发团队先以人类辩手的大量实战数据为蓝本,对模型的每一次回应进行多维度打分:答案是否准确?与议题是否紧密?逻辑链是否严密?在一次次测试、反馈中,让AI少“打马虎眼”、少“跑题”,说话越来越靠谱。

现场的测试也完全反映出AI辩手的真实水平。在与人类辩手陈铭的交锋中,它既能充分发挥其在逻辑分析和知识整合方面的技术特长,又能敏锐捕捉并恰当回应人类情感和价值判断的微妙之处。当AI辩手说出“(按钮)赋予人们在绝望中重新选择的力量,不是为了逃避,而是为了重生”这样富有哲思的语句时,它展现的不仅是对人类痛苦的关怀,更是一种超越代码的情感共鸣。

从图灵测试预见AI新时代

在图灵提出经典设想的75年后,进行一场人机辩论“图灵测试”有何意义?

在王坚看来,这场“图灵测试”的意义,早已超越了简单的“辨别人机”。他表示:“当年的图灵测试为人工智能定了一个极具挑战的目标,70多年后我们做到了,就像大家今天看到的一样。但这也同时让我们看到通过了图灵测试只是人工智能的下一个新的开始,远不是终结,而这是图灵本人也没有预想到的,下面70年会是人工智能更令人激动的时代!”

“测试中AI展现出的辩证思维能力和即时反应速度,证明我国在自然语言处理和认知智能领域已经达到国际领先水平。”漆远补充道,“这场测试既验证了技术突破,又引发了公众对智能本质的思考。这正是科研与科普的完美结合,为人工智能的健康发展提供了示范。”

作为测试的一线观察者,蒋昌建提出,这场盛典“图灵测试”设置的精妙之处,还在于让观众自己去感受:机器何以机智“过人”,人类何以“性情”中人。这种对比,恰恰凸显了目前人类不可替代的价值——生动的情感、灵动的逻辑,和主动助产新知的追问。

MiniMax技术团队也表示,大模型的“首次突破”验证了自研技术的有效性和先进性。未来,团队希望推动技术在更广泛的生产力场景中发挥作用。例如,在教育领域,AI大模型可以作为智能辅导的数字教师,帮助学生提高思辨能力和语言表达能力;在司法领域,AI可以为法律专业人士提供辩论模拟,帮助他们更好地准备庭审,预测对方观点,完善自己的法律论证,提高法律辩论的质量和效率等。

可以预见的是,随着大模型技术发展,AI通过图灵测试将成为常态。这不禁引发我们思考:在人工智能已迈入新纪元的今天,诞生于20世纪中叶的图灵测试是否仍能胜任智能评估的使命?

“就像牛顿力学无法解释微观世界的量子现象一样,旧框架已不足以衡量新智能的维度。”刘嘉认为,如果未来AI能稳定通过图灵测试,那么“智能”的定义需要新的内涵,例如创造力和自我意识。首先,AI的创造力不应仅停留在已有框架里生成内容,而需具备从0到1的颠覆式非共识的创造能力。这就像莫奈能跳出传统绘画的束缚而开创印象画派;爱因斯坦独辟蹊径,提出牛顿力学框架之外的广义相对论。其次,自我意识是AI从新工具到新物种的关键。自我意识的定义是什么,自我意识涌现的充分和必要条件是什么?这一切,都还待心理学、脑科学和人工智能的研究者来探索和定义。所以,AI通过图灵测试并非标志人类对智能的探索的结束;相反,这一切只是开始。

《2025中国·AI盛典》也是总台持续深化“5G+4K/8K+AI”发展战略,积极推动新质生产力转化为媒体传播力的又一重要实践和创新探索。本届盛典还有多个创新节目共同勾勒出“相AI相生”的美好图景:《迎客鼓》展现传统艺术与智能科技的完美融合,《Passion·人机共振》《茉莉花》演绎人机协同的艺术创造力,《浮光·十二兽首归来》《兵马俑世界奇遇记》则实现了跨越时空的文明对话。这些精彩内容既彰显了科技的温度,又传递了思想的深度,更展现了总台以开放姿态拥抱前沿技术,为加快发展新质生产力营造良好氛围的坚定决心。

未来已来,从《2025中国·AI盛典》出发,总台还将继续探索人机协作的无限可能,让科技更有温度,让传播更具智慧,持续书写“相AI相生”的时代新篇。

    责任编辑:王建亮

    http://news.xdnf.cn/UxvtTFqlcG

    相关文章

    城事|中国海岸线:沸腾开渔季,梭子蟹批量到港

    8月16日,福建福州,众多渔船扬帆启航。汽笛撕裂海面,千艘渔船在海湾化作离弦之箭,彩旗与海浪同频翻飞。渔民高喊号子,引擎轰鸣卷起白浪,无人机航拍镜头里,船队如巨网般撒向深蓝——三个半月的休渔期在这一刻就此结束。随着沿海渔港千帆竞发,这场开渔狂欢席卷沿海多地。8…

    金融月评|6万亿的修复

    从信贷投放的一般规律而言,在半年考核和市场排名推动下,6月份均是信贷投放的“大月”,相应7月则属于“小月”,例如2024年6月份信贷投放2.13万亿,当年7月大幅回落至2600亿;2023年6月份信贷投放3.05万亿,7月则大幅回落至3500亿。今年6月信投放了2.24万亿,从规律上来看,7…

    前瞻|欧洲领导人大阵仗“组团”赴美会谈,能否避免二次白宫争吵?

    8月15日美俄元首会晤后,乌克兰总统泽连斯基和多位欧洲领导人赴白宫,与美国总统特朗普会谈。特朗普表示,“如果一切顺利”,将安排举行美俄乌领导人三方会议。据央视新闻报道,当地时间18日清晨,德国总理默茨从慕尼黑启程,乘飞机前往美国华盛顿。按计划,默茨与法国总统马克…

    马上评|电梯“碰一碰”广告真能放心碰吗

    近段时间,多地电梯内悄然出现“碰一碰”优惠领取装置,引发不少居民担忧。那么,这些设备从何而来?安装目的是什么?是否存在安全隐患?据@上海网络辟谣 调查发现,目前电梯里的这些“碰一碰”,是支付平台与电梯广告公司联合推出的营销方式,即在原先电梯广告旁增加一个“碰…

    再遇见|西门子前全球总裁冯必乐:开放合作才有良性竞争,双方应追求长期利益

    【编者按】五十年春风化雨,中欧从相识到相知,走过了半个世纪的合作之路。“志合者,不以山海为远”,这段跨越山海与制度差异的关系,如今已不仅是一份经贸数据的增长图谱,更是两大力量、两大市场、两大文明之间思想互鉴、理念交汇的深层对话。在中欧建交50周年之际,澎湃新…

    记录中国|如何看待合肥夜经济?

    【编者按】从2016年出发到今年,澎湃新闻与复旦大学新闻学院共同创立的专业报道品牌实践项目——“记录中国”已走过十年。经过十年的培育,“记录中国”已成为主流媒体赋能名校社会实践的知名IP。2025年“记录中国”的主题是:“城市不打烊:高质量发展活力密码。”澎湃新闻记…

    山西襄汾一房企违规收天然气接口费,市监局:责令退费并处罚

    山西省临汾市襄汾县市民李先生(化姓)近日向澎湃公众互动平台“服务湃”(https://tousu.thepaper.cn)反映称,襄汾金达房地产开发有限责任公司(下称:金达公司)收取购房者暖气接口费以及天然气接口费,“不交就不给钥匙”。8月18日,襄汾县市场监管局工作人员告诉澎湃新闻…

    回到“原点”,就是回到新闻第一现场

    8月17 日下午,上海书展迎来一场思想碰撞,解放日报社原点栏目《原点:相信抵达的力量》新书分享会举行。本次活动以“时代变迁中的新闻原点在哪里”为主题,复旦大学特聘教授李泓冰、南京大学教授杜骏飞与解放日报原点栏目主编王潇展开深度对谈,与现场读者共同探寻深度报道在…

    350份作品获奖,“韬奋杯”作文大赛凝聚少儿对文学的热爱

    8月18日,第十四届“韬奋杯”全国中小学生创意作文大赛颁奖仪式在中国近现代新闻出版博物馆举行。本届大赛于2024年10月正式启动,至2025年3月截止,共收到一万余份参赛稿件。经过近3个月初评、复评,最终350份参赛作品脱颖而出,分获本届大赛特等奖、一等奖、二等奖、三等奖及…

    徐则臣X姚鄂梅X韩敬群:阅读的最好状态是“读开了”

    今天,文学还能给我们带来什么?8月16日,茅盾文学奖获得者、《人民文学》主编徐则臣,作家姚鄂梅,北京十月文艺出版社总编辑韩敬群做客上海书展,与读者一起聊读书,话文学。活动现场徐则臣讲述了出身农村的自己童年时在爷爷的支持下爱上阅读的经历。“有一次院子里晒粮食,我…

    以琴为笔,孔祥东上海书展分享“声命”体验​

    上海书展期间,钢琴家孔祥东携全新 NFC 数字专辑《声命 —— 孔祥东音乐日记》,做客澎湃新闻X上海世纪出版集团上海书展直播专场,与读者及现场乐迷展开一场关于钢琴与科技、音乐与人生的对谈分享。从年少成名的钢琴天才,到用音乐疗愈自我的创作者;从深耕音乐教育的推动者,…

    北京长水教育集团:创新“师-生-机”协同赋能,引领人工智能时代生涯育人高质量发展

    8月16日-17日,北京长水教育集团2025-2026学年教育发展大会在昆明成功举办。北京长水教育集团各部门、全国各校区200余位管理干部代表参加会议。北京一高科技集团董事长、北京长水教育集团总校长张韶维出席会议,北京长水教育集团执行总校长韩利永作大会工作报告。北京一高科技…

    沪喀同心|《大地上的喀什》:黄浦江与叶尔羌河的对话

    8月18日,在新疆维吾尔自治区成立70周年与上海对口支援喀什15周年的重要节点,全景记录沪喀情谊与上海援疆成果的纪实文学作品《大地上的喀什》在上海书展首发。《大地上的喀什》由伍佰下、杨秀丽、三盅、陈佶、默音、傅小平、李元、王伟、简平、李鹏、吕争、薛舒、王瑢、王萌萌…

    歌剧《沃采克》中国首演,北京国际音乐节10月归来

    十月金秋的北京,每一条街道都将成为五线谱,等待乐迷的脚步踏出新的节奏。10月10日-24日,第二十八届北京国际音乐节如约而至,将以“未来传统刹那新声”为主题,探索古典音乐与现代创作、东方音乐语汇与西方艺术形式的对话与融合。发布会现场经典辉映,全球名家名团来相聚音乐…

    十字路口的古镇|三河古镇:“活”古镇如何打好后“5A”时代的金字招牌?

    【编者按】小桥流水、青砖黛瓦,熙熙攘攘的古镇曾是几代人的集体旅行记忆。随着时代变迁,年轻人旅行观念和旅行方式急剧转变,越来越多的古镇都身处“十字路口”,是继续忍受门可罗雀还是破釜沉舟升级改造,古镇转型势在必行。更有甚者,不少古镇被指为“假古镇”“人造古镇”…

    【社论】沪指创10年新高,动力从何而来

    毫无疑问,2025年8月18日会成为A股历史上一个极具标志意义的时刻。当日,A股三大指数集体上涨,沪指盘中创近10年新高。沪深两市全天成交2.76万亿元,较上个交易日放量5196亿元,成交额再创年内新高。10时34分左右,A股市值总和突破100万亿元(以A股最新价A股总股本计算),创历…

    “抗日战争专题研究”系列图书首批55卷出版

    由南京大学张宪文教授、朱庆葆教授主编的“抗日战争专题研究”系列图书首批55卷在中国人民抗日战争暨世界反法西斯战争胜利80周年之际隆重出版。2025年8月16日,由南京大学中华民国史研究中心、江苏人民出版社联合主办的新书发布会在江西九江举行。“抗日战争专题研究”新书揭幕…

    一周展讯|感受罗丹的力量,走近米勒的土地

    持续13个月的上博“古埃及大展”在8月17日已经落幕,一系列好展仍在继续,雕塑家罗丹的代表作《行走的人》近日亮相中华艺术宫,不远处,上海罗丹艺术中心的“罗丹:现代雕塑的启承”展则呈现了106件珍贵原件。一系列海派艺术大家的展览正在举行,其中包括上海中国画院的丰子恺…

    北美票房|前两名没变化,动作片《小人物2》开画不及前作

    刚刚过去的这个周末,北美电影票房由上周的冠军《凶器》连霸。这部限制级恐怖片在上映后的第二个周末拿到了2500万美元票房,同比下滑仅43%,是今年所有开画票房超过4000万美元的电影里,除《罪人》之外下滑幅度最小的一部。乔什布洛林和朱莉娅加纳在《凶器》中。不过,整体而言…

    韩国特检组将于20日再次传唤调查金建希

    金建希(资料图)韩国金建希特检组通报称,当地时间18日16时37分,对前总统尹锡悦夫人金建希的传唤调查结束。特检组将于20日10时再次对金建希进行传唤调查。本月6日,由于牵涉德意志汽车公司股价操纵案、政治掮客介选案等一系列案件,特检组对金建希进行了传唤调查,但她基本否…