警惕AI“数据投毒”!0.01%虚假训练文本可致有害内容增11.2%

article/2025/8/11 19:09:24

国家安全部今天(5日)发布安全提示文章,人工智能的训练数据存在良莠不齐的问题,其中不乏虚假信息、虚构内容和偏见性观点,造成数据源污染,给人工智能安全带来新的挑战。

数据是人工智能的基础

人工智能的三大核心要素是算法、算力和数据,其中数据是训练AI模型的基础要素,也是AI应用的核心资源。

提供AI模型的原料。海量数据为AI模型提供了充足的训练素材,使其得以学习数据的内在规律和模式,实现语义理解、智能决策和内容生成。同时,数据也驱动人工智能不断优化性能和精度,实现模型的迭代升级,以适应新需求。

影响AI模型的性能。AI模型对数据的数量、质量及多样性要求极高。充足的数据量是充分训练大规模模型的前提;高准确性、完整性和一致性的数据能有效避免误导模型;覆盖多个领域的多样化数据,能提升模型应对实际复杂场景的能力。

促进AI模型的应用。数据资源的日益丰富,加速了“人工智能+”行动的落地,有力促进了人工智能与经济社会各领域的深度融合。这不仅培育和发展了新质生产力,更推动我国科技跨越式发展、产业优化升级、生产力整体跃升。

数据污染冲击安全防线

高质量的数据能够显著提升模型的准确性和可靠性,但数据一旦受到污染,可能导致模型决策失误甚至AI系统失效,存在一定的安全隐患。

投放有害内容。通过篡改、虚构和重复等“数据投毒”行为产生的污染数据,将干扰模型在训练阶段的参数调整,削弱模型性能、降低其准确性,甚至诱发有害输出。研究显示:

当训练数据集中仅有0.01%的虚假文本时,模型输出的有害内容会增加11.2%;

即使是0.001%的虚假文本,其有害输出也会相应上升7.2%。

造成递归污染。受到数据污染的人工智能生成的虚假内容,可能成为后续模型训练的数据源,形成具有延续性的“污染遗留效应”。当前,互联网AI生成内容在数量上已远超人类生产的真实内容,大量低质量及非客观数据充斥其中,导致AI训练数据集中的错误信息逐代累积,最终扭曲模型本身的认知能力。

引发现实风险。数据污染还可能引发一系列现实风险,尤其在金融市场、公共安全和医疗健康等领域。

在金融领域,不法分子利用AI炮制虚假信息,造成数据污染,可能引发股价异常波动,构成新型市场操纵风险;

在公共安全领域,数据污染容易扰动公众认知、误导社会舆论,诱发社会恐慌情绪;

在医疗健康领域,数据污染可能致使模型生成错误诊疗建议,不仅危及患者生命安全,也加剧伪科学的传播。

筑牢人工智能数据底座

加强源头监管,防范污染生成。以《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律法规为依据,建立AI数据分类分级保护制度,从根本上防范污染数据的产生,助力有效防范AI数据安全威胁。

强化风险评估,保障数据流通。加强对人工智能数据安全风险的整体评估,确保数据在采集、存储、传输、使用、交换和备份等全生命周期环节安全。同步加快构建人工智能安全风险分类管理体系,不断提高数据安全综合保障能力。

末端清洗修复,构建治理框架。定期依据法规标准清洗修复受污数据。依据相关法律法规及行业标准,制定数据清洗的具体规则。逐步构建模块化、可监测、可扩展的数据治理框架,实现持续管理与质量把控。

    责任编辑:王建亮
    图片编辑:陈飞燕

    http://news.xdnf.cn/ktsBYdsabe

    相关文章

    甘肃卓尼警方通报越野车超车逼停摩托:未达成调解,将进一步调查

    责任编辑:王建亮图片编辑:陈飞燕澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    招聘教师现“笔试17分进资格复审”奇迹,云南耿马:仅3人有笔试成绩

    8月3日,云南省临沧市耿马自治县2025年特岗教师招聘笔试成绩公布,其中一名报考小学数学老师岗位的考生笔试成绩仅17分,却进入资格复审。此事引发网民热议,不少网友称“17分创造奇迹”,也有人分析,“这样的笔试成绩,面试环节应该过不到”。8月4日,上游新闻记者在耿马自治…

    敕勒川草原复活,逾千里绿道建成:呼和浩特将公园建设融入市民生活追求

    打卡中国|走进“千园之城”呼和浩特,来一场公园Walk。 澎湃新闻记者 陈鑫露 孙骏(01:38)8月3日至4日,“青城”呼和浩特的敕勒川草原游人如织,小草公园大片充满荒野味道的小草映衬着周边高楼如同童话,大黑河郊野公园的鲜花在河水激流声中开得正艳。“北疆韵 青城潮”2025年…

    从短视频到舞台,舞剧《英歌》里的血脉觉醒和阳刚美学

    继舞剧《醒狮》《龙舟》后,又一部来自广州的大戏登陆北京天桥艺术中心,7月31日至8月3日,大型民族舞剧《英歌》连演四场。2023年起,英歌舞在各种短视频平台爆火,英歌舞的铿锵鼓点、刚劲舞姿和脸谱化英雄形象契合视频传播逻辑,例如普宁上寮英歌队的“双抛槌”“金戈铁索阵”…

    澎湃科技聊天室|从炫技到进场打工,机器人是真能干还是看着酷?

    从“看着酷”到“真能干”,如今人形机器人正在加速“进场打工”。从2025年上半年开始,它们陆续经历了马拉松比赛、格斗擂台赛等运动赛事。如今,随着具身智能技术的蓬勃发展,机器人已经开始走向真实的工厂流水线。在本次2025世界人工智能大会(WAIC)期间,澎湃科技(www.th…

    创明日之星佳绩,剑指全运金牌!上海队这一点令马赛教练赞叹

    “看球!回接!往右边!”8月3日上午10点,在浦东足球场外场进行的上海队与马赛队之间的五六名争夺战率先打响,看台上的上海队主教练成耀东和场边的上海队助教王贇的呼喊声此起彼伏。在这样一场雨过天晴、闷热异常的苦战中,上海队最终凭借队长李秋甫在比赛尾声的头球接力破门…

    云南会泽一高中教师被指对学生行为逾矩:学校已解除其人事关系

    针对云南会泽县第一中学高一化学教师马某某被指在教室内对女生有触摸敏感部位、搂抱等行为一事,该校相关人士8月4日向澎湃新闻表示,学校初步认定马某某存在师德师风失范问题,已解除其与学校的人事关系,并作出其他相应处分。目前,暂无证据表明马某某涉嫌违法,警方仍在进一…

    林徽因英文书信结集出版,此前由费正清夫人整理保存

    近日,中国现代著名诗人、建筑学家林徽因写于1935年至1940年的大批英文书信由人民文学出版社出版,该部分书信由林徽因外孙女、梁再冰之女于葵编注,以中英文对照的形式,收录于《林徽因全集英文书信卷(一九三五—一九四〇)》之中。这批珍贵的书信绝大多数从未发表。主体部分…

    体坛联播|吴艳妮100米栏折桂,中国男篮官宣亚洲杯大名单

    吴艳妮女子100米栏折桂2025年全国田径锦标赛4日在浙江衢州落幕。当晚最后一个比赛单元中,吴艳妮以13秒15的成绩获得女子100米栏冠军。上海小将陈圆将在男子110米栏中以13秒18的成绩夺冠,成功达标东京田径世锦赛。女子100米栏决赛中,广东队的刘景扬前半程势头强劲,一度处于领…

    建筑瞭望|黑川纪章与胶囊建筑的乌托邦

    纽约现代艺术博物馆(MoMA)正在举办一场以日本建筑师黑川纪章设计的中银胶囊塔为主题的展览,展览名为《中银胶囊塔的多样生命》。中银胶囊塔于1972年在东京银座建成,2022年被拆除。这个建筑由140个胶囊单元的“微型公寓”组成,每个单元内部大约有10平方米的空间,电视机、冰…

    建了20年的大埃及博物馆:一切就绪,只等图坦卡蒙

    上海博物馆古埃及文明大展即将进入尾声,而在埃及,原定于7月正式开幕的大埃及博物馆(GEM)再次延期,全面开幕将推迟至今年第四季度。澎湃新闻获悉,大埃及博物馆作为埃及最大的文化工程,于2002年选址,2005年开工建设,保护修复工作室自2010年起就已运行,博物馆去年秋天开…

    河南7月平均气温破64年最高纪录,旱情如何?何时缓解?

    连日来,河南遭遇持续高温天气。7月份河南全省平均气温达30.5℃,较常年异常偏高3.2℃,这是1961年以来同期最高值。高温所导致的河南旱情如何?给农业和百姓生活带来怎样影响?如何应对?河南近期的高温干旱天气有怎样的特点?未来将如何发展?河南省气象台8月4日发布高温橙色…

    85后“博士哥”钟林履新湖北红安县代县长

    据湖北省黄冈市红安县融媒体中心微信公众号“最红安”消息,8月1日,红安泛家居产业重点项目——金牌家居红安生产基地一期试投产与“德韬泛家居产业园”启动活动在红安高新区举行。红安县委副书记、代县长钟林致辞。红安县委副书记、代县长钟林。微信公众号“最红安” 图稍早前…

    蓝思科技:今年承接智元机器人全系列多款人形机器人业务

    8月4日,蓝思科技(300433)在接受调研时披露公司在人形机器人领域的最新进展。蓝思科技表示,2024年起已为合作伙伴交付数百台整机,今年则承接了智元机器人全系列多款人形机器人业务。蓝思科技表示,公司在2016年成立智能机器人公司,研发和大规模量产工业机器人、机械臂、灵…

    AI让供应链“活”了起来

    前不久,我在做某数字化平台的调研时,与他们的创始人谈到了一个耐人寻味的话题——“为什么中国拥有全球最完整的工业体系,却仍有无数中小工厂困于‘代工边缘’?”对方提到,“其实只用产业链集群来描述中国制造业的供应链能力是不准确的,至少还包括工艺协同、企业协同、行…

    十字路口的古镇|江西瑶里古镇:高人气与低收益之困

    【编者按】小桥流水、青砖黛瓦,熙熙攘攘的古镇曾是几代人的集体旅行记忆。随着时代变迁,年轻人旅行观念和旅行方式急剧转变,越来越多的古镇都身处“十字路口”,是继续忍受门可罗雀还是破釜沉舟升级改造,古镇转型势在必行。更有甚者,不少古镇更被指为“假古镇”、“人造古…

    煤都“美白”记:鄂尔多斯的科技与狠活

    “家里有矿”的鄂尔多斯,未止步于“天资”。这座中国煤炭大市,坐拥2500多亿吨煤炭储量,占全国的1/6,每天产煤200多万吨,源源不断地输送至25个省区市,以一市之力温暖千座城、点亮万家灯。近年来,煤炭,从“燃料”过渡向“原料”,推动着鄂尔多斯从几十年前粗放式的挖煤卖…

    究竟|理想与重卡非撞不可吗:测试有无必要?结果能否证明车辆安全?

    当8吨重卡与理想i8家用SUV正面对撞,卡车车轮腾空、驾驶室前倾——这场碰撞测试,因其合理性引发持续质疑。自7月29日测试视频上线以来,理想汽车、乘龙卡车、中国汽研三方先后多次表态,强调测试非标准车对车碰撞试验、不针对卡车品牌质量等问题。随着争议升温,一系列追问也浮…

    癌还能脑转移?比中风还可怕

    原创 赵峻 小大夫漫画 北京版权声明 以上图文为熊猫医学原创 版权归熊猫医学所有 未经允许,谢绝商业转载 原标题:《癌还能脑转移?比中风还可怕!但只要早发现,90%可以救回来!》 阅读原文特别声明本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,…

    高温天“药”当心,夏季用药有讲究

    原创 张严娇 常笑健康 ▼本文作者▼夏天一到,高温多湿的天气成了常态。不光人难受,药也“难受”。这时候用药不小心,药没效果、浪费钱还是小事,让人头晕、呕吐、加重副作用,甚至危害生命才是大事! 降温避光 药品储存要当心 夏天存药,温度是个难题。人怕中暑,药也怕…