AI如何赋能生命科学:用“万能函数”表征生命

article/2025/7/29 10:03:34

·要让AI在这个问题上有“用武之地”,还需要科学家在数据、算法等方面做大量的调整和创新工作。

生命是宇宙中最精妙复杂的系统。从一个细胞分裂增殖到37万亿细胞协同构建成一个完整的人体,其背后蕴藏的信息与规律浩如烟海。面对指数级增长的生物大数据和高度动态与非线性的生命过程,人工智能(AI)技术有望帮助科学家探寻其中的规律。

7月28日,在上海举行的世界人工智能大会(WAIC)“AI赋能生命科学论坛”上,来自中国科学院等机构的多名顶尖学者齐聚一堂,共同探讨了如何利用人工智能(AI)这一强大引擎,将离散、高维的生物数据转化为可理解、可预测、甚至可调控的生命模型。

用AI“万能函数”绘制生命地图

对自然世界进行数理建模往往要求科学家首先理解系统背后的物理或化学原理,再用微分方程等工具进行描述。以神经网络算法为基础的AI模型则提供了另一种表征自然的方式:它不预设具体的规律,而是通过学习海量数据,自动发现其中隐藏的高维、非线性关联。中国科学院分子细胞科学卓越创新中心研究员、上海交通大学讲席教授陈洛南将其形容为一个“万能函数”。

生命科学的一个首要问题是构建静态表征,即为复杂的生命系统在特定时刻拍摄一张超高分辨率的“快照”,揭示基因如何调控、蛋白质如何相互作用、细胞如何互动等等过程。要让AI在这个问题上有“用武之地”,还需要科学家在数据、算法等方面做大量的调整和创新工作。

“所有的AI for life science(AI赋能生命科学),基石就是大数据。” 中国科学院院士李劲松说。大数据并不仅仅意味着“多”,统一标准、高质量的数据才是AI模型能够“洞察真相”的前提。

生命科学的核心遵循着一个“中心法则”:DNA储存遗传蓝图,通过转录形成信使RNA,再由RNA指导蛋白质的合成。蛋白质作为生命活动最主要的功能执行者,其种类、数量、位置和相互作用,决定了细胞的命运乃至整个机体的健康与疾病。李劲松院士团队提出的“基因组标签计划”(GTP),通过“类精子干细胞”技术,为小鼠所有2万多个编码蛋白质的基因逐一打上“标签”,用一个统一的框架来追踪动物实验中蛋白质发生的变化。

“未来所有这些蛋白质的研究,就可以用一个抗体的标准化研究体系来搞定,”李劲松将其比喻为生命科学研究的“北斗导航系统”。在这个系统中,每一个蛋白质都被精准“定位”,为后续所有AI分析提供了前所未有的标准化高质量数据基础。

有了标准化的数据,AI便能大显身手,绘制出更精细的“地图”。中国科学院动物研究所的李鑫研究员展示了如何构建“AI虚拟细胞”。他们将海量单细胞数据“喂”给AI,让模型学习细胞的“语言”。“我们把每个细胞的基因表达当成一篇文章,通过自回归的遮蔽训练去完成建模,”李鑫解释道。这好比让AI阅读了数百万篇描述细胞状态的“文章”后,学会了精准表征每一个细胞的状态。

AI能从人类难以理解的信息中“看”出规律。西安交通大学教授叶凯提出一种AI数据分析策略,将一维的基因组序列信息“升维”成二维的图像,使得原本适用于图像识别的强大AI算法(如卷积神经网络)可以直接用于分析基因组,从而在复杂的基因组结构变异检测中,捕捉到传统方法难以发现的模式。

由静到动

生命并非静止的图景,而是一部时刻演进的电影。如何从一张张“快照”中,解读出生命过程的动态规律,是AI赋能生命科学的另一个突破点。然而,AI模型虽然“万能”,虽然能输出正确的结果,但其内部复杂的参数也使其成为难以解读的“黑箱”。

要通过AI模型理解生命,就需要将它从“黑箱子变成一个白箱子”。为此,陈洛南团队提出了“时空信息转换”(STI)理论。该理论从数学上证明,一个高维度的空间状态(静态快照)可以在特定条件下映射为一个低维度的时间序列(动态电影)。这意味着,AI无需看到整个过程,仅通过分析高质量的静态数据,就有可能推演出其背后的动态演化规律。

不同于DNA,目前RNA的结构跟功能的真实测量数据还比较缺乏。深势科技研发负责人、北京科学智能研究院研究员温翰介绍了在相关理论的基础上构建的通用RNA预训练模型,通过AI模型加入“先验”知识结构和算法创新,不仅提高了在少量训练数据基础上预测RNA结构的准确性,更能模拟其在细胞内的动态行为,如调控翻译效率和稳定性。

中国科学技术大学教授刘海燕也指出,蛋白质的功能源于其动态变化。AlphaFold解决了蛋白质的静态“折叠”问题,但要设计出真正有功能的“分子机器”,就必须理解其动态过程。他的团队正致力于通过AI模型,预测蛋白质的动态学特性,甚至设计出能在不同状态间切换的复杂功能蛋白。

导航生命,干预疾病

如果AI能够理解并预测生命的“动态电影”,那么终极目标便是成为一名“导演”,对生命过程进行智能导航与干预。

陈洛南认为,疾病的发生并非一蹴而就,而是从正常状态,经过一个难以察觉的“临界态”,最终才滑向不可逆的疾病状态。他的团队开发了能够根据患者健康数据识别出这个“临界点”的AI模型,实现“治未病”的精准导航。

浙江省肿瘤医院的程向东分享了其团队利用AI进行胃癌早筛的成果。他们训练AI模型通过解读腹部CT平扫图像来发现早期胃癌。他们的模型能将需要做胃镜检查的高危人群从25%浓缩到6.2%,极大地提升了早期诊断的效率。

AI的“导航”能力不仅体现在“避开悬崖”,更体现在“开辟新路”。中国科学院微生物研究所研究员王军介绍了利用AI语言模型在浩瀚的微生物基因组中挖掘具有特定功能的“功能多肽”的研究成果。他的团队甚至能“无中生有”,设计出自然界不存在、但能让工业菌株生长速度提升30%的全新多肽。这如同为生命系统编写了新的“程序代码”,主动引导其走向我们期望的方向。

多名学者提到,AI不仅正在加速知识的发现,更在创造全新的研究范式,但它在生命科学中的应用仍面对多重挑战。首先是数据鸿沟,李劲松指出,高质量、标准化的数据仍是稀缺资源。其次是可解释性瓶颈,AI的“黑箱”本质意味着学者仍需关注科学研究的可解释性。最后是从虚拟到现实的鸿沟。刘海燕指出,AI设计的分子或细胞能否在真实世界中稳定存在并发挥作用,仍需大量的实验验证。

    责任编辑:宦艳红
    图片编辑:蒋立冬
    校对:丁晓

    http://news.xdnf.cn/GjboOJMhKd

    相关文章

    云南省广播电视局局长盛高举转任省自然资源厅党组书记

    近日,云南省自然资源厅官网“领导之窗”栏目更新显示,盛高举现已履新云南省自然资源厅党组书记,主持厅党组全面工作,联系云南省林业和草原局。此前,盛高举担任云南省广播电视局党组书记、局长。公开资料显示,盛高举,男,汉族,1970年9月生,云南省委党校研究生学历,中共…

    日本政府8月1日召开临时国会,将选举参议院领导层

    当地时间7月29日,日本内阁官房长官林芳正出席众议院和参议院议院运营委员会理事会,宣布将于8月1日召集临时国会,并公布了相关的日程安排。在本次临时国会中,将选出参议院的正副议长以及各委员会委员长等职位。此外,还计划于8月4日召开众议院预算委员会会议,首相石破茂将出…

    美国纽约曼哈顿枪击案造成包括枪手在内6人死亡

    当地时间7月28日,美国纽约警方通报曼哈顿枪击案最新伤亡情况,事件共造成6人死亡,包括一名警员、4名平民及枪手本人。据执法部门消息人士透露,枪手系自尽身亡。目前,遇难警员家属已接到正式通知。责任编辑:伍智超澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    第三家汽车央企!中国长安汽车集团有限公司正式成立,注册资本200亿元

    “新长安”正式成立。7月29日,澎湃新闻从全国组织机构统一社会信用代码数据服务中心官网获悉,中国长安汽车集团有限公司(以下简称“中国长安”)于2025年7月27日正式注册成立,注册资本200亿元,法定代表人为朱华荣,注册地址为重庆市江北区建新东路260号。这是继中国一汽集…

    山东出版总经理申维龙辞职,李涛接任

    山东出版传媒股份有限公司(下称“山东出版”,证券代码:601019.SH)7月28日公告称,公司董事会于7月25日收到公司董事、总经理申维龙的辞职报告书。因工作调整原因,申维龙申请辞去公司总经理及第四届董事会提名、薪酬与考核委员会委员职务,该辞职报告书自送达公司董事会之日…

    成都世运会中国体育代表团成立

    成都第12届世界运动会中国体育代表团成立大会29日在北京召开。责任编辑:万婷婷图片编辑:沈轲澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    冒充女性求职并编造低俗内容,“王某香简历事件”涉事男子被刑拘

    近日,网络流传某招聘平台一自称“王某香”的“求职者”与招聘方沟通中存在低俗信息,引发大量网民关注和讨论,扰乱网络空间秩序。经查,尹某杰(男,28岁)为发泄个人情绪,在某招聘APP上注册网名“王某香”的账号,盗用某社交平台2名网络博主个人照片,并虚构“某广播电视台…

    为防基孔肯雅热和登革热,佛山广州两地公园投放“灭蚊鱼”

    据微信公众号“广州市人民公园”7月28日消息,当前,广州持续高温和湿热的天气为蚊媒滋生创造了有利条件,基孔肯雅热与登革热(以下简称“两热”)疫情防控形势严峻。广州市人民公园管理中心迅速响应省、市及主管单位部署,针对人民公园、广州兰圃及海珠广场三大园区“植被茂密…

    网红罗大美遇害案今日再次开庭:主犯曾多次抢劫被判刑,刑满后又犯案

    反串网红“罗大美”遇害案于7月29日上午9点在南阳市中级法院再次不公开开庭审理。上午8点30分,在法院诉讼参与人通道口附近,媒体记者和自发赶来的网民,将罗大美家属围在人群中。罗大美母亲表示,希望判处三名凶手死刑,自己会坚强努力,为儿子讨回公道。7月29日上午8点40分,…

    “不太想和普京谈了”,特朗普要缩短对俄最后通牒50天期限

    美国总统特朗普与俄罗斯总统普京。视觉中国 资料图美国总统特朗普在英国苏格兰南艾尔郡与英国首相斯塔默会晤前对在场记者表示,他对俄罗斯总统普京“十分失望”,将考虑缩短此前对俄罗斯设置的50天内达成俄乌和平协议的期限。“我打算从今天起,设定一个新的最后期限,大约是1…

    儒说|《孟子》入门的入门……的入门

    宋代以降,孔孟并称,《论语》《孟子》被誉为儒学双璧。江户大儒伊藤仁斋谓:“读《论语》,而不读《孟子》,则不知《论语》之言,自有头柄;读《孟子》,而不读《论语》,则亦不知《孟子》之说,本有所据。凡二书之理,浑融通彻,打成一片,是为善读《论》《孟》者也。”惭愧…

    访谈|赖楚谣:算法让更多普通人被看见,也给了他们对生活的掌控感

    【编者按】“算法生活揭示了一系列颠覆性权力关系生成的可能,并最终指向一种可编程世界的可能性。”华东政法大学韬奋新闻传播学院副教授、复旦大学新闻学院博士赖楚谣在其专著《算法生活》中这样写道。她曾在多个短视频直播村实地田野,进行为期12个月的数码民族志,希望从短…

    以媒:以安全内阁考虑“全面军事占领”加沙地带

    当地时间2025年7月28日,加沙地带汗尤尼斯穆瓦西,巴勒斯坦人查看遭到以色列轰炸的地点。视觉中国 图以色列媒体28日报道,以安全内阁正在考虑对加沙地带进行“全面军事占领”,并对巴勒斯坦伊斯兰抵抗运动(哈马斯)活动较为活跃的某些城市中心“实施围困”。据以色列第12频道…

    暑运以来,全国铁路累计发送旅客突破4亿人次

    7月1日,旅客在天津西站候车。新华社 资料图记者从国铁集团获悉,自7月1日暑运启动以来至28日,全国铁路累计发送旅客4.02亿人次,同比增长4.8%,日均安排加开旅客列车541列。今天(29日),全国铁路预计发送旅客1290万人次,计划加开旅客列车462列。责任编辑:张珺图片编辑:陈…

    我国最大超深油气区日产破万吨

    今天(7月29日),记者从中国石油获悉,位于塔克拉玛干沙漠腹地的我国最大超深油气区——富满油气区日产油气突破一万吨,标志着我国8000米级超深油气开采步入规模上产新阶段。位于新疆沙雅县的富满油气区的满深72-H2井日前喷出高产油气,至此,今年富满油气区已钻成30口超深高…

    台风“竹节草”越来越近,上海集中降水时段预计为今晚到明天白天

    台风“竹节草”越来越近了。据@上海市天气7月29日早晨消息,今年第8号台风竹节草(热带风暴级),今天6点钟中心位置已经到达距离浙江省舟山市东南方向约425公里的洋面上,中心气压992百帕,近中心的最大风力8级(18米/秒)。台风中心目前正以每小时15-20公里左右的速度向西偏北方…

    驴友称南太行“一线天”排队5小时体验2分钟,山西古郊乡政府回应

    7月26日,南太行徒步路线“一线天”出现拥堵,驴友排长队等待,有人称排队5小时体验2分钟。28日凌晨,山西古郊乡政府发布通告称,南太行已进入主汛期,沿途河流水位上涨,即日起临时封闭两条徒步路线。驴友在“一线天”峡谷附近排长队。图/受访者提供 一位徒步爱好者杨先生告诉…

    美国纽约曼哈顿发生枪击事件,至少6人中枪

    当地时间7月28日下午,纽约曼哈顿公园大道与51街交界处发生枪击事件,造成至少6人中枪,其中包括一名警员。据警方最新通报,持AR-15式步枪的嫌疑人已被制服。纽约市四位高级官员确认,该枪击案嫌疑人已死于枪击。纽约警察局长通过社交媒体X平台发布声明称,该枪手为“单独作案…

    年轻力量闪耀世界人工智能大会:一座城市和AI的双向奔赴

    16岁放弃高考,成为清华特邀讲师;18岁拿到德国大学Offer,却选择退学;后来获得全奖前往美国深造,又因创业中途休学两次。1996年出生的倪正民,走出一条“不循规蹈矩”的成长路径。从硅谷回到上海后,他开启人生第三次创业,这也是他连续第九年与创业为伴。他所创办的AI智能体…

    美国纽约曼哈顿突发枪击,2人中弹

    当地时间7月28日,美国纽约市曼哈顿公园大道345号发生枪击事件,已致一名警员和一名平民中弹。目前具体情况尚不明确。事发后,纽约警方已封锁相关区域,并呼吁民众避开事发现场。据悉,公园大道345号是黑石集团总部所在地,同时设有NFL总部、美国银行分行以及毕马威会计师事务…