AI破译生命演化密码:我国团队利用蛋白语言模型揭示适应性趋同机制
一、“高阶特征”突破传统研究瓶颈
自然界中存在令人惊叹的趋同演化现象:亲缘关系甚远的蝙蝠与齿鲸,竟各自独立演化出回声定位能力。长期以来,科学家试图从分子层面解释这类现象,但传统研究多聚焦于蛋白质序列中单个氨基酸的趋同变异,存在明显局限性。
研究显示,即便缺乏明确的位点趋同,同源蛋白质仍可能通过高阶结构或理化性质的趋同,实现功能上的相似性。团队成员形象比喻:“如同用不同材质建造结构相似的桥梁——虽然基础单元不同,但整体构架和功能趋于一致。”
二、人工智能赋能演化机制解析
面对这一挑战,邹征廷团队创新开发出名为“ACEP”的计算分析框架,其核心突破在于引入预训练的蛋白语言模型。
该类模型通过对海量蛋白质序列进行深度学习,能够捕捉序列中隐含的复杂上下文信息和高阶特征,进而将氨基酸序列转化为富含演化信息的高维向量。研究人员指出:“蛋白语言模型如同掌握蛋白质‘语法’的智能系统,可解读序列背后的结构与功能规律。”
ACEP框架涵盖三大关键环节:首先测算目标类群同源蛋白嵌入向量的实际距离,随后通过模拟中性演化构建背景距离分布,最终基于统计检验识别是否存在显著的高阶特征趋同信号。
三、系统验证凸显方法可靠性
为检验ACEP的实用性,研究团队开展了多维度实证分析。在Prestin蛋白(回声定位哺乳动物)和PEPC/PPCK蛋白(景天酸代谢植物)等经典案例中,ACEP均有效探测到明确的高阶特征趋同信号。
更具突破性的是,全基因组扫描发现,蝙蝠与齿鲸中存在数百个呈现趋同特征的候选基因。功能分析显示,部分基因显著富集于“感官感知”等与回声定位密切相关的通路。这些新发现基因中,不乏获得正选择分析佐证的案例,进一步支持其参与适应性演化的可能性。
四、推动演化生物学研究范式革新
该研究首次系统论证蛋白质高阶特征趋同是适应性演化的重要机制,突破了以往仅关注氨基酸位点的传统思路。
邹征廷研究员强调:“本项成果不仅深化了对生命演化规律的理解,也彰显人工智能技术在解析复杂生物学问题中的巨大价值。我们期待AI未来能在演化生物学领域实现更广泛的应用。”
ACEF框架为在全基因组尺度系统挖掘复杂适应性趋同模式提供了创新工具。学界认为,这一方法论的进步为探索生物适应性演化的分子基础开辟了新路径,有望推动演化生物学研究范式的转型。相关成果对生物医学、生态保护等学科亦具有重要参考意义。
本研究得到国家自然科学基金与中国科学院战略性先导科技专项资助。ACEP分析框架的源代码已在HuggingFace平台开源,供全球科研同仁使用。
更多文章
-
人工智能加速融入千行百业 开启智能应用新阶段
一、智能体时代已来随着数字技术持续演进,社会正经历从以信息和个人为中心的互联网阶段,迈向以智能系统为核心的新时期。在这一过程中,人工智能不再仅是辅助工具,而是能够自主感知、判断并协同运作的数字主体,推动形成人机协作、智能互联的新型社会运行方式。行业专家指出,智能体作为融合机器学习与自然语言理解等能力
-
沪上高校牵头制定国际标准 破解科研数据互通难题
在推动科技自主创新的进程中,标准化建设正成为打通产学研闭环的关键支撑。近日,复旦大学科研团队主导的两项重要标准规范相继进入审核发布阶段——一项医疗数据流通国家标准已获核准,另一项涉及多组学数据的国际标准也进入国际审批流程。这些标准将为科研数据的共享与应用建立统一规范。当前,在全球科技竞争日益激烈的背
-
海淀区青少年科技嘉年华启幕 构筑创新教育实践平台
一、组建区域科教单位协作联合体启动仪式上,来自国家级科研机构、知名高等学府、前沿人工智能公司及科普场馆的代表共同见证了海淀区中小学科教资源联合体的正式启动。该协作机制是继本季度初校外教育资源平台搭建后,区域推动社会力量参与育人工作的又一重要实践,旨在汇聚多方专业资源,构建学生走出校门的科学实践新空间
-
美方技术围堵多年未果 中国科技创新实现系统性崛起
近期有国际观察指出,尽管美国长期以来通过出口管制、技术封锁等手段试图延缓中国科技发展步伐,但实际效果却与预期相悖。在半导体、人工智能、通信技术等多个关键领域,中国不仅未受制于人,反而展现出加速发展的态势。回顾通信技术发展历程,中国从2G时代的跟随者,逐步晋升为5G技术的全球引领者,并在6G专利布局中占据先
-
并行科技李津宇:MaaS模式推动海洋AI迈向新阶段
海洋占据地球表面绝大部分面积,是人类社会持续发展的关键基础。近年来,高速运算与智能技术不断融合,推动海洋科学研究实现深刻变革。无论是风暴潮预警、卫星数据产品开发,还是立体监测体系优化和高精度预报模型应用,技术突破正持续强化海洋安全、资源利用与生态保护的支撑能力。然而,行业在高速成长中也面临诸多挑战。
