AI破译生命演化密码:我国团队利用蛋白语言模型揭示适应性趋同机制
一、“高阶特征”突破传统研究瓶颈
自然界中存在令人惊叹的趋同演化现象:亲缘关系甚远的蝙蝠与齿鲸,竟各自独立演化出回声定位能力。长期以来,科学家试图从分子层面解释这类现象,但传统研究多聚焦于蛋白质序列中单个氨基酸的趋同变异,存在明显局限性。
研究显示,即便缺乏明确的位点趋同,同源蛋白质仍可能通过高阶结构或理化性质的趋同,实现功能上的相似性。团队成员形象比喻:“如同用不同材质建造结构相似的桥梁——虽然基础单元不同,但整体构架和功能趋于一致。”
二、人工智能赋能演化机制解析
面对这一挑战,邹征廷团队创新开发出名为“ACEP”的计算分析框架,其核心突破在于引入预训练的蛋白语言模型。
该类模型通过对海量蛋白质序列进行深度学习,能够捕捉序列中隐含的复杂上下文信息和高阶特征,进而将氨基酸序列转化为富含演化信息的高维向量。研究人员指出:“蛋白语言模型如同掌握蛋白质‘语法’的智能系统,可解读序列背后的结构与功能规律。”
ACEP框架涵盖三大关键环节:首先测算目标类群同源蛋白嵌入向量的实际距离,随后通过模拟中性演化构建背景距离分布,最终基于统计检验识别是否存在显著的高阶特征趋同信号。
三、系统验证凸显方法可靠性
为检验ACEP的实用性,研究团队开展了多维度实证分析。在Prestin蛋白(回声定位哺乳动物)和PEPC/PPCK蛋白(景天酸代谢植物)等经典案例中,ACEP均有效探测到明确的高阶特征趋同信号。
更具突破性的是,全基因组扫描发现,蝙蝠与齿鲸中存在数百个呈现趋同特征的候选基因。功能分析显示,部分基因显著富集于“感官感知”等与回声定位密切相关的通路。这些新发现基因中,不乏获得正选择分析佐证的案例,进一步支持其参与适应性演化的可能性。
四、推动演化生物学研究范式革新
该研究首次系统论证蛋白质高阶特征趋同是适应性演化的重要机制,突破了以往仅关注氨基酸位点的传统思路。
邹征廷研究员强调:“本项成果不仅深化了对生命演化规律的理解,也彰显人工智能技术在解析复杂生物学问题中的巨大价值。我们期待AI未来能在演化生物学领域实现更广泛的应用。”
ACEF框架为在全基因组尺度系统挖掘复杂适应性趋同模式提供了创新工具。学界认为,这一方法论的进步为探索生物适应性演化的分子基础开辟了新路径,有望推动演化生物学研究范式的转型。相关成果对生物医学、生态保护等学科亦具有重要参考意义。
本研究得到国家自然科学基金与中国科学院战略性先导科技专项资助。ACEP分析框架的源代码已在HuggingFace平台开源,供全球科研同仁使用。
更多文章
-
浙江科创格局焕新:企业梯队成势 创新生态跃升
当时间的指针行至2025年末,浙江的创新图景正在经历一场深刻的演化。年初,一组被称为“杭州六小龙”的科技企业崭露头角,以其突破性的技术与市场表现,拉开了这一年的序幕。它们的集体涌现与稳健成长,不仅成为年度热词,更标志着一个以高潜力科技企业为主角的发展新篇章已然开启。然而,故事并未止步于此。在虚拟现实、智
-
沪举办智能教育研讨会 共话AI推动教学创新路径
近日,上海举办了一场围绕智能技术与教育融合发展的学术会议。与会专家与教师共同探讨了如何借助新兴科技推动教学创新,构建适应数字时代的教育新环境。本次活动由多家教育研究机构、学术团体及企业联合筹办。会上,上海市教育学会负责人指出,人工智能正在深刻改变传统教学形式,推动教育向个性化和均衡化的方向发展。来自
-
制造企业理性布局人工智能 技术扎根产业求实效
当前,人工智能正从概念探讨加速融入实体经济,成为驱动制造业革新的关键力量。在氟化工行业处于领先地位的多氟多公司,较早启动了智能化转型,构建了一套涵盖数据基础、场景应用与产业融合的完整实践体系。位于河南的氟基新材料研发基地内,一面醒目的元素周期表勾勒出企业的技术布局——其产品深度关联了表上前段多个关键
-
人工智能角逐推升资金投入,全球数据枢纽布局加速扩张
标普全球最新统计指出,本年首十一月,全球范围投向数据枢纽的资金累计已接近610亿美元,超越上年总额,刷新历史纪录。行业分析指出,科技领军企业及基建开发商正全力扩充数据处理能力,以应对由智能技术发展带来的庞大运算需求。一、“当前投入仅为开端”数据显示,数据枢纽建设正进入高速扩张阶段。今年前十一月达成的上百
-
技术赋能养殖业 松桃智能养鸡助农增收
在松桃太平营街道的一家禽苗培育场内,近期一批禽苗正装箱运往外地。养殖区里,设备自动运转,环境调控系统持续监测,确保孵化条件稳定。这座现代化养殖场目前有大量种蛋处于孵化阶段,雏禽不断破壳,展现着当地养殖业的活力。自引入重点企业后,松桃蛋鸡养殖逐步走向科技化与规范管理。通过采用自动喂养、光照调节、环境监
