蛋白结构预测AI问世五载,颠覆性推动生命科学研究

发布时间: 访问量:3

问世已满五载的人工智能系统“阿尔法折叠”第二代,正以前所未有的方式重塑生命科学的研究图景。该系统由谷歌旗下DeepMind团队研发,能够精准预测数以亿计的蛋白质三维构造,将以往耗时数年的解析工作压缩到几分钟内完成,彰显了人工智能驱动科研革命的强大能力。

据国际权威学术期刊《自然》网站近期报道,该工具不仅革新了结构生物学的研究范式,也强力助推了计算生物学的发展。然而,将其产生的深刻生物学认识,转化为如新药研发等具体成果,仍是一个需要耐心等待的过程。

1. 加速科学发现步伐

“阿尔法折叠”第二代的应用已渗透至多个科研前沿。

奥地利维也纳分子病理研究所的安德烈亚·泡利及其团队,长期致力于解密卵子与精子结合的奥秘。多年前,他们虽在斑马鱼卵表面发现了一种名为Bouncer的关键蛋白,却难以阐明其识别精子的具体过程。

该人工智能系统的出现带来了突破。其预测显示,一种称为Tmem81的蛋白能与两种精子蛋白结合形成复合体,并与Bouncer发生相互作用。后续的实验数据成功证实了这一预测。

泡利坦言,这一工具极大地提速了他们的研究,“现在几乎每个课题都会借助它”。团队在2024年发表了相关成果,该文章正是引用“阿尔法折叠”二代原始研究论文的近四万篇学术文献之一。2021年夏季,DeepMind公开了该模型的源代码,并在《自然》上详细公布了技术细节。

不同于一般高引用论文的热度周期,科学界对它的关注持续高涨。

许多学者指出,其得以快速普及的核心在于开源共享。研发团队不仅公布了算法,还与欧洲分子生物学实验室协作,构建了一个涵盖超过2.4亿个蛋白质结构预测的公共数据库。该库已囊括了近乎所有已知蛋白质,为全球逾330万来自上百个国家的科研人员提供了支持。

2. 改变学科发展轨迹

受“阿尔法折叠”二代冲击最为显著的,当属结构生物学领域。欧洲生物信息学研究所的珍妮特·桑顿评论道,它“彻底改变了这一学科的面貌”。

据统计,采用该工具的研究人员,向国际蛋白质结构数据库提交成果的数量,比未使用者高出近五成,提交效率也优于使用其他人工智能方法或传统实验技术的团队。

尤为值得关注的是,这个依托于已有蛋白质数据库训练而成的模型,正在反向赋能实验科学。其核心研发者约翰·江珀指出,预测出的结构能有效协助科研人员解读通过X射线晶体学或冷冻电镜技术获得的实验数据,这对那些曾为模型训练提供基础数据的研究者来说,无疑是一种回馈。

计算生物学也因此获得了新的发展动力。桑顿注意到,现今的学术会议上,几乎每个报告都会涉及或引用该工具。在明确引用它的文献中,人工智能辅助的药物开发、新型蛋白质设计等方向最为活跃。

美国哥伦比亚大学的计算生物学家穆罕默德·阿尔库赖希回忆,在该系统初问世时,不少同行曾感到忧虑,担心蛋白质结构预测这一根本性问题已被彻底解决,从而引发领域内的“生存危机”。但事实证明,它开拓了更广阔的创新空间,例如人工智能驱动的蛋白质设计,不仅点燃了新的研究激情,也吸引了更多资金涌入。

目前,科学家们正借助该工具设计对抗抗生素耐药性的新策略、探索治疗疟疾等疾病的新方法,并更深入地理解疾病机理,以促进靶向药物的研发进程。

3. 产生广泛辐射效应

直接引用其论文或使用其数据库,仅仅是“阿尔法折叠”二代广泛影响力的表层体现。

英国伦敦创新增长实验室的科学家乔治·理查森与大卫·安普迪亚·文森特经过综合分析后估计,有超过20万项研究、近80万名科研人员直接或间接地从该技术中获益。

然而,当他们试图具体量化其影响时,却发现情况并不简单:实验室的整体论文产出增长约为5%,而研究者个人的产出增幅平均仅为2%。理查森指出,这并未催生出急功近利的“论文生产流水线”,其真正价值体现在更深层次的科学认知推进上。

在临床与商业转化层面,其影响同样复杂多元。这可能因为五年时间尚短,还不足以充分体现在专利或上市产品等指标中。江珀也认为,将生物学洞察转化为切实应用,需要更长时间的积累。

2024年,“阿尔法折叠”第三代模型正式亮相,其在药物发现领域展现出更大潜力,能够预测潜在药物分子与靶标蛋白之间的相互作用。

江珀坚信,基于第二代系统所取得的科学发现,正在帮助研究人员揭示疾病的根本机制。他展望,在不远的将来,定会有患者因这项技术的赋能而恢复健康。

更多文章