谷歌深度学习模型AlphaFold 3重磅论文登上《自然》
系首个在生物分子结构预测方面超越基于物理工具方法的AI系统AlphaFold 3准确率比现有最好方法高50%
论文称,基于 AlphaFold 2能力的提升,AlphaFold 3如今能预测蛋白质与蛋白质、核酸、小分子、离子、修饰蛋白质残基的复合物以及抗体-抗原相互作用,其预测准确性显著超过当前预测工具,包括AlphaFold-Multimer。DeepMind 团队称,这意味着AlphaFold 3 将人类带到了蛋白质之外的更广泛的生物分子领域。这一飞跃可能开启更多变革性的科学,从开发生物可再生材料和更具弹性的材料,到加速药物设计和基因组学研究等。
AlphaFold 2 于 2020 年问世,可根据蛋白质的氨基酸(蛋白质的基本成分)序列预测其3D结构。论文第一作者、DeepMind高级研究科学家John Jumper 和同事称,到目前为止,全球数以百万计的研究人员已经使用 AlphaFold 2在疟疾疫苗、癌症治疗和酶设计等领域取得了进展。同时,AlphaFold 2据称已被用于预测数以亿计的结构,而按照目前全球的结构生物学实验的速度,这需要花费数亿年的研究时间。
据悉,AlphaFold 3的核心是深度学习模块 Evoformer 的改进版,Evoformer 是 AlphaFold 2的基础架构。论文称,只要给定分子输入列表,AlphaFold
nd 3就会使用一个类似于人工智能图像生成器的融合网络来组合预测结果,不仅能生成它们的联合三维结构,还能揭示分子是如何结合在一起的。
论文称,AlphaFold 3在预测类似药物的相互作用(包括蛋白质与配体的结合以及抗体与目标蛋白质的结合)方面达到了前所未有的准确性。在基准测试中, AlphaFold 3的准确率比现有最好的传统方法高出50%,且无需输入任何结构信息,这使得AlphaFold 3成为首个在生物分子结构预测方面超越基于物理工具的方法的人工智能系统。
DeepMind 团队认为 ,AlphaFold 3有能力将生物界带到前所未有的高度。该系统能够使科学家看到细胞系统的所有复杂性,包括结构、相互作用和修饰,同时揭示了它们是如何相互联系的,并有助于理解这些联系是如何影响生物功能的——比如药物的作用、激素的产生和DNA修复的健康保护过程。
AlphaFold 3的表现表明,开发正确的深度学习框架可以大量减少在这些任务中获得生物学相关性能所需的数据量,并扩大已经收集的数据的影响。DeepMind 预计结构建模将继续改进,这不仅是因为深度学习的进步,而且还因为实验结构确定方法的持续进步,例如低温电子显微镜和断层扫描的巨大改进,将提供丰富的新训练数据,以进一步提高此类模型的泛化能力。实验和计算方法的并行发展有望推动人们更快速地进入一个对分子结构和疾病治疗更加了解的时代。
论文同时介绍,DeepMind新推出的AlphaFold服务器是全球预测蛋白质如何与细胞内其他分子相互作用的最准确的工具。
AlphaFold服务器是一个免费的平台,生物学家可以利用AlphaFold 3的强大功能来模拟由蛋白质、DNA、RNA以及一系列配体、离子和化学修饰物组成的结构。“AlphaFold服务器的影响将通过它们如何使科学家加速发现生物学和新研究领域的开放性问题来实现。我们刚刚开始挖掘AlphaFold 3的潜力,迫不及待地想看看未来会发生什么。” DeepMind团队在论文中写道。
而且,AlphaFold 服务器可以帮助科学家提出新的假设,并在实验室中进行测试,从而加快工作进度,实现进一步的创新。如果采用传统方法,要实现蛋白质结构预测,不仅需要博士级别的知识水平,还要花费数十万美元才能完成。谷歌云平台plaorm还为研究人员提供了生成预测的便捷方法,即使研究人员没有计算资源或不掌握机器学习方面的专业知识也能操作。据悉,Isomorphic Labs正将AlphaFold 3与一套互补的内部人工智能模型相结合,为内部项目以及制药合作伙伴进行药物设计,以期加快并提高药物设计的成功率。
DeepMind团队称,AlphaFold 3将人类带到了蛋白质之外的更广泛的生物分子领域。这一飞跃可能开启更多变革性的科学,从开发生物可再生材料和更具弹性的材料,到加速药物设计和基因组学研究等。