AlphaFold
AlphaFold 是由 Google DeepMind 开发的人工智能系统,旨在根据氨基酸序列精准预测蛋白质的三维结构。2020 年,AlphaFold 2 在 CASP14 竞赛中取得了原子级精度的惊人成绩,被科学界公认为解决了困扰生物学 50 年的“蛋白质折叠问题”。2024 年发布的 AlphaFold 3 进一步引入了扩散模型(Diffusion Model),将预测范围扩展至蛋白质与 DNA、RNA、小分子配体及修饰离子的相互作用。这一技术彻底改变了结构生物学的研究范式,极大地加速了基于结构的药物设计(SBDD)和疾病机理研究。因其革命性贡献,核心研发者 Demis Hassabis 和 John Jumper 荣获 2024 年诺贝尔化学奖。
技术演进:从 v2 到 v3
AlphaFold 的核心突破在于利用深度学习技术,从进化信息中提取空间几何约束。
| 版本 | 核心架构 (Architecture) | 能力边界 |
|---|---|---|
| AlphaFold 2 (2020) |
Evoformer (进化转换器): 利用多序列比对 (MSA) 捕捉共进化信息,通过注意力机制处理氨基酸对之间的空间关系。 | 单体蛋白与多聚体: 极高精度的蛋白质骨架和侧链预测,主要针对蛋白质本身。 |
| AlphaFold 3 (2024) |
Pairformer + 扩散模型 (Diffusion): 减少了对 MSA 的依赖,引入生成式扩散模块直接生成原子坐标云。 | 生物分子复合物: 能预测蛋白-DNA/RNA、蛋白-配体(药物)、抗体-抗原复合物及共价修饰。 |
核心机制:Evoformer 与注意力
多序列比对 (MSA) 的力量
原理: 结构比序列更保守。
AlphaFold 首先在巨大的基因数据库中搜索与目标蛋白相似的序列,构建 MSA。如果两个氨基酸在进化过程中发生共变(例如,位置 A 的突变总是伴随着位置 B 的补偿性突变),则暗示这两个氨基酸在三维空间中靠得很近。
端到端预测 (End-to-End)
不同于以往的“分步拼接”方法,AlphaFold 是端到端的。它直接从序列输入到结构输出,中间通过 Structure Module 旋转和平移每个氨基酸残基(视为刚体),通过反复迭代(Recycling)来优化最终的能量状态,直至结构收敛。其输出包含一个置信度指标 pLDDT,用于衡量预测的局部准确性。
AlphaFold网络架构简图
💊 医药研发应用
- 不可成药靶点 (Undruggable Targets): 快速揭示缺乏晶体结构的潜在药物靶点的口袋特征。
- 虚拟筛选 (Virtual Screening): 结合 AlphaFold 3,可以直接模拟小分子药物与蛋白质口袋的结合模式,大幅降低湿实验筛选成本。
- 抗体设计: 预测抗体与抗原的结合界面,辅助生物大分子药物的优化。
学术参考文献与权威点评
[1] Jumper J, Evans R, Pritzel A, et al. (2021). Highly accurate protein structure prediction with AlphaFold. Nature. 2021;596(7873):583-589.
[里程碑文献]:AlphaFold 2 的主论文,详细披露了模型架构,是引用率最高的 AI 生物学论文之一。
[2] Abramson J, et al. (2024). Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature. 2024;630:493–500.
[最新突破]:介绍了 AlphaFold 3,展示了其在预测蛋白质与 DNA、RNA 及小分子配体复合物结构方面的超越性能力。
[3] Callaway E. (2020). 'It will change everything': DeepMind's AI makes gigantic leap in solving protein structures. Nature News. 2020;588:203-204.
[新闻评论]:报道了 CASP14 的结果,标志着蛋白质结构预测问题在某种程度上被“解决”。