从蛋白质单体到全生物分子复合物——AlphaFold 3 实现了对生命分子结构的统一预测,开启了结构生物学的新纪元。
AlphaFold 3 是 DeepMind 于 2024 年 5 月发布的第三代蛋白质结构预测模型。与仅预测蛋白质单体的 AlphaFold 2 不同,AlphaFold 3 实现了从单一蛋白质到蛋白质-配体、蛋白质-核酸、蛋白质-蛋白质复合物的全链路结构预测。
这一突破使得研究人员能够直接预测药物分子与靶标蛋白的结合模式、抗体与抗原的相互作用、以及蛋白质与 DNA/RNA 的识别机制,极大地加速了药物发现与基础生物学研究的进程。
AlphaFold 3 于 2024 年 5 月 8 日在 Nature 杂志发表,论文标题为 "Accurate structure prediction for biomolecular interactions",标志着 AI 结构生物学进入新阶段。
预测蛋白与小分子药物的结合模式与亲和力
揭示蛋白与 DNA/RNA 的识别与结合机制
预测抗体-抗原、信号通路等蛋白复合物
支持糖链等翻译后修饰的建模与预测
从 CASP13 的惊艳亮相到 AlphaFold 3 的全生物分子预测,每一步都在重新定义结构生物学的边界。
CASP13 大赛中首次亮相,在自由建模中排名第一,基于梯度下降优化与残差网络,开启了深度学习预测蛋白质结构的新篇章。
CASP14 中达到实验精度水平(中位 GDT ≈ 92.4),引入 Evoformer + Structure Module 架构,被认为是 AI 结构生物学的"登月时刻"。2021 年开源代码与数据库。
扩展到蛋白质复合物预测(蛋白-蛋白对接),支持多链复合物建模,AlphaFold Protein Structure Database 覆盖超过 2 亿个预测结构。
统一预测蛋白质、DNA、RNA、小分子配体及糖链的复合物结构,引入扩散模型替代 Structure Module,在蛋白-配体结合位点预测上超越传统对接方法。
AlphaFold 3 在 AlphaFold 2 基础上进行了三大关键升级,构建了全新的多模态生物分子结构预测框架。
蛋白质序列 + DNA/RNA序列 + 小分子SMILES + 糖链序列
统一的多生物分子表征 + MSA搜索 + 模板检索 + 化学键图编码
48层 MSA + Pair 模块
注意力机制迭代更新
仅使用 Pair 表示
减少对 MSA 的依赖
替代 AlphaFold 2 的 Structure Module (SE(3)-Transformer),通过逐步去噪生成原子坐标,天然支持多链、配体和核酸的灵活建模
蛋白质 + DNA/RNA + 小分子 + 糖链 + 离子 → 完整复合物结构
用条件扩散模型替换了 SE(3)-Transformer,通过从噪声逐步去噪生成原子坐标,天然支持不同链之间自由度差异,解决了多模态联合建模的难题。
将蛋白质残基、核酸核苷酸、小分子原子统一为 token 序列,每个 token 携带化学类型、电荷等特征,实现了跨模态的统一表征。
改进的 pLDDT 与 PAE 评估体系,新增 ipTM 指标专门衡量复合物界面质量,帮助研究者判断预测结果的可信度。
| 对比维度 | AlphaFold 2 | AlphaFold 3 |
|---|---|---|
| 预测对象 | 蛋白质单体 | 蛋白质 + DNA + RNA + 小分子 + 糖链 |
| 结构模块 | SE(3)-Transformer | 条件扩散模型 |
| 蛋白-配体预测 | 不支持 | 支持 (优于传统对接) |
| 蛋白-核酸预测 | 不支持 | 支持 |
| 多链复合物 | 有限支持 (Multimer) | 原生支持 |
| 置信度指标 | pLDDT + PAE | pLDDT + PAE + ipTM + pTM |
| MSA 依赖 | 高度依赖 | 降低(Pairformer 补充) |
| 预测速度 | 数分钟~数十分钟 | 分钟级(含采样) |
AlphaFold 3 正在重塑从基础研究到药物开发的完整链条。
直接预测候选药物与靶标蛋白的结合模式,无需晶体结构即可评估药物可及性与结合位点,将先导化合物优化周期从数月缩短至数天。
预测抗体与抗原的复合物结构,识别关键结合表位与互补决定区(CDR),辅助亲和力成熟与人源化设计,加速抗体药物的发现。
验证从头设计的蛋白质结构合理性,预测突变对蛋白稳定性和功能的影响,辅助工业酶改造与功能蛋白设计。
预测转录因子与 DNA 的结合模式、RNA 结合蛋白与 mRNA 的识别机制,揭示基因表达调控的结构基础。
在 PDB 近期释放的结构上的基准测试结果(论文数据)。
结合位点预测精度,显著优于传统对接方法
首次实现蛋白质-DNA/RNA复合物的高精度预测
保持与 AlphaFold 2 相当的单体预测精度
AlphaFold 3 虽然是里程碑式的突破,但仍有一些已知的局限性需要注意。
预测的是静态最优结构,无法捕捉蛋白质的构象变化、别构效应等动态行为。需要结合分子动力学模拟获取动态信息。
能预测结合模式,但不能直接输出结合自由能(ΔG)。需要结合 MM/GBSA、FEP 等方法进行亲和力排序。
对膜蛋白、无序区域及极端 pH/温度条件下的结构预测能力有限,需补充实验验证。
运行 AlphaFold 3 需要大量 GPU 资源,尤其是大规模虚拟筛选场景,需要专业的计算平台支撑。
基于 AlphaFold 3 的专业技术服务平台,让科研与药物发现更高效。
基于 AlphaFold 3 对蛋白质、蛋白-配体、蛋白-核酸复合物进行高精度结构预测,提供 pLDDT/ipTM 置信度分析。
结合分子动力学模拟与 MM/GBSA 自由能计算,对 AlphaFold 3 预测结果进行交叉验证与精度提升。
利用 AlphaFold 3 预测的靶标结构进行百万级化合物虚拟筛选,结合 AI 打分模型提升命中率。
在蛋白质单体预测上,两者的精度相当(AlphaFold 3 略有提升)。但 AlphaFold 3 的核心优势在于多分子复合物预测——这是 AlphaFold 2 无法处理的场景。建议根据具体需求选择:单体预测用 AF2 速度更快,复合物预测必须用 AF3。
在蛋白-配体结合模式预测上,AlphaFold 3 的精度已优于传统对接方法。但传统方法在大规模虚拟筛选(百万级化合物库)的速度上仍有优势。最佳实践是将两者结合:用 AF3 预测靶标-配体复合物结构,再用传统对接进行大规模筛选。
主要通过三个指标:(1) pLDDT — 局部置信度,>90 为高置信度,70-90 为中等,<70 为低置信度;(2) PAE — 预测对齐误差,衡量两个区域间的相对位置可靠性;(3) ipTM — 界面预测 TM-score,专门评估复合物界面质量,>0.8 表示高可信度。
AlphaFold 3 预测的是静态最优结构,不能直接预测蛋白质的动态构象变化。若需研究构象动态、别构效应或折叠路径,需要结合分子动力学(MD)模拟。新智元生物科技提供 AF3+MD 的整合分析服务。
扫码咨询技术顾问
微信扫一扫,获取专业咨询