ProteinMPNN / RFdiffusion 蛋白质设计
2022-2024 是蛋白质从头设计的革命年。 David Baker 实验室开源的 ProteinMPNN + RFdiffusion,让任何人都能”画”出新蛋白。 2024 年 Baker 因蛋白设计获诺贝尔化学奖。
| 模型 | 年份 | 任务 | 核心思想 |
|---|---|---|---|
| ProteinMPNN ⭐ | 2022 | 逆向折叠(结构→序列) | MPNN(消息传递)+ 自回归 |
| RFdiffusion ⭐ | 2023 | 从头生成结构 | 扩散模型 + RoseTTAFold backbone |
| RFdiffusion3 | 2024 | 全原子设计(蛋白-配体-核酸) | 升级版 |
| Chroma | 2023 | 从头生成蛋白 | 扩散模型 |
| LigandMPNN | 2024 | 配体感知序列设计 | ProteinMPNN 改进 |
| BindCraft | 2024 | Binder 设计 | 端到端 binder |
| Boltz-Design | 2025 | AlphaFold3 启发的设计 | 开源替代 |
核心工作流(Baker 实验室范式)
Section titled “核心工作流(Baker 实验室范式)”1. RFdiffusion 生成骨架结构(给定目标或纯从头) ↓2. ProteinMPNN 给骨架填序列(多次采样取最佳) ↓3. AlphaFold2 / ESMFold 验证(预测结构是否符合设计) ↓4. 实验验证(克隆、表达、纯化、活性测试)| 概念 | 一句话 |
|---|---|
| 逆向折叠(Inverse Folding) | 给结构找序列(“画图找文案”) |
| 正向折叠(Forward Folding) | 给序列预测结构(AlphaFold 做的事) |
| From-Scratch 设计 | 从噪声扩散出全新的骨架 |
| Motif Scaffolding | 给定关键功能基序,设计支架 |
| Binder 设计 | 设计能特异结合某靶标的蛋白 |
| Hallucination | 用结构预测反向”幻想”出序列 |
📘 Dauparas et al. (2022) — Robust deep learning-based protein sequence design using ProteinMPNN — Science
📘 Watson et al. (2023) — De novo design of protein structure and function with RFdiffusion — Nature
📘 Ingraham et al. (2023) — Illuminating protein space with a programmable generative model (Chroma) — Nature
📘 Vazquez-Torres et al. (2023) — De novo design of high-affinity binders of bioactive helical peptides — Nature
- 🎥 David Baker 蛋白质设计系列讲座(中英字幕) — B 站
- ✍️ 正刊都在用的 AI 驱动蛋白质从头设计流程 - 知乎
- ✍️ “上帝之手” David Baker 又一篇 Nature - 医药魔方
| 应用 | 工具组合 |
|---|---|
| 设计抗病蛋白 | RFdiffusion + ProteinMPNN,靶向病原效应蛋白 |
| 改造光合酶 | ProteinMPNN 优化天然酶序列 + AF2 验证 |
| 设计新型抗菌肽 | RFpeptides / EvoBind 等多肽设计工具 |
| 农药降解酶设计 | 同抗病蛋白 |
| 重金属结合蛋白 | 用于污染修复 |
-
ColabDesign:https://github.com/sokrypton/ColabDesign
- 一个 Colab 内集成 RFdiffusion + ProteinMPNN + AlphaFold2 的设计 pipeline
-
ProteinMPNN GitHub:https://github.com/dauparas/ProteinMPNN
-
RFdiffusion GitHub:https://github.com/RosettaCommons/RFdiffusion
- 📄 链接资料保留在源目录的
链接.md,后续会结构化迁移。