跳转到内容

调控与变异预测:DeepSEA 等模型

98% 的人类(和大部分植物)DNA 是非编码区。 这些区域决定基因何时何地表达,但传统上很难解读。 DeepSEA/Sei 等 AI 模型让”非编码变异 → 表型影响”的预测成为可能。

模型任务代表论文
DeepSEA非编码变异 → 染色质特征 / TF 结合Zhou & Troyanskaya 2015 NMethods
Sei改进版 DeepSEA,分类调控状态Chen 2022 Nat Genet
Basenji / Basenji2长序列 + 多任务Kelley 2018-2020
BorzoiBasenji 升级,含 RNA-seq 预测Linder 2023
ExPecto变异 → 组织特异表达Zhou 2018 Nat Genet
DeepBindTF 结合预测Alipanahi 2015 Nat Biotech
  • 染色质可及性预测:哪些区域开放
  • TF 结合位点预测:哪些位点会被特定 TF 结合
  • 组蛋白修饰预测:H3K4me3 等的位置
  • 变异功能预测:SNP/Indel 对调控的影响
  • eQTL 预测:表达 QTL 因果变异
  • 剪接位点预测:是 SpliceAI 等专用模型
读 DeepSEA 2015 (CNN 早期应用)
→ 看 Sei 改进 (更细的状态)
→ 学 Basenji/Borzoi (长上下文)
→ 应用:解读 GWAS hit

📘 Zhou & Troyanskaya (2015) — Predicting effects of noncoding variants with deep learning–based sequence model (DeepSEA) — Nature Methods

📘 Chen et al. (2022) — A sequence-based global map of regulatory activity for deciphering human genetics (Sei) — Nature Genetics

  • 植物 GWAS hit 解读:用 DeepSEA 风格模型在植物数据上训练
  • 启动子改造:预测启动子变异对表达的影响
  • 抗逆 cis-element 鉴定
  • 📄 链接资料保留在源目录的 链接.md,后续会结构化迁移。