DNA测序
DNA 测序(DNA Sequencing)是指测定 DNA 分子中核苷酸(A、T、C、G)精确排列顺序的过程。这是现代生物学和医学的“底层操作系统”。从 1977 年 Frederick Sanger 发明“双脱氧链终止法”开启第一代测序,到 2005 年后 高通量测序(NGS)带来的数据爆炸,再到如今单分子测序(TGS)实现的超长读长和实时检测,测序技术的进化速度甚至超越了“摩尔定律”。这一技术不仅完成了人类基因组计划,更让精准医疗、无创产前检测(NIPT)和病原体快速溯源成为现实。
技术进化:三代技术的代际飞跃
测序技术的发展并不意味着旧技术的完全淘汰,而是应用场景的细分。目前形成了以二代为主流、一代为验证、三代为补充的格局。
| 代际 | 代表技术 | 核心特点 | 优缺点 |
|---|---|---|---|
| 第一代 (1977-) |
Sanger 法 (双脱氧链终止) |
利用 ddNTP 随机终止 DNA 合成,通过电泳分离读取末端荧光。 | 优: 准确率极高 (99.99%),金标准。 缺: 通量低,成本高,只能测单条。 |
| 第二代 (NGS) |
Illumina (边合成边测序) |
大规模并行: 在芯片上同时进行数亿个 DNA 簇的扩增和合成反应。 | 优: 通量巨大,成本极低 (WGS < $500)。 缺: 读长短 (150-300bp),拼接复杂。 |
| 第三代 (TGS) |
PacBio (SMRT) Nanopore (纳米孔) |
单分子测序: 无需 PCR 扩增,直接读取单个 DNA 分子的超长序列。 | 优: 超长读长 (>10kb),可测甲基化。 缺: 单次准确率相对较低 (但在提升)。 |
核心机制深度解析
Illumina:可逆末端终止 (NGS 霸主)
目前占据全球 80% 以上市场的测序原理。
1. 文库构建: 将 DNA 打断并在两端加上接头。
2. 桥式 PCR: 在测序芯片 (Flow cell) 表面进行原位扩增,形成 DNA 簇 (Cluster)。
3. 测序: 加入带有荧光标记且 3'-OH 被封闭的核苷酸。每次只延伸一个碱基,拍照记录荧光颜色,然后化学切除荧光基团和保护基团,进行下一轮循环。
Oxford Nanopore:电流信号的解码
这是最具科幻感的纳米孔测序技术。
原理: 可以在手持设备 (MinION) 上进行。让 DNA 单链穿过一个嵌在膜上的纳米级蛋白孔。由于 A、T、C、G 四种碱基的空间结构不同,它们在穿过孔洞时会对穿过孔洞的离子电流产生不同程度的阻断。通过检测电流信号的微小变化,算法实时将其解码为碱基序列。
DNA穿过纳米孔引起电流变化
🧬 关键指标:为什么需要“覆盖度” (Coverage)?
在 NGS 中,单次读取的准确率并不是 100%,且读长很短。为了确保结果准确,我们需要对基因组的每一个位点进行反复测序。
测序深度 (Depth): 指某个特定碱基被测到的平均次数。例如,30X 的全基因组测序(WGS)意味着基因组上的每个位置平均被读取了 30 次。这是临床诊断遗传病的标准深度。
学术参考文献与里程碑
[1] Sanger F, Nicklen S, Coulson AR. (1977). DNA sequencing with chain-terminating inhibitors. PNAS. 1977;74(12):5463-5467.
[起源]:Frederick Sanger 因此获得第二枚诺贝尔化学奖。这篇论文标志着基因组学时代的开始。
[2] Lander ES, et al. (2001). Initial sequencing and analysis of the human genome. Nature. 2001;409(6822):860-921.
[历史时刻]:人类基因组计划 (HGP) 的草图发表。当时的测序耗资 30 亿美元,历时 13 年(主要使用改进的 Sanger 法)。
[3] Shendure J, et al. (2017). DNA sequencing at 40: past, present and future. Nature. 2017;550(7676):345-353.
[权威综述]:回顾了测序技术 40 年的发展历程,详细对比了 NGS 和 TGS 的技术特点。