摘要: 土壤微生物组研究因物种多样、丰度差异悬殊而极具挑战性。当前主流的三种测序方法——基于Illumina平台的短读长16S rRNA扩增子测序、基于Oxford Nanopore Technologies（ONT）R10.4.1流动槽的全长16S测序，以及长读长鸟枪法宏基因组测序——各自存在不同的系统偏差，深刻影响着微生物群落的检测结果与描述方式。本文通过综述将上述方法应用于相同或高度可比样本的对比性基准研究，发现长读长与短读长16S方法在优势类群识别及样本间差异分析上总体一致，但在α多样性估算、稀有类群检测及特定门类相对丰度方面存在显著分歧。ONT R10.4.1化学体系缩小但未消除与Illumina之间的准确性差距；鸟枪法宏基因组测序则揭示了短读长与长读长组装中均存在的系统性偏差，且该偏差与样本内群落多样性相关。作者基于现有证据构建了面向具体研究问题的方法选择决策框架，并指出土壤特异性基准研究中尚存的空白。文章强调，测序方法的选择应作为研究设计的核心环节，研究者需充分认识并尽可能控制所选方法固有的系统偏差。

土壤微生物组研究中三种测序策略的选择：基于基准测试证据的批判性综述¶

概述¶

土壤微生物组研究面临的核心挑战在于：土壤样本中同时存在数千种微生物物种，且丰度差异极为悬殊。测序方法的选择对最终检测到哪些物种、如何描述群落结构具有决定性影响。

目前，土壤微生物组研究领域有三种主流测序策略并存：

短读长 16S rRNA 扩增子测序（Illumina 平台）
全长 16S 测序（Oxford Nanopore Technologies，ONT 平台，尤其是 R10.4.1 流动池）
长读长鸟枪法宏基因组测序（Long-read Shotgun Metagenomics）

然而，研究人员在选择测序方法时，往往依据成本、熟悉程度或本地技术积累，而非基于对各方法系统性偏差的清晰认知。这种选择盲区导致研究结论的可比性存疑，群落描述结果出现方法依赖性偏差，且相关偏差在发表文献中鲜少得到充分讨论。

本文系统综述了将上述两种或多种方法应用于相同土壤样本或直接可比样本的头对头基准测试（head-to-head benchmarking）研究，旨在：

厘清各方法在优势分类群（dominant taxa）、稀有分类群（rare taxa）、Alpha 多样性估计及门水平相对丰度上的一致性与分歧
评估 R10.4.1 流动池在准确性方面相对 Illumina 的差距是否已实质性缩小
揭示鸟枪法宏基因组在组装层面受样本内种群多样性影响的系统性偏差
构建以研究问题为导向的循证决策框架（evidence-based decision framework）

本综述的核心立场是：方法选择本身是研究设计的重要组成部分，各方法固有偏差必须被明确承认并尽可能加以控制，而非简单追问"哪个平台最好"。

核心原理与功能¶

1. 短读长 16S rRNA 扩增子测序（Short-Read 16S Amplicon Sequencing）¶

基本原理

该方法基于对 16S rRNA 基因的特定高变区（hypervariable regions，通常为 V3-V4 区）进行 PCR 扩增，随后在 Illumina 平台上进行双端测序（paired-end sequencing），产生约 250-300 bp 的短读长片段。物种分类通常依赖操作分类单元（Operational Taxonomic Units，OTUs）或扩增子序列变体（Amplicon Sequence Variants，ASVs）方法。

系统性偏差来源

引物偏好性（primer bias）：不同 16S 引物对对不同分类群的扩增效率差异显著，可能系统性低估或高估特定门类（phyla）的相对丰度
嵌合体序列（chimeric sequences）：PCR 过程中可产生人工嵌合序列，需后续生信过滤
拷贝数差异（copy number variation）：不同物种 16S 基因拷贝数差异悬殊（1 至 15 拷贝不等），直接影响相对丰度估计的准确性
分辨率限制：短片段覆盖的高变区信息有限，难以实现物种级别乃至部分属级别的精确分类

对土壤样本的适用性

在优势分类群（dominant taxa）检测和样本间差异（between-sample differences，即 Beta 多样性）分析上表现相对稳健
对稀有分类群（rare taxa）的检测能力受限，且 Alpha 多样性估计存在方法依赖性
门水平相对丰度（phylum-level relative abundance）在与其他方法比较时存在实质性分歧

2. 全长 16S 测序（Full-Length 16S Sequencing，ONT R10.4.1）¶

基本原理

该方法扩增 16S rRNA 基因的近全长序列（约 1500 bp），并在 Oxford Nanopore Technologies（ONT）平台上进行单分子纳米孔测序（nanopore sequencing）。相比短读长方法，全长序列提供更完整的分类学信息，理论上可实现更高分辨率的物种鉴定。

R10.4.1 流动池的技术意义

R10.4.1 是 ONT 平台目前精度最高的流动池化学方案，相较前代产品（如 R9.4.1），在碱基调用（basecalling）准确率上有显著提升。本综述明确指出，R10.4.1 已缩小但未消除与 Illumina 之间的准确性差距（accuracy gap）。

系统性偏差来源

测序错误率（sequencing error rate）：尽管 R10.4.1 已大幅改善，纳米孔测序的原始读长错误率仍高于 Illumina 短读长，对低丰度分类群的准确鉴定构成挑战
引物偏好性：与短读长方法共享部分扩增偏差，但全长覆盖可在一定程度上弥补分类分辨率损失
通量与成本权衡：与 Illumina 相比，单样本测序深度（sequencing depth）通常较低，影响稀有分类群检测灵敏度

对土壤样本的适用性

在优势分类群和 Beta 多样性分析上与短读长 16S 方法总体一致
在 Alpha 多样性估计和稀有分类群检测上与短读长方法存在显著分歧
门水平相对丰度差异在与 Illumina 比较时同样存在

3. 长读长鸟枪法宏基因组测序（Long-Read Shotgun Metagenomics）¶

基本原理

鸟枪法宏基因组测序（shotgun metagenomics）不依赖扩增子，直接对样本中所有 DNA 进行随机打断和测序，理论上可无偏差地获取全部基因组信息，包括功能基因、代谢通路及耐药基因等。长读长版本（通常来自 ONT 或 PacBio 平台）产生数 kb 至数十 kb 的读长，有助于跨越重复区域，改善基因组组装（genome assembly）连续性。

系统性偏差来源

组装偏差（assembly bias）：本综述特别指出，鸟枪法宏基因组在组装层面存在受样本内种群多样性影响的系统性偏差。当样本中某一物种的种群内多样性（within-population diversity）较高时，组装算法难以正确区分株系间的序列差异与测序错误，导致组装结果碎片化或出错
DNA 提取偏差（DNA extraction bias）：土壤样本中革兰氏阳性菌厚壁胞壁难以破碎，导致提取效率不均一
宿主 DNA 污染：土壤样本中植物根系 DNA 可大量占据测序数据
计算成本：长读长宏基因组数据的组装和分箱（binning）计算量巨大，对算力要求极高

对土壤样本的适用性

提供其他两种方法无法获取的功能信息，适合需要超越分类学描述的研究
揭示短读长和长读长组装均存在的系统性偏差，且偏差程度与样本内种群多样性直接相关
土壤样本极高的物种复杂度（complexity）使组装难度远超人体或其他低复杂度样本

4. 三种方法的比较总结¶

维度	短读长 16S	全长 16S（ONT R10.4.1）	长读长鸟枪法宏基因组
优势分类群检测	稳健	稳健，与前者总体一致	稳健
Beta 多样性分析	稳健	与短读长总体一致	可补充功能维度
Alpha 多样性估计	存在方法偏差	与短读长存在显著分歧	[待验证]
稀有分类群检测	能力有限	存在显著分歧	理论更优，受深度限制
门水平相对丰度	存在系统偏差	与 Illumina 存在分歧	可提供独立验证
功能信息	不可获取	不可获取	核心优势
准确性	高	R10.4.1 已接近但未达 Illumina 水平	受种群多样性影响
组装偏差	不适用	不适用	受样本内多样性驱动

关键方法与步骤¶

本文为综述性研究，不涉及单一实验流程，但基于综述内容，可梳理出各方法的关键方法论要点与研究设计建议。

步骤一：明确研究问题，选择对应方法¶

研究问题导向的方法选择框架（循证决策框架）：

1. 主要目标是描述群落组成差异（Beta 多样性）？
   → 短读长 16S 或全长 16S 均可，二者在优势分类群和
     样本间差异上结果总体一致，成本是主要考量因素

2. 主要目标是精确估计 Alpha 多样性或检测稀有分类群？
   → 需谨慎选择，且必须承认方法偏差：
     - 短读长 16S 与全长 16S 在此维度结果存在显著分歧
     - 方法选择本身会影响 Alpha 多样性估计结论
     - 建议在方法与文献中明确报告所用平台及其已知偏差

3. 主要目标是门水平分类群相对丰度的精确定量？
   → 需特别注意：短读长与长读长 16S 在门水平丰度上
     存在实质性分歧，结论应结合方法偏差审慎解读

4. 需要获取功能信息（代谢通路、耐药基因等）？
   → 鸟枪法宏基因组是唯一选择
   → 但需充分考虑土壤样本高复杂度带来的组装偏差

5. 样本内种群多样性（within-population diversity）较高？
   → 长读长鸟枪法宏基因组的组装准确性受此因素显著影响
   → 应在研究设计阶段评估并纳入偏差控制措施

步骤二：基准测试研究的纳入标准评估¶

评估现有基准测试研究适用性的关键维度：

- 样本类型是否为土壤（而非人体肠道、水体等）？
  注：土壤特异性基准测试数据仍相对匮乏，
  是当前方法学的主要局限之一

- 是否采用头对头设计（head-to-head）？
  即同一样本同时经过多种方法处理和比较

- 是否使用了 R10.4.1 化学方案？
  较早的 ONT 基准数据（R9.4.1 等）
  可能低估当前 ONT 平台的实际性能

- 是否报告了稀有分类群检测、Alpha 多样性、
  Beta 多样性和门水平丰度等多维度比较？
  单一指标的基准测试结论不具普遍性

步骤三：偏差控制与报告规范¶

研究设计与报告中的偏差控制建议：

1. 明确声明所用测序平台、流动池版本、引物序列
2. 报告测序深度（reads per sample）
3. 若分析 Alpha 多样性，说明稀疏化（rarefaction）策略
4. 若比较物种相对丰度，讨论 16S 拷贝数校正是否已应用
5. 在讨论部分明确承认所选方法的已知系统性偏差
6. 避免将单一方法的结论外推为"真实"群落组成

实战示例¶

以下场景基于综述所描述的典型研究情境，展示方法选择决策逻辑。

场景一：土壤修复项目的群落变化监测¶

研究背景：研究者希望比较污染土壤修复前后微生物群落的变化，重点关注优势功能菌群的消长趋势，样本量较大（n > 50），经费有限。

方法选择推导：

目标：Beta 多样性比较 + 优势分类群动态
↓
短读长 16S 与全长 16S 在此维度结果总体一致
↓
成本与通量成为决定因素
↓
推荐：Illumina 短读长 16S（成本效益最优）
↓
偏差控制：
  - 统一 DNA 提取方案（控制提取偏差）
  - 明确报告引物序列（记录引物偏好性）
  - 避免在结论中过度解读稀有物种变化
    （该方法对稀有分类群检测存在已知局限）

场景二：土壤稀有生物圈多样性研究¶

研究背景：研究者对土壤"稀有生物圈"（rare biosphere）感兴趣，希望最大化稀有分类群的检测，探索不同生境的稀有菌群多样性。

方法选择推导：

目标：稀有分类群检测 + Alpha 多样性精确估计
↓
短读长 16S 与全长 16S 在此维度结果存在显著分歧
↓
这意味着：结论将部分取决于方法选择本身
↓
当前证据不足以明确推荐单一方法（土壤特异性
基准数据匮乏是当前方法学的主要局限）
↓
建议：
  - 若条件允许，同时进行两种方法并报告分歧
  - 若只能选一种，明确在论文中承认该局限
  - 重点关注在两种方法中均稳健出现的稀有类群

场景三：土壤碳循环功能基因研究¶

研究背景：研究者需要了解不同农业管理措施下土壤微生物的功能基因多样性变化，仅有分类学信息无法满足需求。

方法选择推导：

目标：功能基因信息 + 代谢通路分析
↓
16S 扩增子方法（短读长或全长）均无法提供功能信息
↓
唯一选择：鸟枪法宏基因组测序
↓
关键设计考量：
  - 土壤样本复杂度极高，组装偏差不可忽视
  - 样本内种群多样性会系统性影响组装质量
  - 长读长版本在组装连续性上有优势，
    但受种群多样性驱动的偏差同样存在
  - 需在预算内平衡测序深度与样本量
↓
偏差报告：
  - 明确报告组装统计指标（N50、完整度等）
  - 讨论种群多样性对组装结果的潜在影响

常见问题¶

Q1：ONT R10.4.1 全长 16S 是否已经可以替代 Illumina 短读长 16S？

A：根据现有基准测试证据，R10.4.1 已显著缩小与 Illumina 的准确性差距，但尚未消除该差距。在优势分类群检测和 Beta 多样性分析上，两者结果总体一致；但在 Alpha 多样性估计、稀有分类群检测及门水平相对丰度方面，两种方法仍存在实质性分歧。因此，目前不宜视二者为完全可互换的替代方案，方法选择应结合具体研究目标决定。

Q2：鸟枪法宏基因组比 16S 扩增子测序更"客观"吗？

A：鸟枪法宏基因组不依赖 PCR 扩增，理论上消除了引物偏好性，但并非无偏差。综述明确指出，长读长宏基因组测序在组装层面存在受样本内种群多样性影响的系统性偏差：当样本中某物种的种群内多样性较高时，组装算法难以准确重建基因组，导致短读长和长读长组装均出现系统性错误。土壤是已知复杂度最高的微生物生态系统之一，这一偏差在土壤研究中尤为突出。

Q3：为什么不同方法在 Alpha 多样性和稀有分类群检测上分歧最大？

A：Alpha 多样性和稀有分类群检测对方法偏差最为敏感，原因在于：稀有分类群的信号本身就极微弱，任何系统性偏差（引物偏好性、测序错误率、测序深度差异）都可能导致其被过度检测或漏检。短读长 16S 受限于片段长度，分类分辨率不足；全长 16S 的 ONT 原始错误率（即使 R10.4.1 已改善）仍可能将测序错误误判为稀有新类群。这些偏差在优势类群分析中被"平均化"而不明显，但在稀有分类群分析中被放大。

Q4：现有基准测试证据对土壤样本有多大参考价值？

A：综述明确指出，土壤特异性基准测试数据仍相对匮乏，这是当前方法学的主要局限之一。许多基准测试研究使用的是人体肠道、水体或模拟社区样本，这些样本的物种复杂度和群落结构与土壤存在根本性差异。土壤的极高复杂度（数千物种）使得从其他样本类型的基准测试结论向土壤研究外推时需格外谨慎。

Q5：研究者在发表时应如何处理方法选择带来的偏差问题？

A：综述认为，方法选择是研究设计的重要组成部分，而非可忽略的技术细节。建议的处理方式包括：在方法部分明确报告测序平台、流动池版本和引物信息；在结果解读时承认所选方法的已知系统性偏差；避免将单一方法的结果等同于"真实"群落组成；在条件允许时，使用多种方法进行交叉验证，或引用相关基准测试文献为结论的局限性提供背景。

总结¶

本综述系统梳理了短读长 16S rRNA 扩增子测序（Illumina）、全长 16S 测序（ONT R10.4.1）和长读长鸟枪法宏基因组测序三种方法在土壤微生物组研究中的优势与局限。

核心结论如下：

三种方法在优势分类群检测和样本间 Beta 多样性比较上总体一致
在 Alpha 多样性估计、稀有分类群检测及门水平相对丰度上，方法间存在实质性分歧
ONT R10.4.1 已缩小但未消除与 Illumina 的准确性差距
长读长鸟枪法宏基因组在组装层面存在受样本内种群多样性驱动的系统性偏差
土壤特异性基准测试数据仍相对匮乏，是当前方法学的主要局限
方法选择应以研究问题为导向，偏差必须被明确承认并纳入结果解读

研究者应将测序方法的选择视为研究设计的核心决策，而非后期的技术执行问题。在缺乏完美方法的前提下，透明地报告方法局限性，是保障研究结论可靠性和可比性的基础。

土壤微生物组研究中三种测序策略的选择：基于基准测试证据的批判性综述¶

概述¶

核心原理与功能¶

1. 短读长 16S rRNA 扩增子测序（Short-Read 16S Amplicon Sequencing）¶

2. 全长 16S 测序（Full-Length 16S Sequencing，ONT R10.4.1）¶

3. 长读长鸟枪法宏基因组测序（Long-Read Shotgun Metagenomics）¶

4. 三种方法的比较总结¶

关键方法与步骤¶

步骤一：明确研究问题，选择对应方法¶

步骤二：基准测试研究的纳入标准评估¶

步骤三：偏差控制与报告规范¶

实战示例¶

场景一：土壤修复项目的群落变化监测¶

场景二：土壤稀有生物圈多样性研究¶

场景三：土壤碳循环功能基因研究¶

常见问题¶

总结¶

📚 相关文章推荐