跳转至

PCR 与分子克隆原理(PCR & Molecular Cloning)


一句话说明

PCR(聚合酶链式反应)是在试管里模拟 DNA 复制、把目标片段指数级扩增数百万倍的核心实验技术;分子克隆则是把目标基因"装"进载体、送入宿主细胞无限复制的经典基因工程手段——两者是湿实验室和生信分析的底层逻辑。


1. PCR 原理白话版

核心思想

PCR 的本质就是人工版 DNA 复制。自然界里细胞用 DNA 聚合酶复制整条染色体,而 PCR 只复制你想要的那一小段(通过引物精确定位)。

类比:你有一本 1000 页的书(基因组),你只想复印第 500-501 页(目标基因)。PCR 就是在这两页的开头和结尾各放一个"书签"(引物),告诉复印机只印这两页之间的内容,然后疯狂复印 30 轮,每轮数量翻倍。

三步循环(每个循环 = 1 次复印)

┌─────────────────────────────────────────────────────────────┐
│  第1步:变性(Denaturation)  94-98°C,20-30秒              │
│  白话:高温把 DNA 双链"拉开"成两条单链                      │
│  类比:把拉链拉开                                           │
├─────────────────────────────────────────────────────────────┤
│  第2步:退火(Annealing)     50-65°C,20-30秒              │
│  白话:降温让引物"贴"到目标位置                              │
│  类比:书签精准插到对应页码                                  │
├─────────────────────────────────────────────────────────────┤
│  第3步:延伸(Extension)     72°C,30秒-数分钟              │
│  白话:DNA 聚合酶从引物开始,一个碱基一个碱基地"抄写"新链   │
│  类比:复印机从书签位置开始复印                              │
└─────────────────────────────────────────────────────────────┘

            重复 25-35 个循环
    2^30 ≈ 10 亿份拷贝(理论值)

指数扩增的数学

循环数拷贝数(理论)说明
01原始模板
10~1,0242^10
20~100 万2^20
30~10 亿2^30
35~340 亿2^35(平台期前)

实际扩增效率约 85-95%,不会达到理论值,30 循环后进入平台期(原料耗尽、酶活性下降)。


2. PCR 关键组分(五大要素)

组分英文功能(白话)注意事项
模板 DNATemplate要被复印的"原稿"浓度太高会非特异扩增,太低扩不出来;基因组 DNA 一般用 10-100 ng
引物(正/反)Forward/Reverse Primer两个"书签",限定复印范围18-25 bp,Tm 值 55-65°C,需一对(一正一反)
dNTPsDeoxynucleotide TriphosphatesA/T/G/C 四种碱基的"原料砖块"四种等浓度(各 200 μM),缺一不可
DNA 聚合酶DNA Polymerase (Taq/Pfu等)"复印机"本体,合成新链的酶Taq 无校对活性(错误率 ~10⁻⁴);Pfu 有校对(错误率 ~10⁻⁶)
缓冲液 + Mg²⁺Buffer + MgCl₂提供合适的 pH 和离子环境Mg²⁺ 浓度影响特异性,通常 1.5-2.5 mM

常用 DNA 聚合酶对比

酶名来源保真度特点适用场景
TaqThermus aquaticus(水生栖热菌)低(无 3'→5' 校对)便宜、快速、留 A 尾常规检测、TA 克隆
PfuPyrococcus furiosus(激烈火球菌)高(有校对活性)速度慢、产物为平末端克隆、突变研究
Q5/Phusion工程改造极高(>100× Taq)快速、高保真、容错性强精确克隆、长片段
KODThermococcus kodakarensis速度快 + 高保真长片段精确扩增

3. PCR 的变体:qPCR / RT-PCR / 数字 PCR

三者区别一览表

对比项常规 PCRRT-PCRqPCR(实时定量 PCR)数字 PCR(dPCR)
全称Polymerase Chain ReactionReverse Transcription PCRQuantitative/Real-time PCRDigital PCR
输入模板DNARNA(先反转录成 cDNA)DNA 或 cDNADNA 或 cDNA
目的扩增目标片段检测/扩增 RNA实时监测扩增、精确定量绝对定量(不需标准曲线)
定量方式不定量(终点法,跑胶看条带)可定量也可不定量相对定量(Ct值 + 标准曲线)绝对定量(泊松分布统计阳性微滴)
关键技术琼脂糖凝胶电泳逆转录酶(如 M-MLV, SuperScript)荧光探针(TaqMan)或染料(SYBR Green)微滴(ddPCR)或芯片分割
典型应用基因检测、克隆基因表达分析、病毒 RNA 检测基因表达定量、病原体载量稀有突变检测、拷贝数变异(CNV)
仪器普通 PCR 仪普通 PCR 仪实时荧光定量 PCR 仪Bio-Rad ddPCR / QuantStudio

RT-qPCR 是什么?

RT-qPCR = RT-PCR + qPCR,即先把 RNA 反转录为 cDNA,再用实时荧光定量 PCR 检测。这是基因表达分析的"金标准"方法。

面试易混淆点:RT-PCR 的 "RT" 是 Reverse Transcription(反转录),不是 Real-Time!Real-Time PCR = qPCR。

qPCR 的 Ct 值

  • Ct(Cycle threshold):荧光信号达到阈值时的循环数
  • Ct 值越小 → 初始模板量越多(更早达到阈值)
  • 差 1 个 Ct ≈ 差 2 倍的初始模板量

数字 PCR 的原理(白话)

把一个样品分成 2 万多个小液滴(或微孔),每个液滴里只有 0 或 1 个目标分子。PCR 后统计"亮的液滴数 / 总液滴数",用泊松分布算出绝对分子数——不需要标准曲线,精度极高。


4. 引物设计原则

核心参数

参数推荐范围为什么
长度18-25 bp太短(<15bp)不特异,太长(>30bp)容易形成二级结构
Tm 值55-65°C(两引物 Tm 差 ≤5°C)Tm 太低退火温度低→非特异扩增;Tm 太高→难退火
GC 含量40-60%GC 提供稳定性(3 个氢键),但太高容易形成 G-四链体
3' 末端以 G 或 C 结尾(GC 钳)3' 端是延伸起始点,G/C 结合更牢固
避免连续 4+ 个相同碱基、引物自身互补、引物二聚体这些会导致非特异扩增或引物自己配对消耗

Tm 值计算公式

# 简单公式(适用于 <20bp 短引物):
Tm = 2(A+T) + 4(G+C)    # 单位:°C

# 更准确的最近邻法(Nearest-Neighbor Method):
Tm = ΔH / (ΔS + R × ln(C/4)) - 273.15
# ΔH = 焓变之和, ΔS = 熵变之和, R = 气体常数, C = 引物浓度

引物设计检查清单

  1. 长度 18-25 bp
  2. Tm 值 55-65°C,正反引物 Tm 差 ≤ 5°C
  3. GC 含量 40-60%
  4. 3' 端避免超过 3 个连续 G/C(过强钳制效应)
  5. 无引物二聚体(Primer Dimer)——正反引物 3' 端不能互补
  6. 无自身发夹结构(Hairpin,ΔG > -2 kcal/mol)
  7. 对目标序列特异(BLAST 验证无脱靶)
  8. 避开 SNP 位点(否则某些个体扩不出来)

5. 常用引物设计工具

Primer3(最常用)

  • 网址:https://primer3.ut.ee/
  • 功能:输入目标序列,自动推荐最优引物对
  • 设置要点:可指定产物大小(100-300bp 适合 qPCR)、Tm 范围、GC 含量范围
# Primer3 命令行版(适合批量设计)
# 安装(conda)
conda install -c bioconda primer3-py  # Python接口

# Python 调用示例
import primer3

# 设计引物
result = primer3.bindings.design_primers(
    seq_args={
        'SEQUENCE_ID': 'my_gene',
        'SEQUENCE_TEMPLATE': 'ATCGATCGATCG...(你的目标序列)',
        'SEQUENCE_INCLUDED_REGION': [50, 200],  # 在50-250bp范围内找引物
    },
    global_args={
        'PRIMER_OPT_SIZE': 20,        # 最优引物长度
        'PRIMER_MIN_SIZE': 18,        # 最小长度
        'PRIMER_MAX_SIZE': 25,        # 最大长度
        'PRIMER_OPT_TM': 60.0,       # 最优Tm值
        'PRIMER_MIN_TM': 55.0,       # 最小Tm值
        'PRIMER_MAX_TM': 65.0,       # 最大Tm值
        'PRIMER_MIN_GC': 40.0,       # 最小GC含量
        'PRIMER_MAX_GC': 60.0,       # 最大GC含量
        'PRIMER_PRODUCT_SIZE_RANGE': [[100, 300]],  # 产物大小范围
    }
)

# 输出结果
print(f"左引物: {result['PRIMER_LEFT_0_SEQUENCE']}")  # 正向引物序列
print(f"右引物: {result['PRIMER_RIGHT_0_SEQUENCE']}") # 反向引物序列
print(f"产物大小: {result['PRIMER_PAIR_0_PRODUCT_SIZE']} bp")
print(f"左引物Tm: {result['PRIMER_LEFT_0_TM']:.1f}°C")
print(f"右引物Tm: {result['PRIMER_RIGHT_0_TM']:.1f}°C")

NCBI Primer-BLAST

  • 网址:https://www.ncbi.nlm.nih.gov/tools/primer-blast/
  • 优势:设计引物的同时自动做 BLAST 比对,检查特异性
  • 适用场景:确保引物不会扩增非目标序列(避免脱靶)
使用流程:
1. 输入目标序列的 Accession Number 或粘贴序列
2. 指定 PCR 产物范围(如 Forward primer from: 100, to: 200)
3. 选择目标物种(Organism)
4. 设置引物参数(Tm、长度等)
5. 点击 "Get Primers" → 系统自动设计 + 特异性验证
6. 结果中 "Products on target templates" = 特异性好

其他工具

工具特点网址
OligoAnalyzer (IDT)分析引物二聚体、发夹、Tmhttps://www.idtdna.com/calc/analyzer
MFEprimer电子 PCR + 特异性评估https://www.mfeprimer.com/
Beacon Designer收费,适合 TaqMan 探针设计-
SnapGene可视化引物位置 + 虚拟克隆-

6. 分子克隆基本流程

白话解释

分子克隆 = 把你想要的基因片段(insert)"装进"一个可以自我复制的小环(载体/质粒),再送进细菌里让细菌帮你无限复制这个基因。

类比:你写了一份重要文件(目标基因),要大量复印。你把文件装进一个带自动复印功能的文件夹(质粒载体),交给一个"复印店"(大肠杆菌),复印店会帮你不停地复印。

四步经典流程

┌──────────────────────────────────────────────────────────┐
│  Step 1: 酶切(Digestion)                               │
│  用限制性内切酶把载体和目标片段各切出匹配的"接口"         │
│  类比:把文件夹剪开一个口 + 给文件切出配套的形状          │
├──────────────────────────────────────────────────────────┤
│  Step 2: 连接(Ligation)                                │
│  用 DNA 连接酶(T4 Ligase)把片段和载体"粘"在一起        │
│  类比:用胶水把文件粘进文件夹                             │
├──────────────────────────────────────────────────────────┤
│  Step 3: 转化(Transformation)                          │
│  把重组质粒送进感受态细菌(通常是大肠杆菌 DH5α)         │
│  方法:热激法(42°C, 45秒)或电转化                      │
│  类比:把装好文件的文件夹交给复印店                       │
├──────────────────────────────────────────────────────────┤
│  Step 4: 筛选(Screening)                               │
│  用抗性平板筛选 + 菌落PCR/酶切验证/测序确认               │
│  类比:检查复印店有没有正确复印你的文件                   │
└──────────────────────────────────────────────────────────┘

现代克隆方法(无缝克隆)

方法原理优点缺点
限制酶克隆酶切 + 连接经典、简单受酶切位点限制
Gibson Assembly外切酶 + 聚合酶 + 连接酶一步法无需酶切位点,多片段一步连需要设计 15-20bp 同源臂
Golden GateIIS 型限制酶(如 BsaI)定向组装高效、方向性确定需要去除内部 BsaI 位点
In-Fusion利用同源重组原理简单、高效Clontech 专利试剂盒
Gatewayatt 重组位点交换适合高通量、多载体穿梭需要入门载体、成本高
TOPO 克隆Taq 产物 A 尾 + 拓扑异构酶极简、5 分钟完成方向随机、仅限 Taq 产物

7. 限制性内切酶基础

白话解释

限制性内切酶(Restriction Enzyme)就是细菌的"分子剪刀",它识别 DNA 上特定的短序列(4-8bp),然后精确地把双链 DNA 剪断。

自然功能:细菌用它来剪碎入侵的噬菌体 DNA(自己的 DNA 被甲基化保护不会被剪)。

核心概念

概念英文解释
识别序列Recognition Site酶识别的特定 DNA 序列,通常是回文序列(正反读一样)
切割位点Cleavage Site实际下刀的位置
粘性末端Sticky End / Cohesive End切出突出的单链尾巴(便于定向连接)
平末端Blunt End齐切,没有突出(连接效率低但通用)
回文序列Palindrome正链 5'→3' 和反链 5'→3' 读起来一样

常见限制酶举例

酶名识别序列切割方式末端类型
EcoRI5'-G↓AATTC-3' / 3'-CTTAA↑G-5'交错切5' 粘性末端(4nt 突出)
BamHI5'-G↓GATCC-3' / 3'-CCTAG↑G-5'交错切5' 粘性末端
HindIII5'-A↓AGCTT-3' / 3'-TTCGA↑A-5'交错切5' 粘性末端
NotI5'-GC↓GGCCGC-3'交错切5' 粘性末端(8bp 识别,稀切)
SmaI5'-CCC↓GGG-3'对称切平末端
EcoRV5'-GAT↓ATC-3'对称切平末端

II 型 vs IIS 型限制酶

类型特点举例克隆应用
II 型识别位点 = 切割位点EcoRI, BamHI传统酶切克隆
IIS 型识别位点 ≠ 切割位点(切在旁边)BsaI, BbsIGolden Gate 组装(可设计任意粘性末端)

8. 质粒载体结构

质粒的基本组成

        ┌──── 复制起点(ori):决定质粒能在哪种宿主中复制
        │     ┌── 抗性基因(如 AmpR):筛选标记,只有含质粒的细菌能存活
        │     │
   ─────┼─────┼──────────────────────────
  │     │     │                          │
  │   [ori]  [AmpR]                      │
  │                                      │
  │         ┌── 多克隆位点(MCS)         │
  │         │   一排限制酶切割位点         │
  │        [MCS]                         │
  │                                      │
  │   [Promoter]──[Insert]──[Terminator] │
  │         │                            │
   ─────────┼────────────────────────────
             └── 目标基因插入区域

关键元件说明

元件英文功能
复制起点Origin of Replication (ori)让质粒能在宿主中自我复制(决定拷贝数高/低)
选择标记Selection Marker抗生素抗性基因(Amp/Kan/Cm),用于筛选含质粒的菌
多克隆位点Multiple Cloning Site (MCS)一堆排列好的限制酶位点,方便插入目标片段
启动子Promoter驱动目标基因表达(如 T7、lac、CMV)
终止子Terminator终止转录
报告基因Reporter GenelacZα(蓝白筛选)、GFP(荧光筛选)

常见质粒载体

载体用途特点
pUC19大肠杆菌克隆高拷贝、AmpR、蓝白筛选
pET 系列蛋白表达T7 启动子、IPTG 诱导
pGEM-TTA 克隆适合直接克隆 Taq PCR 产物
pBR322经典克隆AmpR + TetR,低拷贝
pcDNA3.1哺乳动物表达CMV 启动子、NeoR
pLVX慢病毒包装用于基因过表达/敲低

9. 生信中的 PCR 相关分析

9.1 In-silico PCR(电子 PCR)

在计算机上模拟 PCR,预测引物在基因组上的扩增产物。

# 使用 UCSC In-Silico PCR(网页版)
# 网址:https://genome.ucsc.edu/cgi-bin/hgPcr
# 输入正反引物序列 → 选择基因组版本 → 查看预测扩增子

# 命令行工具:isPcr(Jim Kent 开发)
# 安装
conda install -c bioconda isPcr  # 或从 UCSC 下载二进制

# 运行 isPcr
isPcr genome.2bit primers.txt output.fa \
    -minPerfect=15 \    # 3'端完美匹配最少碱基数
    -minGood=15 \       # 总体最少匹配碱基数
    -maxSize=4000       # 最大产物大小

# primers.txt 格式(制表符分隔):
# 引物名    正向引物序列    反向引物序列
# gene1    ATCGATCGATCG    GCTAGCTAGCTA

9.2 引物比对与特异性验证

# 用 BLAST 验证引物特异性
blastn -query primer.fa -db nt \
    -task blastn-short \       # 短序列专用模式
    -evalue 1000 \             # 放宽阈值(引物短,需要宽松阈值)
    -word_size 7 \             # 短序列用小word_size
    -outfmt 6 \                # 表格输出
    -num_threads 4

# 或用 Bowtie2 快速比对引物到参考基因组
bowtie2 -x ref_genome -f primers.fa -S primers_aligned.sam \
    --very-sensitive \         # 高灵敏度模式
    -k 10                      # 报告最多10个比对位置(检查脱靶)

9.3 扩增子分析(16S/ITS 相关)

在宏基因组/微生物多样性研究中,PCR 扩增 16S rRNA 基因的特定可变区(如 V3-V4),再测序分析物种组成。

# QIIME2 扩增子分析核心流程
# 1. 导入数据
qiime tools import \
    --type 'SampleData[PairedEndSequencesWithQuality]' \
    --input-path manifest.tsv \
    --output-path demux.qza \
    --input-format PairedEndFastqManifestPhred33V2

# 2. 引物去除(cutadapt)
qiime cutadapt trim-paired \
    --i-demultiplexed-sequences demux.qza \
    --p-front-f CCTACGGGNGGCWGCAG \   # 341F 引物序列
    --p-front-r GACTACHVGGGTATCTAATCC \ # 805R 引物序列
    --o-trimmed-sequences trimmed.qza

# 3. DADA2 去噪(生成 ASV)
qiime dada2 denoise-paired \
    --i-demultiplexed-seqs trimmed.qza \
    --p-trunc-len-f 280 \     # 正向读长截断位置
    --p-trunc-len-r 200 \     # 反向读长截断位置
    --o-table table.qza \     # ASV 丰度表
    --o-representative-sequences rep-seqs.qza  # ASV 代表序列

9.4 PCR 偏好性(PCR Bias)在生信中的考量

偏好性类型原因生信影响应对策略
GC 偏好高 GC 区域变性不完全某些物种丰度被低估用 PCR-free 建库或校正算法
引物错配引物与某些物种 16S 不完全匹配漏检某些类群使用简并引物或 shotgun 测序
嵌合体PCR 过程中两条模板杂交产生假的 ASV/OTUUCHIME / DADA2 去嵌合体
扩增长度偏好短片段更容易扩增丰度偏差控制扩增子长度范围

10. 面试怎么答(5 道高频题)

Q1:请简述 PCR 的基本原理和三个步骤。

参考答案:PCR 是体外扩增特定 DNA 片段的技术,通过反复温度循环实现指数扩增。三步循环为:(1) 变性(94-98°C)——高温使 DNA 双链解开为单链;(2) 退火(50-65°C)——引物与模板互补区域结合;(3) 延伸(72°C)——耐热 DNA 聚合酶以 dNTPs 为原料合成新链。经过 25-35 个循环,目标片段可被扩增约 10⁶-10⁹ 倍。

Q2:qPCR 和 RT-PCR 有什么区别?

参考答案:RT-PCR(反转录 PCR)是先用逆转录酶将 RNA 转为 cDNA,再进行 PCR 扩增,解决的是"RNA 不能直接 PCR"的问题。qPCR(实时定量 PCR)是在 PCR 过程中通过荧光信号实时监测产物积累量,实现定量分析。两者可以组合使用(RT-qPCR)来定量分析基因表达水平。注意 RT 是 Reverse Transcription 而非 Real-Time。

Q3:引物设计需要考虑哪些因素?

参考答案:主要考虑:(1) 长度 18-25bp;(2) Tm 值 55-65°C,正反引物 Tm 差 ≤5°C;(3) GC 含量 40-60%;(4) 避免引物二聚体和自身发夹结构;(5) 3' 末端以 G/C 结尾增强结合稳定性;(6) 用 BLAST 验证特异性避免脱靶;(7) 避免跨越 SNP 位点。工具方面,Primer3 做初步设计,NCBI Primer-BLAST 做特异性验证。

Q4:分子克隆的基本步骤是什么?为什么要用限制酶?

参考答案:基本步骤为:酶切→连接→转化→筛选。限制酶的作用是在载体和目标片段上切出相容的末端(粘性末端或平末端),使两者能通过 DNA 连接酶连在一起。使用两种不同的酶做双酶切可以确保插入片段的方向性。现代方法如 Gibson Assembly 可以绕过限制酶,利用同源重组实现无缝克隆。

Q5:在宏基因组/扩增子研究中,PCR 可能引入什么偏差?如何应对?

参考答案:PCR 偏差包括:(1) GC 偏好——高/低 GC 含量的物种扩增效率不同;(2) 引物错配——通用引物无法完美匹配所有目标物种;(3) 嵌合体序列——不同模板在延伸不完全时杂交产生假序列;(4) 长度偏好——短片段优先扩增。应对策略:减少 PCR 循环数、使用高保真酶、采用 PCR-free 文库方法(shotgun 宏基因组测序)、生信分析中用 UCHIME/DADA2 去嵌合体。


速查表

PCR 反应体系(25 μL 标准体系)

组分体积终浓度
10× Buffer2.5 μL
dNTPs (10 mM each)0.5 μL200 μM each
正向引物 (10 μM)1.0 μL0.4 μM
反向引物 (10 μM)1.0 μL0.4 μM
MgCl₂ (25 mM)1.5 μL1.5 mM
Taq 聚合酶 (5 U/μL)0.125 μL0.625 U
模板 DNA1.0 μL10-100 ng
ddH₂O补至 25 μL-

PCR 程序设置

步骤温度时间循环
预变性95°C3-5 min
变性95°C30 sec─┐
退火55-65°C30 sec30×│
延伸72°C1 min/kb─┘
终延伸72°C5-10 min
保存4°C-

常见 PCR 问题排查

问题可能原因解决方案
无条带引物不匹配/模板降解/Mg²⁺不足检查引物序列、换模板、梯度Mg²⁺
拖尾/弥散退火温度太低/延伸时间不够提高退火温度、增加延伸时间
多条带退火温度太低/引物不特异提高退火温度、重新设计引物
引物二聚体引物 3' 端互补重新设计引物、减少引物浓度
产物过短/过长模板问题/引物设计错误验证引物位置、检查模板完整性

关键公式 & 数字

PCR 扩增倍数 = 2^n(n = 循环数,理论值)
Tm ≈ 2(A+T) + 4(G+C)(简易公式,短引物)
退火温度 ≈ Tm - 5°C
Taq 延伸速度 ≈ 1 kb/min
Pfu/Q5 延伸速度 ≈ 0.5 kb/min(更慢但更准)
Taq 错误率 ≈ 1×10⁻⁴ / bp / cycle
Q5 错误率 ≈ 5×10⁻⁷ / bp / cycle

延伸资源

推荐阅读

资源类型说明
Molecular Cloning: A Laboratory Manual (Sambrook)教材分子克隆实验圣经(第四版)
PCR Primer Design (Humana Press)专著引物设计方法学
NEB 酶切工具在线工具https://nebcloner.neb.com/ ,选酶 + 查缓冲液兼容性
Addgene 质粒库数据库https://www.addgene.org/ ,查找/获取公开质粒
Benchling在线工具免费分子生物学设计平台(引物、质粒可视化)

生信工具链

工具用途安装
Primer3引物设计conda install -c bioconda primer3-py
isPcr电子 PCRconda install -c bioconda isPcr
BLAST+引物特异性验证conda install -c bioconda blast
Cutadapt引物去除conda install -c bioconda cutadapt
QIIME2扩增子分析全流程conda install -c qiime2 qiime2
SnapGene Viewer质粒可视化(免费查看)官网下载

相关知识库文章

  • 01_宏基因组全流程.md —— 扩增子 vs 宏基因组的区别
  • 02_微生物多样性分析.md —— 16S 扩增子分析详细流程
  • 13_测序技术原理.md —— 测序建库中 PCR 的角色
  • 23_分子生物学中心法则与基因组学基础.md —— DNA 复制(PCR 的理论基础)

最后更新:2026-05-03 | 本文约 4500 字 | 适用岗位:生信工程师、分子生物学相关