跳转至

CUT&Tag 技术原理与分析


一句话说明

CUT&Tag 就像给基因组上的"书签"(组蛋白修饰)拍照——用抗体找到书签位置,再用酶把那段 DNA 剪下来测序,比 ChIP-seq 省钱省细胞。


核心知识点

要点1:CUT&Tag 是什么

  • CUT&Tag = Cleavage Under Targets and Tagmentation
  • 传统 ChIP-seq 需要大量细胞(百万级)、操作繁琐,CUT&Tag 只需几百到几千个细胞
  • 白话类比:ChIP-seq 像用渔网捕鱼再筛选,CUT&Tag 像精准钓鱼——直接在目标位置下钩

要点2:技术原理四步走

  1. 抗体结合:一抗识别目标蛋白(如 H3K27me3),二抗放大信号
  2. pA-Tn5 结合:蛋白A-Tn5 转座酶复合物与二抗结合,定位到目标位置
  3. 激活切割:加入 Mg²⁺ 激活 Tn5,在目标位置进行 tagmentation(切割+加接头)
  4. 扩增测序:PCR 扩增带接头的 DNA 片段,上机测序

要点3:与 ChIP-seq 的关键区别

特征ChIP-seqCUT&Tag
细胞量10⁵-10⁷10²-10⁴
背景噪声
测序深度2000-5000 万 reads300-800 万 reads
成本低(约 1/5)
操作时间2-3 天1 天

要点4:适用场景

  • 组蛋白修饰分析(H3K27me3、H3K4me3、H3K27ac 等)
  • 转录因子结合(信号较弱,需优化)
  • 单细胞表观基因组(scCUT&Tag)
  • 珍贵临床样本(细胞量少)

实战代码

# ===== CUT&Tag 数据分析流程 =====

# 1. 质控:检查原始测序数据质量
fastqc -t 8 -o fastqc_results/ sample_R1.fastq.gz sample_R2.fastq.gz

# 2. 去接头:用 Trim Galore 去除 Nextera 接头
trim_galore --paired --nextera -o trimmed/ \
    sample_R1.fastq.gz sample_R2.fastq.gz

# 3. 比对:用 Bowtie2 比对到参考基因组
# --very-sensitive: 最灵敏模式,CUT&Tag 数据量少所以要尽量比上
# --no-mixed --no-discordant: 只保留正确配对的 reads
# --maxins 700: 最大插入片段 700bp(CUT&Tag 片段较小)
bowtie2 --very-sensitive --no-mixed --no-discordant \
    --maxins 700 -x hg38_index \
    -1 trimmed/sample_R1_val_1.fq.gz \
    -2 trimmed/sample_R2_val_2.fq.gz \
    -S sample.sam -p 8

# 4. 排序和去重
samtools sort -@ 8 -o sample.sorted.bam sample.sam  # 按坐标排序
samtools markdup -r sample.sorted.bam sample.dedup.bam  # 去除 PCR 重复
samtools index sample.dedup.bam  # 建索引

# 5. 去除黑名单区域(ENCODE blacklist)
bedtools intersect -v -abam sample.dedup.bam \
    -b hg38-blacklist.v2.bed > sample.clean.bam

# 6. Peak calling:用 SEACR(专为 CUT&Tag 设计)
# SEACR 比 MACS2 更适合 CUT&Tag 的低背景数据
bedtools genomecov -ibam sample.clean.bam -bg > sample.bedgraph  # 转 bedgraph
bash SEACR_1.3.sh sample.bedgraph IgG_control.bedgraph \
    non stringent sample_peaks  # stringent 模式减少假阳性

# 7. 也可用 MACS2(需调参数)
macs2 callpeak -t sample.clean.bam -c IgG_control.bam \
    -f BAMPE --nomodel --keep-dup all \
    -g hs -n sample_macs2 --broad  # --broad 用于宽峰如 H3K27me3

面试常问点

★ CUT&Tag 比 ChIP-seq 好在哪里?

参考答案:三个核心优势——第一,细胞量需求低,几百个细胞就能做,ChIP-seq 需要几十万;第二,信噪比高,因为 Tn5 只在抗体结合的位置切割,背景噪声很低;第三,成本低、操作简单,一天就能完成实验。缺点是对转录因子这种结合位点窄的目标效果不如 ChIP-seq 稳定。

★ 为什么 CUT&Tag 推荐用 SEACR 而不是 MACS2?

参考答案:CUT&Tag 的背景噪声非常低,MACS2 是为 ChIP-seq 设计的,假设背景符合泊松分布,面对 CUT&Tag 的低背景会过度 call peak。SEACR 是专门为 CUT&Tag 设计的,基于信号的百分位数阈值来识别峰,更适合低背景数据。不过如果是分析宽峰(如 H3K27me3),MACS2 加 --broad 参数也能用。

★ CUT&Tag 的 IgG 对照是什么意思?

参考答案:IgG 是一种非特异性抗体,不会和任何目标蛋白结合。用 IgG 做对照,能捕获实验过程中的非特异性背景信号。在 peak calling 时用 IgG 对照减去背景,得到的峰才是真正的目标信号。


速查卡片

问题一句话答案
CUT&Tag 全称Cleavage Under Targets and Tagmentation
核心酶pA-Tn5 转座酶
最少细胞量约 100-1000 个细胞
推荐 peak callerSEACR(低背景专用)
推荐比对工具Bowtie2(双端模式)
与 ChIP-seq 最大区别低细胞量、低背景、低成本
适合分析的目标组蛋白修饰(H3K4me3、H3K27me3 等)
推荐测序深度3-8M reads(远低于 ChIP-seq)