CUT&Tag 技术原理与分析¶
一句话说明¶
CUT&Tag 就像给基因组上的"书签"(组蛋白修饰)拍照——用抗体找到书签位置,再用酶把那段 DNA 剪下来测序,比 ChIP-seq 省钱省细胞。
核心知识点¶
要点1:CUT&Tag 是什么¶
- CUT&Tag = Cleavage Under Targets and Tagmentation
- 传统 ChIP-seq 需要大量细胞(百万级)、操作繁琐,CUT&Tag 只需几百到几千个细胞
- 白话类比:ChIP-seq 像用渔网捕鱼再筛选,CUT&Tag 像精准钓鱼——直接在目标位置下钩
要点2:技术原理四步走¶
- 抗体结合:一抗识别目标蛋白(如 H3K27me3),二抗放大信号
- pA-Tn5 结合:蛋白A-Tn5 转座酶复合物与二抗结合,定位到目标位置
- 激活切割:加入 Mg²⁺ 激活 Tn5,在目标位置进行 tagmentation(切割+加接头)
- 扩增测序:PCR 扩增带接头的 DNA 片段,上机测序
要点3:与 ChIP-seq 的关键区别¶
| 特征 | ChIP-seq | CUT&Tag |
|---|---|---|
| 细胞量 | 10⁵-10⁷ | 10²-10⁴ |
| 背景噪声 | 高 | 低 |
| 测序深度 | 2000-5000 万 reads | 300-800 万 reads |
| 成本 | 高 | 低(约 1/5) |
| 操作时间 | 2-3 天 | 1 天 |
要点4:适用场景¶
- 组蛋白修饰分析(H3K27me3、H3K4me3、H3K27ac 等)
- 转录因子结合(信号较弱,需优化)
- 单细胞表观基因组(scCUT&Tag)
- 珍贵临床样本(细胞量少)
实战代码¶
# ===== CUT&Tag 数据分析流程 =====
# 1. 质控:检查原始测序数据质量
fastqc -t 8 -o fastqc_results/ sample_R1.fastq.gz sample_R2.fastq.gz
# 2. 去接头:用 Trim Galore 去除 Nextera 接头
trim_galore --paired --nextera -o trimmed/ \
sample_R1.fastq.gz sample_R2.fastq.gz
# 3. 比对:用 Bowtie2 比对到参考基因组
# --very-sensitive: 最灵敏模式,CUT&Tag 数据量少所以要尽量比上
# --no-mixed --no-discordant: 只保留正确配对的 reads
# --maxins 700: 最大插入片段 700bp(CUT&Tag 片段较小)
bowtie2 --very-sensitive --no-mixed --no-discordant \
--maxins 700 -x hg38_index \
-1 trimmed/sample_R1_val_1.fq.gz \
-2 trimmed/sample_R2_val_2.fq.gz \
-S sample.sam -p 8
# 4. 排序和去重
samtools sort -@ 8 -o sample.sorted.bam sample.sam # 按坐标排序
samtools markdup -r sample.sorted.bam sample.dedup.bam # 去除 PCR 重复
samtools index sample.dedup.bam # 建索引
# 5. 去除黑名单区域(ENCODE blacklist)
bedtools intersect -v -abam sample.dedup.bam \
-b hg38-blacklist.v2.bed > sample.clean.bam
# 6. Peak calling:用 SEACR(专为 CUT&Tag 设计)
# SEACR 比 MACS2 更适合 CUT&Tag 的低背景数据
bedtools genomecov -ibam sample.clean.bam -bg > sample.bedgraph # 转 bedgraph
bash SEACR_1.3.sh sample.bedgraph IgG_control.bedgraph \
non stringent sample_peaks # stringent 模式减少假阳性
# 7. 也可用 MACS2(需调参数)
macs2 callpeak -t sample.clean.bam -c IgG_control.bam \
-f BAMPE --nomodel --keep-dup all \
-g hs -n sample_macs2 --broad # --broad 用于宽峰如 H3K27me3
面试常问点¶
★ CUT&Tag 比 ChIP-seq 好在哪里?¶
参考答案:三个核心优势——第一,细胞量需求低,几百个细胞就能做,ChIP-seq 需要几十万;第二,信噪比高,因为 Tn5 只在抗体结合的位置切割,背景噪声很低;第三,成本低、操作简单,一天就能完成实验。缺点是对转录因子这种结合位点窄的目标效果不如 ChIP-seq 稳定。
★ 为什么 CUT&Tag 推荐用 SEACR 而不是 MACS2?¶
参考答案:CUT&Tag 的背景噪声非常低,MACS2 是为 ChIP-seq 设计的,假设背景符合泊松分布,面对 CUT&Tag 的低背景会过度 call peak。SEACR 是专门为 CUT&Tag 设计的,基于信号的百分位数阈值来识别峰,更适合低背景数据。不过如果是分析宽峰(如 H3K27me3),MACS2 加 --broad 参数也能用。
★ CUT&Tag 的 IgG 对照是什么意思?¶
参考答案:IgG 是一种非特异性抗体,不会和任何目标蛋白结合。用 IgG 做对照,能捕获实验过程中的非特异性背景信号。在 peak calling 时用 IgG 对照减去背景,得到的峰才是真正的目标信号。
速查卡片¶
| 问题 | 一句话答案 |
|---|---|
| CUT&Tag 全称 | Cleavage Under Targets and Tagmentation |
| 核心酶 | pA-Tn5 转座酶 |
| 最少细胞量 | 约 100-1000 个细胞 |
| 推荐 peak caller | SEACR(低背景专用) |
| 推荐比对工具 | Bowtie2(双端模式) |
| 与 ChIP-seq 最大区别 | 低细胞量、低背景、低成本 |
| 适合分析的目标 | 组蛋白修饰(H3K4me3、H3K27me3 等) |
| 推荐测序深度 | 3-8M reads(远低于 ChIP-seq) |