染色质重塑复合物分析¶
一句话说明¶
染色质重塑复合物就像基因组的"装修队"——它们消耗 ATP 的能量,移动、弹出或重新排列核小体,决定哪段 DNA 能被读取、哪段被封住。
核心知识点¶
要点1:什么是染色质重塑¶
- 核小体 = 147bp DNA 缠绕在组蛋白八聚体上,像线缠在线轴上
- 染色质重塑 = 用 ATP 能量改变核小体的位置或组成
- 白话类比:图书馆的书架(核小体)挡住了某些书(基因),重塑复合物就是搬书架的工人
要点2:四大重塑复合物家族¶
| 家族 | 代表成员 | 功能 | 疾病关联 |
|---|---|---|---|
| SWI/SNF | BRG1, BAF | 滑动/弹出核小体,激活基因 | 肿瘤(~20% 突变) |
| ISWI | SNF2H, ACF | 规则排列核小体 | 发育异常 |
| CHD | CHD1, NuRD | 含有染色质结构域,调控发育 | 自闭症、肿瘤 |
| INO80 | INO80, SWR1 | 替换组蛋白变体(H2A.Z) | DNA 损伤修复 |
要点3:研究方法¶
- ChIP-seq / CUT&Tag:定位重塑复合物在基因组上的结合位置
- ATAC-seq:检测染色质开放性变化(重塑的结果)
- MNase-seq:检测核小体定位变化
- Co-IP + 质谱:鉴定复合物的蛋白组成
- 敲低/敲除 + 多组学:研究功能影响
要点4:分析思路¶
- 先鉴定复合物成员的基因组结合位点(ChIP/CUT&Tag)
- 在敲低条件下做 ATAC-seq,看哪些区域的开放性受影响
- 结合 RNA-seq,看基因表达变化
- 整合分析:哪些基因的调控依赖于该重塑复合物
实战代码¶
# ===== 染色质重塑复合物分析:整合 ATAC-seq + RNA-seq =====
# 1. ATAC-seq 差异开放性分析(以 BRG1 敲低为例)
# 比对已在上游完成,这里从 peak calling 开始
# 对 WT 和 KD(knockdown)分别 call peaks
macs2 callpeak -t WT_atac.bam -f BAMPE \
--nomodel -g hs -n WT_peaks --keep-dup all
macs2 callpeak -t KD_atac.bam -f BAMPE \
--nomodel -g hs -n KD_peaks --keep-dup all
# 2. 合并所有 peaks 得到统一的区域集合
cat WT_peaks_peaks.narrowPeak KD_peaks_peaks.narrowPeak | \
sort -k1,1 -k2,2n | \
bedtools merge -i - > merged_peaks.bed # 合并重叠的 peaks
# 3. 用 featureCounts 计算每个 peak 区域的 reads 数
featureCounts -p --countReadPairs -T 8 \
-F SAF -a merged_peaks.saf \
-o peak_counts.txt \
WT_rep1.bam WT_rep2.bam KD_rep1.bam KD_rep2.bam
# ===== R: 差异开放性 + 基因表达整合分析 =====
library(DESeq2)
library(ChIPpeakAnno)
# --- 差异开放性分析 ---
# 读取 ATAC-seq peak 计数矩阵
counts <- read.table("peak_counts.txt", header = TRUE, row.names = 1)
coldata <- data.frame(
condition = c("WT", "WT", "KD", "KD"), # 两组各两个重复
row.names = colnames(counts))
# DESeq2 分析差异开放性
dds <- DESeqDataSetFromMatrix(counts, coldata, ~ condition)
dds <- DESeq(dds)
res <- results(dds, contrast = c("condition", "KD", "WT"))
# 筛选 KD 后关闭的区域(BRG1 依赖的开放区域)
closing <- subset(res, log2FoldChange < -1 & padj < 0.05)
cat("BRG1 敲低后关闭的区域数:", nrow(closing), "\n")
# --- 与基因表达关联 ---
# 将关闭的 peak 区域注释到最近的基因
library(TxDb.Hsapiens.UCSC.hg38.knownGene)
txdb <- TxDb.Hsapiens.UCSC.hg38.knownGene
# 把关闭区域的坐标转成 GRanges 对象
closing_gr <- GRanges(closing_peaks) # 从 bed 文件读取
# 找最近的基因 TSS
anno <- annotatePeakInBatch(closing_gr,
AnnotationData = TSS.human.GRCh38)
# 看这些基因在 RNA-seq 中是否也下调
# 如果 ATAC 关闭 + RNA 下调 = BRG1 直接激活的靶基因
面试常问点¶
★ SWI/SNF 复合物在肿瘤中为什么重要?¶
参考答案:SWI/SNF 复合物的核心亚基(BRG1、ARID1A 等)在约 20% 的人类肿瘤中发生突变,是突变频率最高的染色质调控因子。它的功能是打开染色质、激活抑癌基因的表达。突变导致染色质无法正常打开,抑癌基因被沉默,促进肿瘤发生。目前 SWI/SNF 突变已成为重要的肿瘤治疗靶点。
★ 怎么判断一个基因是否受染色质重塑复合物直接调控?¶
参考答案:需要三层证据——第一,ChIP/CUT&Tag 证明重塑复合物在该基因的调控区域有结合;第二,敲低重塑复合物后 ATAC-seq 显示该区域的开放性下降;第三,RNA-seq 显示该基因的表达也下降。三者一致才是强有力的直接调控证据。
速查卡片¶
| 问题 | 一句话答案 |
|---|---|
| 染色质重塑的本质 | 消耗 ATP 改变核小体位置或组成 |
| 四大家族 | SWI/SNF、ISWI、CHD、INO80 |
| 肿瘤中最重要的家族 | SWI/SNF(~20% 肿瘤突变) |
| 主要检测技术 | ChIP-seq + ATAC-seq + RNA-seq 整合 |
| 核小体定位检测 | MNase-seq |
| SWI/SNF 的功能 | 滑动/弹出核小体,开放染色质 |
| INO80 的特殊功能 | 替换组蛋白变体(如 H2A.Z) |