跳转至

染色质重塑复合物分析


一句话说明

染色质重塑复合物就像基因组的"装修队"——它们消耗 ATP 的能量,移动、弹出或重新排列核小体,决定哪段 DNA 能被读取、哪段被封住。


核心知识点

要点1:什么是染色质重塑

  • 核小体 = 147bp DNA 缠绕在组蛋白八聚体上,像线缠在线轴上
  • 染色质重塑 = 用 ATP 能量改变核小体的位置或组成
  • 白话类比:图书馆的书架(核小体)挡住了某些书(基因),重塑复合物就是搬书架的工人

要点2:四大重塑复合物家族

家族代表成员功能疾病关联
SWI/SNFBRG1, BAF滑动/弹出核小体,激活基因肿瘤(~20% 突变)
ISWISNF2H, ACF规则排列核小体发育异常
CHDCHD1, NuRD含有染色质结构域,调控发育自闭症、肿瘤
INO80INO80, SWR1替换组蛋白变体(H2A.Z)DNA 损伤修复

要点3:研究方法

  • ChIP-seq / CUT&Tag:定位重塑复合物在基因组上的结合位置
  • ATAC-seq:检测染色质开放性变化(重塑的结果)
  • MNase-seq:检测核小体定位变化
  • Co-IP + 质谱:鉴定复合物的蛋白组成
  • 敲低/敲除 + 多组学:研究功能影响

要点4:分析思路

  1. 先鉴定复合物成员的基因组结合位点(ChIP/CUT&Tag)
  2. 在敲低条件下做 ATAC-seq,看哪些区域的开放性受影响
  3. 结合 RNA-seq,看基因表达变化
  4. 整合分析:哪些基因的调控依赖于该重塑复合物

实战代码

# ===== 染色质重塑复合物分析:整合 ATAC-seq + RNA-seq =====

# 1. ATAC-seq 差异开放性分析(以 BRG1 敲低为例)
# 比对已在上游完成,这里从 peak calling 开始

# 对 WT 和 KD(knockdown)分别 call peaks
macs2 callpeak -t WT_atac.bam -f BAMPE \
    --nomodel -g hs -n WT_peaks --keep-dup all
macs2 callpeak -t KD_atac.bam -f BAMPE \
    --nomodel -g hs -n KD_peaks --keep-dup all

# 2. 合并所有 peaks 得到统一的区域集合
cat WT_peaks_peaks.narrowPeak KD_peaks_peaks.narrowPeak | \
    sort -k1,1 -k2,2n | \
    bedtools merge -i - > merged_peaks.bed  # 合并重叠的 peaks

# 3. 用 featureCounts 计算每个 peak 区域的 reads 数
featureCounts -p --countReadPairs -T 8 \
    -F SAF -a merged_peaks.saf \
    -o peak_counts.txt \
    WT_rep1.bam WT_rep2.bam KD_rep1.bam KD_rep2.bam
# ===== R: 差异开放性 + 基因表达整合分析 =====
library(DESeq2)
library(ChIPpeakAnno)

# --- 差异开放性分析 ---
# 读取 ATAC-seq peak 计数矩阵
counts <- read.table("peak_counts.txt", header = TRUE, row.names = 1)
coldata <- data.frame(
    condition = c("WT", "WT", "KD", "KD"),  # 两组各两个重复
    row.names = colnames(counts))

# DESeq2 分析差异开放性
dds <- DESeqDataSetFromMatrix(counts, coldata, ~ condition)
dds <- DESeq(dds)
res <- results(dds, contrast = c("condition", "KD", "WT"))

# 筛选 KD 后关闭的区域(BRG1 依赖的开放区域)
closing <- subset(res, log2FoldChange < -1 & padj < 0.05)
cat("BRG1 敲低后关闭的区域数:", nrow(closing), "\n")

# --- 与基因表达关联 ---
# 将关闭的 peak 区域注释到最近的基因
library(TxDb.Hsapiens.UCSC.hg38.knownGene)
txdb <- TxDb.Hsapiens.UCSC.hg38.knownGene

# 把关闭区域的坐标转成 GRanges 对象
closing_gr <- GRanges(closing_peaks)  # 从 bed 文件读取

# 找最近的基因 TSS
anno <- annotatePeakInBatch(closing_gr,
    AnnotationData = TSS.human.GRCh38)

# 看这些基因在 RNA-seq 中是否也下调
# 如果 ATAC 关闭 + RNA 下调 = BRG1 直接激活的靶基因

面试常问点

★ SWI/SNF 复合物在肿瘤中为什么重要?

参考答案:SWI/SNF 复合物的核心亚基(BRG1、ARID1A 等)在约 20% 的人类肿瘤中发生突变,是突变频率最高的染色质调控因子。它的功能是打开染色质、激活抑癌基因的表达。突变导致染色质无法正常打开,抑癌基因被沉默,促进肿瘤发生。目前 SWI/SNF 突变已成为重要的肿瘤治疗靶点。

★ 怎么判断一个基因是否受染色质重塑复合物直接调控?

参考答案:需要三层证据——第一,ChIP/CUT&Tag 证明重塑复合物在该基因的调控区域有结合;第二,敲低重塑复合物后 ATAC-seq 显示该区域的开放性下降;第三,RNA-seq 显示该基因的表达也下降。三者一致才是强有力的直接调控证据。


速查卡片

问题一句话答案
染色质重塑的本质消耗 ATP 改变核小体位置或组成
四大家族SWI/SNF、ISWI、CHD、INO80
肿瘤中最重要的家族SWI/SNF(~20% 肿瘤突变)
主要检测技术ChIP-seq + ATAC-seq + RNA-seq 整合
核小体定位检测MNase-seq
SWI/SNF 的功能滑动/弹出核小体,开放染色质
INO80 的特殊功能替换组蛋白变体(如 H2A.Z)