166_DNA损伤修复通路分析¶
一句话概述¶
DNA损伤修复(DDR)通路分析通过评估同源重组(HR)、非同源末端连接(NHEJ)、错配修复(MMR)和碱基切除修复(BER)等通路的基因突变、表达和功能状态,计算HRD评分预测PARP抑制剂和铂类药物敏感性,是精准肿瘤治疗的核心生信分析。
核心知识点总览¶
| 知识点 | 说明 |
|---|---|
| HR(同源重组) | 高保真修复DSB,BRCA1/2为核心 |
| NHEJ(非同源末端连接) | 快速但易错的DSB修复 |
| MMR(错配修复) | 修复复制错误,缺陷导致MSI |
| BER(碱基切除修复) | 修复氧化损伤等单碱基损伤 |
| HRD评分 | LOH+TAI+LST三指标综合评估HR缺陷 |
| BRCA突变 | 胚系/体细胞BRCA1/2突变导致HRD |
| 合成致死 | PARP抑制剂利用HRD肿瘤的合成致死 |
| MSI检测 | 微卫星不稳定性反映MMR缺陷 |
各步骤详解¶
第一步:DDR通路概览¶
白话解释: DNA每天都在受到各种"攻击"(紫外线、氧化、复制错误等),细胞有多套"修理工"来应对。如果某套"修理工"罢工了(基因突变导致通路失活),细胞就只能依赖其他通路。PARP抑制剂就是针对HR缺陷的肿瘤——阻断BER通路后,HR也坏了的肿瘤细胞就无路可修,走向死亡(合成致死)。
主要DDR通路及关键基因: | 通路 | 修复对象 | 核心基因 | 临床意义 | |------|---------|---------|---------| | HR | DSB(双链断裂) | BRCA1/2, RAD51, PALB2, ATM, ATR | PARPi/铂类敏感 | | NHEJ | DSB | 53BP1, LIG4, XRCC4, Ku70/80 | 放疗敏感性 | | MMR | 碱基错配 | MLH1, MSH2, MSH6, PMS2 | 免疫治疗响应(MSI-H) | | BER | 单碱基损伤 | PARP1, OGG1, APE1, XRCC1 | PARPi靶点 | | NER | 大加合物 | ERCC1-6, XPA-XPG | 铂类耐药 | | FA通路 | ICL(链间交联) | FANCA-FANCN | 铂类/MMC敏感 |
第二步:HRD评分计算¶
代码示例:
# === 使用scarHRD计算HRD评分 ===
# install.packages("devtools")
# devtools::install_github("sztup/scarHRD")
library(scarHRD)
# 输入: Sequenza输出的拷贝数segment文件
# 格式: SampleID, Chromosome, Start_position, End_position,
# total_cn, A_cn, B_cn, ploidy
hrd_result <- scar_score(
seg_file = "sequenza_segments.txt",
reference = "grch38",
seqz = TRUE # 输入来自Sequenza
)
# 输出三个基因组瘢痕指标:
# HRD-LOH: 超过15Mb但不覆盖整条染色体的LOH区域数
# LST: 相邻segment间>10Mb的大规模状态转换数
# TAI: 延伸到端粒的等位不平衡区域数
print(hrd_result)
# HRD-LOH LST TAI HRD_sum
# 12 15 10 37
# HRD评分 = LOH + LST + TAI
# 临床阈值: HRD >= 42 (Myriad myChoice CDx标准)
if (hrd_result$HRD_sum >= 42) {
cat("HRD-positive: 可能对PARPi敏感\n")
} else {
cat("HRD-negative\n")
}
# === 从ASCAT结果计算 ===
# ASCAT输出: allele-specific拷贝数
# 也可使用scarHRD处理ASCAT segments
hrd_ascat <- scar_score(
seg_file = "ascat_segments.txt",
reference = "grch38",
seqz = FALSE # 非Sequenza格式
)
第三步:BRCA突变和DDR基因分析¶
代码示例:
library(maftools)
# === 读取MAF文件 ===
maf <- read.maf("tumor_mutations.maf")
# === DDR基因列表 ===
hr_genes <- c("BRCA1", "BRCA2", "PALB2", "RAD51B", "RAD51C", "RAD51D",
"ATM", "ATR", "CHEK1", "CHEK2", "BARD1", "BRIP1", "FANCA",
"FANCC", "FANCD2", "FANCE", "FANCF", "FANCG", "FANCL", "NBN")
mmr_genes <- c("MLH1", "MSH2", "MSH6", "PMS2", "EPCAM")
nhej_genes <- c("TP53BP1", "LIG4", "XRCC4", "XRCC5", "XRCC6")
ber_genes <- c("PARP1", "PARP2", "OGG1", "MUTYH", "XRCC1", "APEX1")
all_ddr_genes <- c(hr_genes, mmr_genes, nhej_genes, ber_genes)
# === 提取DDR基因突变 ===
ddr_mutations <- subsetMaf(maf, genes = all_ddr_genes)
# 瀑布图
oncoplot(maf, genes = all_ddr_genes[1:20])
# === BRCA突变分类 ===
brca_muts <- subsetMaf(maf, genes = c("BRCA1", "BRCA2"))
# 区分致病性突变类型
# Frameshift, Nonsense, Splice_Site → 功能丧失(LOF)
lof_types <- c("Frame_Shift_Del", "Frame_Shift_Ins", "Nonsense_Mutation",
"Splice_Site")
brca_lof <- brca_muts@data[Variant_Classification %in% lof_types]
# === 胚系vs体细胞BRCA突变 ===
# 胚系突变需要normal样本的VAF确认
# VAF ~ 50% in normal → 胚系
# VAF ~ 0% in normal → 体细胞
# === DDR通路缺陷评估 ===
# 综合判断: 突变 + 表达沉默 + HRD评分
ddr_status <- data.frame(
Pathway = c("HR", "MMR", "NHEJ", "BER"),
Gene_Mutation = c(
any(ddr_mutations@data$Hugo_Symbol %in% hr_genes),
any(ddr_mutations@data$Hugo_Symbol %in% mmr_genes),
any(ddr_mutations@data$Hugo_Symbol %in% nhej_genes),
any(ddr_mutations@data$Hugo_Symbol %in% ber_genes)
),
HRD_positive = hrd_result$HRD_sum >= 42,
Signature = NA # 需要突变签名分析
)
第四步:MSI检测(MMR缺陷)¶
代码示例:
# === MSIsensor2: 从BAM检测MSI ===
# 安装: conda install -c bioconda msisensor2
# 生成微卫星位点列表
msisensor2 scan -d reference.fa -o microsatellites.list
# 检测MSI状态
msisensor2 msi \
-d microsatellites.list \
-n normal.bam \
-t tumor.bam \
-o msi_output \
-b 4
# 输出: msi_output
# Total_Number_of_Sites Number_of_Somatic_Sites %
# MSI score ≥ 3.5% → MSI-H; < 3.5% → MSS
# === 替代方法: MANTIS ===
# conda install -c bioconda mantis
mantis --bedfile microsatellites.bed \
--genome reference.fa \
-n normal.bam \
-t tumor.bam \
-o mantis_output.txt
# MANTIS score > 0.4 → MSI-H
# === 基于表达的MMR缺陷检测 ===
# MLH1甲基化导致的表达沉默是散发性MSI的主要原因
# 检查MMR基因表达
mmr_expression <- expression_matrix[mmr_genes, ]
# MLH1低表达 + MSI-H → 可能是MLH1启动子甲基化
# MLH1正常表达 + MSI-H → 可能是其他MMR基因突变(Lynch综合征)
第五步:DDR通路的转录组评估¶
代码示例:
library(GSVA)
library(msigdbr)
# === 基于基因集的DDR通路活性评估 ===
# 获取DDR相关基因集
ddr_genesets <- list(
HR_repair = c("BRCA1", "BRCA2", "RAD51", "PALB2", "ATM", "ATR", "CHEK1", "CHEK2"),
MMR = c("MLH1", "MSH2", "MSH6", "PMS2", "EXO1", "RFC1"),
NHEJ = c("XRCC5", "XRCC6", "LIG4", "XRCC4", "DCLRE1C", "PRKDC"),
BER = c("OGG1", "APEX1", "XRCC1", "PARP1", "PARP2", "LIG3"),
NER = c("XPA", "XPB", "XPC", "XPD", "ERCC1", "DDB1", "DDB2"),
FA_pathway = c("FANCA", "FANCB", "FANCC", "FANCD2", "FANCE", "FANCF", "FANCG")
)
# GSVA评估通路活性
gsva_result <- gsva(
as.matrix(expression_tpm),
ddr_genesets,
method = "gsva",
verbose = TRUE
)
# 热图展示各样本的DDR通路活性
library(pheatmap)
pheatmap(gsva_result,
scale = "row",
annotation_col = clinical_annotation,
color = colorRampPalette(c("blue", "white", "red"))(100),
main = "DDR Pathway Activity Scores")
# === 与PARP抑制剂响应关联 ===
# HR通路低活性 → 可能PARPi敏感
hr_low <- gsva_result["HR_repair", ] < median(gsva_result["HR_repair", ])
cat(sprintf("HR-low样本比例: %.1f%%\n", sum(hr_low)/length(hr_low)*100))
实战命令¶
# === 完整DDR分析流程 ===
# 1. 变异检测
gatk Mutect2 -R ref.fa -I tumor.bam -I normal.bam -O somatic.vcf
# 2. 拷贝数分析(HRD需要)
sequenza-utils bam2seqz -n normal.bam --tumor tumor.bam --fasta ref.fa -o seqz.gz
# 3. HRD评分
Rscript -e 'library(scarHRD); scar_score("segments.txt", reference="grch38", seqz=TRUE)'
# 4. MSI检测
msisensor2 scan -d ref.fa -o ms.list
msisensor2 msi -d ms.list -n normal.bam -t tumor.bam -o msi_result
# 5. DDR基因突变提取
Rscript -e 'library(maftools); maf=read.maf("somatic.maf"); subsetMaf(maf, genes=ddr_genes)'
面试常问点¶
Q1:HRD评分的三个组成部分分别反映什么?¶
A: (1) HRD-LOH(Loss of Heterozygosity):超过15Mb的LOH区域数,反映HR缺陷后DNA修复不当导致的杂合性丢失;(2) LST(Large-Scale State Transitions):过滤后相邻片段间>10Mb的大规模拷贝数状态转换数,反映HR缺陷后错误修复导致的基因组重排;(3) TAI(Telomeric Allelic Imbalance):延伸到亚端粒区域的等位基因不平衡数,反映端粒区域的异常修复。三者之和>=42为HRD阳性(Myriad标准)。
Q2:PARP抑制剂为什么对HRD肿瘤有效(合成致死)?¶
A: PARP酶参与BER和单链断裂修复。PARP被抑制后,单链断裂积累并在复制叉处转化为双链断裂(DSB)。正常细胞可以用HR(同源重组)高保真修复DSB。但HRD肿瘤(如BRCA突变)的HR通路缺陷,无法修复这些DSB,导致基因组不稳定和细胞死亡。这就是"合成致死"——单独BER缺陷或HR缺陷细胞都能存活,但两者同时缺陷则致死。
Q3:如何综合判断一个肿瘤是否HRD?¶
A: 多层次证据综合:(1) 基因突变:BRCA1/2/PALB2等HR基因的LOF突变(胚系+体细胞);(2) 基因组瘢痕:HRD评分≥42(LOH+LST+TAI);(3) 突变签名:COSMIC SBS3(HR缺陷特征性签名);(4) 表达层面:BRCA1启动子甲基化导致表达沉默;(5) 功能检测:RAD51 foci assay(研究级)。临床上通常结合(1)+(2)做决策。
Q4:MSI-H和dMMR的关系是什么?¶
A: dMMR(MMR缺陷)是原因,MSI-H(微卫星不稳定)是结果。MMR系统(MLH1/MSH2/MSH6/PMS2)负责修复DNA复制时在微卫星区域产生的错误(滑移突变)。MMR缺陷导致微卫星区域积累大量indel突变→MSI-H。检测方法:IHC检测MMR蛋白表达(dMMR);PCR/NGS检测微卫星位点变化(MSI)。两者高度一致(>95%concordance)。
Q5:DDR分析在临床用药指导中的具体应用?¶
A: (1) HRD → PARPi:卵巢癌/乳腺癌/前列腺癌/胰腺癌中HRD阳性患者可受益于olaparib/niraparib等;(2) MSI-H/dMMR → 免疫治疗:MSI-H是泛癌种免疫治疗标志物(pembrolizumab获FDA泛癌种适应症);(3) NER缺陷 → 铂类敏感:ERCC1低表达预测铂类化疗获益;(4) ATM/ATR缺陷 → ATR抑制剂:ATR-ATM通路缺陷的肿瘤对ATR抑制剂敏感(临床试验中)。
易错点¶
1. 混淆胚系和体细胞BRCA突变¶
错误: 不区分来源直接报告"BRCA突变"。 正确做法: 胚系BRCA突变(遗传的)需要遗传咨询和家族筛查;体细胞BRCA突变也预测PARPi敏感性。两者临床意义不同。需要配对normal确认。
2. HRD评分未考虑全基因组倍性¶
错误: 多倍体肿瘤的HRD评分假性升高。 正确做法: HRD计算依赖准确的allele-specific拷贝数估计。近四倍体肿瘤需要正确估计ploidy后再计算。使用ASCAT/Sequenza先确定ploidy。
3. 只看基因突变不看功能后果¶
错误: 报告BRCA2同义突变为"BRCA2突变阳性"。 正确做法: 只有功能丧失(LOF)突变才有临床意义:移码、无义、剪接位点突变。错义突变需要查ClinVar/BRCA Exchange的致病性分类(P/LP)。VUS(意义未明)不应用于临床决策。
4. MSI检测样本不匹配¶
错误: 无配对normal样本时用MSIsensor。 正确做法: MSIsensor2需要配对normal;如果无配对normal,使用MSIsensor-pro(tumor-only模式)或基于panel的方法(如MSIpred)。
5. 忽略DDR通路的代偿机制¶
错误: BRCA2突变就直接判定HRD。 正确做法: 回复突变(reversion mutation)可恢复BRCA2功能→PARPi耐药。53BP1丧失也可部分代偿HR缺陷。需要综合评估(基因组瘢痕+突变+表达)而非依赖单一证据。
补充知识¶
DDR相关临床试验标志物¶
| 药物 | 靶点 | 生物标志物 |
|---|---|---|
| Olaparib | PARP | BRCA1/2突变, HRD |
| Niraparib | PARP | HRD评分≥42 |
| Pembrolizumab | PD-1 | MSI-H/dMMR |
| Berzosertib | ATR | ATM缺失 |
| Adavosertib | WEE1 | TP53突变+CCNE1扩增 |
数据库资源¶
- ClinVar: BRCA变异致病性分类
- BRCA Exchange: BRCA1/2变异综合数据库
- HRDetect: 基于多特征的HRD预测器
- COSMIC signatures: DDR缺陷相关突变签名