跳转至

166_DNA损伤修复通路分析

一句话概述

DNA损伤修复(DDR)通路分析通过评估同源重组(HR)、非同源末端连接(NHEJ)、错配修复(MMR)和碱基切除修复(BER)等通路的基因突变、表达和功能状态,计算HRD评分预测PARP抑制剂和铂类药物敏感性,是精准肿瘤治疗的核心生信分析。


核心知识点总览

知识点说明
HR(同源重组)高保真修复DSB,BRCA1/2为核心
NHEJ(非同源末端连接)快速但易错的DSB修复
MMR(错配修复)修复复制错误,缺陷导致MSI
BER(碱基切除修复)修复氧化损伤等单碱基损伤
HRD评分LOH+TAI+LST三指标综合评估HR缺陷
BRCA突变胚系/体细胞BRCA1/2突变导致HRD
合成致死PARP抑制剂利用HRD肿瘤的合成致死
MSI检测微卫星不稳定性反映MMR缺陷

各步骤详解

第一步:DDR通路概览

白话解释: DNA每天都在受到各种"攻击"(紫外线、氧化、复制错误等),细胞有多套"修理工"来应对。如果某套"修理工"罢工了(基因突变导致通路失活),细胞就只能依赖其他通路。PARP抑制剂就是针对HR缺陷的肿瘤——阻断BER通路后,HR也坏了的肿瘤细胞就无路可修,走向死亡(合成致死)。

主要DDR通路及关键基因: | 通路 | 修复对象 | 核心基因 | 临床意义 | |------|---------|---------|---------| | HR | DSB(双链断裂) | BRCA1/2, RAD51, PALB2, ATM, ATR | PARPi/铂类敏感 | | NHEJ | DSB | 53BP1, LIG4, XRCC4, Ku70/80 | 放疗敏感性 | | MMR | 碱基错配 | MLH1, MSH2, MSH6, PMS2 | 免疫治疗响应(MSI-H) | | BER | 单碱基损伤 | PARP1, OGG1, APE1, XRCC1 | PARPi靶点 | | NER | 大加合物 | ERCC1-6, XPA-XPG | 铂类耐药 | | FA通路 | ICL(链间交联) | FANCA-FANCN | 铂类/MMC敏感 |


第二步:HRD评分计算

代码示例:

# === 使用scarHRD计算HRD评分 ===
# install.packages("devtools")
# devtools::install_github("sztup/scarHRD")
library(scarHRD)

# 输入: Sequenza输出的拷贝数segment文件
# 格式: SampleID, Chromosome, Start_position, End_position, 
#        total_cn, A_cn, B_cn, ploidy
hrd_result <- scar_score(
  seg_file = "sequenza_segments.txt",
  reference = "grch38",
  seqz = TRUE  # 输入来自Sequenza
)

# 输出三个基因组瘢痕指标:
# HRD-LOH: 超过15Mb但不覆盖整条染色体的LOH区域数
# LST: 相邻segment间>10Mb的大规模状态转换数
# TAI: 延伸到端粒的等位不平衡区域数
print(hrd_result)
# HRD-LOH  LST  TAI  HRD_sum
# 12       15   10   37

# HRD评分 = LOH + LST + TAI
# 临床阈值: HRD >= 42 (Myriad myChoice CDx标准)
if (hrd_result$HRD_sum >= 42) {
  cat("HRD-positive: 可能对PARPi敏感\n")
} else {
  cat("HRD-negative\n")
}

# === 从ASCAT结果计算 ===
# ASCAT输出: allele-specific拷贝数
# 也可使用scarHRD处理ASCAT segments
hrd_ascat <- scar_score(
  seg_file = "ascat_segments.txt",
  reference = "grch38",
  seqz = FALSE  # 非Sequenza格式
)


第三步:BRCA突变和DDR基因分析

代码示例:

library(maftools)

# === 读取MAF文件 ===
maf <- read.maf("tumor_mutations.maf")

# === DDR基因列表 ===
hr_genes <- c("BRCA1", "BRCA2", "PALB2", "RAD51B", "RAD51C", "RAD51D",
              "ATM", "ATR", "CHEK1", "CHEK2", "BARD1", "BRIP1", "FANCA",
              "FANCC", "FANCD2", "FANCE", "FANCF", "FANCG", "FANCL", "NBN")
mmr_genes <- c("MLH1", "MSH2", "MSH6", "PMS2", "EPCAM")
nhej_genes <- c("TP53BP1", "LIG4", "XRCC4", "XRCC5", "XRCC6")
ber_genes <- c("PARP1", "PARP2", "OGG1", "MUTYH", "XRCC1", "APEX1")

all_ddr_genes <- c(hr_genes, mmr_genes, nhej_genes, ber_genes)

# === 提取DDR基因突变 ===
ddr_mutations <- subsetMaf(maf, genes = all_ddr_genes)

# 瀑布图
oncoplot(maf, genes = all_ddr_genes[1:20])

# === BRCA突变分类 ===
brca_muts <- subsetMaf(maf, genes = c("BRCA1", "BRCA2"))
# 区分致病性突变类型
# Frameshift, Nonsense, Splice_Site → 功能丧失(LOF)
lof_types <- c("Frame_Shift_Del", "Frame_Shift_Ins", "Nonsense_Mutation", 
               "Splice_Site")
brca_lof <- brca_muts@data[Variant_Classification %in% lof_types]

# === 胚系vs体细胞BRCA突变 ===
# 胚系突变需要normal样本的VAF确认
# VAF ~ 50% in normal → 胚系
# VAF ~ 0% in normal → 体细胞

# === DDR通路缺陷评估 ===
# 综合判断: 突变 + 表达沉默 + HRD评分
ddr_status <- data.frame(
  Pathway = c("HR", "MMR", "NHEJ", "BER"),
  Gene_Mutation = c(
    any(ddr_mutations@data$Hugo_Symbol %in% hr_genes),
    any(ddr_mutations@data$Hugo_Symbol %in% mmr_genes),
    any(ddr_mutations@data$Hugo_Symbol %in% nhej_genes),
    any(ddr_mutations@data$Hugo_Symbol %in% ber_genes)
  ),
  HRD_positive = hrd_result$HRD_sum >= 42,
  Signature = NA  # 需要突变签名分析
)


第四步:MSI检测(MMR缺陷)

代码示例:

# === MSIsensor2: 从BAM检测MSI ===
# 安装: conda install -c bioconda msisensor2

# 生成微卫星位点列表
msisensor2 scan -d reference.fa -o microsatellites.list

# 检测MSI状态
msisensor2 msi \
  -d microsatellites.list \
  -n normal.bam \
  -t tumor.bam \
  -o msi_output \
  -b 4

# 输出: msi_output
# Total_Number_of_Sites  Number_of_Somatic_Sites  %
# MSI score ≥ 3.5% → MSI-H; < 3.5% → MSS

# === 替代方法: MANTIS ===
# conda install -c bioconda mantis
mantis --bedfile microsatellites.bed \
  --genome reference.fa \
  -n normal.bam \
  -t tumor.bam \
  -o mantis_output.txt

# MANTIS score > 0.4 → MSI-H

# === 基于表达的MMR缺陷检测 ===
# MLH1甲基化导致的表达沉默是散发性MSI的主要原因

# 检查MMR基因表达
mmr_expression <- expression_matrix[mmr_genes, ]

# MLH1低表达 + MSI-H → 可能是MLH1启动子甲基化
# MLH1正常表达 + MSI-H → 可能是其他MMR基因突变(Lynch综合征)

第五步:DDR通路的转录组评估

代码示例:

library(GSVA)
library(msigdbr)

# === 基于基因集的DDR通路活性评估 ===
# 获取DDR相关基因集
ddr_genesets <- list(
  HR_repair = c("BRCA1", "BRCA2", "RAD51", "PALB2", "ATM", "ATR", "CHEK1", "CHEK2"),
  MMR = c("MLH1", "MSH2", "MSH6", "PMS2", "EXO1", "RFC1"),
  NHEJ = c("XRCC5", "XRCC6", "LIG4", "XRCC4", "DCLRE1C", "PRKDC"),
  BER = c("OGG1", "APEX1", "XRCC1", "PARP1", "PARP2", "LIG3"),
  NER = c("XPA", "XPB", "XPC", "XPD", "ERCC1", "DDB1", "DDB2"),
  FA_pathway = c("FANCA", "FANCB", "FANCC", "FANCD2", "FANCE", "FANCF", "FANCG")
)

# GSVA评估通路活性
gsva_result <- gsva(
  as.matrix(expression_tpm),
  ddr_genesets,
  method = "gsva",
  verbose = TRUE
)

# 热图展示各样本的DDR通路活性
library(pheatmap)
pheatmap(gsva_result,
         scale = "row",
         annotation_col = clinical_annotation,
         color = colorRampPalette(c("blue", "white", "red"))(100),
         main = "DDR Pathway Activity Scores")

# === 与PARP抑制剂响应关联 ===
# HR通路低活性 → 可能PARPi敏感
hr_low <- gsva_result["HR_repair", ] < median(gsva_result["HR_repair", ])
cat(sprintf("HR-low样本比例: %.1f%%\n", sum(hr_low)/length(hr_low)*100))


实战命令

# === 完整DDR分析流程 ===
# 1. 变异检测
gatk Mutect2 -R ref.fa -I tumor.bam -I normal.bam -O somatic.vcf

# 2. 拷贝数分析(HRD需要)
sequenza-utils bam2seqz -n normal.bam --tumor tumor.bam --fasta ref.fa -o seqz.gz

# 3. HRD评分
Rscript -e 'library(scarHRD); scar_score("segments.txt", reference="grch38", seqz=TRUE)'

# 4. MSI检测
msisensor2 scan -d ref.fa -o ms.list
msisensor2 msi -d ms.list -n normal.bam -t tumor.bam -o msi_result

# 5. DDR基因突变提取
Rscript -e 'library(maftools); maf=read.maf("somatic.maf"); subsetMaf(maf, genes=ddr_genes)'

面试常问点

Q1:HRD评分的三个组成部分分别反映什么?

A: (1) HRD-LOH(Loss of Heterozygosity):超过15Mb的LOH区域数,反映HR缺陷后DNA修复不当导致的杂合性丢失;(2) LST(Large-Scale State Transitions):过滤后相邻片段间>10Mb的大规模拷贝数状态转换数,反映HR缺陷后错误修复导致的基因组重排;(3) TAI(Telomeric Allelic Imbalance):延伸到亚端粒区域的等位基因不平衡数,反映端粒区域的异常修复。三者之和>=42为HRD阳性(Myriad标准)。

Q2:PARP抑制剂为什么对HRD肿瘤有效(合成致死)?

A: PARP酶参与BER和单链断裂修复。PARP被抑制后,单链断裂积累并在复制叉处转化为双链断裂(DSB)。正常细胞可以用HR(同源重组)高保真修复DSB。但HRD肿瘤(如BRCA突变)的HR通路缺陷,无法修复这些DSB,导致基因组不稳定和细胞死亡。这就是"合成致死"——单独BER缺陷或HR缺陷细胞都能存活,但两者同时缺陷则致死。

Q3:如何综合判断一个肿瘤是否HRD?

A: 多层次证据综合:(1) 基因突变:BRCA1/2/PALB2等HR基因的LOF突变(胚系+体细胞);(2) 基因组瘢痕:HRD评分≥42(LOH+LST+TAI);(3) 突变签名:COSMIC SBS3(HR缺陷特征性签名);(4) 表达层面:BRCA1启动子甲基化导致表达沉默;(5) 功能检测:RAD51 foci assay(研究级)。临床上通常结合(1)+(2)做决策。

Q4:MSI-H和dMMR的关系是什么?

A: dMMR(MMR缺陷)是原因,MSI-H(微卫星不稳定)是结果。MMR系统(MLH1/MSH2/MSH6/PMS2)负责修复DNA复制时在微卫星区域产生的错误(滑移突变)。MMR缺陷导致微卫星区域积累大量indel突变→MSI-H。检测方法:IHC检测MMR蛋白表达(dMMR);PCR/NGS检测微卫星位点变化(MSI)。两者高度一致(>95%concordance)。

Q5:DDR分析在临床用药指导中的具体应用?

A: (1) HRD → PARPi:卵巢癌/乳腺癌/前列腺癌/胰腺癌中HRD阳性患者可受益于olaparib/niraparib等;(2) MSI-H/dMMR → 免疫治疗:MSI-H是泛癌种免疫治疗标志物(pembrolizumab获FDA泛癌种适应症);(3) NER缺陷 → 铂类敏感:ERCC1低表达预测铂类化疗获益;(4) ATM/ATR缺陷 → ATR抑制剂:ATR-ATM通路缺陷的肿瘤对ATR抑制剂敏感(临床试验中)。


易错点

1. 混淆胚系和体细胞BRCA突变

错误: 不区分来源直接报告"BRCA突变"。 正确做法: 胚系BRCA突变(遗传的)需要遗传咨询和家族筛查;体细胞BRCA突变也预测PARPi敏感性。两者临床意义不同。需要配对normal确认。

2. HRD评分未考虑全基因组倍性

错误: 多倍体肿瘤的HRD评分假性升高。 正确做法: HRD计算依赖准确的allele-specific拷贝数估计。近四倍体肿瘤需要正确估计ploidy后再计算。使用ASCAT/Sequenza先确定ploidy。

3. 只看基因突变不看功能后果

错误: 报告BRCA2同义突变为"BRCA2突变阳性"。 正确做法: 只有功能丧失(LOF)突变才有临床意义:移码、无义、剪接位点突变。错义突变需要查ClinVar/BRCA Exchange的致病性分类(P/LP)。VUS(意义未明)不应用于临床决策。

4. MSI检测样本不匹配

错误: 无配对normal样本时用MSIsensor。 正确做法: MSIsensor2需要配对normal;如果无配对normal,使用MSIsensor-pro(tumor-only模式)或基于panel的方法(如MSIpred)。

5. 忽略DDR通路的代偿机制

错误: BRCA2突变就直接判定HRD。 正确做法: 回复突变(reversion mutation)可恢复BRCA2功能→PARPi耐药。53BP1丧失也可部分代偿HR缺陷。需要综合评估(基因组瘢痕+突变+表达)而非依赖单一证据。


补充知识

DDR相关临床试验标志物

药物靶点生物标志物
OlaparibPARPBRCA1/2突变, HRD
NiraparibPARPHRD评分≥42
PembrolizumabPD-1MSI-H/dMMR
BerzosertibATRATM缺失
AdavosertibWEE1TP53突变+CCNE1扩增

数据库资源

  • ClinVar: BRCA变异致病性分类
  • BRCA Exchange: BRCA1/2变异综合数据库
  • HRDetect: 基于多特征的HRD预测器
  • COSMIC signatures: DDR缺陷相关突变签名