跳转至

临床生信与精准医学入门

一句话说明:精准医学根据每个人的基因信息"量体裁衣"制定治疗方案,临床生信工程师就是把测序数据变成医生能用的诊断和用药建议的人。


一、什么是精准医学

传统医学像"均码衣服"——同一种病,所有人吃一样的药、用一样的剂量。但每个人的基因不同,同一种药有人有效、有人无效、有人还会中毒。

精准医学(Precision Medicine)就是"量体裁衣"——通过分析患者的基因组、转录组等多组学数据,找到: - 这个人得的具体是哪种亚型(同样叫"肺癌",驱动基因不同治疗完全不同) - 哪种药对这个人最有效(靶向药 vs 化疗 vs 免疫治疗) - 这个人代谢药物的速度(药量是该加还是该减)

白话类比:传统医学是"大锅饭",精准医学是"私人订制套餐"。


二、临床生信 vs 科研生信

很多人以为生信就是发论文,但临床生信是另一条赛道:

维度科研生信临床生信
目标发现新知识、发论文出具临床报告、指导治疗
质量标准同行评审即可必须通过 CAP/CLIA 认证(美国)或国家卫健委认证(中国)
错误代价文章被质疑患者用错药、可能危及生命
流程要求灵活、可探索固定、经过验证、有 SOP(标准操作流程)
报告格式论文/幻灯片标准化临床报告(给医生看)
数据管理发到 SRA/GEO严格遵守隐私法规(HIPAA/个人信息保护法)
验证要求统计显著即可每个变异需要多数据库交叉验证 + 分级
软件更新随时用最新版经过验证的固定版本,不能随便升级

白话:科研生信像"自由厨师做实验菜",临床生信像"连锁餐厅的标准化厨房"——每道菜必须味道一样、安全可靠。


三、临床级分析流程标准

3.1 CAP/CLIA 认证(美国标准)

  • CLIA(Clinical Laboratory Improvement Amendments):美国临床实验室改进修正案,所有出具临床检测结果的实验室必须通过
  • CAP(College of American Pathologists):美国病理学家学会认证,比 CLIA 更严格
  • 中国对应的是国家卫健委临检中心的室间质评

3.2 临床流程的核心要求

样本接收 → DNA提取 → 建库测序 → 生信分析 → 变异解读 → 临床报告 → 医生决策
   ↑                                                              ↑
   └── 每一步都有 SOP 文档、质控指标、操作记录 ──────────────────────┘
要求说明白话
验证(Validation)新流程上线前必须用已知样本验证灵敏度和特异性先用"答案已知"的题目考试,及格才能上岗
质控(QC)每批样本必须有阳性对照、阴性对照像考试时放"标准答案卷"一起改
SOP每个步骤有标准操作文档换个人按文档也能做出一样的结果
溯源每个结果可以追溯到原始数据出了问题能查到是哪一步出错
版本锁定软件、数据库版本固定,升级需要重新验证不能今天用 v1、明天用 v2

四、肿瘤基因检测(白话版)

肿瘤基因检测是目前临床生信最大的应用场景。

4.1 检测 Panel 设计

Panel = 一组精选的基因列表,不是测全基因组,而是只测和肿瘤相关的几十到几百个基因。

Panel 类型基因数测序深度适用场景
小 Panel(热点检测)10-50 个基因1000-5000x已知驱动基因的快速检测
中 Panel(综合检测)300-500 个基因500-1000x全面的肿瘤基因分析(如 FoundationOne CDx)
大 Panel / WES全外显子200-500x科研+临床结合

白话:小 Panel 像"只查关键几个指标的体检套餐",大 Panel 像"全身检查"。深度越高,越不容易漏掉低频突变。

4.2 关键生物标志物

TMB(肿瘤突变负荷)

TMB = 肿瘤中体细胞突变的数量 / 检测区域大小(单位:mutations/Mb)
  • 白话:肿瘤里有多少个"错别字"。错别字越多(TMB-High,通常 ≥10 mut/Mb),肿瘤越容易被免疫系统识别,免疫治疗(如 PD-1 抑制剂)效果越好
  • 计算方法:统计编码区的非同义突变数,除以 Panel 覆盖的总碱基数
  • 临床应用:FDA 已批准 TMB-H 作为免疫治疗的生物标志物(Keytruda)

MSI(微卫星不稳定性)

  • 微卫星:基因组中短串联重复序列(如 ACACAC...)
  • MSI-H(高度不稳定):DNA 错配修复(MMR)系统出问题,导致微卫星长度变化
  • 白话:细胞里负责"改错别字"的系统坏了,导致到处都是重复错误
  • 临床意义:MSI-H 的肿瘤对免疫治疗响应好(已获 FDA 批准,不限癌种)
  • 检测方法:比较肿瘤和正常组织在多个微卫星位点的长度差异

驱动基因与用药指导

癌种驱动基因对应靶向药白话
非小细胞肺癌EGFR 突变(L858R, del19)奥希替尼(Osimertinib)肺癌最常见的"开关"突变
非小细胞肺癌ALK 融合克唑替尼(Crizotinib)两个基因错误拼接在一起
乳腺癌HER2 扩增曲妥珠单抗(Herceptin)HER2 基因"开了挂"疯狂复制
黑色素瘤BRAF V600E维莫非尼(Vemurafenib)BRAF 蛋白被突变"卡在"激活状态
结直肠癌KRAS 野生型西妥昔单抗(Cetuximab)KRAS 没突变才能用这个药

注意:KRAS 突变 = 耐药标志物,说明这个"下游开关"一直开着,上游的药堵不住。


五、遗传病基因检测(白话版)

5.1 WES 筛查流程

WES(Whole Exome Sequencing,全外显子测序)只测编码蛋白质的区域(约占全基因组的 1-2%),但覆盖了约 85% 的已知致病变异。

患者 DNA → WES 测序 → 比对(BWA) → 变异检测(GATK) → 变异注释(ANNOVAR/VEP) → ACMG 分级 → 临床报告
                                          同时分析家系成员(trio分析:患儿+父+母)───┘

5.2 ACMG 变异分级指南

ACMG(美国医学遗传学与基因组学学院)2015 年发布的变异分类指南,是遗传病基因检测的"金标准":

分级英文含义白话临床行动
PPathogenic致病的这个变异确定导致疾病据此诊断和治疗
LPLikely Pathogenic可能致病很可能致病(概率 >90%)可用于临床决策
VUSVariant of Uncertain Significance意义不明不确定是不是坏的不能用于诊断,需随访
LBLikely Benign可能良性大概率没事一般不报告
BBenign良性正常变异不报告

分级依据(简化版): - 人群频率:在健康人群中很常见(gnomAD 频率 >5%)→ 倾向良性 - 功能预测:SIFT/PolyPhen/CADD 等工具预测蛋白质损伤程度 - 文献证据:是否有研究/ClinVar 报告过这个变异 - 家系共分离:家族中患病的人是否都携带这个变异 - 功能实验:实验室验证这个变异确实影响蛋白功能


六、药物基因组学

6.1 CYP450 代谢酶

CYP450(细胞色素P450)是肝脏中负责代谢药物的一大家族酶。不同人的 CYP450 基因型不同,代谢速度差异很大。

代谢类型英文白话临床影响
超快代谢者Ultra-rapid Metabolizer"消化快",药还没起效就被代谢掉了标准剂量可能无效,需加量
快代谢者Extensive/Normal Metabolizer正常速度标准剂量即可
中间代谢者Intermediate Metabolizer"消化慢一些"可能需要减量
慢代谢者Poor Metabolizer"消化不动",药物在体内堆积标准剂量可能导致毒性,必须减量

6.2 临床常见示例

基因 CYP2D6 → 代谢可待因(codeine)
┌─────────────────────────────────────────────────┐
│ 可待因 ──CYP2D6──→ 吗啡(真正起镇痛作用的产物) │
│                                                   │
│ 超快代谢者:产生过多吗啡 → 呼吸抑制风险(危险!) │
│ 慢代谢者:产生极少吗啡 → 吃了等于没吃(无效)      │
│                                                   │
│ → 临床建议:检测 CYP2D6 基因型再决定用药          │
└─────────────────────────────────────────────────┘

基因 CYP2C19 → 代谢氯吡格雷(抗血小板药,心脏支架后常用)
- 慢代谢者:药物无法被激活 → 血栓风险升高
- 建议慢代谢者换用替格瑞洛(不依赖 CYP2C19 代谢)

6.3 药物不良反应预测

基因药物风险白话
HLA-B*5701阿巴卡韦(HIV药)严重超敏反应用药前必须检测,阳性禁用
HLA-B*5801别嘌醇(痛风药)Stevens-Johnson 综合征(严重皮肤反应)亚洲人携带率高,建议检测
DPYD5-FU(化疗药)严重毒性反应DPYD 缺陷者标准剂量可能致命
UGT1A1伊立替康(化疗药)严重腹泻和骨髓抑制UGT1A1*28 纯合子需减量

七、临床数据库

数据库全称内容用途地址
ClinVarClinical Variations变异-疾病关联查某个变异是致病还是良性https://www.ncbi.nlm.nih.gov/clinvar/
COSMICCatalogue of Somatic Mutations in Cancer肿瘤体细胞突变目录查某突变在哪些癌种中出现过https://cancer.sanger.ac.uk/cosmic
OncoKBPrecision Oncology Knowledge Base肿瘤变异-药物关联查某突变对应什么靶向药(有证据分级)https://www.oncokb.org
PharmGKBPharmacogenomics Knowledge Base基因-药物关联查某基因型应该怎么调药https://www.pharmgkb.org
gnomADGenome Aggregation Database人群等位基因频率判断变异是常见多态还是罕见致病https://gnomad.broadinstitute.org
OMIMOnline Mendelian Inheritance in Man遗传病-基因关联查某基因和什么遗传病相关https://www.omim.org
CIViCClinical Interpretation of Variants in Cancer社区驱动的癌症变异解读查临床可操作变异的证据https://civicdb.org

OncoKB 证据分级(2025 最新 v7.1 数据版本)

级别含义
Level 1FDA 批准的生物标志物,预测对本适应症 FDA 批准药物的响应
Level 2NCCN 等专家指南推荐的标准治疗生物标志物
Level 3A有临床证据支持在本适应症中有效
Level 3B在其他适应症中有标准治疗或研究证据
Level 4有生物学证据支持
Level R1标准治疗中预测耐药的生物标志物
Level R2有临床证据预测耐药

八、与 T2D(2型糖尿病)的关联

精准医学在 T2D 领域正在快速发展,具有实际研究价值:

8.1 T2D 精准用药前景

方向说明当前进展
CYP2C9 与磺脲类药物CYP2C9 慢代谢者使用格列本脲(Glibenclamide)低血糖风险更高PharmGKB 已收录,建议减量
SLCO1B1 与二甲双胍SLCO1B1 基因影响二甲双胍在肝脏中的转运和效果研究阶段,暂无临床指南
TCF7L2 与药物选择TCF7L2 是 T2D 最强的风险基因,rs7903146 变异影响对GLP-1类药物的响应大型队列验证中
肠道菌群分型该项目方向!不同菌群组成可能影响二甲双胍的疗效和胃肠道副作用2022-2024 多篇 Nature Medicine 文章
多基因风险评分(PRS)综合数百个 SNP 预测 T2D 风险已有商业化产品,但临床应用有争议

8.2 面试串联话术

"该研究项目做的是 T2D 患者肠道菌群宏基因组分析。从精准医学的角度看,这和药物基因组学有交叉——比如有研究发现肠道菌群的组成影响二甲双胍的代谢和副作用。未来如果把菌群特征纳入 T2D 的精准用药决策模型,可能帮助医生为不同患者选择更合适的降糖方案。"


九、面试怎么答

Q1: 什么是精准医学?和传统医学有什么区别?

传统医学是"一种病一个方案",精准医学是根据每个患者的基因组、转录组等多组学数据制定个性化治疗方案。比如同样是非小细胞肺癌,有 EGFR 突变的患者用奥希替尼(靶向药)效果比化疗好很多,没有这个突变的患者则不适合。精准医学的核心是"对的药、对的人、对的剂量"。

Q2: 临床生信和科研生信有什么区别?

最大的区别是合规性和质量标准。科研生信追求新发现,流程灵活;临床生信出具的结果直接影响治疗决策,必须通过 CAP/CLIA 认证、有固定 SOP、软件版本锁定、每批样本有阳性阴性对照。出了错不是文章被撤,而是可能影响患者安全。另外临床生信强调变异的标准化分级(如 ACMG 五级分类)和多数据库交叉验证。

Q3: 请解释一下 ACMG 变异分类的五级是什么?

ACMG 将变异分为五级:致病(Pathogenic)、可能致病(Likely Pathogenic)、意义不明(VUS)、可能良性(Likely Benign)、良性(Benign)。分级依据包括人群频率(gnomAD 中是否常见)、功能预测(SIFT/PolyPhen 等计算工具)、文献证据(ClinVar 中是否有报告)、家系共分离、以及功能实验。其中 VUS 是最棘手的——不能用于诊断,但也不能排除,需要积累更多证据后重分类。

Q4: TMB 和 MSI 在肿瘤免疫治疗中的作用?

TMB(肿瘤突变负荷)衡量肿瘤中突变的密度,TMB-High 意味着产生更多新抗原,免疫系统更容易识别肿瘤,因此免疫检查点抑制剂(如 PD-1 抗体)效果更好。MSI-H(微卫星高度不稳定)说明 DNA 错配修复系统缺陷,同样产生大量突变和新抗原。FDA 已批准 TMB-H 和 MSI-H 作为不限癌种的免疫治疗适应症。两者互补但不完全重叠——MSI-H 的肿瘤通常 TMB 也高,但 TMB-H 不一定是 MSI-H。

Q5: 该 T2D 项目和精准医学有什么关联?

该项目分析 T2D 患者和健康对照的肠道菌群差异。从精准医学角度,这和药物基因组学有交叉:研究表明肠道菌群影响二甲双胍的疗效和胃肠道副作用。如果能建立菌群特征和药物响应的预测模型,未来可能帮助医生为不同 T2D 患者选择更合适的治疗方案。此外,所用的随机森林模型就是一种可以用于临床决策辅助的方法。


十、速查表

肿瘤检测关键术语

术语全称白话解释
TMBTumor Mutational Burden肿瘤里"错别字"的密度
MSIMicrosatellite Instability"纠错系统"坏了导致的重复错误
CNVCopy Number Variation基因被多复制或少复制了
FusionGene Fusion两个基因错误拼接在一起
SNVSingle Nucleotide Variant单个碱基的"打字错误"
IndelInsertion/Deletion多了或少了几个碱基
LOHLoss of Heterozygosity杂合性丢失(一份变异一份正常变成两份都变异)
ctDNACirculating Tumor DNA血液中游离的肿瘤 DNA(液体活检)

变异注释常用工具

工具功能适用场景
ANNOVAR多数据库注释快速注释,支持自定义数据库
VEP(Ensembl)变异效果预测官方维护,注释最全面
SnpEff变异功能注释速度快,适合大数据
InterVarACMG 自动分级遗传病变异自动分类

药物基因组学核心基因

基因代谢的常见药物检测重要性
CYP2D6可待因、他莫昔芬、部分抗抑郁药高(FDA 黑框警告)
CYP2C19氯吡格雷、奥美拉唑、部分抗抑郁药高(心脏支架必查)
CYP2C9华法林、苯妥英、磺脲类降糖药高(华法林剂量)
DPYD5-FU(氟尿嘧啶)极高(缺陷可致命)
UGT1A1伊立替康高(减量避免毒性)
TPMT硫嘌呤类药物高(免疫抑制剂)

十一、延伸资源

资源说明地址
ClinVarNCBI 变异-疾病关联数据库https://www.ncbi.nlm.nih.gov/clinvar/
OncoKB肿瘤精准医学知识库(v7.1, 2026-04)https://www.oncokb.org
PharmGKB药物基因组学知识库https://www.pharmgkb.org
COSMIC肿瘤体细胞突变数据库https://cancer.sanger.ac.uk/cosmic
gnomAD人群等位基因频率数据库https://gnomad.broadinstitute.org
ACMG 2015 Guidelines变异分类指南原文https://doi.org/10.1038/gim.2015.30
CPIC Guidelines药物基因组学临床实施指南https://cpicpgx.org/guidelines/
CIViC社区驱动的临床变异解读https://civicdb.org
FDA Table of PGx BiomarkersFDA 药物基因组学生物标志物列表https://www.fda.gov/drugs/science-and-research-drugs/table-pharmacogenomic-biomarkers-drug-labeling
知识库关联T2D 研究项目/path/to/project/