44. CRISPR 分析工具完全指南¶
一句话说明:CRISPR 是基因编辑的"分子剪刀",本文覆盖从 sgRNA 设计、编辑效率评估、全基因组筛选分析到脱靶检测的完整生信分析工具链。
一、CRISPR-Cas9 原理白话版(基因剪刀)¶
1.1 什么是 CRISPR?¶
CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats,成簇规律间隔短回文重复序列)本来是细菌的"免疫系统"——细菌用它来记住入侵过的病毒 DNA,下次病毒再来就直接把它剪碎。
白话类比:
- Cas9 蛋白 = 一把剪刀
- sgRNA(单导向 RNA) = 剪刀上的导航仪,告诉剪刀剪哪里
- PAM 序列(Protospacer Adjacent Motif)= 剪刀的着陆标记,Cas9 必须先看到 PAM(SpCas9 识别 NGG)才能降落
- DSB(双链断裂) = 剪刀剪出来的伤口
1.2 工作流程¶
sgRNA(~20nt)与目标DNA配对
↓
Cas9识别PAM序列(NGG)并结合
↓
Cas9在PAM上游3nt处切割双链DNA → 产生DSB(双链断裂)
↓
┌────────────────┐
↓ ↓
NHEJ修复 HDR修复
(非同源末端连接) (同源定向修复)
↓ ↓
随机插入/缺失 精确编辑
(基因敲除) (基因敲入/替换)
- NHEJ(Non-Homologous End Joining):细胞自己随便补一下伤口,容易出错 → 产生 indel(插入缺失),打乱基因 → 基因敲除(Knockout)
- HDR(Homology-Directed Repair):给细胞提供一段"修理模板",细胞按模板修 → 精确插入/替换(Knock-in)
二、CRISPR 实验类型一览¶
| 类型 | 英文 | 原理白话 | 结果 |
|---|---|---|---|
| 基因敲除 | Knockout (KO) | 用 Cas9 剪断基因,NHEJ 修复出错 → 基因报废 | 完全失去基因功能 |
| 基因敲入 | Knock-in (KI) | 剪断后提供 HDR 模板,精确插入新序列 | 替换/插入特定序列 |
| CRISPRi | CRISPR interference | 用失活 Cas9(dCas9)+ 抑制结构域(KRAB),坐在基因上游挡住转录 | 降低基因表达(不破坏 DNA) |
| CRISPRa | CRISPR activation | 用 dCas9 + 激活结构域(VP64/p65/Rta),招募转录因子 | 增强基因表达 |
| 碱基编辑 | Base Editing (BE) | dCas9 融合脱氨酶,直接把 C 改成 T(CBE)或 A 改成 G(ABE) | 单碱基替换,不切断 DNA |
| 先导编辑 | Prime Editing (PE) | Cas9-切口酶 + 逆转录酶 + pegRNA,写入新序列 | 任意小片段编辑,不需 DSB 也不需模板 |
面试关键区分: - KO/KI = 真的剪断 DNA - CRISPRi/a = 不剪断,只影响转录 - BE/PE = 精细修改,不产生 DSB
三、sgRNA 设计工具¶
3.1 CRISPOR¶
网址:http://crispor.tefor.net/
CRISPOR 是最全面的 sgRNA 设计平台,支持 700+ 基因组,综合评分(MIT 特异性分数 + Doench 2016 效率分数)。
特点: - 输出每个 sgRNA 的效率分数(Doench/Moreno-Mateos)和特异性分数(MIT) - 列出所有潜在脱靶位点,分 0/1/2/3/4 个错配 - 支持下载引物序列 - 发表文献:Haeussler et al., Genome Biology, 2016
在线使用步骤: 1. 输入目标序列(最长 2000bp)或基因名 2. 选择基因组(如 hg38 人类基因组) 3. 选择 PAM(SpCas9 默认 NGG) 4. 点击 "Submit" → 获取排名后的 sgRNA 列表
命令行版安装(本地部署):
# 克隆 CRISPOR 仓库
git clone https://github.com/maxhaeussler/crispor.git # 克隆代码
cd crispor # 进入目录
# 安装依赖
pip install biopython numpy # 安装 Python 依赖
# 下载基因组索引(以人类 hg38 为例)
# 需要从 CRISPOR 网站下载预建索引,或自行用 bwa 建索引
3.2 Benchling¶
网址:https://www.benchling.com/
Benchling 是商业级分子生物学设计平台,免费学术版功能就很强。
特点: - 可视化序列编辑器 + sgRNA 设计一体化 - 自动评分(On-target: Doench 2016; Off-target: MIT/CFD) - 实验室信息管理系统(LIMS)集成 - 适合需要管理大量实验的团队
使用流程: 1. 注册免费学术账号 2. 创建 DNA 序列 → 导入目标基因 3. 右键选区域 → "Design CRISPR Guides" 4. 查看自动生成的 sgRNA 列表和评分
3.3 CHOPCHOP¶
网址:https://chopchop.cbu.uib.no/
CHOPCHOP 是挪威卑尔根大学开发的 sgRNA 设计工具(v3),支持多种 CRISPR 系统。
特点: - 支持 SpCas9、SaCas9、Cpf1/Cas12a 等多种核酸酶 - 可视化基因结构 + sgRNA 位置 - 综合排名考虑效率、脱靶、GC 含量 - 支持基因名或坐标输入 - 发表文献:Labun et al., Nucleic Acids Research, 2019
三工具对比:
| 特性 | CRISPOR | Benchling | CHOPCHOP |
|---|---|---|---|
| 免费 | 完全免费 | 学术免费 | 完全免费 |
| 基因组数量 | 700+ | 主流物种 | 200+ |
| 命令行支持 | 有 | 无 | 有 |
| 批量设计 | 支持 | 支持 | 支持 |
| 适合场景 | 学术研究首选 | 企业/团队管理 | 多酶切系统 |
四、CRISPR 筛选分析工具¶
CRISPR 筛选(CRISPR Screen)是用全基因组 sgRNA 文库(如 GeCKO、Brunello)感染细胞,通过 NGS 测序统计每个 sgRNA 的丰度变化,找出必需基因或功能基因。
4.1 MAGeCK(推荐首选)¶
全称:Model-based Analysis of Genome-wide CRISPR-Cas9 Knockout 最新版本:0.5.9.5(Bioconda) 文献:Li et al., Genome Biology, 2014; Li et al., Genome Biology, 2015(MAGeCK-VISPR)
MAGeCK 是 CRISPR 筛选分析的金标准工具,用负二项分布(NB)建模 sgRNA 计数,用稳健排名聚合(RRA)或最大似然估计(MLE)识别显著基因。
安装:
# 方法1:conda 安装(推荐)
conda create -n crispr python=3.8 # 创建专用环境
conda activate crispr # 激活环境
conda install -c bioconda mageck # 安装 MAGeCK
# 方法2:pip 安装
pip install mageck # pip 安装
# 验证安装
mageck -v # 查看版本号,应显示 0.5.9.x
完整分析流程:
步骤 1:准备输入文件¶
# count table 格式(制表符分隔):
# sgRNA名 基因名 样本1_count 样本2_count ...
# 示例 count_table.txt:
# sgRNA Gene Day0_Rep1 Day0_Rep2 Day14_Rep1 Day14_Rep2
# sgGENE1_1 GENE1 500 480 100 90
# sgGENE1_2 GENE1 600 550 120 110
步骤 2:从 FASTQ 生成 count table¶
# mageck count:从 FASTQ 文件统计每个 sgRNA 的 read 数
mageck count \
-l library.csv \ # sgRNA文库文件(sgRNA名、序列、基因名)
-n sample_counts \ # 输出文件前缀
--sample-label Day0,Day14 \ # 样本标签
--fastq Day0.fastq.gz Day14.fastq.gz # 输入 FASTQ 文件
# 输出:sample_counts.count.txt(count矩阵)
# sample_counts.count_normalized.txt(归一化后的矩阵)
步骤 3:MAGeCK test(RRA 分析)¶
# mageck test:比较两组样本,用RRA算法识别显著富集/耗竭的基因
mageck test \
-k sample_counts.count.txt \ # 输入 count 矩阵
-t Day14_Rep1,Day14_Rep2 \ # 处理组(treatment)
-c Day0_Rep1,Day0_Rep2 \ # 对照组(control)
-n mageck_result \ # 输出文件前缀
--normcounts-to-file # 输出归一化后的 count
# 输出关键文件:
# mageck_result.gene_summary.txt → 基因水平结果
# mageck_result.sgrna_summary.txt → sgRNA水平结果
步骤 4:解读结果¶
# gene_summary.txt 关键列说明:
# neg|score → 负选择得分(越小 = 该基因越必需,敲除后细胞死亡)
# neg|p-value → 负选择 p 值
# neg|fdr → 负选择 FDR 校正 p 值
# pos|score → 正选择得分(越小 = 该基因敲除后细胞增殖更快)
# pos|fdr → 正选择 FDR
# neg|rank → 负选择排名
# 筛选显著基因(Python 脚本)
python3 -c "
import pandas as pd # 导入 pandas
df = pd.read_csv('mageck_result.gene_summary.txt', sep='\t') # 读取结果
# 筛选 FDR < 0.05 的负选择基因(必需基因)
essential = df[df['neg|fdr'] < 0.05].sort_values('neg|rank') # 按排名排序
print(f'必需基因数量: {len(essential)}') # 打印数量
essential.to_csv('essential_genes.csv', index=False) # 保存结果
"
步骤 5:MAGeCK MLE(多因素分析)¶
# 当有多个条件/时间点时用 MLE 模型
# 需要先准备 design matrix(设计矩阵)
# design_matrix.txt 格式:
# Samples baseline treatment
# Day0_Rep1 1 0
# Day0_Rep2 1 0
# Day14_Rep1 1 1
# Day14_Rep2 1 1
mageck mle \
-k sample_counts.count.txt \ # count 矩阵
-d design_matrix.txt \ # 设计矩阵
-n mageck_mle_result \ # 输出前缀
--norm-method median # 归一化方法:中位数
# 输出:mageck_mle_result.gene_summary.txt
# 关键列:treatment|beta(效应量)、treatment|fdr
4.2 CRISPResso2¶
全称:Analysis of deep sequencing data for genome editing experiments GitHub:https://github.com/pinellolab/CRISPResso2 文档:https://docs.crispresso.com 文献:Clement et al., Nature Biotechnology, 2019
CRISPResso2 专门用于分析单个位点的编辑效率——把测序 reads 比对到参考序列,量化 indel(插入缺失)的类型和频率。它和 MAGeCK 不同:MAGeCK 分析全基因组筛选,CRISPResso2 分析单位点深度测序。
安装:
# 方法1:conda 安装(推荐)
conda install -c bioconda crispresso2 # Bioconda 安装
# 方法2:Docker 运行
docker pull pinellolab/crispresso2:latest # 拉取 Docker 镜像
# 验证安装
CRISPResso --help # 查看帮助信息
基本分析命令:
# 分析单个扩增子的编辑效率
CRISPResso \
-r1 edited_sample_R1.fastq.gz \ # 测序 reads(R1)
-r2 edited_sample_R2.fastq.gz \ # 测序 reads(R2,双端测序时)
-a AATGTCCCCCAATGGGAAGTTCATCTGGCACTGCCCACAGGTGAGGAGGTCATGATCCCCTTCTGGAGCTCCCAACGGGCCGTGGTCTGGTTCATCATCTGTAAGAATGGCTTCAAGAGGCTCGGCTGTGGTT \
# -a:扩增子参考序列(amplicon sequence)
-g CTGCCCACAGGTGAGGAGGT \ # -g:sgRNA 序列(guide sequence,20nt)
-o output_dir \ # 输出目录
-n my_experiment \ # 实验名称
--quantification_window_size 10 # 量化窗口大小(PAM附近±10bp)
# 输出:编辑效率图、indel 频率分布、reads 比对可视化
CRISPResso2 工具套件:
# CRISPRessoBatch:批量分析多个样本
CRISPRessoBatch \
-bs batch_file.txt \ # 批次文件(每行一个样本信息)
-o batch_output # 输出目录
# CRISPRessoCompare:比较编辑 vs 对照
CRISPRessoCompare \
CRISPResso_on_treated \ # 处理组 CRISPResso 结果目录
CRISPResso_on_control # 对照组结果目录
# CRISPRessoPooled:多靶点 pooled 扩增子分析
CRISPRessoPooled \
-r1 pooled_reads.fastq.gz \ # 测序文件
-f amplicons.fa \ # 多个扩增子参考序列
-o pooled_output # 输出目录
4.3 BAGEL2¶
全称:Bayesian Analysis of Gene Essentiality 2 GitHub:https://github.com/hart-lab/bagel 文献:Kim & Hart, Genome Medicine, 2021
BAGEL2 用贝叶斯分类框架判断基因是否必需,核心思想是拿你的数据和已知的必需/非必需基因参考集(gold standard)做比较。
安装与运行:
# 克隆仓库
git clone https://github.com/hart-lab/bagel.git # 下载 BAGEL2
cd bagel # 进入目录
# 运行 BAGEL2(需要 Python 3 + numpy + scipy + pandas + sklearn)
# 步骤1:计算 fold change
python BAGEL.py fc \
-i count_table.txt \ # sgRNA count 矩阵
-o foldchange.txt \ # 输出 fold change 文件
-c control_columns # 对照组列名(逗号分隔)
# 步骤2:计算 BF(Bayes Factor)
python BAGEL.py bf \
-i foldchange.txt \ # 上一步的 fold change
-o bf_output.txt \ # 输出贝叶斯因子
-e essential_genes.txt \ # 已知必需基因参考集(正例)
-n nonessential_genes.txt # 已知非必需基因参考集(负例)
# BF > 0 → 可能是必需基因
# BF 越大 → 越可能必需
# 步骤3:计算 precision-recall
python BAGEL.py pr \
-i bf_output.txt \ # 贝叶斯因子结果
-o pr_output.txt \ # precision-recall 曲线数据
-e essential_genes.txt # 必需基因参考集
MAGeCK vs BAGEL2 对比:
| 特性 | MAGeCK | BAGEL2 |
|---|---|---|
| 统计模型 | 负二项分布 + RRA/MLE | 贝叶斯分类器 |
| 是否需要参考集 | 不需要 | 需要(必需/非必需基因列表) |
| 适合场景 | 正选择+负选择都能做 | 主要做负选择(必需性) |
| 多因素设计 | MLE 支持 | 不直接支持 |
| 社区活跃度 | 高 | 中 |
| 推荐场景 | 通用首选 | 补充验证必需基因 |
五、脱靶分析¶
5.1 Cas-OFFinder¶
网址:http://www.rgenome.net/cas-offinder/ 文献:Bae et al., Bioinformatics, 2014
Cas-OFFinder 是基于 OpenCL 加速的脱靶位点搜索工具,在全基因组范围内找到所有与 sgRNA 序列相似(允许错配/bulge)的位点。
在线使用: 1. 访问 http://www.rgenome.net/cas-offinder/ 2. 选择 PAM 类型和基因组 3. 输入 sgRNA 序列 4. 设置允许的最大错配数(通常 ≤4) 5. 提交 → 获取脱靶位点列表
离线版安装和使用:
# 下载离线版(需要 OpenCL 支持)
# 从 http://www.rgenome.net/cas-offinder/portable 下载
# 准备输入文件 input.txt:
# 第1行:基因组 2bit 文件路径
# 第2行:PAM 序列 + 要搜索的模式(N=任意碱基)
# 第3行起:sgRNA序列 + 允许错配数
# input.txt 示例:
# /path/to/hg38.2bit
# NNNNNNNNNNNNNNNNNNNNNGG
# CTGCCCACAGGTGAGGAGGTGGG 4
# 运行 Cas-OFFinder
cas-offinder input.txt C output.txt # C=使用CPU,G=使用GPU
# 输出格式:sgRNA序列 染色体 位置 脱靶序列 链 错配数
5.2 GUIDE-seq 分析¶
GUIDE-seq(Genome-wide Unbiased Identification of DSBs Evaluated by Sequencing)是实验方法——在细胞中引入短双链 oligo 标签(dsODN),这些标签会插入到 Cas9 切割的所有位点(包括脱靶位点),然后通过测序找到它们。
分析工具:guideseq
# 安装 guideseq 分析流程
pip install guideseq # pip 安装
# 或从 GitHub 安装
git clone https://github.com/aryeelab/guideseq.git # 克隆仓库
cd guideseq # 进入目录
pip install -e . # 开发模式安装
# 准备 YAML 配置文件 manifest.yaml:
# reference_genome: /path/to/hg38.fa
# output_folder: guideseq_output
# bam: treated.bam # GUIDE-seq 处理组 BAM
# control_bam: control.bam # 对照组 BAM
# sgRNA_sequence: CTGCCCACAGGTGAGGAGGT
# PAM: NGG
# 运行分析
guideseq all -m manifest.yaml # 运行完整分析流程
# 输出:identified_offtargets.txt(所有鉴定到的脱靶位点)
脱靶分析策略对比:
| 方法 | 类型 | 原理 | 优势 | 局限 |
|---|---|---|---|---|
| Cas-OFFinder | 计算预测 | 序列相似性搜索 | 快速、全面 | 假阳性高 |
| GUIDE-seq | 实验验证 | dsODN 标签插入 | 无偏全基因组 | 需做实验 |
| CIRCLE-seq | 实验验证 | 体外环化 DNA 切割 | 灵敏度高 | 体外≠体内 |
| DISCOVER-seq | 实验验证 | 检测 DNA 修复蛋白 MRE11 | 反映体内真实脱靶 | 技术门槛高 |
六、CRISPR 在生信中的应用场景¶
6.1 功能基因组学筛选¶
用全基因组 sgRNA 文库做正选择/负选择筛选,找出与特定表型相关的基因: - 药物耐药基因筛选:药物处理 → 哪些基因敲除后细胞活下来 - 必需基因鉴定:培养一段时间 → 哪些基因敲除后细胞死亡 - 合成致死筛选:在特定基因突变背景下,敲除哪个基因会致死
6.2 基因功能验证¶
用 CRISPR 验证组学分析发现的候选基因,比如: - GWAS 发现的风险位点 → 用 CRISPR 敲除验证功能 - 转录组差异基因 → 用 CRISPRi/a 验证因果关系
6.3 调控元件鉴定¶
- CRISPRi/a 筛选增强子:用 sgRNA 靶向非编码区域,看哪些区域影响基因表达
- Perturb-seq:CRISPR 扰动 + 单细胞转录组,看每个基因敲除对全局表达的影响
6.4 基因治疗开发¶
- sgRNA 设计 + 脱靶分析 → 评估基因治疗安全性
- 碱基编辑/先导编辑 → 精确修正致病突变
6.5 宏基因组中的 CRISPR 分析¶
- 从宏基因组数据中挖掘新型 CRISPR-Cas 系统(用 CRISPRCasFinder、CRISPRDetect 等工具)
- 分析 CRISPR spacer 序列 → 推断微生物的噬菌体感染史
七、面试高频题(5 道)¶
Q1:请解释 CRISPR-Cas9 的基本工作原理¶
答:CRISPR-Cas9 系统由两个核心组件组成:Cas9 核酸酶和 sgRNA。sgRNA 是一段约 20nt 的序列,通过碱基互补配对识别目标 DNA。Cas9 蛋白首先扫描基因组寻找 PAM 序列(SpCas9 识别 NGG),找到 PAM 后在其上游 3nt 处切割双链 DNA 产生 DSB。细胞通过两种方式修复 DSB:NHEJ 是容易出错的修复方式,产生 indel 导致移码突变实现基因敲除;HDR 在提供同源模板的情况下可实现精确编辑。
Q2:MAGeCK 分析 CRISPR 筛选数据的流程是什么?¶
答:MAGeCK 分析分三步:(1) mageck count 从 FASTQ 统计每个 sgRNA 的 read 数量生成 count 矩阵;(2) mageck test 用负二项分布对 sgRNA 的 count 差异建模,然后用 RRA(Robust Rank Aggregation)算法将 sgRNA 水平的结果聚合到基因水平,分别给出正选择和负选择的 p 值和 FDR;(3) 或者用 mageck mle 基于最大似然估计做多因素分析,适合复杂实验设计。一般以 FDR < 0.05 作为显著性阈值筛选 hit 基因。
Q3:CRISPResso2 和 MAGeCK 有什么区别?¶
答:两者解决的问题完全不同。MAGeCK 分析全基因组 CRISPR 筛选数据,关注的是"哪些基因被敲除后影响细胞表型",输入是整个文库的 sgRNA count 矩阵。CRISPResso2 分析单个基因编辑位点的深度测序数据,关注的是"这个位点的编辑效率是多少、产生了什么类型的 indel",输入是扩增子测序的 FASTQ 文件。简单说,MAGeCK 回答"Who"(哪些基因重要),CRISPResso2 回答"How well"(编辑了多少)。
Q4:sgRNA 设计需要考虑哪些因素?如何降低脱靶效应?¶
答:sgRNA 设计需要考虑:(1) 效率——选择高 on-target 效率分数的 sgRNA(Doench 2016 分数或 Rule Set 2);(2) 特异性——选择高 MIT 特异性分数,确保全基因组中没有太多相似序列;(3) GC 含量——40%-70% 为佳;(4) 避免多聚 T——连续 4 个以上 T 会导致 RNA Pol III 提前终止。降低脱靶的策略包括:使用高保真 Cas9 变体(eSpCas9、HiFi Cas9)、用截短 sgRNA(17-18nt)、用双切口酶策略(paired nickases)、用 Cas-OFFinder 预先筛查脱靶位点。
Q5:CRISPR 筛选中正选择和负选择的区别是什么?¶
答:正选择(Positive selection):筛选在特定压力下存活/富集的克隆。比如用药物处理,敲除了耐药基因的细胞活下来 → 这些 sgRNA 的 read 数增加。用于发现耐药基因、增殖抑制因子等。负选择(Negative selection):筛选被淘汰/耗竭的克隆。培养一段时间后,敲除了必需基因的细胞死亡 → 这些 sgRNA 的 read 数减少。用于发现必需基因、合成致死搭档等。MAGeCK 的 gene_summary 结果中 pos|fdr 对应正选择,neg|fdr 对应负选择。
八、速查表¶
工具选择速查¶
| 需求 | 推荐工具 | 命令/操作 |
|---|---|---|
| 设计 sgRNA | CRISPOR | 在线提交序列 → 选高分 sgRNA |
| 预测脱靶位点 | Cas-OFFinder | cas-offinder input.txt C output.txt |
| 分析编辑效率 | CRISPResso2 | CRISPResso -r1 reads.fq -a amplicon -g guide |
| 全基因组筛选分析 | MAGeCK | mageck count → mageck test |
| 必需基因鉴定 | BAGEL2 | BAGEL.py fc → BAGEL.py bf |
| 多样本比较 | CRISPRessoBatch | CRISPRessoBatch -bs batch.txt |
| 实验脱靶验证 | guideseq | guideseq all -m manifest.yaml |
关键文件格式速查¶
# MAGeCK sgRNA 文库文件(library.csv):
sgRNA_name,sgRNA_sequence,gene
sgGENE1_1,ACGTACGTACGTACGTACGT,GENE1
sgGENE1_2,TGCATGCATGCATGCATGCA,GENE1
# MAGeCK count 矩阵输出:
sgRNA Gene sample1 sample2 sample3
sgA_1 GENEA 1000 800 200
# CRISPResso2 最小输入:
CRISPResso -r1 reads.fastq.gz -a AMPLICON_SEQ -g GUIDE_SEQ
常见报错与解决¶
| 报错 | 原因 | 解决 |
|---|---|---|
mageck: command not found | 未安装或未激活 conda 环境 | conda activate crispr |
CRISPResso: No reads aligned | 扩增子序列错误 | 检查 -a 参数是否与实际测序序列匹配 |
BAGEL: KeyError essential genes | 参考集基因名不匹配 | 确保基因名格式一致(HGNC symbol) |
Cas-OFFinder: OpenCL not found | 缺少 OpenCL 驱动 | 安装 GPU 驱动或使用 CPU 模式 -C |
No PAM found | sgRNA 序列包含 PAM 或方向错误 | sgRNA 序列不应包含 PAM 的 NGG |
conda 环境一键搭建¶
# 创建 CRISPR 分析专用环境
conda create -n crispr python=3.8 -y # 创建环境
conda activate crispr # 激活
conda install -c bioconda mageck -y # 安装 MAGeCK
conda install -c bioconda crispresso2 -y # 安装 CRISPResso2
pip install guideseq # 安装 GUIDE-seq 分析工具
git clone https://github.com/hart-lab/bagel.git # 下载 BAGEL2
九、延伸资源¶
核心文献¶
- MAGeCK:Li W et al. MAGeCK enables robust identification of essential genes from genome-scale CRISPR/Cas9 knockout screens. Genome Biology, 2014.
- CRISPResso2:Clement K et al. CRISPResso2 provides accurate and rapid genome editing sequence analysis. Nature Biotechnology, 2019.
- BAGEL2:Kim E, Hart T. Improved analysis of CRISPR fitness screens and reduced off-target effects with the BAGEL2 gene essentiality classifier. Genome Medicine, 2021.
- Cas-OFFinder:Bae S, Park J, Kim JS. Cas-OFFinder: A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics, 2014.
- CRISPOR:Haeussler M et al. Evaluation of off-target and on-target scoring algorithms and integration into the guide RNA selection tool CRISPOR. Genome Biology, 2016.
在线资源¶
- MAGeCK 官方文档:https://sourceforge.net/projects/mageck/
- CRISPResso2 文档:https://docs.crispresso.com
- CRISPOR 在线工具:http://crispor.tefor.net/
- CHOPCHOP 在线工具:https://chopchop.cbu.uib.no/
- Cas-OFFinder 在线版:http://www.rgenome.net/cas-offinder/
- Benchling(学术免费):https://www.benchling.com/
- Addgene CRISPR 资源:https://www.addgene.org/crispr/
- Broad Institute GPP sgRNA 设计:https://portals.broadinstitute.org/gpp/public/
进阶学习¶
- CRISPRCasFinder:从宏基因组中发现新型 CRISPR-Cas 系统
- MAGeCK-VISPR:MAGeCK 的可视化扩展,提供交互式结果浏览
- DepMap/Project Achilles:Broad Institute 的大规模 CRISPR 筛选数据库
- GenomeCRISPR:已发表 CRISPR 筛选实验的综合数据库
文档信息:知识库2 第44篇 | 主题:CRISPR 分析工具 | 适用岗位:生信工程师 | 面试重点:MAGeCK 流程、sgRNA 设计考量、正/负选择区别