44. CRISPR 分析工具完全指南¶

一句话说明：CRISPR 是基因编辑的"分子剪刀"，本文覆盖从 sgRNA 设计、编辑效率评估、全基因组筛选分析到脱靶检测的完整生信分析工具链。

一、CRISPR-Cas9 原理白话版（基因剪刀）¶

1.1 什么是 CRISPR？¶

CRISPR（Clustered Regularly Interspaced Short Palindromic Repeats，成簇规律间隔短回文重复序列）本来是细菌的"免疫系统"——细菌用它来记住入侵过的病毒 DNA，下次病毒再来就直接把它剪碎。

白话类比：

Cas9 蛋白 = 一把剪刀
sgRNA（单导向 RNA） = 剪刀上的导航仪，告诉剪刀剪哪里
PAM 序列（Protospacer Adjacent Motif）= 剪刀的着陆标记，Cas9 必须先看到 PAM（SpCas9 识别 NGG）才能降落
DSB（双链断裂） = 剪刀剪出来的伤口

1.2 工作流程¶

sgRNA（~20nt）与目标DNA配对
         ↓
Cas9识别PAM序列（NGG）并结合
         ↓
Cas9在PAM上游3nt处切割双链DNA → 产生DSB（双链断裂）
         ↓
    ┌────────────────┐
    ↓                ↓
  NHEJ修复         HDR修复
（非同源末端连接）  （同源定向修复）
    ↓                ↓
随机插入/缺失      精确编辑
（基因敲除）     （基因敲入/替换）

NHEJ（Non-Homologous End Joining）：细胞自己随便补一下伤口，容易出错 → 产生 indel（插入缺失），打乱基因 → 基因敲除（Knockout）
HDR（Homology-Directed Repair）：给细胞提供一段"修理模板"，细胞按模板修 → 精确插入/替换（Knock-in）

二、CRISPR 实验类型一览¶

类型	英文	原理白话	结果
基因敲除	Knockout (KO)	用 Cas9 剪断基因，NHEJ 修复出错 → 基因报废	完全失去基因功能
基因敲入	Knock-in (KI)	剪断后提供 HDR 模板，精确插入新序列	替换/插入特定序列
CRISPRi	CRISPR interference	用失活 Cas9（dCas9）+ 抑制结构域（KRAB），坐在基因上游挡住转录	降低基因表达（不破坏 DNA）
CRISPRa	CRISPR activation	用 dCas9 + 激活结构域（VP64/p65/Rta），招募转录因子	增强基因表达
碱基编辑	Base Editing (BE)	dCas9 融合脱氨酶，直接把 C 改成 T（CBE）或 A 改成 G（ABE）	单碱基替换，不切断 DNA
先导编辑	Prime Editing (PE)	Cas9-切口酶 + 逆转录酶 + pegRNA，写入新序列	任意小片段编辑，不需 DSB 也不需模板

面试关键区分： - KO/KI = 真的剪断 DNA - CRISPRi/a = 不剪断，只影响转录 - BE/PE = 精细修改，不产生 DSB

三、sgRNA 设计工具¶

3.1 CRISPOR¶

网址：http://crispor.tefor.net/

CRISPOR 是最全面的 sgRNA 设计平台，支持 700+ 基因组，综合评分（MIT 特异性分数 + Doench 2016 效率分数）。

特点： - 输出每个 sgRNA 的效率分数（Doench/Moreno-Mateos）和特异性分数（MIT） - 列出所有潜在脱靶位点，分 0/1/2/3/4 个错配 - 支持下载引物序列 - 发表文献：Haeussler et al., Genome Biology, 2016

在线使用步骤： 1. 输入目标序列（最长 2000bp）或基因名 2. 选择基因组（如 hg38 人类基因组） 3. 选择 PAM（SpCas9 默认 NGG） 4. 点击 "Submit" → 获取排名后的 sgRNA 列表

命令行版安装（本地部署）：

# 克隆 CRISPOR 仓库
git clone https://github.com/maxhaeussler/crispor.git  # 克隆代码
cd crispor  # 进入目录

# 安装依赖
pip install biopython numpy  # 安装 Python 依赖

# 下载基因组索引（以人类 hg38 为例）
# 需要从 CRISPOR 网站下载预建索引，或自行用 bwa 建索引

3.2 Benchling¶

网址：https://www.benchling.com/

Benchling 是商业级分子生物学设计平台，免费学术版功能就很强。

特点： - 可视化序列编辑器 + sgRNA 设计一体化 - 自动评分（On-target: Doench 2016; Off-target: MIT/CFD） - 实验室信息管理系统（LIMS）集成 - 适合需要管理大量实验的团队

使用流程： 1. 注册免费学术账号 2. 创建 DNA 序列 → 导入目标基因 3. 右键选区域 → "Design CRISPR Guides" 4. 查看自动生成的 sgRNA 列表和评分

3.3 CHOPCHOP¶

网址：https://chopchop.cbu.uib.no/

CHOPCHOP 是挪威卑尔根大学开发的 sgRNA 设计工具（v3），支持多种 CRISPR 系统。

特点： - 支持 SpCas9、SaCas9、Cpf1/Cas12a 等多种核酸酶 - 可视化基因结构 + sgRNA 位置 - 综合排名考虑效率、脱靶、GC 含量 - 支持基因名或坐标输入 - 发表文献：Labun et al., Nucleic Acids Research, 2019

三工具对比：

特性	CRISPOR	Benchling	CHOPCHOP
免费	完全免费	学术免费	完全免费
基因组数量	700+	主流物种	200+
命令行支持	有	无	有
批量设计	支持	支持	支持
适合场景	学术研究首选	企业/团队管理	多酶切系统

四、CRISPR 筛选分析工具¶

CRISPR 筛选（CRISPR Screen）是用全基因组 sgRNA 文库（如 GeCKO、Brunello）感染细胞，通过 NGS 测序统计每个 sgRNA 的丰度变化，找出必需基因或功能基因。

4.1 MAGeCK（推荐首选）¶

全称：Model-based Analysis of Genome-wide CRISPR-Cas9 Knockout 最新版本：0.5.9.5（Bioconda）文献：Li et al., Genome Biology, 2014; Li et al., Genome Biology, 2015（MAGeCK-VISPR）

MAGeCK 是 CRISPR 筛选分析的金标准工具，用负二项分布（NB）建模 sgRNA 计数，用稳健排名聚合（RRA）或最大似然估计（MLE）识别显著基因。

安装：

# 方法1：conda 安装（推荐）
conda create -n crispr python=3.8  # 创建专用环境
conda activate crispr  # 激活环境
conda install -c bioconda mageck  # 安装 MAGeCK

# 方法2：pip 安装
pip install mageck  # pip 安装

# 验证安装
mageck -v  # 查看版本号，应显示 0.5.9.x

完整分析流程：

步骤 1：准备输入文件¶

# count table 格式（制表符分隔）：
# sgRNA名   基因名   样本1_count   样本2_count   ...
# 示例 count_table.txt：
# sgRNA      Gene    Day0_Rep1  Day0_Rep2  Day14_Rep1  Day14_Rep2
# sgGENE1_1  GENE1   500        480        100         90
# sgGENE1_2  GENE1   600        550        120         110

步骤 2：从 FASTQ 生成 count table¶

# mageck count：从 FASTQ 文件统计每个 sgRNA 的 read 数
mageck count \
  -l library.csv \               # sgRNA文库文件（sgRNA名、序列、基因名）
  -n sample_counts \             # 输出文件前缀
  --sample-label Day0,Day14 \    # 样本标签
  --fastq Day0.fastq.gz Day14.fastq.gz  # 输入 FASTQ 文件
  # 输出：sample_counts.count.txt（count矩阵）
  #       sample_counts.count_normalized.txt（归一化后的矩阵）

步骤 3：MAGeCK test（RRA 分析）¶

# mageck test：比较两组样本，用RRA算法识别显著富集/耗竭的基因
mageck test \
  -k sample_counts.count.txt \   # 输入 count 矩阵
  -t Day14_Rep1,Day14_Rep2 \     # 处理组（treatment）
  -c Day0_Rep1,Day0_Rep2 \       # 对照组（control）
  -n mageck_result \             # 输出文件前缀
  --normcounts-to-file           # 输出归一化后的 count
  # 输出关键文件：
  # mageck_result.gene_summary.txt → 基因水平结果
  # mageck_result.sgrna_summary.txt → sgRNA水平结果

步骤 4：解读结果¶

# gene_summary.txt 关键列说明：
# neg|score  → 负选择得分（越小 = 该基因越必需，敲除后细胞死亡）
# neg|p-value → 负选择 p 值
# neg|fdr    → 负选择 FDR 校正 p 值
# pos|score  → 正选择得分（越小 = 该基因敲除后细胞增殖更快）
# pos|fdr    → 正选择 FDR
# neg|rank   → 负选择排名

# 筛选显著基因（Python 脚本）
python3 -c "
import pandas as pd  # 导入 pandas
df = pd.read_csv('mageck_result.gene_summary.txt', sep='\t')  # 读取结果
# 筛选 FDR < 0.05 的负选择基因（必需基因）
essential = df[df['neg|fdr'] < 0.05].sort_values('neg|rank')  # 按排名排序
print(f'必需基因数量: {len(essential)}')  # 打印数量
essential.to_csv('essential_genes.csv', index=False)  # 保存结果
"

步骤 5：MAGeCK MLE（多因素分析）¶

# 当有多个条件/时间点时用 MLE 模型
# 需要先准备 design matrix（设计矩阵）
# design_matrix.txt 格式：
# Samples     baseline    treatment
# Day0_Rep1   1           0
# Day0_Rep2   1           0
# Day14_Rep1  1           1
# Day14_Rep2  1           1

mageck mle \
  -k sample_counts.count.txt \   # count 矩阵
  -d design_matrix.txt \         # 设计矩阵
  -n mageck_mle_result \         # 输出前缀
  --norm-method median           # 归一化方法：中位数
  # 输出：mageck_mle_result.gene_summary.txt
  # 关键列：treatment|beta（效应量）、treatment|fdr

4.2 CRISPResso2¶

全称：Analysis of deep sequencing data for genome editing experiments GitHub：https://github.com/pinellolab/CRISPResso2 文档：https://docs.crispresso.com 文献：Clement et al., Nature Biotechnology, 2019

CRISPResso2 专门用于分析单个位点的编辑效率——把测序 reads 比对到参考序列，量化 indel（插入缺失）的类型和频率。它和 MAGeCK 不同：MAGeCK 分析全基因组筛选，CRISPResso2 分析单位点深度测序。

安装：

# 方法1：conda 安装（推荐）
conda install -c bioconda crispresso2  # Bioconda 安装

# 方法2：Docker 运行
docker pull pinellolab/crispresso2:latest  # 拉取 Docker 镜像

# 验证安装
CRISPResso --help  # 查看帮助信息

基本分析命令：

# 分析单个扩增子的编辑效率
CRISPResso \
  -r1 edited_sample_R1.fastq.gz \    # 测序 reads（R1）
  -r2 edited_sample_R2.fastq.gz \    # 测序 reads（R2，双端测序时）
  -a AATGTCCCCCAATGGGAAGTTCATCTGGCACTGCCCACAGGTGAGGAGGTCATGATCCCCTTCTGGAGCTCCCAACGGGCCGTGGTCTGGTTCATCATCTGTAAGAATGGCTTCAAGAGGCTCGGCTGTGGTT \
                                     # -a：扩增子参考序列（amplicon sequence）
  -g CTGCCCACAGGTGAGGAGGT \          # -g：sgRNA 序列（guide sequence，20nt）
  -o output_dir \                    # 输出目录
  -n my_experiment \                 # 实验名称
  --quantification_window_size 10    # 量化窗口大小（PAM附近±10bp）
  # 输出：编辑效率图、indel 频率分布、reads 比对可视化

CRISPResso2 工具套件：

# CRISPRessoBatch：批量分析多个样本
CRISPRessoBatch \
  -bs batch_file.txt \               # 批次文件（每行一个样本信息）
  -o batch_output                    # 输出目录

# CRISPRessoCompare：比较编辑 vs 对照
CRISPRessoCompare \
  CRISPResso_on_treated \            # 处理组 CRISPResso 结果目录
  CRISPResso_on_control              # 对照组结果目录

# CRISPRessoPooled：多靶点 pooled 扩增子分析
CRISPRessoPooled \
  -r1 pooled_reads.fastq.gz \        # 测序文件
  -f amplicons.fa \                  # 多个扩增子参考序列
  -o pooled_output                   # 输出目录

4.3 BAGEL2¶

全称：Bayesian Analysis of Gene Essentiality 2 GitHub：https://github.com/hart-lab/bagel 文献：Kim & Hart, Genome Medicine, 2021

BAGEL2 用贝叶斯分类框架判断基因是否必需，核心思想是拿你的数据和已知的必需/非必需基因参考集（gold standard）做比较。

安装与运行：

# 克隆仓库
git clone https://github.com/hart-lab/bagel.git  # 下载 BAGEL2
cd bagel  # 进入目录

# 运行 BAGEL2（需要 Python 3 + numpy + scipy + pandas + sklearn）
# 步骤1：计算 fold change
python BAGEL.py fc \
  -i count_table.txt \       # sgRNA count 矩阵
  -o foldchange.txt \        # 输出 fold change 文件
  -c control_columns         # 对照组列名（逗号分隔）

# 步骤2：计算 BF（Bayes Factor）
python BAGEL.py bf \
  -i foldchange.txt \        # 上一步的 fold change
  -o bf_output.txt \         # 输出贝叶斯因子
  -e essential_genes.txt \   # 已知必需基因参考集（正例）
  -n nonessential_genes.txt  # 已知非必需基因参考集（负例）
  # BF > 0 → 可能是必需基因
  # BF 越大 → 越可能必需

# 步骤3：计算 precision-recall
python BAGEL.py pr \
  -i bf_output.txt \         # 贝叶斯因子结果
  -o pr_output.txt \         # precision-recall 曲线数据
  -e essential_genes.txt     # 必需基因参考集

MAGeCK vs BAGEL2 对比：

特性	MAGeCK	BAGEL2
统计模型	负二项分布 + RRA/MLE	贝叶斯分类器
是否需要参考集	不需要	需要（必需/非必需基因列表）
适合场景	正选择+负选择都能做	主要做负选择（必需性）
多因素设计	MLE 支持	不直接支持
社区活跃度	高	中
推荐场景	通用首选	补充验证必需基因

五、脱靶分析¶

5.1 Cas-OFFinder¶

网址：http://www.rgenome.net/cas-offinder/ 文献：Bae et al., Bioinformatics, 2014

Cas-OFFinder 是基于 OpenCL 加速的脱靶位点搜索工具，在全基因组范围内找到所有与 sgRNA 序列相似（允许错配/bulge）的位点。

在线使用： 1. 访问 http://www.rgenome.net/cas-offinder/ 2. 选择 PAM 类型和基因组 3. 输入 sgRNA 序列 4. 设置允许的最大错配数（通常 ≤4） 5. 提交 → 获取脱靶位点列表

离线版安装和使用：

# 下载离线版（需要 OpenCL 支持）
# 从 http://www.rgenome.net/cas-offinder/portable 下载

# 准备输入文件 input.txt：
# 第1行：基因组 2bit 文件路径
# 第2行：PAM 序列 + 要搜索的模式（N=任意碱基）
# 第3行起：sgRNA序列 + 允许错配数

# input.txt 示例：
# /path/to/hg38.2bit
# NNNNNNNNNNNNNNNNNNNNNGG
# CTGCCCACAGGTGAGGAGGTGGG 4

# 运行 Cas-OFFinder
cas-offinder input.txt C output.txt  # C=使用CPU，G=使用GPU
# 输出格式：sgRNA序列 染色体 位置 脱靶序列 链 错配数

5.2 GUIDE-seq 分析¶

GUIDE-seq（Genome-wide Unbiased Identification of DSBs Evaluated by Sequencing）是实验方法——在细胞中引入短双链 oligo 标签（dsODN），这些标签会插入到 Cas9 切割的所有位点（包括脱靶位点），然后通过测序找到它们。

分析工具：guideseq

# 安装 guideseq 分析流程
pip install guideseq  # pip 安装

# 或从 GitHub 安装
git clone https://github.com/aryeelab/guideseq.git  # 克隆仓库
cd guideseq  # 进入目录
pip install -e .  # 开发模式安装

# 准备 YAML 配置文件 manifest.yaml：
# reference_genome: /path/to/hg38.fa
# output_folder: guideseq_output
# bam: treated.bam          # GUIDE-seq 处理组 BAM
# control_bam: control.bam  # 对照组 BAM
# sgRNA_sequence: CTGCCCACAGGTGAGGAGGT
# PAM: NGG

# 运行分析
guideseq all -m manifest.yaml  # 运行完整分析流程
# 输出：identified_offtargets.txt（所有鉴定到的脱靶位点）

脱靶分析策略对比：

方法	类型	原理	优势	局限
Cas-OFFinder	计算预测	序列相似性搜索	快速、全面	假阳性高
GUIDE-seq	实验验证	dsODN 标签插入	无偏全基因组	需做实验
CIRCLE-seq	实验验证	体外环化 DNA 切割	灵敏度高	体外≠体内
DISCOVER-seq	实验验证	检测 DNA 修复蛋白 MRE11	反映体内真实脱靶	技术门槛高

六、CRISPR 在生信中的应用场景¶

6.1 功能基因组学筛选¶

用全基因组 sgRNA 文库做正选择/负选择筛选，找出与特定表型相关的基因： - 药物耐药基因筛选：药物处理 → 哪些基因敲除后细胞活下来 - 必需基因鉴定：培养一段时间 → 哪些基因敲除后细胞死亡 - 合成致死筛选：在特定基因突变背景下，敲除哪个基因会致死

6.2 基因功能验证¶

用 CRISPR 验证组学分析发现的候选基因，比如： - GWAS 发现的风险位点 → 用 CRISPR 敲除验证功能 - 转录组差异基因 → 用 CRISPRi/a 验证因果关系

6.3 调控元件鉴定¶

CRISPRi/a 筛选增强子：用 sgRNA 靶向非编码区域，看哪些区域影响基因表达
Perturb-seq：CRISPR 扰动 + 单细胞转录组，看每个基因敲除对全局表达的影响

6.4 基因治疗开发¶

sgRNA 设计 + 脱靶分析 → 评估基因治疗安全性
碱基编辑/先导编辑 → 精确修正致病突变

6.5 宏基因组中的 CRISPR 分析¶

从宏基因组数据中挖掘新型 CRISPR-Cas 系统（用 CRISPRCasFinder、CRISPRDetect 等工具）
分析 CRISPR spacer 序列 → 推断微生物的噬菌体感染史

七、面试高频题（5 道）¶

Q1：请解释 CRISPR-Cas9 的基本工作原理¶

答：CRISPR-Cas9 系统由两个核心组件组成：Cas9 核酸酶和 sgRNA。sgRNA 是一段约 20nt 的序列，通过碱基互补配对识别目标 DNA。Cas9 蛋白首先扫描基因组寻找 PAM 序列（SpCas9 识别 NGG），找到 PAM 后在其上游 3nt 处切割双链 DNA 产生 DSB。细胞通过两种方式修复 DSB：NHEJ 是容易出错的修复方式，产生 indel 导致移码突变实现基因敲除；HDR 在提供同源模板的情况下可实现精确编辑。

Q2：MAGeCK 分析 CRISPR 筛选数据的流程是什么？¶

答：MAGeCK 分析分三步：(1) mageck count 从 FASTQ 统计每个 sgRNA 的 read 数量生成 count 矩阵；(2) mageck test 用负二项分布对 sgRNA 的 count 差异建模，然后用 RRA（Robust Rank Aggregation）算法将 sgRNA 水平的结果聚合到基因水平，分别给出正选择和负选择的 p 值和 FDR；(3) 或者用 mageck mle 基于最大似然估计做多因素分析，适合复杂实验设计。一般以 FDR < 0.05 作为显著性阈值筛选 hit 基因。

Q3：CRISPResso2 和 MAGeCK 有什么区别？¶

答：两者解决的问题完全不同。MAGeCK 分析全基因组 CRISPR 筛选数据，关注的是"哪些基因被敲除后影响细胞表型"，输入是整个文库的 sgRNA count 矩阵。CRISPResso2 分析单个基因编辑位点的深度测序数据，关注的是"这个位点的编辑效率是多少、产生了什么类型的 indel"，输入是扩增子测序的 FASTQ 文件。简单说，MAGeCK 回答"Who"（哪些基因重要），CRISPResso2 回答"How well"（编辑了多少）。

Q4：sgRNA 设计需要考虑哪些因素？如何降低脱靶效应？¶

答：sgRNA 设计需要考虑：(1) 效率——选择高 on-target 效率分数的 sgRNA（Doench 2016 分数或 Rule Set 2）；(2) 特异性——选择高 MIT 特异性分数，确保全基因组中没有太多相似序列；(3) GC 含量——40%-70% 为佳；(4) 避免多聚 T——连续 4 个以上 T 会导致 RNA Pol III 提前终止。降低脱靶的策略包括：使用高保真 Cas9 变体（eSpCas9、HiFi Cas9）、用截短 sgRNA（17-18nt）、用双切口酶策略（paired nickases）、用 Cas-OFFinder 预先筛查脱靶位点。

Q5：CRISPR 筛选中正选择和负选择的区别是什么？¶

答：正选择（Positive selection）：筛选在特定压力下存活/富集的克隆。比如用药物处理，敲除了耐药基因的细胞活下来 → 这些 sgRNA 的 read 数增加。用于发现耐药基因、增殖抑制因子等。负选择（Negative selection）：筛选被淘汰/耗竭的克隆。培养一段时间后，敲除了必需基因的细胞死亡 → 这些 sgRNA 的 read 数减少。用于发现必需基因、合成致死搭档等。MAGeCK 的 gene_summary 结果中 pos|fdr 对应正选择，neg|fdr 对应负选择。

八、速查表¶

工具选择速查¶

需求	推荐工具	命令/操作
设计 sgRNA	CRISPOR	在线提交序列 → 选高分 sgRNA
预测脱靶位点	Cas-OFFinder	`cas-offinder input.txt C output.txt`
分析编辑效率	CRISPResso2	`CRISPResso -r1 reads.fq -a amplicon -g guide`
全基因组筛选分析	MAGeCK	`mageck count` → `mageck test`
必需基因鉴定	BAGEL2	`BAGEL.py fc` → `BAGEL.py bf`
多样本比较	CRISPRessoBatch	`CRISPRessoBatch -bs batch.txt`
实验脱靶验证	guideseq	`guideseq all -m manifest.yaml`

关键文件格式速查¶

# MAGeCK sgRNA 文库文件（library.csv）：
sgRNA_name,sgRNA_sequence,gene
sgGENE1_1,ACGTACGTACGTACGTACGT,GENE1
sgGENE1_2,TGCATGCATGCATGCATGCA,GENE1

# MAGeCK count 矩阵输出：
sgRNA    Gene    sample1    sample2    sample3
sgA_1    GENEA   1000       800        200

# CRISPResso2 最小输入：
CRISPResso -r1 reads.fastq.gz -a AMPLICON_SEQ -g GUIDE_SEQ

常见报错与解决¶

报错	原因	解决
`mageck: command not found`	未安装或未激活 conda 环境	`conda activate crispr`
`CRISPResso: No reads aligned`	扩增子序列错误	检查 -a 参数是否与实际测序序列匹配
`BAGEL: KeyError essential genes`	参考集基因名不匹配	确保基因名格式一致（HGNC symbol）
`Cas-OFFinder: OpenCL not found`	缺少 OpenCL 驱动	安装 GPU 驱动或使用 CPU 模式 `-C`
`No PAM found`	sgRNA 序列包含 PAM 或方向错误	sgRNA 序列不应包含 PAM 的 NGG

conda 环境一键搭建¶

# 创建 CRISPR 分析专用环境
conda create -n crispr python=3.8 -y           # 创建环境
conda activate crispr                            # 激活
conda install -c bioconda mageck -y              # 安装 MAGeCK
conda install -c bioconda crispresso2 -y         # 安装 CRISPResso2
pip install guideseq                             # 安装 GUIDE-seq 分析工具
git clone https://github.com/hart-lab/bagel.git  # 下载 BAGEL2

九、延伸资源¶

核心文献¶

MAGeCK：Li W et al. MAGeCK enables robust identification of essential genes from genome-scale CRISPR/Cas9 knockout screens. Genome Biology, 2014.
CRISPResso2：Clement K et al. CRISPResso2 provides accurate and rapid genome editing sequence analysis. Nature Biotechnology, 2019.
BAGEL2：Kim E, Hart T. Improved analysis of CRISPR fitness screens and reduced off-target effects with the BAGEL2 gene essentiality classifier. Genome Medicine, 2021.
Cas-OFFinder：Bae S, Park J, Kim JS. Cas-OFFinder: A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics, 2014.
CRISPOR：Haeussler M et al. Evaluation of off-target and on-target scoring algorithms and integration into the guide RNA selection tool CRISPOR. Genome Biology, 2016.

在线资源¶

MAGeCK 官方文档：https://sourceforge.net/projects/mageck/
CRISPResso2 文档：https://docs.crispresso.com
CRISPOR 在线工具：http://crispor.tefor.net/
CHOPCHOP 在线工具：https://chopchop.cbu.uib.no/
Cas-OFFinder 在线版：http://www.rgenome.net/cas-offinder/
Benchling（学术免费）：https://www.benchling.com/
Addgene CRISPR 资源：https://www.addgene.org/crispr/
Broad Institute GPP sgRNA 设计：https://portals.broadinstitute.org/gpp/public/

进阶学习¶

CRISPRCasFinder：从宏基因组中发现新型 CRISPR-Cas 系统
MAGeCK-VISPR：MAGeCK 的可视化扩展，提供交互式结果浏览
DepMap/Project Achilles：Broad Institute 的大规模 CRISPR 筛选数据库
GenomeCRISPR：已发表 CRISPR 筛选实验的综合数据库

文档信息：知识库2 第44篇 | 主题：CRISPR 分析工具 | 适用岗位：生信工程师 | 面试重点：MAGeCK 流程、sgRNA 设计考量、正/负选择区别