摘要: 本文介绍了 Φ-Space ST,一种平台无关的空间转录组学(ST)数据分析方法,可利用多个单细胞 RNA 测序(scRNA-seq)参考数据集识别连续细胞状态。针对超细胞分辨率的 ST 数据,该方法能够实现可解释的细胞类型解卷积,同时显著提升计算效率;针对亚细胞分辨率数据,则无需细胞分割即可直接标注细胞状态,从而实现高质量的空间微环境识别。Φ-Space ST 能够整合来自多个 scRNA-seq 参考的注释结果,并借助健康参考数据对疾病细胞状态进行可解释性表征。研究者通过涵盖 CosMx、Visium、Xenium 和 Stereo-seq 四个主流平台、多种癌症组织的案例研究对该方法进行了系统验证。结果显示,Φ-Space ST 能够识别微环境特异性富集的细胞类型及不同的细胞类型共存模式,从而有效区分肿瘤与非肿瘤组织区域。上述结果表明,Φ-Space ST 是一种稳健且可扩展的 ST 数据分析工具,在解析复杂组织结构与病理机制方面具有重要应用潜力。
Φ-Space ST:平台无关的空间转录组细胞状态识别方法¶
概述¶
Φ-Space ST 是一种平台无关(platform-agnostic)的计算方法,专为空间转录组学(Spatial Transcriptomics, ST)数据分析而设计。其核心目标是利用多个单细胞 RNA 测序(scRNA-seq)参考数据集,在 ST 数据中识别连续的细胞状态(continuous cell states)。
在空间转录组学研究中,研究者面临两大核心挑战:第一,如何在超细胞分辨率(supercellular resolution)数据中准确解析混合信号中的细胞类型组成;第二,如何在亚细胞分辨率(subcellular resolution)数据中无需细胞分割(cell segmentation)即可完成细胞状态注释。Φ-Space ST 针对这两个问题提出了统一的解决框架。
该方法的重要性体现在以下几个方面:一是它能够协调来自多个 scRNA-seq 参考的注释结果,减少单一参考带来的偏差;二是通过整合健康参考数据,可对疾病细胞状态(disease cell states)提供可解释的特征刻画;三是其计算速度显著优于同类方法,具备良好的可扩展性(scalability)。研究团队在 CosMx、Visium、Xenium 和 Stereo-seq 四个主流平台的癌症组织数据中进行了系统验证,证明了该方法的鲁棒性与广泛适用性。
核心原理与功能¶
1. 平台无关性设计¶
Φ-Space ST 的"平台无关"特性意味着该方法不依赖于特定空间转录组平台的技术细节,可跨平台应用。已验证支持的平台包括:
- CosMx(NanoString 公司的单分子成像平台)
- Visium(10x Genomics 的捕获阵列平台,代表超细胞分辨率)
- Xenium(10x Genomics 的原位测序平台)
- Stereo-seq(华大基因的时空组学平台)
这四类平台覆盖了当前主流 ST 技术路线,涵盖了从超细胞分辨率到亚细胞分辨率的不同数据特征。
2. 双分辨率模式处理¶
Φ-Space ST 针对两种分辨率场景分别设计了处理策略:
超细胞分辨率(Supercellular Resolution)
在 Visium 等平台中,一个空间捕获点(spot)通常包含多个细胞的混合信号。Φ-Space ST 在此场景下执行细胞类型解卷积(cell-type deconvolution),即将混合信号分解为各细胞类型的比例组成。其主要优势包括:
- 结果具有可解释性(interpretability),每个 spot 的细胞类型构成可被清晰量化
- 计算速度显著快于现有同类方法,适合大规模数据处理
亚细胞分辨率(Subcellular Resolution)
在 Xenium、CosMx 等平台中,测量精度可达单分子水平,但传统流程需要先进行细胞分割(cell segmentation)再进行注释,而细胞分割本身是一个误差来源较大的步骤。Φ-Space ST 的创新在于绕过细胞分割步骤,直接对分子信号进行细胞状态注释,从而:
- 避免细胞分割误差的传播
- 实现空间生态位识别(spatial niche identification),揭示具有高度洞察力的组织微环境结构
3. 多参考协调机制¶
传统方法通常依赖单一 scRNA-seq 参考数据集进行注释,这会引入参考数据集本身的偏差。Φ-Space ST 支持同时整合多个 scRNA-seq 参考数据集,并通过内部协调(harmonization)机制统一不同参考之间的注释差异,输出一致且稳健的细胞状态标签。
4. 连续细胞状态建模¶
与传统方法将细胞离散归类为固定标签不同,Φ-Space ST 建模的是连续细胞状态(continuous cell states)。这一设计更符合生物学现实,细胞在分化、激活等过程中往往处于状态连续谱上,而非非此即彼的离散类别。
5. 疾病细胞状态的可解释表征¶
通过引入健康参考(healthy references)与疾病样本进行对比,Φ-Space ST 能够:
- 识别疾病特异性细胞状态(disease-specific cell states)
- 为疾病细胞状态提供相对于健康基线的可解释性特征描述
- 辅助理解疾病发生发展中的细胞状态偏移
6. 空间生态位与肿瘤微环境分析¶
在癌症组织的四个案例研究中,Φ-Space ST 揭示了以下生物学发现:
- 生态位特异性富集细胞类型(niche-specific enriched cell types):不同空间区域中特征性细胞类型的分布规律
- 细胞类型共存模式(cell-type co-presence patterns):区分肿瘤(tumor)与非肿瘤(non-tumor)组织区域的特征性细胞类型组合
关键方法与步骤¶
由于原始文献为方法介绍性摘要,以下整理 Φ-Space ST 的核心分析流程,反映其方法论框架。
步骤一:数据准备¶
# 输入数据要求
输入1:空间转录组数据(ST data)
- 支持平台:CosMx / Visium / Xenium / Stereo-seq
- 格式:各平台标准输出格式
输入2:scRNA-seq 参考数据集(可为多个)
- 健康参考(healthy reference):用于建立正常细胞状态基线
- 疾病参考(disease reference,可选):用于疾病细胞状态对比
步骤二:判断分辨率类型并选择分析模式¶
# 根据数据来源平台判断分辨率场景
if 平台 == "Visium":
# 超细胞分辨率(supercellular resolution)
# 一个 spot 含多个细胞
选择模式 = "细胞类型解卷积(cell-type deconvolution)"
elif 平台 in ["CosMx", "Xenium", "Stereo-seq"]:
# 亚细胞分辨率(subcellular resolution)
# 单分子级别精度,无需细胞分割
选择模式 = "细胞状态注释(cell state annotation,无需 cell segmentation)"
步骤三:多参考协调注释¶
# 多参考整合流程(Multi-reference harmonization)
1. 分别使用每个 scRNA-seq 参考对 ST 数据进行初步注释
- 参考1 → 注释结果1
- 参考2 → 注释结果2
- 参考N → 注释结果N
2. Φ-Space ST 内部协调机制对多套注释结果进行整合
输出:统一且一致的连续细胞状态(continuous cell states)表征
3. 若提供健康参考:
对比健康 vs 疾病状态 → 输出疾病细胞状态可解释特征
步骤四:空间生态位识别¶
# 空间生态位分析(Spatial niche identification)
基于细胞状态注释结果:
1. 计算空间相邻区域的细胞类型/状态组成
2. 识别 niche-specific enriched cell types(生态位特异性富集细胞类型)
3. 分析 cell-type co-presence patterns(细胞类型共存模式)
4. 比较肿瘤(tumor)vs 非肿瘤(non-tumor)区域的差异模式
实战示例¶
案例一:Visium 平台癌症组织解卷积¶
背景:Visium 平台每个捕获点(spot)直径约 55 μm,通常包含 1-10 个细胞的混合转录组信号,是典型的超细胞分辨率数据。
应用场景: - 输入:癌症组织 Visium ST 数据 + 多个 scRNA-seq 参考(包含健康和肿瘤细胞类型注释) - 处理:Φ-Space ST 执行细胞类型解卷积 - 输出:每个 spot 上各细胞类型的比例组成,以及连续细胞状态表征 - 发现:识别出肿瘤区域特异性的细胞类型富集模式,以及区别于正常组织的细胞共存组合
优势体现:相比现有解卷积方法,Φ-Space ST 在此场景下计算速度显著提升,适合处理全组织切片规模的 Visium 数据。
案例二:Xenium/CosMx 平台亚细胞分辨率注释¶
背景:Xenium 和 CosMx 平台可实现单分子原位检测,分辨率达亚细胞水平,传统分析流程需要先进行细胞分割再注释。
应用场景: - 输入:癌症组织 Xenium 或 CosMx ST 数据 + scRNA-seq 参考 - 处理:Φ-Space ST 跳过细胞分割步骤,直接对分子信号分布进行细胞状态注释 - 输出:空间分辨的细胞状态图谱,揭示组织微环境中的空间生态位结构 - 发现:识别出高洞察力的空间生态位,揭示肿瘤微环境中不同功能区域的细胞状态特征
案例三:健康参考驱动的疾病状态解析¶
背景:理解癌症细胞状态需要与正常细胞状态进行比较,但传统方法缺乏整合健康参考的框架。
应用场景: - 输入:癌症 ST 数据 + 健康组织 scRNA-seq 参考 + 癌症 scRNA-seq 参考 - 处理:Φ-Space ST 利用健康参考建立正常细胞状态基线,对比识别疾病特异性状态偏移 - 输出:具有可解释性的疾病细胞状态特征描述 - 发现:揭示肿瘤细胞相对于正常细胞的状态转变规律,为理解癌症发生机制提供参考
案例四:Stereo-seq 平台多癌种验证¶
背景:Stereo-seq 是华大基因开发的 DNA 纳米球时空组学平台,具有超高分辨率和大视野的特点。
应用场景:Φ-Space ST 在 Stereo-seq 癌症组织数据中的验证,进一步证明其平台无关性,以及在不同测序技术路线下的分析一致性与稳健性。
常见问题¶
Q1:Φ-Space ST 与现有解卷积方法(如 RCTD、SPOTlight、Cell2location)相比有何核心优势?
A:Φ-Space ST 的差异化优势主要体现在三点:第一,支持多参考协调,而多数现有方法只支持单一参考输入;第二,具备双分辨率适配能力,同一框架可处理超细胞和亚细胞两种分辨率场景;第三,在超细胞分辨率场景下计算速度显著更快,可扩展性更好。此外,建模的是连续细胞状态而非离散标签,更符合生物学实际。
Q2:在亚细胞分辨率数据中,跳过细胞分割步骤是否会影响分析质量?
A:这是 Φ-Space ST 的核心创新点之一。细胞分割(cell segmentation)本身在高密度组织区域容易产生误差(如细胞边界判断错误、细胞漏检等),这些误差会传播到后续注释步骤。Φ-Space ST 通过直接在分子信号层面进行细胞状态注释,规避了分割误差的引入。根据论文描述,这一策略可产生"高度洞察力的空间生态位识别(highly insightful spatial niche identification)"结果,验证了其分析质量 [待验证具体量化指标]。
Q3:如果只有一个 scRNA-seq 参考数据集,是否仍可使用 Φ-Space ST?
A:从方法设计描述来看,Φ-Space ST 支持多参考输入,但其框架理论上也应兼容单参考场景(即多参考协调机制在单参考时退化为标准注释流程)。具体单参考模式的支持情况建议参阅原始论文方法部分 [待验证]。
Q4:Φ-Space ST 适用于哪些疾病研究领域?
A:根据论文描述,Φ-Space ST 已在多种癌症组织中完成验证,其核心能力——疾病细胞状态识别、肿瘤与非肿瘤区域区分、空间生态位分析——同样适用于其他复杂组织和病理研究。论文明确指出该方法旨在"understanding complex tissues and pathologies(理解复杂组织与病理)",因此理论上适用范围不局限于肿瘤学。
Q5:Φ-Space ST 对输入 ST 数据的基因 panel 大小有要求吗?
A:原始摘要未明确说明对基因 panel 规模的要求。CosMx 和 Xenium 通常为数百到数千基因的靶向 panel,Stereo-seq 和 Visium 则可覆盖全转录组。Φ-Space ST 在上述平台均有应用,提示其对不同规模 panel 具有一定适应性,但具体的最低基因数量要求建议参阅原始论文 [待验证]。
总结¶
Φ-Space ST 是一个统一的、平台无关的空间转录组分析框架,核心贡献体现在四个层面:
- 双模式适配:同一方法论框架同时支持超细胞分辨率的细胞类型解卷积和亚细胞分辨率的无分割细胞状态注释
- 多参考协调:突破单参考局限,整合多个 scRNA-seq 参考并输出一致注释,同时支持健康参考驱动的疾病状态解析
- 连续状态建模:以连续细胞状态替代离散标签,更贴近生物学现实
- 广泛验证:在 CosMx、Visium、Xenium、Stereo-seq 四大主流平台的癌症数据上完成验证,揭示了肿瘤微环境中的生态位结构和细胞共存规律
对于从事空间转录组数据分析、肿瘤微环境研究或多平台 ST 数据整合的研究者而言,Φ-Space ST 提供了一个计算高效、结果可解释且跨平台适用的分析选项。