这篇刚发的 Nature Genetics 算法能够实现单个细胞级别的空间转录组分析!直接输出单细胞表达矩阵,可以衔接后续常规单细胞分析流程
生信碱移单个细胞级别的空间转录Cellist高分辨率空转的细胞分割算法实现单个细胞级别的空间转录组分析。高分辨率空间转录组这几年还是很卷的Stereo-seq、Seq-Scope、STARmap、seqFISH、Xenium 这些平台把 RNA 的空间位置做得越来越细。对研究组织结构、肿瘤微环境、空间互作来说分辨率提高至少结果层面都会更加显著。 不过空间转录组数据本身并不是单细胞数据。一方面spot 里捕获到的 RNA 数量有限另一方面在实验和测序过程中转录本信号也可能因为扩散、背景噪声或捕获偏移而偏离真实的细胞位置。因此原始空间表达信号只能说一定程度上反映邻近细的转录表达。不过分析层面往往是尽可能再做一些提升单个细胞级别的空间转录组分析可以说是最近的大势所趋这样的分析专业点可以称为细胞分割cell-segmentation。细胞分割就是根据图像把空间级别的数据拆解成一个个明确的细胞 每个细胞的基因表达小编去年分享的 NC 算法 Thor 其实也是这类方法Thor 算法以无需训练的单张片子推断方式将 spot 级空间转录组数据解析到细胞分辨率并与组织学影像深度整合。点击此处阅读学习现有方法还是存在一些问题。其中不少方法更偏 imaging-based ST到了 Stereo-seq 这类大视野 barcoding-based 数据上相应的计算量和转录本扩散问题会更明显。需要注意的是细胞分割最后输出每个空间细胞的表达矩阵后面的细胞注释、空间区域、互作分析、CNV 和克隆分析都会受影响所以一个合适的细胞分割方法还是比较重要的。今天给各位分享一篇昨天刚刚发表在 Nature Genetics [IF 29.0] 的算法工具 Cellist作者做的就是高分辨率空间转录组里的细胞分割问题。DOI: 10.1038/s41588-026-02610-1Cellist 需要两类数据。第一类是空间表达也就是每个 spot 的表达矩阵和空间坐标。第二类是对应的图像比如 Stereo-seq 的 ssDNA staining image也可以是其他平台里的 HE、DAPI 或形态图像。图像提供细胞核或组织结构位置表达数据提供 spot 的分子信息。原理层面还是蛮直接的先用图像或已有分割结果找到候选细胞再对核外 spots 做重新分配。不过分配时会同时考虑两个指标一个是 spot 到附近细胞核的物理距离另一个是 spot 表达和候选细胞表达之间的差异。空间上更近、表达上更接近的 spot更容易分到对应细胞。图Stereo-seq 转录本扩散和 Cellist 的 spot 分配流程。a展示小鼠脑 Stereo-seq 数据中 ssDNA 信号和 UMI 信号并不完全重合转录本扩散让细胞范围更难直接判断b显示细胞核和胞质表达整体存在相关性c中可以看到距离细胞核越近spot 表达和核表达的相关性越高d展示 Cellist 从空间表达和配套图像进入配准、候选细胞识别、spot 分配和下游空间分析的流程。结果其实也就是单个细胞级别的空间转录组。应用层面作者找了 6 个新辅助免疫治疗后的 NSCLC 患者样本有 Stereo-seq也有匹配 scRNA-seq。分析主要就是看 Cellist 分割后的表达矩阵能不能有稳定的空间 CNV 分析结果可以看到与单细胞测序结果高度相关图NSCLC 样本里的 CNV 推断和肿瘤克隆分布。a展示 6 个 NSCLC 患者的 Stereo-seq 和 scRNA-seq 设计b/c显示 ST2 样本中不同细胞类型注释比较清楚marker specificity 在对应细胞类型里更集中d中 Stereo-seq 和匹配 scRNA-seq 通过 CopyKAT 推断的 CNV profile 相关性达到 0.78e/f展示整合 marker 和 CNV 后的 malignant cell 注释及空间位置g/h中 clone B 在局部区域富集i/j中 clone B 的 adipogenesis、EMT 和 CSC score 更高。作者还进一步分析了髓系细胞亚群找了一些 functional signature 和肿瘤区域附近的空间分布。具体看了肿瘤区域附近的空间位置和免疫相关分数发现不同空间域的细胞分布差异与基因表达差异图治疗后 NSCLC 样本中的髓系细胞空间分布。a展示 ST1 样本里的细胞类型空间分布和 SpaDo 识别出的 spatial domainsb显示跨样本 domain 按细胞组成聚成 8 类 ecotype包括 tumor、airway、stromal 和 immune 相关区域c/d中可以看到 AM、TREM2 macrophage、SPP1 macrophage、CXCL9 macrophage 等髓系亚型e中不同 myeloid subtype 的 functional signature 有差异CXCL9 macrophage 偏 M1/抗肿瘤信号SPP1 macrophage 的 angiogenesis signature 更高g/h中 ST1 和 ST5 的 tumor boundary 附近髓系亚型分布不同i/j中不同空间层里的 lymphocyte cytotoxic score 和 HLA-DQA1 表达存在差异。这个工具的使用也相对清晰可以使用下述代码在新建环境 celllist 进行安装conda create -n cellist python3.10 conda activate cellist pip install -U cellist然后进行图像与基因表达的配准cellist align \ --gem Data/sample.gem \ --tif Data/staining.tiff \ --nworkers 8 \ --outdir Result/Alignment \ --outprefix sample细胞核分割cellist watershed \ --gem Data/sample.gem \ --tif Result/Alignment/sample_aligned.tiff \ --min-distance 6 \ --outdir Result/Watershed \ --outprefix sample完整细胞分割cellist seg \ --platform barcoding \ --resolution 0.5 \ --gem Data/sample.gem \ --spot-count-h5 Result/Watershed/sample_bin1.h5 \ --nucleus-seg-method Watershed \ --nucleus-prop Result/Watershed/sample_Watershed_nucleus_property.txt \ --nucleus-count-h5 Result/Watershed/sample_Watershed_segmentation_cell_count.h5 \ --nucleus-seg Result/Watershed/sample_Watershed_nucleus_coord.txt \ --nworkers 16 \ --cell-radius 15 \ --spot-imputation-distance 2.5 \ --outdir Result/Cellist \ --outprefix sample后续其实也就是细胞注释、空间区域、互作分析CNV、clone 和免疫微环境分析这些。Cellist 毕竟是单个细胞级别的结果逻辑上讲其实大部分的单细胞算法都可以去试试。分析完以后再映射回空间信息后面不是各显神通