空间数据库SpatialTME与空间主要分析

1周前 (04-25) 0 点赞 0 收藏 0 评论 3 已阅读

作者,Evil Genius

在昨天的文章空间转录组识别恶性-边界-非恶性轴肿瘤空间微环境解析中,函数

STInferCNV <-
  STCNV(
    TumorST = TumorST,
    OutDir  = OutDir,
    assay = "Spatial"
    )

是跑不通的,有一位叫止水如若的网络侠客指出了其中的问题,

STCNV那个函数 由于infercnv工具更新后对于randomtree的树文件和最终infercnv矩阵文件observation文件输出增加了write_expr_matrix和write_phylo默认为FALSE 导致原封装函数并没设置,需要手动更改下这个函数,把这个加上。否则后续计算cnvscore函数读取文件缺失。

所以大家在使用Cottrazm分析肿瘤边界的时候需要注意这个问题,或者inferCNV单独运行。今天我们在这个基础上继续扩展一个内容,数据库SpatialTME和其包含的分析方法。文章在The Web-Based Portal SpatialTME Integrates Histological Images with Single-Cell and Spatial Transcriptomics to Explore the Tumor Microenvironment(cancer research ,IF 11.2)。

网址在SpatialTME,website link: http://www.spatialtme.yelab.site/

肿瘤微环境(tumor microenvironment, TME)是一个复杂的网络,在这个网络中,肿瘤细胞不仅相互沟通,还与基质细胞和免疫细胞沟通。TME中的细胞间相互作用有助于肿瘤的发生、进展、转移和治疗结果。空间转录组学(ST)的最新进展在空间水平上彻底改变了对TME的分子理解。在这项研究中,SpatialTME收集了296张ST切片,涵盖19种癌症类型,并开发了一个计算pipeline,沿恶性-边界-非恶性轴描绘空间结构。该pipeline鉴定了差异表达基因及其功能富集,解构了TME的细胞组成,在subspot水平上重建了细胞类型特异性基因表达谱,并进行了细胞-细胞相互作用分析。

知识储备

肿瘤微环境(TME)在肿瘤发生、肿瘤进展、转移和决定治疗结果中至关重要。目前,癌症研究和治疗已经从以癌症为中心的模式转变为强调整个TME的模式。这一转变承认了TME在癌症生物学中日益重要的意义。TME是一个复杂的网络,肿瘤细胞之间不仅相互沟通,而且还与基质细胞和免疫细胞沟通。这些细胞以空间结构排列,表现出微环境生态位、营养梯度和细胞间相互作用。近年来,空间转录组学(ST)研究使研究人员能够捕捉到TME内空间结构和细胞定位的复杂性。ST可以在保留组织结构的同时测量组织标本中所有基因的表达。将ST与单细胞RNA测序(scRNA-seq)相结合,可以探索TME中的细胞组成、细胞相互作用、肿瘤空间结构、肿瘤边界和其他微观解剖结构,如三级淋巴样结构(TLSs)

近年来,开发了AQUILA、SODB、SPASCER、SpatialDB和STOmics等数据库。他们收集了跨物种和疾病状态的空间组学数据,并提供了可视化的基本工具。然而,到目前为止,还没有数据资源提供专门针对TME的全面互动分析。在这里,从公开访问的ST数据集中收集了总共26个ST数据集和296张幻灯片,涵盖19种癌症类型

通过聚类基于苏木精和伊红(HE)染色进行形态学调整获得的表达矩阵来描绘空间结构。对于肿瘤边界清晰的切片,进一步沿着恶性-边界-非恶性(MalBdy-nMal)轴确定了三个不同的空间区域。然后,进行了基于空间结构的差异表达和功能富集分析。通过整合匹配癌症类型的单细胞转录组数据,对ST spot的细胞组成进行了反卷积。此外,在subspot水平上重建了细胞类型特异性基因表达谱,并进行了细胞-细胞相互作用分析

空间结构表征

对于来自10x Visium平台的幻灯片,使用Cottrazm中的STModiCluster函数定义每个样本的ST数据的形态学调整cluster。为了建立mal - body - nmal轴,使用Cottrazm中的“STCNVScore”函数计算每个位点的DNA拷贝数变异(CNV)分数。使用cotrazm中的BoundaryDefine函数选择CNV得分较高的聚类。以此来区分恶性区、肿瘤边界区和非恶性区。该计算方法的病理注释与计算区域的一致性已经在之前的研究中得到验证。使用Seurat软件包中的SpatialDimPlot函数来可视化上述空间结构。对于Slide-seq平台的幻灯片,使用stLearn应用Leiden算法来定义ST数据的空间cluster

空间表达模式

空间表达模式包括单个基因或感兴趣基因的空间分布。对于这些基因,结合了TLS评分、来自分子特征数据库(MSigDB)的癌症相关标志基因集和来自Kyoto Encyclopedia of Genes与KEGG基因集。使用Seurat评估单个基因或感兴趣基因的表达数据,并计算感兴趣基因中基因表达的几何平均值。为了可视化,使用Seurat软件包中的“SpatialFeaturePlot”函数生成单个基因或感兴趣基因的表达图或平均表达图

空间差异表达分析

利用Cottrazm中的FindDiffGenes功能计算每个样品在不同空间结构或空间cluster之间的差异表达基因(DEGs)。使用cotrazm中的DiffVolcanoplot函数将deg可视化。利用clusterProfiler进行基因GO分析,以探索空间结构或cluster中的功能富集。

空间层面的细胞组成

反卷积分析。这一分析是基于ST和单细胞转录组学从相应的癌症类型。首先,从相同癌症类型的多个样本中收集scRNA-seq数据作为汇总的scRNA参考。然后,根据表达基因的数量、唯一分子标识符(UMI)计数和每个细胞中的线粒体RNA百分比对单细胞转录组学进行质量控制。然后,使用FindAllMarkers函数鉴定了scRNA-seq数据中每种细胞类型的DEG(only.pos = T, logfc_threshold = 0.25),将这些DEG表示为clustermarkers_list。接下来,使用Cottrazm中的get_sig_exp函数来计算每种细胞类型的clustermarkers_list的平均表达式,它返回一个sig_exp矩阵,其中DEG作为行,细胞类型作为列。
通过计算scRNA-seq数据中每种细胞类型的前25个特异性表达基因的平均表达量,生成特征得分矩阵。利用Cottrazm中的get_enrichment _matrix和enrichment _analysis函数生成富集评分矩阵。然后,计算mal - body - nmal轴或形态调整cluster每个区域的spot的细胞组成。这个计算使用了cotrazm中的SpatialDecon函数。使用Cottrazm中的DeconPieplot和DeconBarplot函数来量化每个spot和每个区域或空间cluster的细胞组成。为了显示特定细胞类型在spot中的比例,使用Seurat中的SpatialFeaturePlot函数。使用Wilcoxon检验进行两两比较,以评估不同空间区域(恶性、边界和非恶性区域)中细胞类型的不同比例。这个评估是在ggpubr的stat_compare_means函数中完成的。对于形态学调整的cluster中细胞类型比例的统计学显著差异,采用KruskalWallis检验。分析还进行了Fisher’s Exact检验,以评估不同空间区域间细胞组成的差异。
对于Slide-seq 样本,使用RCTD pipeline,它是R包spacexr的一部分。对于每一种癌症类型,使用与10X Visium载玻片相同的reference。鉴于Slide-seq的高分辨率,可与单个细胞大小相媲美,将每个spot的细胞类型定义为推断具有最高比例的细胞类型。
为了评估来自同一患者的ST匹配的scRNA作为参考和合并的scRNA作为参考之间细胞组成反卷积结果的一致性,使用了来自同一患者的两个ST样本,这些样本提供了scRNA-seq数据。利用这些scRNA-seq数据,使用相同的方法对ST点进行反卷积,并基于每个spot中每种细胞类型的这两个reference对预测的细胞组成进行Pearson相关。配对细胞类型与合并scRNA对照呈显著正相关,多数Pearson相关系数(R)大于0.5,最高可达0.98

Cell interaction

使用R包CellChat和默认参数来评估细胞群的相互作用权重。该评估基于10X Visium载玻片的subspot GEPs,而CellChat则用于基于Slide-seq数据推断空间近端细胞-细胞通信。分析纳入了2021个经过验证的分子相互作用。这些相互作用包括60%的旁分泌/自分泌信号相互作用,21%的细胞外基质(ECM)受体相互作用和19%的细胞-细胞接触相互作用。简而言之,在ST样品的细胞clusters中鉴定出DEG (P < 0.05),以推断特定的细胞通信。使用Cellchat中的netVisual_bubble函数来显示从一种或某些细胞类型到另一种或其他细胞类型的选定信号通路中配体-受体(L-R)对中的所有重要相互作用。利用Cellchat中的netVisual_circle函数对细胞间通信网络进行可视化

数据整理

为了全面表征空间结构及其特征对人类癌症中TSME的影响,SpatialTME收集了19种癌症类型的邻近正常组织、原发肿瘤组织、健康组织或转移性肿瘤组织的296张空间转录组学切片,包括乳腺癌(BRCA)、结直肠癌(CRC)、宫颈鳞状细胞癌(CSCC)、室管膜瘤(EPN)、胶质母细胞瘤(GBM)、胃肠道间质瘤(GIST)、肝细胞癌(HCC)、头颈部鳞状细胞癌(HNSC)、肺鳞状细胞癌(LUSC)、髓母细胞瘤(MB)、卵巢癌(OV)、原发性中枢神经系统淋巴瘤(PCNSL)、胰腺导管腺癌(PDAC)、前列腺腺癌(PRAD)、前列腺腺癌(PRAD)、肾细胞癌(RCC)、鳞状细胞癌(SCC)、皮肤黑色素瘤(SKCM)和子宫肌体子宫内膜癌(UCEC)。其中,使用10X Visium平台获得265张幻灯片,使用Slide-seq平台获得31张slide。在所有癌症类型中,BRCA样本所占比例最大(20.2%),其次是OV(12.7%)。除肺腺癌(LUAD)外,所有癌症类型均可获得原发肿瘤组织样本。邻近的正常组织样本可用于GBM, HCC和PRAD。BRCA、OV、RCC、CRC、LUAD和SKCM的转移性肿瘤组织可用。此外,健康组织样本可用于PRAD。在26个数据集中,大多数包含来自单一癌症类型的样本。然而,四个数据集包含来自多种癌症的样本。包括EGAS00001006124、GSE203612、10x resource和GSE179572。GSE210616包含43个BRCA样本,样本量最大,其次是PMID35700707,包含27个GBM样本。

TME的空间结构与表现模式

为了剖析TME的空间结构,划分了恶性区域、肿瘤边界和非恶性区域。这是基于67张肿瘤边界清晰的ST slide的mal - body - nmal轴来完成的。对296张ST玻片进行了形态学调整聚类,以获得不同的空间聚类。SpatialTME还可以显示单个基因或一组基因的空间表达分布。此外,还建立了来自MSigDB的50个癌症相关标志基因集、来自KEGG数据库的317个基因集和一个TLS相关基因集的特征评分。

SpatialTME揭示了细胞类型在特定空间位置的组成和功能作用

为了研究TSME的细胞组成,基于cotrazm进行了反卷积分析,预测了265个10x Visium样品中686,084个spot的12种细胞类型,并基于RCTD预测了31个Slide-seq样品的细胞类型。在上述HCC样本中,在整个ST切片中鉴定出12种细胞类型,包括内皮细胞、成纤维细胞、B细胞、浆细胞、中性粒细胞、CD4+ T细胞、CD8+T细胞、自然杀伤细胞(NK)、巨噬细胞、树突状细胞、肝细胞和肿瘤细胞。然后,空间区域呈现出不同的细胞组成;非恶性区包括正常肝细胞、间质细胞(成纤维细胞和内皮细胞)和各种免疫细胞(如CD4+ T细胞、CD8+ T细胞)。几乎所有的CD8+ T细胞都位于非恶性区,尤其是TLS区。肿瘤边界倾向于由巨噬细胞、成纤维细胞和内皮细胞组成,而恶性区主要由肿瘤细胞组成,并有少量巨噬细胞、内皮细胞和中性粒细胞。

Spatial structure and heterogeneity of TME

空间细胞-细胞相互作用

为了进一步探索不同细胞类型的功能作用和空间细胞-细胞相互作用,在“subspot GEP”模块中重构了TSME,并获得了subspot水平的GEP。

用户友好的交互式web界面的SpatialTME

github在GitHub - SpatialTME,https://github.com/Yelab2020/SpatialTME,大家感兴趣可以研究研究。

生活很好,有你更好


空间数据库SpatialTME与空间主要分析

本文收录在
0评论

登录

忘记密码 ?

切换登录

注册