作者,Evil_Genius
隔离的第三天,真的是让人无语,没事非要隔离干什么。
今天我们继续回顾有关空间CNV的分析,CNV的分析我写了很多,包括原理,方法与可视化,列在下面,供大家参考。
10X单细胞(10X空间转录组)肿瘤数据分析之肿瘤进化树
时空CNV分析导论
10X单细胞个性化分析之CNV篇
10X单细胞(10X空间转录组)CNV分析之inferCNVpy
10X单细胞(10X空间转录组)CNV分析回顾之CopyKAT
10X单细胞(10X空间转录组)分析之将单细胞转录组映射到拷贝数进化树(scatrex)
10X空间转录组CNV和速率分析的空间图谱
10X空间转录组数据分析之CNV事件的spatial landscape
10X单细胞(10X空间转录组)数据分析之识别肿瘤细胞的CNV分析原理
10X空间转录组数据推断基因拷贝数畸变(copy number aberrations)CNA
今天参考的文章在Spatially resolved clonal copy number alterations in benign and malignant tissue,2022年8月发表于nature,利用空间转录组进行空间拷贝数的图谱分析,非常NICE。文章的预印版我分享过,文章在10X空间转录组数据分析之CNV事件的spatial landscape
了解哪些细胞产生了癌症的哪些区域可以提高我们对肿瘤如何生长和发展的理解,包括它在遗传上如何随着时间的推移发生变化。这已经通过一种叫做空间转录组学(spatial transcriptomics)的新技术成为可能,该技术允许科学家们在不破坏他们正在观察的组织的情况下观察发生了什么遗传变化。这增加了科学家们如今用来揭示器官生态系统中哪些细胞发生了突变以及何处发生突变的新维度。
目前研究肿瘤内细胞遗传学的技术涉及从癌变区域取样并分析这些细胞的DNA。问题是许多癌症,如前列腺癌,是三维的,这意味着任何一个样本只能提供一小快肿瘤的信息。
在一项新的研究中,来自瑞典皇家理工学院、瑞典卡罗琳学院、英国牛津大学和谢菲尔德大学等研究机构的研究人员利用空间转录组学构建出整个前列腺的横断面图谱,包括健康细胞和癌细胞的区域。通过根据相似的遗传特征对细胞进行分组,发现所谓的健康组织区域已经具有许多癌症遗传特征。这一发现令人吃惊,因为这种组织内的遗传变异性,以及大量被认为是健康的细胞,但却包含通常被认为是癌细胞的突变。
主要研究内容
该研究涉及的标本均通过前列腺癌患者开放性根治性前列腺切除术获得,轴向切片取自中腺体。轴向切片并被细分为立方体(组织切片),使用Gleason分级系统对相应的组织切片进行组织学分级,进而发现了周围良性组织存在广泛的瘤内异质性(ITH)。研究团队从21个组织切片约21000个区域获得了器官范围的转录信息,平均每个条形码spot检测到3500个表达基因。
接下来,从原位空间分辨的mRNA图谱中推断出CNV,并设计了一个计算机系统来整合含有多个克隆的组织,使用空间推断的CNV(siCNV)检测表达数据,成功再现了拷贝数状态和克隆分组。结果显示,除某些区域的CNV活性增加外,大部分组织区域的拷贝数较正常。这些初步结果表明,siCNV可以在器官尺度上识别组织区域,能够推断出与形态学或表达分析不同的基因组可变性和被研究组织的克隆进化模式。
前列腺的全器官克隆图
运用siCNV的方法对前列腺的空间CNV图谱进行分析(样本患有前列腺癌),为了构建克隆树,假设(1)包含相同拷贝数配置文件的细胞组更有可能是相关的,而不是偶然出现的;(2)体细胞拷贝数事件是随着时间的推移依次获得的(事件越多,克隆就越独特)。由于Visium spot的固有大小,不能最终排除较小的克隆可能代表克隆细胞混合物的可能性。然而,使用这种方法,观察到一个常见的ancestral clone(克隆H)包含truncal events,包括染色体6q和16q上的拷贝数丢失和染色体12q和16q上的拷贝数增加。这些事件明显位于两个组织区域:位于主要肿瘤病灶内侧的Gleason分级2组区域(切片H1_4)和位于中上边缘的病理学共识描述为“过渡状态”的区域(切片H2_5)。这些在不同空间位置上的保守siCNV特征值得注意。一种可能的解释是克隆H代表了前列腺腺系统1中分支形态的线性序列,进一步的体细胞事件发生了,产生了克隆I, J和K,并形成了高级别肿瘤病灶,这推开了分支组织学,因为具有侵袭性的扩张表型。因此,在前列腺组织中有了这些事件的空间印记。分析还提出,基于空间分子系统发育,一些CNVs可能具有特殊的病理意义。因此,分析结果提供了对肿瘤克隆进化过程的洞察,通过空间背景下的点水平CNV调用识别识别事件。
跨越组织边界的体细胞克隆
通过软件和算法推断每个spot的CNV状态,分层聚类,等级由A到G,结果发现虽然CNV聚类分析的cluster与组织形态学显著相关,但是许多CNVs已经发生在良性组织中(克隆C),其中最显著的是8号和10号染色体。
在空间上,具有癌症的克隆E、F是混合的,有多达25%的良性细胞。克隆G完全由Gleason 2级癌细胞组成。因此,在组织学上良性的细胞中存在体细胞突变事件,表明克隆群能够跨越组织学边界。
多组织克隆异质性
为证实上述发现,研究人员对前列腺切除术横截面上额外的37000个spot进行了验证,发现靠近癌症的良性克隆具有空间连续性,有共同的Truncal events,也证实了前列腺肿瘤位点内siCNV克隆的高度ITH以及良性前列腺中存在的关键体细胞突变事件。将这一结果推广到多个器官中,进一步验证了siCNV克隆与基因表达的区别。
最后,研究团队分析了包含良性鳞状上皮和鳞状细胞癌(SCC)的皮肤组织,获得了一组与患者匹配的良性对照皮肤单细胞转录组测序数据,并在相邻的良性组织切片中进行了确认。值得注意的是,有两个关键事件(部分1号染色体和12号染色体gain)与附近的另一个完全由组织学上的良性组织组成的克隆共享。上述结果显示,siCNV分析能够正确预测91%空间克隆区域的CNV状态。
分析认为,将siCNV信息、空间基因表达模式和细胞类型定位相结合可以实现对单个克隆、良性组织或肿瘤的靶向治疗,这是通过其他方法无法轻易实现的。
CNV的检测方法
第一步,选择参考区域
用于推断cnv的输入包括一个umi barode对象的参考集,以提高对观察群体基因组拷贝数事件的精确推断。首先只对良性管腔上皮参考细胞进行无监督分析(inferCNV对象的参数:ref_group_names = NULL;参数:cutoff = 0.1, cluster_by_groups = FALSE,降噪= TRUE)。使用去噪后的输出,通过目视检查确定了所有良性spot的一个亚组,这些良性spot包含很少到没有推测的cnv。然后进一步分析相关的树状图profile(包含集群结构和其中的每个barcode)以进行node选择。
InferCNV parameter
对于非监督siCNV分析,为CreateInfercnvObject()函数包含了以下参数:chr_exclude = c(" chrM ")。对于run()函数,使用了以下参数值:cut-off = 0.1, num_threads = 10, cluster_by_groups = FALSE, denoise = TRUE, HMM = FALSE。除了定义参考集或没有合适的参考集之外,所有的分析都使用一个参考集。
在有监督的siCNV分析中(调用inferCNV隐马尔可夫模型(HMM)函数),inferCNV运行如下。node标识文件被用来代替注释文件。使用了以下inferCNV运行参数:cutoff = 0.1, num_threads = 10, cluster_by_groups = TRUE,降噪= TRUE, HMM = TRUE。
对于siCNV事件的全局可视化,在没有参考集的全局分析中分析了所有21个section的空间转录组学(1k数组)数据。执行分析,使每个单独的空间转录组点运行以下inferCNV run()参数:cutoff = 0.1, num_threads = 10, cluster_by_groups = FALSE, denoise=TRUE, HMM=TRUE, analysis_mode= " cells, " HMM_report_by= " cell "。为了在空间上可视化整个前列腺的global siCNV图谱,确定了检测到的个体基因的数量,从而推断出拷贝数的增加或减少。为了减少可视化中的背景噪声,生成的HMM调用的阈值为在整个数据集中至少35%的所有点中出现的基因级别siCNV事件的数量,以及在给定部分中至少45%的点中出现的事件的数量。这些阈值是在详细query阈值范围从10-90%在5%的增量与阳性对照,中性和阴性对照部分的视觉一致性之后选定的。
Clone selection
具有数值node标识的树状图树被可视化,node被提取,特定的barcode(Visium斑点)被数字选择并分配一个克隆标识。对给定分析的所有members进行合并,并为每个Visium部分输出包含克隆标识和条形码的.csv文件。
Clone visualization
Loupe Browser version 5.0 (10x Genomics) was used to spatially visualize resultant clones from clone selection. For the manuscript, if a clone was present in <10 spatial spots (from 1k arrays or Visium) in a given section, it was not visualized.
Manual algorithmic tree building from preprocessed inferCNV data
Clone tree consensus siCNV event calling。HMM siCNVs(来自文件infercnv.17_HMM_predHMMi6.hmm_mode-samples.png和17_HMM_predHMMi6.hmm_mode-samples.pred_cnv_regions.dat)和manual interpretation去噪后的输出(来自文件infercnv.21_denoised.png)被用于识别推定的亚克隆CNVs。然后将它们合并成最终的共识集,其中为每个克隆列出事件,以构建克隆树。简而言之,树是通过确定CNV在上述集群中共享的位置来构建的,假设CNV一旦发生就不能逆转,这表明这些集群中的细胞拥有共同的祖先。因此,我们使用这种逻辑来识别集群之间的祖先关系,并构建克隆树。由于我们的克隆树将克隆识别为相关的细胞组(与克隆只是相关的突变相反,这是批量测序研究中通常采用的方法),克隆出现在空间上不接近的子树中,在共同祖先之间用虚线标记了这种不确定性。
Clone trees: branch lengths:为了半定量地描述亚无性系之间的“进化距离”,对descendant无性系中附加的CNV数量取对数(以2为基数),并添加一个任意值,以确保即使CNV差异很小,分支也始终可见,从而确定分支长度。公式为bk = 100log2(| zdescent | - |Zparent|) + 300,其中bk是分支k的长度,以像素为单位。
Clone trees: clone diameters:使用公式dl = 10log2(sl),根据分配给克隆的样本中spot的比例缩放表示克隆的每个圆的大小,其中dl表示圆的直径,以像素为单位,sl表示对应于克隆的spot数量。
好了,方法思路已经分享给大家了,生活很好,有你更好,百度文库出现了大量抄袭我的文章,对此我深表无奈,我写的文章,别人挂上去赚钱,抄袭可耻,挂到百度文库的人更可耻