细胞轨迹分析是常见的单细胞数据下游分析,根据细胞的表达情况对每个细胞进行排序,进而模拟预测出细胞的动态发育变化。常见的轨迹分析方法有拟时序分析(monocle2/monocle3)和RNA速率分析(RNAVelocity),但由于单细胞数据的复杂性,以及科研需求的个性化,各有优劣的上百种软件,到底哪一个才能更好的阐明实验结果?这里为大家推荐一款非常适合关注线性单细胞谱系发育的软件--- 天蝎座 SCORPIUS,各位老师一起来看看吧!
1.SCORPIUS原理简介
【资料图】
SCORPIUS是一款R包,通过单细胞转录组测序数据来推测细胞的线性发育过程。预印本发表链接是:SCORPIUS improves trajectory inference and identifies novel modules in dendritic cell development ,目前已有 67次引用。分析中,软件主要通过3步计算来预测细胞的发育轨迹:
图1 | 预测细胞发育轨迹
1.降维重聚类:计算相关距离,过滤掉离域值后多维缩放(spearman);
2.计算通过 k 个聚类中心的最短路径,并使用主曲线算法迭代地将该路径拟合到数据,创建初始路径(principal_curve),并预测主曲线输出的细胞排序;
3.特征选择过程中,使用表达数据训练随机森林,计算每个基因的重要性。
最后,再根据每个细胞的假时间,以及筛选到的重要基因,对结果进行汇总,并展示出不同条件下细胞沿假时间的发育情况。
2.SCORPIUS分析方法
2.1降维聚类和假时间预测
首先从上游单细胞分析数据(RDS/h5seurat)提取表达信息,计算细胞间的相关距离(spearman),以及簇中心之间的euclidean距离。基于这个结果,我们可以进一步找到连接所有聚类中心的最短路径。
降维聚类和每个细胞的排序将会以图表的结果提供。部分示例见表1:time为细胞发育过程中的假时间排序(0~1),comp1~3 为缩放后细胞的空间位置。预测的线性发育时间也可以根据实际细胞类型或分组进行调整。
表1 | 细胞降维聚类和初始轨迹时间结果
2.2 筛选重要基因
其次,软件采用随机森林方法,计算并筛选出最重要基因,然后对结果进行BH矫正,获得在时间变化过程中的重要基因列表,后面将在可视化热图中展示。
表2|筛选得到的重要基因表格
2.3 可视化绘图
最后,根据上一步筛选得到的重要基因,结合假时间趋势,以热图的形式展示出细胞的发育变化。我们也可提供自己感兴趣的基因单独展示,比如梯度发育阶段表达变化较大的基因,或者多种细胞类型的marker基因。
图2 | UMAP展示假时间变化趋势
图3 | 多维缩放后细胞空间位置
图4 | 重要基因、指定基因假时间趋势热图
而后,作者也在多种数据中对该软件进行了验证,结果都比较理想,说明该软件在单细胞的空间位置分布,以及细胞的轨迹预测,进而拓展至细胞的发育、分化或者复杂代谢背景的细胞功能识别中,都有较广泛的适用性。
欢迎百度搜索欧易生物——访问欧易生物官网——了解更多多组学技术
猜你想看
1、PLOS GENET I 中科院水生所发现六倍体银鲫雄性分化的调控机制
2、STOTEN | 上海海洋大学王有基教授团队发现纳米 TiO2 可以减轻 TCPP 对贻贝的毒性
3、Nat Med | “自动化诊断”,质谱流式细胞技术用于血液病理学的单细胞形态测量
4、速看!百篇单细胞文章实战经验分享:高分文章“稳”了
原创声明:本文由欧易生物(OEBIOTECH)学术团队报道,本文著作权归文章作者所有。欢迎个人转发及分享,未经作者的允许禁止转载。