Bioinformatics| MOVICS:癌症分型中多组学集成和可视化的R包

  • A+
所属分类:杂谈天下 科研助手

中国药科大学的老师2020年在Bioinformatics(IF=6.94分)杂志上发表了“MOVICS: an R package for multi-omics integration and visualization in cancer subtyping”。专门用于癌症分型中多组学集成和可视化的R包,包括了GET、COMP和RUN三个模块,在之后的几篇推文中,针对三个模块分别以TCGA数据库的数据进行实操展示~

近年来,用于组学数据生产的下一代测序、微阵列和质谱技术的进步,使生成和收集不同形式的高维分子数据成为可能。结合这些不同类型的多组学数据集可能有潜力揭示进一步的系统层面的见解,从而增强对疾病或生物过程机制的全面认识。基于多组学数据将癌症患者划分为不同的分子亚组是精准医学背景下的一个重要问题。MOVICS为10种最先进的多组学集成聚类算法提供了统一接口,并整合了癌症分型研究中最常用的下游分析,包括从多个角度对已识别的亚型进行表征和比较,以及使用两种无模型方法对多类预测的外部队列中的亚型进行验证。MOVICS还以最小的努力创建功能丰富的可定制可视化。通过分析两个已发表的乳腺癌队列表明,MOVICS可以服务于广泛的用户,并通过摆脱“一刀切”的患者护理方法来辅助癌症治疗。

Bioinformatics| MOVICS:癌症分型中多组学集成和可视化的R包

用于整合和可视化多组学数据的MOVICS管道示意图。左面板描述了三个内置分析模块。有方向的箭头表示函数应该按顺序执行,而无方向的实线表示函数彼此独立,可选函数由虚线连接。右边的面板展示了由MOVICS生成的简化插图MOVICS目前要求R(4.0.1)以上,主要包括三个模块(即GET、COMP和RUN)。所有面向用户的函数都从任何模块的标签开始命名。 一、GET module为每个组学数据过滤出一部分有用的数据:用户可以根据标准偏差(sd)、中位数绝对偏差(mad)、主成分分析(pca)、突变频率(freq)和单变量Cox比例风险回归(Cox)五种方法。参考聚类预测指数和gap统计来估计聚类数量:两个统计数据之和达到最大值的聚类数将被任意认为是最优的,但建议参考给定癌症类型的分子亚型的先验知识,重新考虑这个数量。在这个模块中,MOVICS为用户提供了一个统一的接口,可以同时指定十个或多个多组学聚类算法中的一个。可视化子类型内部或之间的全基因组模式:所有的聚类结果,无论是基于单一算法还是基于多个算法,都保持相同的输出,以促进下游分析,并获得垂直连接的多组学热图。二、COMP module在这个模块中,MOVICS为用户提供了以下七个功能,以实现癌症分型中最常用的下游分析。(i) 用户可以评估预后,以了解生存模式在不同亚型中的区分情况。(ii) 临床特征可以用一个格式化的.docx文件进行比较和总结,该文件易于在医学研究论文中使用。(iii) 对于遗传分析,可以通过比较突变频率来推断亚型特异性驱动突变。(iv) 允许用户通过单独估计IC50来预测患者对药物(例如化疗)的反应。由于免疫治疗正在成为现代癌症治疗的支柱,因此建立了两个函数来计算和比较;(v) 总突变负担(vi) 可能影响免疫反应的基因组改变部分。

(vii) MOVICS还计算了Rand指数、调整互信息、Jaccard指数和Fowlkes-Mallows四个统计量,以评估和可视化新子类型与以前分类的一致性,这对于反映聚类分析的鲁棒性和确定潜在但新的子类型至关重要。三、RUN module该模块运行成对的差异表达分析,以进一步识别亚型特异性的生物标志物和功能通路,执行单样本富集分析,并进行亚型重现性验证程序。MOVICS嵌入了三种主流方法,即edgeR 、DESeq2 和limma,可适应各种表达谱(如RNA-Seq计数、微阵列表达谱和归一化表达矩阵)。MOVICS通过基因集富集分析来检索每个亚型的功能图谱,以便更好地理解潜在的生物学过程。给出一个感兴趣的基因集列表,MOVICS还估计单个样本富集评分,以评估通路水平的相对失调。MOVICS根据从差异表达分析中提取的log2FoldChange为每个子类型识别一定数量的独特生物标志物,以构建模板,然后利用最接近的模板预测确定每个样本最可能的子类型。第二种方法首先在发现队列中围绕中位数分类器训练一个分区,验证队列中的每个样本被分配到一个子类型标签,其质心与样本的Pearson相关性最高。最后,将进行组内比例统计,以评估发现组和验证组之间获得的亚型的相似性和再现性。预测结果与真实标签之间的一致性可以通过MOVICS中的Kappa统计进一步评估。

最后,MOVICS两个乳腺癌队列(TCGABRCA作为发现队列,Yau-BRCA作为验证队列)的完整分析过程将会在接下来几篇文章中呈现~

weinxin
我的微信公共号
我的微信公招扫一扫

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: