rrvgo--基于语义相似度简化GO富集结果冗余
文章图片
文章图片
背景介绍
基因本体论 (GO) 通常用于指导高通量组学实验 , 将差异调节基因列表汇总为具有共同功能表示的基因集合 。由于 Gene Ontology 的分层性质 , 生成的丰富集列表通常是多余的并且难以解释 。今天小编给大家介绍的是一个基于语义相似性识别冗余来减少和可视化GO结果列表的R包rrvgo 。
文章图片
文章图片
R包安装
BiocManager::install("rrvgo")library(rrvgo)可视化介绍
01计算相似度矩阵并减少GO terms
rrvgo不关心基因 , 而是关心 GO terms 。输入是一个富集的 GO terms向量 , 以及分数向量 。如果未提供分数 , 则 rrvgo 将 GO terms(集合)大小作为分数 。第一步是得到terms之间的相似度矩阵 。函数calculateSimMatrix 获取要计算语义相似度的GO terms列表、OrgDb 对象、感兴趣的ontology和计算相似度分数的方法 。go_analysis 相似度矩阵中 , 可以根据相似度对terms进行分组 。rrvgo 为此提供了 reduceSimMatrix 函数 。scores 02绘图
rrvgo 提供了几种绘制和解释结果的方法 。
相似度矩阵热图
将相似性矩阵绘制为热图 , 默认情况下启用行列聚类heatmapPlot(simMatrix, reducedTerms, annotateParent=TRUE, annotationLabel="parentTerm", fontsize=6)
文章图片
文章图片
描述组和terms之间距离的散点图
将 GO terms绘制为散点,点之间的距离表示terms之间的相似性 , 点的大小代表提供的分数 , 或者在没有分数的情况下 , GO terms包含的基因数量 。scatterPlot(simMatrix, reducedTerms)
文章图片
文章图片
树状图
树状图是分层结构的空间填充可视化 。terms根据其父项进行分组(着色) , 并且terms使用的空间与分数成正比 。树状图可以帮助解释汇总结果并比较不同的 GO terms集 。treemapPlot(reducedTerms)
文章图片
文章图片
词云
词云是再现文本的可视化 , 强调在文本中频繁出现的词 。可以帮助识别在一组丰富的 GO terms中更常见的过程和功能 , 以及不同组之间的比较 。wordcloudPlot(reducedTerms, min.freq=1, colors="black")
文章图片
文章图片
03shiny app
为了让不熟悉编程的用户更容易使用该软件 , rrvgo 打包了一个shiny app , 可以从R中调用 Shiny_rrvgo() 函数来访问该应用程序 。rrvgo::shiny_rrvgo()
文章图片
文章图片
小编总结
rrvgo的使用整体来说是非常简单的 , 只要我们输入GO terms矩阵 , 就可以一步步得到结果 , 将原本繁多的富集结果进行精简 , 得到其中更重要的功能!
【rrvgo--基于语义相似度简化GO富集结果冗余】来源:健康界
- 烟台电网首套基于5G网络的纵联差动保护顺利投运
- 中科大首次实验实现基于局域操作的最优量子门检验
- 英国航天局资助开发基于激光的新型卫星通信系统
- 云朵软件“基于大数据的‘烟台文旅云’平台”入选文化和旅游部《2021年智慧旅游典型案例》
- 科学家开发出基于FBG传感原理的触觉传感器应用于微创手术组织触诊
- 三星半导体实现基于mram的内存内计算
- 专家学者江苏盐城共议基于自然的解决方案(NbS)实践
- 年终购物季后看跨境电商的下一站:基于云和数字化的精细化运营
- 首批基于商用密码算法的智能网联汽车信息安全标准项目发布会在长春举行
- 研究基于LAMOST光谱巡天数据提出4500多颗早型星的参数星表
