1. 机器学习的训练集和验证集拆分 需要一个R包:caret 代码: library(caret) set.seed(12) #按照75%的比例拆分数据集,data为原始数据...
当我们画热图(heatmap)的时候,如果基因的名字比较多的时候,在热图中展示的话,就会出现名字重叠的情况,针对这个情况,我们有两种比较好的解决办法,第一是在热图中仅显示关注...
这篇一部分复现的文章是Comprehensive Analysis of the Expression and Prognosis for E2Fs in Human Bre...
DAVID富集分析 DAVID富集支持多种基因名类型,本次以genesymbol为例 DAVID:https://david.ncifcrf.gov/ 进入之后跟着以下步骤操...
在基因芯片数据或其他类型数据中,采用计算所有样本的平均值从而进行填充,如果需要用中位数或其他统计量填充时只需修改相应的方法即可 #1. 检查是否有缺失值 which(is.n...
GSEA的分析汇总 学习GSEA 生信技能树 GSEA的统计学原理试讲 GSEA GSEA这个java软件使用非常方便,只需要根据要求做好GCT/CLS格式的input文件就...
R语言绘图包系列: R语言绘图包01--优秀的拼图包patchwork[https://www.jianshu.com/p/e57555d48c91] R语言绘图包02--热...
#mRNA表达矩阵与GROUP文件样式,heatmap样式见文章最后 library(limma) mRNA <- read.table("表达矩阵.txt",sep = "...
数据框:mRNA; 基因名列:Symbol(在该数据框最后一列); results = t(sapply(split(mRNA,mRNA$Symbol),function(x...
单细胞绘图系列: Seurat绘图函数总结[https://www.jianshu.com/p/95e61f7e834d] 使用ggplot2优化Seurat绘图[https...
简介 这本书是一位韩国的数据科学家写的书,书并不新,几年前的,虚拟机都已经过时,但全书读下来最大的感受是内容写的很详细,可以照着步骤实践,加深了对机器学习的理解,或者说是一本...
针对测序数据和芯片数据,目前常用差异分析的R包有edgeR、limma、DESeq2,做一简单比较,方便平时分析。内容多为搬运,主要方便下次寻找。 1. 三种分析方法的比较 ...