1.安装,先装原生系统 ,再装studio,选老一点的版本,兼容32bit。
2.数据库导入:数据库最好不含任何中文字符(可以有缺失)。在spss里存为CSV,正常之后,在用excel打开,看数据有没有跑行,然后转存为excel,然后import file。
3.确定使用的分析包,上网搜。
4.拟采用survival,survminer,plyr,fdrtool(控制变量)
- R语言之survival-生存分析(原文转自公众号:你忘拿伞了)
library(survival)
library(survminer)
两分组最佳cutoff
cutoff<-surv_cutpoint(survival_OS_data, #数据集
time="OS.time",#“ ”里写数据集时间变量
event="OS",##“ ”里数据集结局变量名称
variables=c("TP53")
);summary(cutoff) #输出结果
好了,确定了最佳cutoff。其实我分了三组(利用x-tile软件分组,确定两组最佳cutoff后就可以根据cutoff值进一步利用x-tile软件划分分三个组),这里只显示高低两组。
下面作图
fit <- survfit(Surv(OS.time, OS)~group,
data=survival_OS_data_hl)
TCGS_OS <- ggsurvplot(fit,
pval = "high vs low : P=0.027",
pval.size =7,##p值文字大小
color = "group",
palette = c("red","green"),
surv.median.line = "hv",##添加中位生存线
risk.table = TRUE,##添加risk.table
tables.height = 0.3,
ylim=c(0,1),
xlim=c(0,4500),
axes.offset=FALSE,#曲线顶点靠右顶格
xlab = "Time(days)",
ylab="Overall survial",
font.x = c(20, "black"),
font.y = c(20, "black"),
font.tickslab = c(20),
risk.table.title = "",
risk.table.y.text = FALSE,
legend.title = "",
font.legend=20,
fontsize=7,
legend.labs = c("high","low"))
6 讲解 -哔哩哔哩-生存分析R包survival的Kaplan-Merier.
Kaplan-Merier Analysis (nonparametric method)
life table
cox proportional hazards model1 (semiparametric method).
cencoring:right censoring
7.https://www.w3cschool.cn/r/r_survival_analysis.html
8.…cox回归前,要先对个个变量进行标签化