IP属地:河南
TCGA是目前使用最多的肿瘤组学数据库,2018年的一批Cell文章也非常抢眼。在近年的肿瘤文章中,对TCGA数据库的分析,已成为标配。使用这个...
摘自易侕科研 很多人在学习临床研究时是会遇到这样的困扰:回顾性数据,为什么有的做了回顾性队列,而有的却做了病例对照?它们之间有什么区别?今...
缺失值 异常值处理办法 丢弃 选择y=3-20之间的数值。 用缺失值代替 ifelse() 函数有3 个参数。第一个参数test 应该是一个逻辑...
1.简介 探索性数据分析(exploratory data analysis,EDA),具有以下作用:(1) 对数据提出问题。(2) 对数据进行...
分组新变量 用到的变量有:select(),mutate(),summarize(),filter()。组合使用。 找出每组中最差的成员 注:<...
summarize() 将一列数据折叠成一行,经常与group_by() 组合构成了使用dplyr 包时最常用的操作之一:分组摘要。如果没有gr...
混杂因素是指能同时导致研究因素和研究疾病,既和X有关,又和Y有关。交互作用是指当两个或两个以上因素共同作用于某一事件时,其效应明显不同于该两个或...