在单细胞转录组测序中一个重要的方面就是定义聚类得来的cluster,一个思考的方向就是根据marker基因来定义cluster的细胞类型(cell type)。怎样才能建立c...
在单细胞转录组测序中一个重要的方面就是定义聚类得来的cluster,一个思考的方向就是根据marker基因来定义cluster的细胞类型(cell type)。怎样才能建立c...
TCGA是目前使用最多的肿瘤组学数据库,2018年的一批Cell文章也非常抢眼。在近年的肿瘤文章中,对TCGA数据库的分析,已成为标配。使用这个数据库,首先,当然是数据的下载...
摘自易侕科研 很多人在学习临床研究时是会遇到这样的困扰:回顾性数据,为什么有的做了回顾性队列,而有的却做了病例对照?它们之间有什么区别?今天我们就来聊聊这两种研究的两点...
缺失值 异常值处理办法 丢弃 选择y=3-20之间的数值。 用缺失值代替 ifelse() 函数有3 个参数。第一个参数test 应该是一个逻辑向量,如果test 为TRUE...
1.简介 探索性数据分析(exploratory data analysis,EDA),具有以下作用:(1) 对数据提出问题。(2) 对数据进行可视化、转换和建模,进而找出问...
分组新变量 用到的变量有:select(),mutate(),summarize(),filter()。组合使用。 找出每组中最差的成员 注:<10的意思不是值,而是个数,是...
summarize() 将一列数据折叠成一行,经常与group_by() 组合构成了使用dplyr 包时最常用的操作之一:分组摘要。如果没有group_by,就会把整个数据框...
混杂因素是指能同时导致研究因素和研究疾病,既和X有关,又和Y有关。交互作用是指当两个或两个以上因素共同作用于某一事件时,其效应明显不同于该两个或两个以上因素单独作用时的和或积...
arrange()排序 注:就是excel的多条件排序。后面的在前面的变量基础上排序。 降序排列。 无论正序倒序,空值排在最后 注:arrange(df, desc(is.n...
如果不想麻烦每次设置工作目录,可以多保存几个R文件。需要哪个就打开哪个。 工作流-基础 使用RStudio 快捷键:Alt+-(Alt 加上减号)。RStudio 会自动在<...
历史性队列研究与病例对照研究最明显的不同在于对照组的划分.历史性队列研究先回顾样本人群有无暴露于某种因素,划分的依据是是否暴露于某种因素,而不是是否发病(对照组也可发病).比...
准备工作 R Rstudio tidyverse mpg mpg是ggplot2的内置数据框。dplyr包是Hadley Wickham的新作,主要用于数据清洗和整理,该包专...
今天学习测序相关知识 学习内容 怎么区分一二三代测序 二代测序大体流程 NGS组学都包括哪些分类(粗略) 测序原理和过程 原理介绍视频:https://share.weiyu...