4.工具 • 确定与某种模式相匹配的字符串;• 找出匹配的位置;• 提取出匹配的内容;• 使用新值替换匹配内容;• 基于匹配拆分字符串。 4.1...
缺失值 异常值处理办法 丢弃 选择y=3-20之间的数值。 用缺失值代替 ifelse() 函数有3 个参数。第一个参数test 应该是一个逻辑...
1.简介 探索性数据分析(exploratory data analysis,EDA),具有以下作用:(1) 对数据提出问题。(2) 对数据进行...
分组新变量 用到的变量有:select(),mutate(),summarize(),filter()。组合使用。 找出每组中最差的成员 注:<...
summarize() 将一列数据折叠成一行,经常与group_by() 组合构成了使用dplyr 包时最常用的操作之一:分组摘要。如果没有gr...
中文版第5章对应英文版第七章。讲的是探索性数据分析,结合了dplyr和ggplot2。 1.简介 提出问题→通过可视化,转换和建模来解决问题→优...
准备工作 R Rstudio tidyverse mpg mpg是ggplot2的内置数据框。dplyr包是Hadley Wickham的新作,...
arrange()排序 注:就是excel的多条件排序。后面的在前面的变量基础上排序。 降序排列。 无论正序倒序,空值排在最后 注:arrang...
如果不想麻烦每次设置工作目录,可以多保存几个R文件。需要哪个就打开哪个。 工作流-基础 使用RStudio 快捷键:Alt+-(Alt 加上减号...