1.apply()
apply()以数据帧或矩阵作为输入,并以向量、列表或数组的形式给出输出。
apply(X, MARGIN, FUN)
x :数组或矩阵
MARGIN:取1到2之间的值或范围来定义在何处应用函数,
1:在行执行的
2:在列上执行的
c(1,2):对行和列都执行
FUN :应用哪个函数。构建的函数如mean, median, sum, min, max,也可使用用户自己定义的。例子
> data <- matrix(C<-(1:30),nrow=5)
> data
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 1 6 11 16 21 26
[2,] 2 7 12 17 22 27
[3,] 3 8 13 18 23 28
[4,] 4 9 14 19 24 29
[5,] 5 10 15 20 25 30
> apply(data, 2, sum)
[1] 15 40 65 90 115 140
> apply(data, 1, sum)
[1] 81 87 93 99 105
> apply(data, c(1,2), sum)
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 1 6 11 16 21 26
[2,] 2 7 12 17 22 27
[3,] 3 8 13 18 23 28
[4,] 4 9 14 19 24 29
[5,] 5 10 15 20 25 30
2.lapply()
lapply()(代表list apply)与矩阵的apply()函数的用法类似。其对列表对象执行操作,并返回与原始集合长度相同的列表对象。
lapply()和apply()之间的区别在于输出。lapply()的输出是一个列表。lapply()可以用于其他对象,比如数据帧和列表。
- lapply(X, FUN)
X: 向量或对象,其余对象将被通过as.list强制转换为list
FUN: 作用于x中的每个元素的函数
lapply()函数不需要参数MARGIN - 例子
> x <- list(a = 1:10, beta = exp(-3:3), logic = c(TRUE,FALSE,FALSE,TRUE))
> lapply(x, quantile, probs = 1:3/4)
$a
25% 50% 75%
3.25 5.50 7.75
$beta
25% 50% 75%
0.2516074 1.0000000 5.0536690
$logic
25% 50% 75%
0.0 0.5 1.0
3.sapply()
sapply()(代表simplified [l]apply)可以将结果整理以向量,矩阵,列表 的形式输出。
- sapply(X,FUN,…, simplify = TRUE, USE.NAMES = TRUE)
X: 向量或对象
FUN: 作用于x中每个元素的函数
simplify 逻辑值或者字符串,如果可以,结果应该被简化为向量、矩阵或者高维数组。必须是命名的,不能是简写。默认值是TRUE,若合适将会返回一个向量或者矩阵。如果simplify=”array”,结果将返回一个阵列。
USE.NAMES 逻辑值,如果为TRUE,且x没有被命名,则对x进行命名。 - 例子
#以向量输出
> sapply(x, mean)
a beta logic
5.500000 4.535125 0.500000
#以矩阵输出
> sapply(x, quantile)
a beta logic
0% 1.00 0.04978707 0.0
25% 3.25 0.25160736 0.0
50% 5.50 1.00000000 0.5
75% 7.75 5.05366896 1.0
100% 10.00 20.08553692 1.0
#以列表输出
> sapply(x, seq)
$a
[1] 1 2 3 4 5 6 7 8 9 10
$beta
[1] 1 2 3 4 5 6 7
$logic
[1] 1 2 3 4
4.vapply()
vapply()与sapply()相似,他可以预先指定的返回值类型。所以它使用起来会更加安全,有的时候会更快
在vapply函数中总是会进行简化,vapply会检测FUN的所有值是否与FUN.VALUE兼容,以使他们具有相同的长度和类型。
- vapply(X, FUN, FUN.VALUE, …, USE.NAMES = TRUE)
X: 向量或对象
FUN: 作用于x中每个元素的函数
FUN.VALUE 一个通用型向量,FUN函数返回值得模板
simplify 逻辑值或者字符串,如果可以,结果应该被简化为向量、矩阵或者高维数组。必须是命名的,不能是简写。默认值是TRUE,若合适将会返回一个向量或者矩阵。如果simplify=”array”,结果将返回一个阵列。
USE.NAMES 逻辑值,如果为TRUE,且x没有被命名,则对x进行命名。 - 例子
> sapply(x, quantile)
a beta logic
0% 1.00 0.04978707 0.0
25% 3.25 0.25160736 0.0
50% 5.50 1.00000000 0.5
75% 7.75 5.05366896 1.0
100% 10.00 20.08553692 1.0
> vapply(x, quantile, c(Min. = 0, "1st Qu." = 0, Median = 0, "3rd Qu." = 0, Max. = 0))
a beta logic
Min. 1.00 0.04978707 0.0
1st Qu. 3.25 0.25160736 0.0
Median 5.50 1.00000000 0.5
3rd Qu. 7.75 5.05366896 1.0
Max. 10.00 20.08553692 1.0
5.tapply()
tapply()为向量中的每个因子变量根据函数计算一个度量值。
- tapply(X, INDEX, FUN = NULL, …, simplify = TRUE)
X: 一个对象,通常是向量,不可以是数据框
INDEX: 一个包含因子的列表
FUN: 作用于x中每个元素的函数
simplify 若为FALSE,tapply将以列表形式返回阵列。若为TRUE,FUN则直接返回数值 - 例子
> n <- 17
> fac <- factor(rep_len(1:3, n), levels = 1:5)
> table(fac)
fac
1 2 3 4 5
6 6 5 0 0
> tapply(1:n, fac, sum)
1 2 3 4 5
51 57 45 NA NA
6.mapply()
多参数版本的sapply()。第一次计算传入各组向量的第一个元素到FUN,进行结算得到结果;第二次传入各组向量的第二个元素,得到结果;第三次传入各组向量的第三个元素…以此类推。
mapply(FUN, …, MoreArgs = NULL, SIMPLIFY = TRUE, USE.NAMES = TRUE)
MoreArgs FUN函数的其他参数列表
SIMPLIFY 逻辑或者字符串,可以减少结果成为一个向量、矩阵或者更高维阵列,详见sapply的simplify参数
USE.NAMES 逻辑值,如果第一个参数…已被命名,将使用这个字符向量作为名字例子
> mapply(rep, 1:4, 4:1,SIMPLIFY = FALSE)
[[1]]
[1] 1 1 1 1
[[2]]
[1] 2 2 2
[[3]]
[1] 3 3
[[4]]
[1] 4