R 中的向量要求元素都为同一类型,而列表不一样,列表可以组合不同类型的元素,类似于 Python 中的字典。
创建列表 list()
存储一个员工的姓名,薪资,是否为工会成员:
> j <- list(name="Joe", salary=55000, union=T)
> j
$name
[1] "Joe"
$salary
[1] 55000
$union
[1] TRUE
> # 有多种访问列表元素的方式,$/[[ ]] 都可以
> j$salary
[1] 55000
> # 标签 tag 也可以简写,只要不引起歧义,R 都可以识别
> j$sal
[1] 55000
> j[["salary"]]
[1] 55000
> # 也可以用数字索引的方式
> j[[2]]
[1] 55000
> # 列表也是一种向量,可以用以下方式创建
> z <- vector(mode="list")
> z[["abc"]] <- 3
> z
$abc
[1] 3
访问列表 lst 中的组件 c 的三种方法,返回的是 c 的数据类型:
- lst$c
- lst[["c"]]
- lst[[i]] i 是组件 c 在 lst 中的数字索引
与后两种方法类似的列表操作还有:
- lst["c"]
- lst[i]
这两种操作返回的是一个新列表,是原列表的子列表。
列表索引单中括号与双重中括号的区别:
> j[1:2]
$name
[1] "Joe"
$salary
[1] 55000
> j2 <- j[2]
> j2
$salary
[1] 55000
> class(j2)
[1] "list"
> str(j2)
List of 1
$ salary: num 55000
> j3 <- j[[2]]
> j3
[1] 55000
> class(j3)
[1] "numeric"
> str(j3)
num 55000
> # 双重中括号一次只能取一个列表组件
> j[[1:2]]
Error in j[[1:2]] : 下标出界
用单中括号对原列表取子集,返回子列表,用双重中括号取原列表组件,返回的是组件本身的类型,而不是列表。
增加或删除列表元素
列表创建之后可以增加新的组件,删除某个组件时将其重新赋值为 NULL 即可,删除一个组件之后,它之后的元素索引全部减 1:
> z <- list(a="abc",b=1)
> z
$a
[1] "abc"
$b
[1] 1
> z$c <- "test"
> z
$a
[1] "abc"
$b
[1] 1
$c
[1] "test"
> z[[4]] <- 123
> z
$a
[1] "abc"
$b
[1] 1
$c
[1] "test"
[[4]]
[1] 123
> z$b <- NULL
> z
$a
[1] "abc"
$c
[1] "test"
[[3]]
[1] 123
> # 用 c() 连接函数合并两个列表
> c(z,list(500))
$a
[1] "abc"
$c
[1] "test"
[[3]]
[1] 123
[[4]]
[1] 500
访问列表元素和值
names() 函数可直接获取列表各元素的名字,unlist() 函数去列表化,也可以得到列表各元素的值:
> j
$name
[1] "Joe"
$salary
[1] 55000
$union
[1] TRUE
> names(j)
[1] "name" "salary" "union"
> j[["name"]]
[1] "Joe"
> unj <- unlist(j)
> unj
name salary union
"Joe" "55000" "TRUE"
> class(unj)
[1] "character"
> unname(unj)
[1] "Joe" "55000" "TRUE"
unlist() 去列表化时,如果列表中元素类型不同,会转为可以最大限度保持不同组件特性的类型,例如本例中的字符串。
unname() 函数可以去除 unlist() 得到的向量的元素名字。
对列表使用 apply 函数
lapply() 就是 list apply,对列表作用的 apply 函数,得到的结果也是一个列表。
sapply() 就是 simplified apply,得到矩阵或向量形式的结果。
> L <- list(1:3,25:29)
> L
[[1]]
[1] 1 2 3
[[2]]
[1] 25 26 27 28 29
> lapply(L,median)
[[1]]
[1] 2
[[2]]
[1] 27
> sapply(L,median)
[1] 2 27
order() 函数对向量排序,返回的是排序后向量在原向量中的索引:
> x <- c(12,5,13,8)
> order(x)
[1] 2 4 1 3
> sort(x)
[1] 5 8 12 13
sort() 函数返回排序后的向量。
递归列表
列表可以是递归的,即列表的组件也是列表。
连接函数 c() 有一个可选参数 recursive 决定在拼接的时候是否把原列表压平,就是把所有组件的元素提取出来组成一个向量。
> list(a=1,b=2,c=list(d=5,e=9))
$a
[1] 1
$b
[1] 2
$c
$c$d
[1] 5
$c$e
[1] 9
> c(list(a=1,b=2,c=list(d=5,e=9)),recursive=T)
a b c.d c.e
1 2 5 9