R语言数据类型

1.字符串

1.连接字符串 - paste()函数
  • 语法说明
paste(var-1,var-2..., sep = " ", collapse = NULL)
  • 参数解释
var-1,var-2..., 表示要组合的任意数量的自变量
sep, 表示参数之间的任何分隔符。它是可选的
collapse, 用于消除两个字符串之间的空格。 但不是一个字符串的两个字内的空间
2.格式化数字和字符串 - format()函数
  • 语法说明
format(x, digits, nsmall, scientific, width, justify = c("left", "right", "centre", "none")) 
  • 参数解释
x是向量输入
digits是显示的总位数
nsmall是小数点右边的最小位数
scientific,设置为TRUE以显示科学记数法
width指示通过在开始处填充空白来显示的最小宽度
justify是字符串向左,右或中心的显示。
3.提取字符串的一部分 - substring()函数
  • 语法说明
substring(x,first,last)
  • 参数解释
x,是字符向量输入
first,是要提取的第一个字符的位置
last,是要提取的最后一个字符的位置

2.向量

1.单元素向量

R语言中所有变量都以向量的方式储存,所以单个输入即为单元素向量

2.多元素向量
  • 实现方式一:使用冒号
v <- 5:13
print(v)
[1]  5  6  7  8  9 10 11 12 13
  • 实现方式二:使用Seq()函数
print(seq(5, 9, by = 0.4))
[1] 5.0 5.4 5.8 6.2 6.6 7.0 7.4 7.8 8.2 8.6 9.0
  • 实现方式三:使用C()函数
s <- c('apple','red',5,TRUE)
print(s)
[1] "apple" "red"   "5"     "TRUE" 
3.访问向量元素
  • 访问向量元素时,用[]建立索引,索引从"1"开始
    代码示例:
t = c(1,2,3,4,5,6,7,8,9)
a = t[2]
b = t[c(1,3)]

代码输出

[1] 2
[2] 1,3
  • 索引中负值对应元素会被丢弃
#代码示例
c = t[-1,-5]
#代码输出
[1] 2,3,4,6,7,8,9
  • 使用TRUE,FALSE,0,1亦可建立索引
d = t[0,0,0,0,0,0,0,1]
[1] 9
4.向量操作
  • 向量运算:两向量可以进行加减乘除运算,直接使用运算符号即可(长度不一样的两个向量运算时,较短的向量会被重复以达到相同长度)
t = c(1,2,3,4,5,6)
q = c(1, 2)
#运算时 q = (1,2,1,2,1,2)
  • 向量元素排序:排序函数 sort()
sort(x, decreasing = FALSE)

3.列表

1.创建列表

创建列表使用 list()函数,列表可以包含字符串,数字,向量,布尔值等

list_data = list('red','green',1,2)
#输出结果
[[1]]
[1] "red"

[[2]]
[1] "green"

[[3]]
[1] 1

[[4]]
[1] 2
2.命名列表元素

R语言中的列表可以重命名以便访问,使用 names()函数,同时命名多个列表元素时,可以用 向量 传入参数

names(list_data) <- c("1st Quarter", "A_Matrix", "A Inner list")
3.访问列表元素

访问列表元素可以使用索引,对于已命名元素,也可以使用名称访问元素

#使用索引访问
list_data[1]
#使用名称访问
list_data$NAME
4.操作列表元素
  • 删除元素:列表元素删除操作,即将该元素标记为 NULL
ld[5] = NULL
  • 更新元素:更新元素可以直接使用索引替换
ld[2] = 1
5.合并列表

合并列表可以使用 c()函数 合并列表

list.merged = c(list_1,list_2)
#输出结果【list_1 = c(1,2,3,4)  list_2 = c(4,5,6,7)】
[1] 1 2 3 4 4 5 6 7
6.将列表转换为向量

使用 unlist()函数 可以将列表转换为向量

4.矩阵

1.创建矩阵

创建矩阵使用 matrix()函数 ,函数参数为:

matrix(data, nrow, ncol, byrow, dimnames)

函数的参数说明:

  • data 是成为矩阵的数据元素的输入向量。
  • nrow 是要创建的行数。
  • ncol 是要创建的列数。
  • byrow 是一个逻辑线索。 如果为TRUE,则输入向量元素按行排列。
  • dimname 是分配给行和列的名称,行列的名称用向量传入,c(rowname_list,colname_list)
2.访问矩阵元素

访问矩阵元素,可以使用矩阵索引

  • 访问具体元素:M[row_n,col_n]
  • 访问某行元素:M[row_n,]
  • 访问某列元素:M[,col_n]
3.矩阵计算

矩阵计算使用运算符合和函数,要求矩阵行列相等

5.数组

数组常用于储存多维数据,数组仅接受数值输入

1.创建数组

创建数组使用 array()函数

array(data = NA, dim = length(data), dimnames = NULL)
  • data,表示输入数据,一般使用多维向量输入,如 c(vector_1,vector_2)
  • dim,表示数组的维度,输入为向量,如 c(row_n,col_n,dim_n)
  • dimnames,表示数组的维度名称,输入同样为向量
2.访问数组元素

访问数组元素主要使用索引

  • 访问具体元素:A[row_n,col_n,dim_n]
  • 访问某行元素:A[row_n,,dim_n]
  • 访问某列元素:A[,col_n,dim_n]
  • 访问某维元素:A[,,dim_n]
3.跨数组元素的计算

apply()函数可用于操作跨数组元素进行计算,其语法为:

apply(x, data, function)
  • x,表示操作的矩阵
  • data,表示用于操作的矩阵的维度,"1"表示对行进行操作;"2"表示对列进行操作
  • function,表示用于操作的函数
示例
a<-matrix(1:12,nrow=3)
apply(a,2,mean)
#输出结果
[1]  2  5  8 11

6.因子

因子是R语言中比较特别的数据类型,主要用于储存"类别"数据.R把表示分类的数据称为因子

  • 因子是一个向量,通常情况下,每个元素都是字符类型,也有其他类型数据
  • 因子具有因子水平,用于限制因子的取值范围
1.创建因子

通常情况下,R隐式把数据类型为字符的列创建为因子,因为R会把文本类型自动识别为类别数据,并自动转化为因子,但同时也可以通过 factor()函数 显式创建,语法如下:

factor(x = character(), levels, labels = levels,
       exclude = NA, ordered = is.ordered(x), nmax = NA)
  • x,表示用于创建因子的字符
  • levels,是水平的标签,字符类型,用于对水平添加标签,相当于对因子水平重命名
  • ordered,逻辑值,用于指定水平是否有序
  • nmax,水平的上限数量
2.因子水平
  • 查看因子水平:使用 levels(factor) 查看
  • 因子水平的标签:使用 factor()函数 创建因子时,可以通过 lables 参数为 因子水平 添加标签
 sex=factor(c('f','m','f','f','m'),levels=c('f','m'),labels=c('female','male'),ordered=TRUE)

7.数据帧

数据帧是表或二维矩阵列状结构,每一列包含一个变量的值,并且每一行包含来自每一列的一组值

  • 列名称应为非空
  • 行名称应该是唯一的
  • 存储在数据帧中的数据可以是数字,因子或字符类型
  • 每个列应包含相同数量的数据项
1.创建数据帧

创建数据帧需要使用 data.frame()函数 ,其语法如下

data.frame(data, row.names = NULL, check.rows = FALSE,
           check.names = TRUE, fix.empty.names = TRUE,
           stringsAsFactors = default.stringsAsFactors())

参数解释为:

  • data,表示输入数据
  • row.names,NULL或单个整数或字符串,指定某列用作行名,或者一个字符或整型向量用作数据帧的行名
  • check.rows:,如果是TRUE,那么就检查行长度和名称是否一致性
2.从数据帧中提取数据
  • 使用列名称提取数据,使用示例:
data_cut <- data.frame(emp.data$name_1,emp.data$name_2)
  • 使用切片方式提取数据,使用示例:
#提取行数据
data_cut <- emp.data[1:2,]
#提取列数据
data_cut <- emp.data[,2:3]
3.扩展数据帧
  • 添加列:直接使用 列名称 即可添加数据,示例如下:
emp.data$new_col = c('向量')
  • 添加行:一般需要使用 rbind()函数
    创建同样的dataframe并使用该函数合并两者
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,529评论 5 475
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,015评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,409评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,385评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,387评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,466评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,880评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,528评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,727评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,528评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,602评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,302评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,873评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,890评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,132评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,777评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,310评论 2 342

推荐阅读更多精彩内容

  • 通常,在使用任何编程语言进行编程时,需要使用各种变量来存储各种信息。变量只是保留值的存储位置。这意味着,当你创建一...
    D_MarsD阅读 901评论 0 0
  • 数据类型变量不会声明为某种数据类型。 变量分配有R对象,R对象的数据类型变为变量的数据类型常用R对象类型矢量列表矩...
    yuanyb阅读 684评论 0 0
  • 注意 在R中尽量使用 <- 进行赋值, <- 更标准。在R中使用 = 进行赋值可能会出现错误(有些函数会将其解释为...
    芒果芭乐阅读 10,748评论 2 7
  • 1)这本书为什么值得看: Python语言描述,如果学的Python用这本书学数据结构更合适 2016年出版,内容...
    孙怀阔阅读 12,428评论 0 15
  • 《R语言入门》的读书笔记 本书的重点内容及感悟: 第一章 导言 1、R是一个有着统计分析功能及强大作图功能的软件系...
    格式化_001阅读 12,578评论 0 9