R语言学习DAY01:数据对象

向量

R的特性:向量化计算,即对向量内的所有元素进行相同的运算。

  • 向量建立:
    普通向量:C()函数
    有序向量:seq(from = , to =, by =, length = , along = )函数,或者用rep(vec, times = )将指定的向量重复
    生成空向量:numeric(n)生成一个包含n个元素的数值向量

  • 向量提取:方括号索引,索引值也可以是一个向量

  • 生成随机序列
    runif(n)返回n个0-1之间均匀分布的随机数
    sample(vec, size = , replace ) 从vec向量中随机抽样

  • 向量计算
    充分利用R向量化计算的特征:

# 计算均值
vector <- runif(10)  #生成随机向量
vec_max <- max(vector)
vec_min <- min(vector)

#提取出vector中最大值和最小值以外的内容
vec_trim <- vector[vector > vec_min & vector < vec_max]
#计算平均值
vec_mean <- mean(vec_trim)
  • 向量类型的转换
    数值型转换成字符型as.character(vec)

矩阵

  • 矩阵生成
    原始生成方法:由向量转化。matrix(vec, nrow = , ncol = , byrow = ),或者直接用dim()dim()既可以返回一个矩阵的维度,也可以用于定义对象的维度,dim(vec) <- c(n,m),可以将一个向量定义为n行m列的矩阵
    向量合并方法:cbind()将向量按列合并,rbind(),将向量按行合并
  • 矩阵索引
    用二维数组[n,m]提取,如果是matrix[n,m],返回(n,m)位置上的数值,如果是matrix[n, ]返回第n行的结果
    但注意索引后就变成普通的向量了,可以加参数matrix[n,m,drop = FALSE]使得索引后仍然是一个矩阵
  • 矩阵计算
  1. 矩阵计算的特点和向量相似:对矩阵内的每个元素都进行运算
    rowSums(matrix)将矩阵按行求和
    colSums(matrix)将矩阵按列求和
    diag(matrix)返回矩阵的对角线数值
  2. 矩阵赋值:索引后直接赋值即可,或者用ifelse(object, yes, no)函数,这个函数很巧妙,如果object中的逻辑运算为真,会对整个对象都进行yes内的操作
  3. 专门矩阵的运算:t(matrix)矩阵转置,%*%矩阵乘法,solve(matrix1, matrix2)解矩阵方程组,若第二个参数没有输入,则求矩阵的逆

数据框

数据库是R中最常用的对象,数据库中不同向量的类型可以不同,列可以表示变量,行可以表示样品。

  • 数据框创建
    data.frame(vec1, vec2)注意字符型向量被创建为数据框时会自动转化成因子类型,可以通过改变参数stringAsFactors =设置
  • 数据框索引
  1. [n,m]按列数和行数索引
  2. $按列名索引
  • 数据框描述统计
    summary()对每列进行描述统计
    dim()统计维度
    head()返回前6行数据
    str()返回整个数据结构
  • 数据框排序
    order(vector, decreasing = )将向量排序,注意排序后的结果是向量的索引号,可以用此对数据框进行索引
    data[order(data$vec1, decreasing = T), ][1:2, ],将数据库按照vec1列排序后取前两行

列表

列表可以容纳任何类型和结构的数据,且无论各类数据之间的长度

  • 列表索引
    直接用数字或者元素名称索引的结果仍然是列表,如my_list[3],如果想提取内部数据对象,需要加两个方括号,如my_list[[3]]

特殊对象

缺失值与空值

一般向量中包含缺失值后,做聚合运算的结果也会是NULL,需要在参数里添加na.rm = TRUE

公式

公式的形式y~x,左侧为因变量,右侧为自变量
小技巧:生成多个自变量

n <- seq(1,50,1)
xvar <- paste0('x', n) #paste0函数,将两种字符进行拼接
right <- paste(xvar, collapse = '+') #paste函数,将字符串向量粘成一个字符串
left <- 'y~'
formula <- paste(left, right) #paste函数,将两个字符拼接
formula <- as.formula(formula) #转换成公式对象

表达式

暂缓执行表达式expression(obj) 将obj作为表达式内容存储,但不执行
执行表达式eval(obj)
当表达式以字符串形式存在时,用parse()函数解析

环境

可以理解为房间。默认的环节为全局环境

  • 创建新环境:new.env()
  • 判断环境中是否存在某变量:exist(obj, envir = )

函数

#自定义函数
myfunc <- function(r) {
  t <- mean(r)
  return(t)
}

函数内部定义的变量为局部变量,不会再全局环境中出现,但函数内部可以调用全局变量

以上即为R语言中的常见对象,其中最常用的是数据框形式(data.frame),R运算的最大特点就是可以对对象内的每个元素进行运算。下一章要学习的正是R的这一操作:向量化运算。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 193,812评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,626评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,144评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,052评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,925评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,035评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,461评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,150评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,413评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,501评论 2 307
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,277评论 1 325
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,159评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,528评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,868评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,143评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,407评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,615评论 2 335

推荐阅读更多精彩内容