R语言之书笔记:常见的概率分布

常见的概率质量函数:离散变量的概率分布

  • 伯努利分布

两种可能结果的离散随机变量概率分布,失败是0,成功是1,p是成功的概率。

  1. 伯努利分布函数:


    伯努利分布函数
  2. 平均值和方差:


    伯努利分布均值和方差
  • 二项分布
    n次伯努利试验中成功次数服从的分布。
  1. 二项分布函数:


    二项分布函数
  2. 平均值和方差:


    二项分布平均值和方差
  3. dbinorm(),pbinom(),qbinom(),rbinom()

dbinorm():提供任何有效x的概率质量函数

dbinom(x=5,size=8,prob=1/6) # 掷骰子8次,得到5次4点的结果的概率
X.prob <- dbinom(x=0:8,size=8,prob=1/6)# 掷骰子8次,得到0-8次4点的结果的概率
X.prob
sum(X.prob) # 所有可能结果概率的和为1
round(X.prob,3)
8/6 # 可能结果的平均值
8*(1/6)*(5/6) # 可能结果的方差
# 绘制相应的概率质量函数:
barplot(X.prob,names.arg=0:8,space=0,xlab="x",ylab="Pr(X = x)")

pbinom():提供累积概率分布,求结果成功q次及q次以下的累积概率,给定分位数值q,输出累积概率p

sum(dbinom(x=0:3,size=8,prob=1/6)) # 
pbinom(q=3,size=8,prob=1/6)
#
1-pbinom(q=2,size=8,prob=1/6) # 因为总概率是1,所有这是求结果成功2次以上的概率

qbinom():累积概率分布的逆(pbinom()的逆),给定累积概率p,输出分位数值q

qbinom(p=0.95,size=8,prob=1/6)

rbinom():产生n个服从二项分布的随机数

rbinom(n=1,size=8,prob=1/6)
rbinom(n=1,size=8,prob=1/6)
rbinom(n=1,size=8,prob=1/6)
rbinom(n=3,size=8,prob=1/6)
  • 泊松分布
    ** 计数的实体、特征或事件在定义的时间间隔中以恒定的速率独立发生。
  1. 泊松分布函数


    泊松分布函数
  2. 平均值和方差


    泊松分布函数均值和方差

3.dpois(),ppois(),qpois(),rpois()

dpois(x=3,lambda=3.22) # 均值为3.22的泊松分布,取值为3时的概率
dpois(x=0,lambda=3.22) # 均值为3.22的泊松分布,取值为0时的概率
round(dpois(0:10,3.22),3) # 均值为3.22的泊松分布,取值为0-10时的概率
(3.22^3*exp(-3.22))/prod(3:1) # 手动计算均值为3.22的泊松分布,取值为3时的概率
barplot(dpois(x=0:10,lambda=3.22),ylim=c(0,0.25),space=0,names.arg=0:10,ylab="Pr(X=x)",xlab="x")
#画出均值为3.22的泊松分布的质量分布图

ppois(q=2,lambda=3.22) #取值为2的左侧累积概率
1-ppois(q=5,lambda=3.22) #取值为5的右侧累积概率
barplot(ppois(q=0:10,lambda=3.22),ylim=0:1,space=0,names.arg=0:10,ylab="Pr(X<=x)",xlab="x")
#画出均值为3.22的泊松分布的累积概率条形图

# qpois()是ppois()函数的逆

rpois(n=15,lambda=3.22) # 生成15个服从均值为3.22的泊松分布的随机数

  • 其他质量函数
    几何分布(geometric):dgeom(),pgeom(), qgeom(), rgeom()
    负二项分布(negative binominal): dnbiom(),pnbiom(), qnbiom(), rnbiom()
    超几何分布(hypergeometric):dhyper(),phyper(), qhyper(), rhyper()
    多项分布(multinominal):dmultinom(), rmultinom()

常见的概率密度函数:连续变量的概率分布

  • 均匀分布
    取值范围内概率保持不变
  1. 均匀分布函数


    均匀分布函数
  1. 均值和方差


    均匀分布均值和方差
  2. dunif(), punif(), qunif(), runif()

1/(0.41-0.223) # 手动计算取值范围为0.41-0.223之间的均匀分布的高度
#
dunif(x=c(-2,-0.33,0,0.5,1.05,1.2),min=-0.4,max=1.1) # 取值范围区间内的高度相同,区间之外是零
#
dunif(x=c(0.3,0,0.41),min=0.223,max=0.41) # 取值范围区间内的高度相同,区间之外是零
#
a1 <- -4/10
b1 <- 11/10
unif1 <- 1/(b1-a1)
plot(c(a1,b1),rep(unif1,2),type="o",pch=19,xlim=c(a1-1/10,b1+1/10),ylim=c(0,0.75),ylab="f(x)",xlab="x")
abline(h=0,lty=2)
segments(c(a1-2,b1+2,a1,b1),rep(0,4),rep(c(a1,b1),2),rep(c(0,unif1),each=2),lty=rep(1:2,each=2))
points(c(a1,b1),c(0,0))
#
segments(c(-0.21,0.6),c(0,0),c(-0.21,0.6),rep(unif1,2),lty=3)
#
polygon(rbind(c(a1,0),c(a1,unif1),c(-0.21,unif1),c(-0.21,0)),col="gray",border=NA)
#画出均匀分布密度函数图

punif(q=-0.21,min=a1,max=b1) # 取值为-0.21的左侧累积概率
#
1-punif(q=0.6,min=a1,max=b1)# 取值为0.6的右侧累积概率
#
punif(q=0.6,min=a1,max=b1) - punif(q=-0.21,min=a1,max=b1)# 取值为-0.21到0.6之间的概率
#
qunif(p=0.1266667,min=a1,max=b1) #累积概率为0.1266667的分位数值
qunif(p=1-1/3,min=a1,max=b1)# 累积概率为2/3的分位数值
#
runif(n=10,min=a1,max=b1) # 生成10个服从取值在a1到b1之间的均匀分布的随机数
  • 正态分布
    也称为高斯分布,钟形曲线为特征
  1. 正态分布密度函数


    正态分布密度函数

    标准正态分布密度函数
  2. 均值和方差
    正态分布有两个参数,即期望(均数)μ和标准差σ,σ2为方差,均值为0,标准差为1时为标准正态分布

  3. dnorm(), pnorm(), qnorm(), rnorm()

  • 学生t分布
    t分布看起来很像标准正态分布,两者的区别在于正态分布通常用于处理总体,t分布用于处理来自总体的样本
    随着自由度趋向无穷大,t密度将渐渐接近标准正态密度。自由度(df)是给定统计量的计算中自由改变的单个元素数量。

dt(), pt(), qt(), rt()

  • 指数分布
  1. 指数分布密度函数


    指数分布密度函数
  2. 均值和方差


    指数分布均值和方差
  3. dexp(), pexp(),qexp(), rexp()


xvals <- seq(0,10,length=200)
plot(xvals,dexp(x=xvals,rate=1.65),xlim=c(0,8),ylim=c(0,1.65),type="l",xlab="x",ylab="f(x)")
lines(xvals,dexp(x=xvals,rate=1),lty=2)
lines(xvals,dexp(x=xvals,rate=0.4),lty=3)
abline(v=0,col="gray")
abline(h=0,col="gray")
legend("topright",legend=c("EXP(1.65)","EXP(1)","EXP(0.4)"),lty=1:3)
lambda.e <- 107/120
lambda.e
1-pexp(q=2.5,rate=lambda.e)
pexp(25/60,lambda.e)
qexp(p=0.15,lambda.e)
  • 其他密度函数
    卡方分布:模拟正态变量平方和,dchisq(), pchisq(),qchisq(),rchisq()
    F分布:模拟两个卡方分布随机变量的比率,df(), pf(),qf(),rf()
    伽马分布:是指数分布和卡方分布的一般化,dgamma(), pgamma(),qgamma(),rgamma()
    贝塔分布:通常用于贝叶斯建模,dbeta(), pbeta(),qbeta(),rbeta()
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,529评论 5 475
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,015评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,409评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,385评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,387评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,466评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,880评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,528评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,727评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,528评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,602评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,302评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,873评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,890评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,132评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,777评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,310评论 2 342

推荐阅读更多精彩内容