随机变量和随机事件的区别
- 随机事件是样本点的集合
- 随机变量是将每个样本点映射成了一个唯一确定的数,广义上讲是随机现象各种可能结果的变量。
离散型随机变量
- 随机变量的值是有限多个,或者是无限可数个。
- 无限可数: 能和自然数集一一对应的集合,虽然数目无限,但是每一个特定的元素都对应一个自然数。
- 离散型随机变量要满足两个条件,设随机变量X可能取值为a1.....an(1)P(X=ai) >=0;(2)P(X=a1) + .....+ P(X=an)=1
重复独立实验
- 每次实验彼此独立
- 每个事件的P在每次实验中不变
- 伯努利实验:只有两种结果的重复独立实验
两点分布
只进行一次伯努利实验,结果只有两种,也叫伯努利分布
二项分布
- n次伯努利实验,A发生的概率为p,计算A出现k次的概率,(k=0,1,....k,....n)。
- A出现k次的概率记为B(k,n,p),其中k代表k次,n代表总共进行n次实验,p代表每次实验A发生的概率。同时,每次实验A不发生的概率为q。
- B(k,n,p)=(Cnk)pkqn-k
- B(0,n,p)+B(1,n,p)+....+B(k,n,p)+...+B(n,n,p) = (Cn0)p0qn +.....+ (Cnn)pnqn-n = (p+q)n = 1.
这个式子中间两步的转化是依据二项式定理,因此称这种分布为二项分布。 -
二项式定理:
-
二项分布,n=100,p=0.9时,B(k,100,0.9)随着k的变化曲线:
- n和p固定,B(k,n,p)的最大值称为当前n和p的中心项,取最大值时的k称为最可能成功次数。
例题: 射击,500发子弹,每发子弹命中目标的概率是0.01,求最可能命中目标多少次。
典型的二项分布,求的是n=500,q=0.01时的曲线最高点。
泊松分布
- X=k时,满足概率P(X=k) = (λk / k!)e-k形式的分布为泊松分布。
- 分布律 (λ > 0)
X | 0 | 1 | ... | k | ... | n |
---|---|---|---|---|---|---|
P(X) | (λ0 / 0!)e-0 | (λ1 / 1!)e-1 | ... | (λk / k!)e-k | ... | (λn / n!)e-n |
- 泊松分布逼近二项分布:在n次伯努利实验中,P表示每次实验A出现的概率,若n×p→λ,则n→∞时,则B(k,n,p)→(λk / k!)e-k。这里要求n远大于p,这样n×p的结果大小始终。
- 泊松分布和二项分布的X的取值都是可数的,具体来说分为两种情况:(1)有限个(一定可数);(2)无限可数。
分布函数
- 连续函数不能使用分布律,因为点的个数不可数,而且连续函数在某个点概率为0。
- X是一个随机变量,x是任意实数,F(x)=P{X ≤ x} 为X的分布函数。
- 性质:(1)F(x)单调不减;(2)0 ≤ F(x) ≤ 0,F(-∞)=0,F(∞)=1;(3)F(x+0)=F(x) ,即右连续,F(x+0)代表在x这个点F(x)的右极限,左极限为F(x-0)。
连续型随机变量
-
随机变量X的分布函数为F(X),如果存在非负函数f(x),使
则称X为连续型随机变量。
- 对于∀x,P(X=x)=0。在[0,1]区间内,取到任意一个点的概率为0,只有取到某个范围才有具体的概率。
- 改变概率密度函数在有限个点处的值不会影响分布函数的取值。
约定:提到概率分布时,离散型对应分布律,连续型对应概率密度
均匀分布
- 均匀:等可能性
-
密度函数如下的分布为均匀分布。
-
分布函数
指数分布
-
密度函数
-
分布函数
- 无记忆性:P{X > s + t | X > s} = P{ X > t }
指数分布是唯一具有无记忆性的连续型随机变量分布。
几何分布
正态分布
-
密度函数:
-
图像:
在x=μ处,密度函数f(x)取得最大值。
- μ=0,σ=1时,X~N(0,1),此时正态分布为标准正态分布,记为φ(x),分布函数Φ(x)。
- 令X~N(μ,φ),令Y=(X-μ)/σ ,P(X≤Y)=Φ(X),可见Y~N(0,1)。
- Φ(-x) = 1 - Φ(x)
- 3σ法则:P{ μ - 3σ ≤ X ≤ μ + 3σ } = 0.9973.
- 分位点:求P{X ≥ α},则称α为上α分位点。因为这个概率求的是≥ α后的图像面积。