设E为随机试验,若对于每一个样本点e 属于Omega,都有唯一确定的实数X(e)与之对应,则称X(e)是一个随机变量,简记为X.
分布函数 F(x) = P(X <= x)
离散随机变量:如果一个随机变量X的可能取值为有限多个或者可列无穷多个,则称为是离散随机变量。设X的可能取值为{x1, x2, .....}且X=xi时的概率为P(X=xi)=pi, i = 1,2....
全部加起来和为1
F(x) = P(X <= x) = \sigma(xi <= x) P{X = xi}
数学期望 E(X) = \sigma xkpk
设X和Y为两个随机变量:E(X+Y) = E(X) + E(Y)
设随机变量X和Y独立: E(XY) = E(X)E(Y)
方差:var(X) =E((X-E(X))^2)= E(X^2) - E(X) ^2
Var(CX) = C^2 Var(X)
设X和Y互相独立,Var(X+Y) = Var(X)+Var(Y) Var(X-Y) = Var(X)+Var(Y)
一些离散分布:
伯努利分布(Bernoulli Distribution): 对于一个随机试验,如果它的样本空间只包含两个元素,e1,e2
P(X = 1) = p, P(X = 0 )=q = 1-p
E(x) = p Var(X) = p(1-p)
二项分布(Binomial Distribution):假如一个伯努利试验独立重复n次,相应的概率分布称为二项分布
假设时间成功的概率是p,则在n次伯努利实验后,A发生的次数为k次的概率为:
P(X=k) = (k,n)p^k(1-p)^(n-k)
图片来自https://zh.wikipedia.org/wiki/%E4%BA%8C%E9%A0%85%E5%88%86%E4%BD%88
因为这个公式很像我们的二项式展开:
https://zh.wikipedia.org/wiki/%E4%BA%8C%E9%A1%B9%E5%BC%8F%E5%AE%9A%E7%90%86
举例:某人进行射击,设每次射击的命中率是0.02,独立射击400次,求至少命中两次的概率
P(X=k) = (k,400)* (0.02)^k *(0.98)^(400-k)
P(X>=2) = 1 - P(X=0) - P(X=1) = 1 - 0.98^400 - 400*0.02*(0.98)^399 = 0.9972
负二项分布:在一连串的伯努利试验中,刚好在第n次试验时候出现第r次成功的概率:
P(X=n) =C (r-1, n-1) p^r *(1-p) ^(n-r)
因为最后那个n次必须是第r次成功,而前面的r-1次成功出现的地方是可以组合的
当这里的r=1时候,负二项分布退化为几何分布:
P(X=n) = (1-p)^(n-1) * p
也就是前面N-1次全都失败了,就最后第n次获得了成功
泊松分布:
其实泊松分布往往用于描述一段时间或者空间间隔的某个事件发生的频数,比如有一个区域成功次数是\lumda次,然后切成n份,那每一份就会使\lumda/n,当n十分大的时候,每份成功概率就会很小,lim(n->infinity)Binomial(n, lumda/n) = Paisson(lumda)
泰勒展开
连续随机变量:
均匀分布(Uniform Distribution):
指数函数:
正太分布:
Central Limit Thoerm:
sample mean是服从正态分布!!