1. 样本
-
样本总体:
考察的对象的全体。 -
样本个体:
总体中的每一个考察的对象。 -
样本:
总体中所抽取的一部分个体。 -
样本容量:
样本中个体的数目。 -
样本空间:
也称事件空间,随机事件E的所有基本结果组成的集合为E的样本空间。样本空间的元素 称为样本点或基本事件。例如:设[随机试验]E为“抛一颗骰子,观察出现的点数”。那么E的样本空间 S:{1,2,3,4,5,6,}。
2. 概率
-
条件概率
概率是对随机事件发生的可能性的度量。P(A)表示样本空间中事件A发生的概率。
上式为条件概率公式,表示事件B发生的情况下事件A发生的概率,也称后验概率。
-
全概率公式
公式描述:公式表示若事件A1,A2,…,An构成一个完备事件组且都有正概率,则对任意一个事件B都有公式成立。
-
贝叶斯定理
3. 随机变量
-
随机变量定义
随机变量是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。它是由于随机而获得的非确定值,是概率中的一个基本概念。 -
随机变量的类型
1. 离散型随机变量:在一定区间内变量取值为有限个,或数值可以一一列举出来。例如某地区某年人口的出生数、死亡数等。
2. 连续型随机变量:在一定区间内变量取值有无限个,或数值无法一一列举出来。例如某地区男性健康成人的身高、体重等。
4. 离散随机变量概率分布
-
0—1分布
表格直观表示:
X | 0 | 1 |
---|---|---|
P | 1-p | p |
-
二项分布
二项分布是指统计变量中只有性质不同的两项群体的概率分布。所谓两项群体是按两种不同性质划分的统计变量,是二项试验的结果。即各个变量都可归为两个不同性质中的一个,两个观测值是对立的。
上式表示在n次试验中有k次成功,每次成功的概率为p。也可表示为b(k; n, p)。其期望与方差分别为np和np(1-p)。值得一提的是,上面的0-1分布是n=1时的二项分布。
-
泊松分布
泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。 泊松分布适合于描述单位时间内随机事件发生的次数。
当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。通常当n≧10,p≦0.1时,就可以用泊松公式近似得计算。泊松分布的期望和方差都为λ。
5. 连续随机变量概率密度函数
-
均匀分布
设连续型随机变量X的概率密度函数为
则称随机变量X服从(a, b)上的均匀分布,记为X~U(a, b)。易知,f(x) >= 0,且其期望值为(a+b)/2,方差为(b-a)^2/12。
指数分布
****指数分布****是指如果一个随机变量呈指数分布,当s,t≥0时有P(T>s+t|T>t)=P(T>s)。指数函数的一个重要特征是无记忆性。例如,T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。期望为1/λ,方差为(1/λ)^2。
-
正态分布
若随机变量X服从一个位置参数为μ 、尺度参数为σ的概率分布,且其概率密度函数为
则这个随机变量就称为正态随机变量,正态随机变量服从的分布就 称为正态分布。