t-test(参数检验)
Student's t-test 是由William Sealy Gosset 于1908年发表的统计检验方法,常用于检验样本的均值。单样本时,检验样本均值是否等于某一数值;双样本时,检验两个样本的均值是否相等。Student's t-test是我们通常所说的t-test 。
-
使用t检验时,样本必须满足以下条件:
- 两个样本需来自正态总体(可以使用Shapiro-Wilk test,Kolmogorov-Smirnov test,或者用Q-Q plot来检验正态性);
- 两个样本的方差需相等(方差齐性,可通过F-test, Levene's test, Bartlett's test 等来检验)。
配对样本(paired-sample)和独立样本(independent sample):一个对象做多次实验得到的样本,再做检验,称为配对样本;多个不同的对象做统计检验,称为独立样本。
-
样本大小:
- 对于paired-sample,样本的大小不需要考虑,因为样本大小是相同的
- 对于大小相同的两个样本,不管是方差齐或不齐,t-test 都能得到非常robust的结果;
- 对于大小不同的两个样本,当两个样本并非来自正太总体时,不管是sample-size相等或不相等,结果也都不太好。 所以t-test对于正态性是比较敏感的。
R语言函数
t.test(x, y = NULL, alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95, ...)
# 部分参数说明:
# x, y: 我们这里主要讲two-sample 检验,所以x和y两个向量都需要提供,表示两个不同的样本。
# alternative: 选择时单侧检验还是双侧检验;
# mu: 单样本检验的时候用的参数;
# paired: 是否为配对样本检验;
# var.equal: 这个参数选择是否样本方差一样,默认时方差不一样,这时候底层实现的是welch's t-test;
# 如果方差一样,选择TRUE,则底层实现的是student's t-test。
Wilcox-test(非参数检验)
- 两个独立样本的t-test是检验两个样本的均值是否相等。而相对的,两个独立样本的wilcoxon-test 则是检验两个样本的中位数,或者说两个样本的分布是否有偏移。
- wilcox检验不需要数据的正态性
- wilcoxon test在计算统计量时是先将两个样本混到一起,然后对混合后的list进行从小到大排序,根据排序把两个样本的值分别转换成排序序数,最后比较两个样本的序数的大小。如果序数大的富集在其中一个样本,表明该样本相对另一个样本的值要更大,相反亦然。
参考
https://www.jianshu.com/p/c4890fc4c2dd
https://www.jianshu.com/p/9df4af9249c2