一、描述性统计分析
基本描述性统计
- summary( ) 比fivenum 多一个均值
- fivenum( ) 最大最小值外加三个分位数
- Hmisc::describe( ) 变量和观测的数目,缺失值、唯一值的数目,均值,分位数,5个最大值,5个最小值
- pastecs:: stat.desc ( x, basic=TRUE, desc=TRUE, norm=FALSE, p=0.95) 此函数非常强大 令norm=TRUE,返回正太分布统计量,包括偏度,峰度,和Shapiro-Wilk正态检验结果。
- psych:: describe( ) 偏度,峰度等等,很全
分组描述性统计
- aggregate( data, by=list( ), fun)
- by(data, INDICES, fun) 其中INDICES是一个因子或y因子组成的列表
- doBy::summaryBy( formula, data=dataframe, fun) formula的格式为:
var1+var2+... ~ groupvar1+groupvar2+...
- psych::describe.by( data, 分组变量) 返回观测数,均值,标准差,中位数,截尾均值,绝对中位差,最小值,最大值,值域,偏度,峰度