统计软件Titanic课堂作业
1.朴素贝叶斯
贝叶斯统计:支持度&置信度
有原理&手写实现:
有实例+词云&e1061R包实现:
(可能是R的自带包)案例+实现:
另外一个常用包(klaR):
朴素贝叶斯分类——R语言e1071 and klaR包初体验
2.列联表的运用
(混淆矩阵)
3.Others
ifelse判断语句:
iflelse(y%in%z,which(y==z,0) ##若y值包含在z值中,输出对应位置,否则输出0
选取数据框中的列:
titanic[,c("Survived","Sex")]
一个判断语句:
titanic$Child[titanic$Age<18]<-1
ROC曲线:
二分类模型的评价问题(查准率查全率&调和平均数)
年龄age有缺失值
线性回归
逻辑回归
决策树
SVM
朴素贝叶斯
K最近邻算法
K均值算法
随机森林算法
降维算法
Gradient Boost 和 Adaboost 算法
统计软件Customer个人作业(2)
1.偏度系数&峰度系数的计算
2.添加正态分布密度曲线&核密度曲线
核密度:
3.图例的设置
4.箱线图的绘制
5.复式直方图的绘制