开始时间:2018.3.30
部分1 欢迎学习机器学习 2018.3.30
机器学习简介、配置Anaconda、配置Jupyter notebook、项目0泰坦尼克号生还者分析
什么是机器学习
决策树、朴素贝叶斯、梯度下降、线性回归、对数几率回归、支持向量机、核函数、神经网络、K均值聚类、层次聚类
部分2 机器学习基础 2018.4.1
模型评估和验证简介、数据的中心、数据的差异性、监督学习简介、朴素贝叶斯上手、贝叶斯规则
数据的中心、差异性
均值、众数、中位数、值域、IQR、方差、标准偏差、样本标准偏差、贝塞尔校正
- 异常值:
IQR = Q3 - Q1
Outlier < Q1 - 1.5 (IQR)
Outlier > Q3 - 1.5 (IQR) - 贝塞尔校正
针对样本标准偏差,除以(n-1),偏差增大,以符合实际情况
朴素贝叶斯
- scikit-learn
- GaussianNB
支持向量机
- 间隔:分隔距离最近点的距离
- 先考虑分类正确,再考虑间隔最大化