
做数据分析许久了, 简单写写比赛的数据分析项目思路一 使用逻辑回归/随机森林等对kaggle比赛项目 "给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存"进行简单的数据分析...
说实话,不喜欢用博客园的编辑器,是在是太low了。虽然博客园的文章一旦写出来,还是好看,至少在技术博客方面是这样。但我还是决定来简书写技术博客,虽然简书上可能阅读量会比较小,...
相关性是变量之间的数学关系,但不意味着因果性线性回归法是计算最佳拟合线的一种方法两变量之间可能不是线性的在样本数据区间内,最佳拟合线能做出估计,但超出范围的毫无把握 如何判断...
样本均值、比例等于总体均值、比例的点估计量,这是无偏样本最可能的情况。但是这一情况仍有可能是错误的,因为毕竟是一个样本的结果。置信区间:总体统计量在某一区间内的可信程度,这一...
1.通过样本估计总体: 2.已知总体参数,求样本的比例抽样分布和样本均值抽样分布,进而求出样本某一比例范围或均值范围的概率:
卡方分布也是假设检验的一种方法,利用卡方分布来检验观察频数与期望频数之间的差异大小是否显著主要用途有:1.检验观察频数与某一概率分布的拟合优度2.检验两个事件是否独立 一:检...
一句话描述假设检验的原理为:假定原假设成立,计算检验结果及更差情况的概率,若这一概率很小(小于显著性水平),则认为原假设为假。 一:假设检验基本步骤: 1.确定原假设,备择假...
我来答下磊叔【数据分析面试30题】专栏的小作业。 题目:微信日某一日的用户上亿,你如何算出这一日的男女比例?解题思路:上亿的数据量,硬件人力软件时间都配齐肯定能算出来,但这明...
知乎上学了磊叔【知乎作者:徐小磊】的数据分析方法论,我来交作业了本文目标:练习数据分析的七剑法 有这样一份数据,数值代表日活跃用户: 15个连续时间的数据,日活用户时高时低,...
【写在开头】自从开始数据分析的学习,看了很多莎爷[简书作者:邓莎]的文章,深受启发,非常感谢。我也坚信写作是为了更好地总结与分享。 从Kesci上下载了一份数据集——五大城市...