想老大怀恋当初凌晨1点睡觉5点30起床地铁背书的时光。小漾问了我很多次重学课程吗?我说不学没时间,直到周末我迫切的想学习课程;去年他问我还写总结吗、会认真写总结吗————不挺的敷衍,现在自己主动会写总结了。计划好好写一年的总结:
学习的内容以及如何学以致用
遇见的问题以及解决方案
制定目标每天学习4小时
感谢在团队遇见所有的人,以后会去见学长和29期的哥们
目前还没进入数据分析行业,后来在慢慢的学习不断的交流中发现分析能力很重要,得有自己的思维。关于思维的训练想到了学以致用,如果学以致用“背”,用的时候才能用的好。
……
……
总之不喜欢以前的自己,还好自己找到的目标。期间有因为没制定计划导致无限的拖延,想让老大给自己答疑一下,哈哈
还记得当初写总结的时候就是不断的抄课程,在提炼关键词以及写几行自己对课程的理解
一、今日学习
1、 总体和样本的估计
2、 置信区间
二、具体内容
《总体和样本的估计》
目的:通过样本了解总体,如何通过总体了解样本
点估计量:通过样本估计总体统计量的最佳猜测值
样本均值与总体均值:我们无法通过样本求出总体均值的确切数值,不过只要样本是无偏的就能得出十分接近的估计值。
我们可以利用样本数据求出(点估计值),但无法求出u本身的数值
案例1:利用样本数据估计总体均值的数据
(总体均值的良好估计)
案例2:利用样本数据估计总体方差
方差:度量数值与均值的偏离程度。分母用n – 1
案例3:样本的比例作为总体比例的点估计量
样本比例是对总体比例的具体数值的最好的猜测
案例4:根据总体比例求样本比例。样本比例的均值和方差()
需要连续修正1/2n
案例5:根据总体均值求样本均值。样本均值的平均数和方差
小结:无论是样本数据求总体统计量,还是根据总体求样本。需要理解二项分布、正态分布的判断和定义,以此判断抽样属于何种分布。会球均值和方差
更多时候自己在运用的时候还是会翻书、现在是了解概念(可能中间有错误的地方、希望可以帮忙指出、谢谢!)
《置信区间》
点估计量是我们有可能给出的总体统计量的最佳估计。点估计量虽然有价值但是也存在小小的误差。置信区间的作用就是减少误差。
求解置信区间的四步:
1、 选择总体统计量
2、 求出其抽样分布(如:正态分布、t分布、二项分布)
3、 决定置信水平(如:99%、95%、90%)
4、 求出置信上下限
记住公式就OK
在学习上面有很大的问题没有明确的计划。统计学都看了10天(无语),明天学完假设检验就总结统计学。
20190205春节,20190220大年十五。学习计划
1212—1213统计学假设检验、总结
1213—1231 r语言。基本的命令用法和数据分析包
(期间要分析抱团学习的数据累计7小时左右)
2019年
0101—0107 爬虫(相关学习视频还没有)
0108—0208练习项目:4周+早上背书(2W+字背2遍)
过年期间把excel学习了。
待列入计划:机器学习模型的了解、EXCEL、看书《数据化管理》、背部分专业知识2万字(感觉2万字也很少)【内容还没找到】。每天学习时间至少4.5小时。
小目标:一年持续写总结,每天800+
明日计划
1、 早上5:50起床
2、 统计学假设检验。总结统计学三分之一内容
3、 学习时间4.5h
4、 完善学习计划1213—1231