20190630 更新:优化一些翻译表达,增加【太长不看】部分 原文链接:https://www.dataquest.io/blog/settingwithcopywarni...

IP属地:北京
20190630 更新:优化一些翻译表达,增加【太长不看】部分 原文链接:https://www.dataquest.io/blog/settingwithcopywarni...
如果使用基于最大似然估计的模型,模型中存在隐变量,就要用EM算法做参数估计。个人认为,理解EM算法背后的idea,远比看懂它的数学推导重要。idea会让你有一个直观的感受,从...
1 数据倾斜调优 1.1 调优概述 有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。数据倾斜调优,就是使用各种技术方...