Hive用的好,才能从数据中挖掘出更多的信息来。用过hive的朋友,我想或多或少都有类似的经历:一天下来,没跑几次hive,就到下班时间了。Hive在极大数据或者数据不平衡等...
![240](https://cdn2.jianshu.io/assets/default_avatar/5-33d2da32c552b8be9a0548c7a4576607.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
IP属地:广东
Hive用的好,才能从数据中挖掘出更多的信息来。用过hive的朋友,我想或多或少都有类似的经历:一天下来,没跑几次hive,就到下班时间了。Hive在极大数据或者数据不平衡等...
2019/2/14-星期四-阴晴天 最近陆陆续续看完了网易电商数据分析师的相关课程,看完课程后的感受我的天一套一套的方法论,跟体验课说的一样这门微专业的课程偏向于理论内功心法...
分类器: 随机森林分类器(RandomForest):包含多个决策树的分类器,每一个子分类器都是一颗CART分类器。 GridSearchTV工具对模型参数进行调优: 它是p...
偏统计理论知识 1. 扑克牌54张,平均分成2份,求这2份都有2张A的概率。 M表示两个牌堆各有2个A的情况:M=4(25!25!)N表示两个牌堆完全随机的情况:N=27!2...