火山日常啰嗦学习了一些大数据的相关框架后,发现应用层的东西确实不难,真正难的都是底层原理,所以我查看了很多资料,借鉴了前人的方法再加上自己的理解,写下了这篇文章。 数据倾斜的...

火山日常啰嗦学习了一些大数据的相关框架后,发现应用层的东西确实不难,真正难的都是底层原理,所以我查看了很多资料,借鉴了前人的方法再加上自己的理解,写下了这篇文章。 数据倾斜的...
1、特征工程是什么 有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的...
hive 中使用grouping SETS时遇见对坑 :hive报错 Grouping sets aggregations (with rollups or cubes) a...
数据仓库简介 一:什么是数据仓库 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略...
1.在informatic 使用过程中我们有时候需要一个动态的变量去作为一个判断的条件。在使用过程中自己使用的经历如下 1.1首先我们需要要创建一个变量: 在这里不得不提醒一...
1. 明天我就要结婚了,新郎是高大帅气又多金的宏。因为父母的关系,我们从小便认识,青梅竹马 两小无猜。 然,我们并没有爱的轰轰烈烈,有的不过是心心相惜罢了。 我一直以为,自己...