本书是阿里巴巴分享描述了按照其公司业务的一些大数据技术实施的方案,是阿里巴巴对大数据的认知。其中也有很多值得学习的资料。 本书分为数据技术篇、数据模型篇、数据管理篇、数据应用...
数据分析简述: 数据分析分类及作用: 分类:描述性分析,探索性分析,验证性分析 作用:现状分析,原因分析,预测分析 数据分析六步曲: 明确分析思路-数据收集-数据处理...
最近发觉老是被别人问一个问题,“如何说服老板花大价钱上价格昂贵的大数据?”。 确实也是啊,我们的商务智能感觉上就是一个报表系统,基本上就是为了满足业务基层所做的事情;而就算我...
本文主要描述在mac系统下如何从安装到实现python到mysql的连接,并解决乱码问题。 整体流程(mac 自带python不用安装): 1、安装mysql(这里就直接发大...
因为之前平台部署的hive下的元数据是放在mysql中的,而mysql由设置了为了拉丁文,导致元数据都是乱码的。 于是开始了更新计划,办法就是用svn中的建表语句,提取出来写...
逛书店的时候,无意间留意到展柜有本书《程序员必读的职业规划书》,还是李开复推荐的。 鉴于之前他推荐的《IT创业疯魔史》也是挺有意思的书。对这本未解封的书就产生了兴趣。于是买下...
写这篇文章是为了某些特殊原因,另外也算是给自己过往的学到的经历总结一下吧。提纲是列好了,但是到真正写的时候才知道是多么乏力。尽管平时思路也还算清晰,说得也头头是道。但是要总结...
由于项目需要获取(本季度的的发生额总和)/(本季度经历的天数)的数据(还有月均,年均的数据)。 判断季度的时候是一个难点,开始的时候写了一堆case when 来判断月份,后...
基于python函数的udf日期处理函数 1、基于最近在学习python,就是试试用python进行一下的日期处理udf函数的输出,亲测可以上传去到hive中使用。后面开始学...
UDF函数:客户连续三天经营判断方法的趣味实现。 最近有同事问了我一个关于数据处理的面试题,“如何在一张业务数据表中判断客户是否连续经营了三天”。当时给出的答案是如果是增量计...