ForgetThatNight

IP属地：四川

[转]Spark购物篮分析:关联规则挖掘
1、浅谈数据挖掘中的关联规则挖掘 2、Hadoop/MapReduce购物篮分析:关联规则挖掘 3、Spark购物篮分析过程分析:

625 0 0
中文分词之马尔可夫模型
一马尔科夫模型 • 每个状态只依赖之前有限个状态– N阶马尔科夫：依赖之前n个状态– 1阶马尔科夫（即《中文分词基础》中的二元模型）：仅仅依赖...

0.1 2435 0 1

Hive中的各种join
准备数据建表：导入数据：实验： inner join left join right join full outer join left ...

2206 0 1
Hive SQL练习
查询全体学生的学号与姓名查询选修了课程的学生姓名 ----hive的group by 和集合函数查询学生的总人数计算1号课程的学生平均成绩...

0.2 3063 0 2
Hive分桶表
测试数据创建分桶表设置变量,设置分桶为true, 设置reduce数量是分桶的数量个数加载数据检查刚刚加载的数据创建测试数据表 //结...

3050 0 0
Hive实践练习
创建表查看刚刚创建的表造测试数据加载测试数据由于是内部表上图红色路径中的元数据在drop表的同时也会被清除第一步，先求个用户的月总金额...

505 0 0
图解hadoop的高可用机制
参考文章：https://blog.csdn.net/ForgetThatNight/article/details/80009698https...

260 0 0

图解mapreduce&yarn的工作机制
YARN：资源（linux资源隔离机制：运算资源---运算程序jar/配置文件/CPU/内存/IO--从linux中开辟出诸如内存、处理器的co...

826 1 1
图解mapreduce原理全剖析
1、mapTask调用InputFormat再调用RecourReader的read()方法来读取数据，获得key、value，mapreduc...

1083 0 1