1、浅谈数据挖掘中的关联规则挖掘 2、Hadoop/MapReduce购物篮分析:关联规则挖掘 3、Spark购物篮分析 过程分析:
一 马尔科夫模型 • 每个状态只依赖之前有限个状态– N阶马尔科夫:依赖之前n个状态– 1阶马尔科夫(即《中文分词基础》中的二元模型):仅仅依赖...
准备数据 建表: 导入数据: 实验: inner join left join right join full outer join left ...
查询全体学生的学号与姓名 查询选修了课程的学生姓名 ----hive的group by 和集合函数 查询学生的总人数 计算1号课程的学生平均成绩...
测试数据 创建分桶表 设置变量,设置分桶为true, 设置reduce数量是分桶的数量个数 加载数据 检查刚刚加载的数据 创建测试数据表 //结...
创建表 查看刚刚创建的表 造测试数据 加载测试数据 由于是内部表上图红色路径中的元数据在drop表的同时也会被清除 第一步,先求个用户的月总金额...
参考文章:https://blog.csdn.net/ForgetThatNight/article/details/80009698https...
YARN:资源(linux资源隔离机制:运算资源---运算程序jar/配置文件/CPU/内存/IO--从linux中开辟出诸如内存、处理器的co...
1、mapTask调用InputFormat再调用RecourReader的read()方法来读取数据,获得key、value,mapreduc...