240 发简信
IP属地:四川
  • Resize,w 360,h 240
    [转]Spark购物篮分析:关联规则挖掘

    1、浅谈数据挖掘中的关联规则挖掘 2、Hadoop/MapReduce购物篮分析:关联规则挖掘 3、Spark购物篮分析 过程分析:

  • Resize,w 360,h 240
    中文分词之马尔可夫模型

    一 马尔科夫模型 • 每个状态只依赖之前有限个状态– N阶马尔科夫:依赖之前n个状态– 1阶马尔科夫(即《中文分词基础》中的二元模型):仅仅依赖...

  • Hive中的各种join

    准备数据 建表: 导入数据: 实验: inner join left join right join full outer join left ...

  • Hive SQL练习

    查询全体学生的学号与姓名 查询选修了课程的学生姓名 ----hive的group by 和集合函数 查询学生的总人数 计算1号课程的学生平均成绩...

  • Hive分桶表

    测试数据 创建分桶表 设置变量,设置分桶为true, 设置reduce数量是分桶的数量个数 加载数据 检查刚刚加载的数据 创建测试数据表 //结...

  • Hive实践练习

    创建表 查看刚刚创建的表 造测试数据 加载测试数据 由于是内部表上图红色路径中的元数据在drop表的同时也会被清除 第一步,先求个用户的月总金额...

  • Resize,w 360,h 240
    图解hadoop的高可用机制

    参考文章:https://blog.csdn.net/ForgetThatNight/article/details/80009698https...

  • Resize,w 360,h 240
    图解mapreduce&yarn的工作机制

    YARN:资源(linux资源隔离机制:运算资源---运算程序jar/配置文件/CPU/内存/IO--从linux中开辟出诸如内存、处理器的co...

  • Resize,w 360,h 240
    图解mapreduce原理全剖析

    1、mapTask调用InputFormat再调用RecourReader的read()方法来读取数据,获得key、value,mapreduc...