240 发简信
IP属地:江苏
  • 120
    Python3数据分析与挖掘建模实战 笔记

    第2章 数据获取 数据获取手段: 数据仓库 监测与抓取 填写、埋点、日志 计算 数据仓库 将所有业务数据经汇总处理,构成数据仓库(DW) 全部事实的记录 部分维度与数据的整理...

  • 120
    全面解析基于Hadoop模型的数据分析平台框架

    本文主要讲解以下两个方面: ♦Hadoop MapReduce与Hive技术研究 ♦数据分析平台框架设计与环境配置 Hadoop MapReduce与Hive技术研究 一、H...

  • 120
    微博广告推荐中有关Hadoop的那些事

    一、背景 微博,一个DAU上亿、每日发博量几千万的社交性产品,拥有庞大的数据集。如何高效得从如此规模的数据集中挖掘出有价值的信息,以增强用户粘性,提高信息传播速度,就成了重中...

  • 120
    一篇文章教你如何在一个月内学会爬取大规模数据

    Python爬虫为什么受欢迎 如果你仔细观察,就不难发现,懂爬虫、学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方面,像 Python这样的编程语言提供越来...

  • 120
    大数据架构师必读:常见的Hadoop和Spark项目案例

    如果您的Hadoop项目将有新的突破,那么它必定与下边介绍的七种常见项目很相像。有一句古老的格言是这样说的,如果你向某人提供你的全部支持和金融支持去做一些不同的和创新的事情,...