240 发简信
IP属地:广东
  • 「大数据」04大数据框架:Lambda Architecture(LA)

    1.LA框架的提出 最早由Twitter工程师Nathan Marz提出来,它是一种大数据软件设计架构,其目的是指导用户充分利用批处理和流式计算...

  • Resize,w 360,h 240
    「大数据」03Hadoop与Spark开源大数据技术栈

    Hadoop与Spark开源大数据技术栈如下图: (1)数据收集层:主要由关系型与非关系型数据收集组件、分布式消息队列构成。 ①Sqoop/Ca...

  • Resize,w 360,h 240
    「大数据」02大数据技术体系

    从数据在信息系统中的生命周期看,大数据从数据源开始,经过分析、挖掘到最终环节获得价值一般需要经过6个主要环节:数据收集、数据存储、资源管理与服务...

  • 「大数据」01大数据的概念及应用场景

    1.大数据的概念 2015年国务院向社会公布了《促进大数据发展行动纲要》明确提出了大数据的基本概念:大数据是以容量大、类型多、存取速度快、应...

  • Resize,w 360,h 240
    「爬虫」19利用PhantomJS编写爬虫程序

    虽然PhantomJS的开发者已经停止更新了,但现存版本依旧可以使用,仍然可以用来解决爬虫中遇到的某些问题,所以还是很值得了解学习一下的。 (1...

  • 「补充」20Python主要模块的使用

    import numpy对数据进行操作,创建数组,生成随机数 ·numpy.concatenate()数据集成 import pandas导入数...

  • 「补充」19sklearn库自带标准数据集说明

    sklearn库中自带的标准数据集有: 前面有用到过的数据集说明: (1)波士顿房价数据集(boston)包含506组数据,每条数据包含房屋以及...

  • Resize,w 360,h 240
    「关联分析」18关联分析之Aprior算法与FP-growth算法

    1.关联分析 关联分析是从大量数据中发现项集之间的相关联系。关联分析的一个典型例子是购物篮分析。该过程通过发现顾客放人其购物篮中的不同商品之间的...

  • 「人工神经网络」17人工神经网络之BP算法

    1.人工神经网络 人工神经网络(Artificial Neural Network,ANN)是在受到了生物学的启发后创建的,在某种程度上它是对生...

个人介绍
学习新知识,复盘旧知识,重新开始。