240 发简信
IP属地:湖南
  • spark跟pandas数据转换

    因为传统的机器学习是基于sklearn,xgboost,有着丰富分算法库,spark mlib不能满足所有的需求. spark来处理数据预处理...

  • Resize,w 360,h 240
    pycharm 开发pyspark

    下载spark包 配置参数 配置spark参数vim ${spark_dir}/conf/spark-env.shexport SPARK_LO...

  • scala特性

    为了能用scala开发spark,简单的介绍一下scala特性.scala即面向对象编程,也同时面向方法编程,也可以说是面向容器编程,在编译阶段...

  • Resize,w 360,h 240
    spark应用开发HelloWorld

    准备 代码列子1.安装scala插件开发工具 intellij-IDEA 插件 3.开发代码数据people.json 新建HelloWorld...

  • marathon 订阅事件

    参考:https://mesosphere.github.io/marathon/docs/event-bus.html 启用marathon订...

  • 安装docker

    安装docker yum install docker 启动docker sudo service docker start

  • Resize,w 360,h 240
    Jupyter gateway api使用

    启动 nohup jupyter kernelgateway --JupyterWebsocketPersonality.list_kernel...

  • Jupyter Kernel Gateway 安装

    安装 conda install -c conda-forge jupyter_kernel_gateway 启动 jupyter kernel...

  • 安装Anaconda

    下载 https://www.continuum.io/downloads 安装 bash $filedir/anaconda_xxx.sh 参...