240 发简信
IP属地:上海
  • 120
    SPARK WITH JUPYTER NOTEBOOK

    1.安装Anaconda,里面自带了jupyter 2.安装scala,并配置环境变量 3.安装spark,并配置环境变量 4.安装pip模块 5安装spark' kerne...

  • 2018-08-10 pandas写入sqlserver错误处理

    使用pyodbc时读取数据是ok 的,但写入时会报错 当将DataFrame写回数据库时就报错了 错误如下: 折腾半天总是找到方法了。修改后的代码如下:

  • 120
    2018-07-16 执行时间分析

    今天刚看到ipython的一个函数执行时间的分析器,非常好用,记录一下。 安装模块 pip install line_profiler 导入模块 %load_ext line...

  • 120
    spark+matplotlib 数据可视化2018-05-25

    ['"custID","gender","state","cardholder","balance","numTrans","numIntlTrans","creditLin...

  • DataFrame的去重,none值填充及异常值处理2018-05-23

    spark 数据建模准备 去重 count of rows: 7count of distinct rows: 6 +---+------+------+---+------...

  • numpy 数组常用函数 2018-05-22

    numpy 数组常用函数 where [1 2 3 4 5 6 7 8 9] [[1 2 3][4 5 6][7 8 9]] (array([5, 6, 7, 8], dty...

  • numpy数组1 2018-05-22

    Numpy 学习笔记 (3,) 3 dtype('int64') array([0, 2, 4, 6, 8]) array([ 0. , 2.5, 5. , 7...