1.安装Anaconda,里面自带了jupyter 2.安装scala,并配置环境变量 3.安装spark,并配置环境变量 4.安装pip模块 5安装spark' kerne...
1.安装Anaconda,里面自带了jupyter 2.安装scala,并配置环境变量 3.安装spark,并配置环境变量 4.安装pip模块 5安装spark' kerne...
使用pyodbc时读取数据是ok 的,但写入时会报错 当将DataFrame写回数据库时就报错了 错误如下: 折腾半天总是找到方法了。修改后的代码如下:
今天刚看到ipython的一个函数执行时间的分析器,非常好用,记录一下。 安装模块 pip install line_profiler 导入模块 %load_ext line...
['"custID","gender","state","cardholder","balance","numTrans","numIntlTrans","creditLin...
spark 数据建模准备 去重 count of rows: 7count of distinct rows: 6 +---+------+------+---+------...
numpy 数组常用函数 where [1 2 3 4 5 6 7 8 9] [[1 2 3][4 5 6][7 8 9]] (array([5, 6, 7, 8], dty...
Numpy 学习笔记 (3,) 3 dtype('int64') array([0, 2, 4, 6, 8]) array([ 0. , 2.5, 5. , 7...