学习网址:https://www.liaoxuefeng.com/wiki/896043488029600(只是整理了一遍,简易去上面的网址学习) 以下基于MAC 1. gi...
学习网址:https://www.liaoxuefeng.com/wiki/896043488029600(只是整理了一遍,简易去上面的网址学习) 以下基于MAC 1. gi...
有一个数据想增加一列时间,数据 其中,在pd.date_range中'01/01/2020 12:56:31'表示数据开始的时间,periods表示一共需要多少个数据,fre...
1.安装spark,假设不需要使用hdfs,此时可以直接启用spark,如果需要使用hdfs需要先启用hadoop后,再启用spark。a. 进入spark安装路径 b. 进...
1. 创建Spark用于读取数据,创建DataFrame SparkSession是整个程序的入口,创建过程(还不懂Spark到底后台怎么整的,先写下来,后续再理解) 各参...
字典相关 闭包 函数里面套用函数,就是某一个定义的函数里面还有函数。(不是递归) 装饰器 python装饰器就是用于拓展原来函数功能的一种函数,这个函数的特殊之处在于它的返回...
主要思想:画出数据分布的直方图,根据数据的频率计算异常程度,认为直方图中频率越小越异常。特点:1. 难以确定最佳带宽2. 高维清醒下效果不佳 过程:假设数据各个维度之间相互独...
看算法看到了PNN,找了好几篇介绍没太看懂,决定自己看完章理一遍。前期算法储备: FM算法 FFM算法 DeepFMPNN算法结构图PNN结构图从上往下看:最后一层为输出层执...
两个值均应用于假设检验中。显著性水平为实验之前人为确定的值,如0.05、0.1等,用α表示。表示原假设为真时,拒绝原假设的概率,即犯错误的概率。 根据α,可以求出相应的分位数...
1. python中赋值 此时b和a指向同一内存地址,如果a中元素发生变化,b中也会发生变化。如 2. 浅copy 但是 并不能完全将二者隔离。 3. 深拷贝
参考链接 :https://www.zhihu.com/question/58230411 1. Xgboost XGBoost处理缺失值,是将所有有缺失值的数据捆绑在一起,...
1. 正态分布 如果样本X的概率密度函数为,成为X服从均值为,方差为的正态分布,记为 2. 卡方分布(Chi-squared Distribution) k个独立同分布于标准...
1. 所有权重初始化为0或任一常数:不可行 以全链接网络为例,每一层神经元的梯度为相同的值,所以如果其具有相同的初始化值,参数更新后,同层神经元仍然会有相同的值,每个神经元特...
.todensereturns a matrix. and toarrayreturns an ndarray;If you want a matrix, usetodens...