240 发简信
IP属地:天津
  • git入门

    学习网址:https://www.liaoxuefeng.com/wiki/896043488029600(只是整理了一遍,简易去上面的网址学习) 以下基于MAC 1. gi...

  • pandas中添加时间列

    有一个数据想增加一列时间,数据 其中,在pd.date_range中'01/01/2020 12:56:31'表示数据开始的时间,periods表示一共需要多少个数据,fre...

  • MAC单机版本Pyspark运行

    1.安装spark,假设不需要使用hdfs,此时可以直接启用spark,如果需要使用hdfs需要先启用hadoop后,再启用spark。a. 进入spark安装路径 b. 进...

  • Pyspark基础整理

    1. 创建Spark用于读取数据,创建DataFrame SparkSession是整个程序的入口,创建过程(还不懂Spark到底后台怎么整的,先写下来,后续再理解) 各参...

  • Python基础-字典、闭包和装饰器

    字典相关 闭包 函数里面套用函数,就是某一个定义的函数里面还有函数。(不是递归) 装饰器 python装饰器就是用于拓展原来函数功能的一种函数,这个函数的特殊之处在于它的返回...

  • 基于直方图的异常估计HBOS

    主要思想:画出数据分布的直方图,根据数据的频率计算异常程度,认为直方图中频率越小越异常。特点:1. 难以确定最佳带宽2. 高维清醒下效果不佳 过程:假设数据各个维度之间相互独...

  • 120
    推荐系统的PNN算法

    看算法看到了PNN,找了好几篇介绍没太看懂,决定自己看完章理一遍。前期算法储备: FM算法 FFM算法 DeepFMPNN算法结构图PNN结构图从上往下看:最后一层为输出层执...

  • 120
    显著性水平与显著性概率值p

    两个值均应用于假设检验中。显著性水平为实验之前人为确定的值,如0.05、0.1等,用α表示。表示原假设为真时,拒绝原假设的概率,即犯错误的概率。 根据α,可以求出相应的分位数...

  • Python中可变对象的深拷贝与浅拷贝

    1. python中赋值 此时b和a指向同一内存地址,如果a中元素发生变化,b中也会发生变化。如 2. 浅copy 但是 并不能完全将二者隔离。 3. 深拷贝

  • 树模型中的缺失值处理

    参考链接 :https://www.zhihu.com/question/58230411 1. Xgboost XGBoost处理缺失值,是将所有有缺失值的数据捆绑在一起,...

  • 120
    正态分布、卡方分布、t分布、F分布

    1. 正态分布 如果样本X的概率密度函数为,成为X服从均值为,方差为的正态分布,记为 2. 卡方分布(Chi-squared Distribution) k个独立同分布于标准...

  • 120
    深度学习参数初始化

    1. 所有权重初始化为0或任一常数:不可行 以全链接网络为例,每一层神经元的梯度为相同的值,所以如果其具有相同的初始化值,参数更新后,同层神经元仍然会有相同的值,每个神经元特...

  • 120
    .todense() 作用

    .todensereturns a matrix. and toarrayreturns an ndarray;If you want a matrix, usetodens...