240 发简信
IP属地:北京
  • 120
    数据分布

    1 离散概率分布 1.1 伯努利分布 又叫做0-1分布,指一次随机试验,结果只有两种。也就是一个随机变量的取值只有0和1。记为: 0-1分布 或B(1,p),其中 p 表示一...

  • 谈谈 WOE和IV

    谈谈 WOE和IV[WOE] weight of evidence ,即证据权重;[IV] information value,即信息价值。 WOE WOE是对原始自变量的一...

  • 熵、条件熵、信息增益(互信息)

    信息增益 首先明确一点,信息熵是信息量的期望!期望!期望!(各种信息熵都是如此,像熵、条件熵、信息增益)熵:表示随机变量的不确定性。当熵中的概率由数据估计(特别是最大似然估计...

  • 120
    数据的描述性统计

    数据描述的维度及指标 数据的集中趋势 有些数据之间的关系不是加减关系,而是乘除关系。此时,应该用几何平均值来表示由这样的数值组成的数据集合的集中趋势。如生产线: 数据的离散程...

  • 解决crontab运行python脚本不生效

    实习中老板给安排了一个任务,写一个脚本kgtest.py,定时监测我们公司给客户做的各种网站和接口,遇到挂掉的网站第一时间在钉钉群里让机器人通知给相关的负责人。由于windo...

  • 120
    理解 LSTM 网络

    作者: Christopher Olah (OpenAI)译者:朱小虎 Xiaohu (Neil) Zhu(CSAGI / University AI)原文链接:https:...

  • SPSS中Logistic(或COX)回归自变量筛选方法

    SPSS提供了6中筛选自变量的方法,向前法(Forward)有三种,即一般统计学书上所说的逐步回归,这三种向前法选入自变量时均采用比分检验,但剔除自变量的标准不同。分别为:条...

  • python3编程中的if __name__ == '__main__': 的作用和原理

    最近看一些机器学习代码,在每个函数后面都要加上 一开始很不能理解,后来经过查阅一些大神的博客后终于明白了,总结下来。一个python的文件有两种使用的方法,第一是直接作为脚本...

  • 120
    Python网络爬虫(六)- Scrapy框架

    目录: Python网络爬虫(一)- 入门基础[https://www.jianshu.com/p/9dfbe35ce95b]Python网络爬虫(二)- urllib爬虫案...