240 发简信
IP属地:天津
  • 为什么要进行数据分箱?(转)

    一般在建立分类模型时,需要对连续变量离散化,特征离散化后,模型会更稳定,降低了模型过拟合的风险。比如在建立申请评分卡模型时用logsitic作为...

  • Resize,w 360,h 240
    ROC曲线与KS曲线的理解

    ROC曲线是评判一个模型好坏的标准,有两个值要知道,FPR(假正率)和TPR(真正率),ROC曲线就是以这两个值为坐标轴画的。比如逻辑回归得到的...

  • 吴恩达机器学习笔记

    What is Machine Learning? Two definitions of Machine Learning are offere...

  • 学习资料整理--《Cheat Sheets for Machine Learning, Data Science, Probability, SQL & Big Data》

    Python for Data Science Cheat Sheets 1.Quick Guide to learn Python for D...

  • 心理学--《心灵的七种兵器》

    作者:武志红 国内著名的心理学家,资深心理咨询师 不必抵触“灵魂黑夜”,相反当拥抱它时,当你做到全然地拥抱“灵魂的黑夜”时,它便给你巨大的力量。...

  • 简书第一天

    今天是我来简书第一天,希望能在这里记录下更多关于生活、学习、工作、心情的点点滴滴,期待自己的成长和进步。

个人介绍
一只搞数据的菜鸟,希望不要被数据搞