240 发简信
IP属地:辽宁
  • 120
    二元分类特征的选择:IV值

    IV值(Information Value),即信息价值指标,是评分卡模型中的一个常见指标,在金融风控领域得到了广泛的应用,尤其是在特征选择的场景下,会经常提及这个概念。 在...

  • 随笔

    每次看到别人的好文章,都经不住感叹,写得真棒;每次自己感慨的时候,都经不住想,自己也要写出这么酣畅的文章;然而每次下笔的时候,却总是太容易拖,尝尝是写了几篇就荒那里了。 每次...

  • 我所认识的「癌症」

    2016年双亲相继检查发现患癌,让「癌症」这个原本不太熟悉的词成为我16年的关键词,而家人与癌症病魔的斗争也让我对它有了更深刻的认识。 什么是癌症 Canceris a gr...

  • 大公司都在招什么样的数据技术人才

    「大数据」这个概念从2012年开始被广泛传播,尤其是近两年,各大公司,不仅仅是互联网公司,都在谈论它。「大数据」的火,不仅体现在各种会议、文章或者报道上,更真真切切的表现在各...

  • 120
    数据技术的应用价值:让数据发声

    过年回家,免不了会被亲人问起,你是做什么的?作为一个数据技术从业者,面对没怎么接触过电脑,对电脑使用都不太熟悉的亲人,每次回答:程序员,软件工程师,就是每天对着电脑「搬砖」写...

  • 120
    如何成为一名数据科学家

    上图是IBM Watson的首席技术专家Swami Chandrasekaran编撰的数据科学家地铁图,可以说是数据科学家的技能修炼指南,分享出来,供「骨骼惊奇」之人慢慢修炼...

  • 120
    什么是NP完全问题

    在学习决策树的时候,我们知道,其一大特点是:寻找最佳的决策树是NP完成问题。什么是NP完全问题,决策树的这一特点又是什么意思? 什么是NP完全问题 这里的NP其实是Non-d...

  • 120
    十分钟了解决策树

    决策树是一种非参数的监督学习方法,可用于分类和回归的应用中。旨在通过数据学习出简单的决策规则来创建模型,进而预测和判定目标变量的结果。 ** 决策树的工作原理 ** 顾名思义...

  • 120
    鸢尾花数据集

    鸢【音:yuān】尾花(Iris)是单子叶百合目花卉,是一种比较常见的花,可能不经意间你就能在某个公园里碰见它,而且鸢尾花的品种较多。如果逛公园的时,想在女神面前一展才华,不...

  • 120
    十分钟了解决策树

    决策树是一种非参数的监督学习方法,可用于分类和回归的应用中。旨在通过数据学习出简单的决策规则来创建模型,进而预测和判定目标变量的结果。 ** 决策树的工作原理 ** 顾名思义...