240 发简信
IP属地:江苏
  • 画一棵树,用来决策

    #决策树简介#决策树(Decision Tree)是一种简单但是广泛使用的分类器。通过训练数据构建决策树,可以高效的对未知的数据进行分类。决策数...

    0.1 1887 2 20
  • 最“懒惰”的kNN分类算法

    1. K-近邻算法#### k-近邻算法(k Nearest Neighbor),是最基本的分类算法,其基本思想是采用测量不同特征值之间的距离方...

  • Resize,w 360,h 240
    逻辑回归:比概念稍微深入一点的细节

    1 逻辑回归的定位 首先,逻辑回归是一种分类(Classification)算法。比如说: 给定一封邮件,判断是不是垃圾邮件 给出一个交易明细数...

    0.1 5199 2 13
  • 关于目标,你要学会”聪明地制定、细致地拆解及高效地执行“

    1 当你把目标制定的足够“聪明”(SMART),这个目标才有可执行的意义 毋庸置疑,每个人都需要目标,因为目标是一个人未来的方向和不断前进的动力...

  • Resize,w 360,h 240
    一名业余数据分析爱好者对于北京朝阳北苑地区各小区房价的粗浅分析

    1 数据来源 本次分析的数据源来自链家网。链家网中有"二手房-成交房源"这个板块,可以查看到所有通过链家成交的二手房的信息,其中最值得称赞的是成...

  • Resize,w 360,h 240
    数据挖掘的入门概念

    1 数据挖掘 数据挖掘(Data Mining,简称DM),是指从大量的数据中,挖掘出未知的且有价值的信息和知识的过程 2 机器学习 与 数据挖...

    0.5 8129 7 66
  • Resize,w 360,h 240
    华山论剑的活动预算问题(爬山算法)

    1. 组团旅游问题 有一天,东邪西毒南帝北丐中神通决定搞一次华山论剑,于是这五绝需要从四面八方坐飞机到西安咸阳机场,然后一起租车到华山比武: 王...

  • 搜索引擎的基本原理

    搜索引擎最初阶段: 利用网页爬虫进行抓取,通过网页中的链接层层深入,对网页去掉Tag后进行分词,保存每个单词在网页中的位置……查询时允许多单词,...

  • 分类算法之朴素贝叶斯(NaiveBayes)

    我个人认为,在数据挖掘领域,分类算法是最为重要。它根据以往的数据来对新的数据做预测。垃圾邮件判断,潜在用户挖掘等都会用到分类算法。今天把总结朴素...

    0.3 3341 1 17
个人介绍
业余数据分析爱好者