#决策树简介#决策树(Decision Tree)是一种简单但是广泛使用的分类器。通过训练数据构建决策树,可以高效的对未知的数据进行分类。决策数...
1. K-近邻算法#### k-近邻算法(k Nearest Neighbor),是最基本的分类算法,其基本思想是采用测量不同特征值之间的距离方...
1 逻辑回归的定位 首先,逻辑回归是一种分类(Classification)算法。比如说: 给定一封邮件,判断是不是垃圾邮件 给出一个交易明细数...
1 数据来源 本次分析的数据源来自链家网。链家网中有"二手房-成交房源"这个板块,可以查看到所有通过链家成交的二手房的信息,其中最值得称赞的是成...
1 数据挖掘 数据挖掘(Data Mining,简称DM),是指从大量的数据中,挖掘出未知的且有价值的信息和知识的过程 2 机器学习 与 数据挖...
1. 组团旅游问题 有一天,东邪西毒南帝北丐中神通决定搞一次华山论剑,于是这五绝需要从四面八方坐飞机到西安咸阳机场,然后一起租车到华山比武: 王...
搜索引擎最初阶段: 利用网页爬虫进行抓取,通过网页中的链接层层深入,对网页去掉Tag后进行分词,保存每个单词在网页中的位置……查询时允许多单词,...
我个人认为,在数据挖掘领域,分类算法是最为重要。它根据以往的数据来对新的数据做预测。垃圾邮件判断,潜在用户挖掘等都会用到分类算法。今天把总结朴素...
基于用户的协同过滤,适用于物品较少,用户也不太多的情况。如果用户太多了,针对每个用户的购买情况来计算哪些用户和他品味类似,效率很低下。如果商品很...
文集作者