0
4
1156
如何构造决策树? 通过对不同特征的优先选择 通过信息增益来量化评价一个信息的好坏 什么是信息增益? 在信息学里面,熵是对不确定性的度量。1948...
基本概念 聚类:根据信息相似原则将样本划分为若干个类 分类: 根据决策属性给样本区分归类 训练集:一部分类别已知的样本数据(局部代替整体)用于建...
参考:大佬1|大佬2 主要目的:用于文本查重比较,文档相似度比较。 估计的原理:两个集合经随机排列转换后得到的两个最小哈希值相等的概率等于这两个...