传统机器学习 一、朴素贝叶斯朴素贝叶斯(naïve Bayes)法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的...
传统机器学习 一、朴素贝叶斯朴素贝叶斯(naïve Bayes)法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的...
特征选择 1、TF-IDF原理TF-IDF(Term Frequency-Inverse Document Frequency)是一种统计方法,用以评估一字词对于一个文件集或...
特征提取 一、基本文本处理 1. 分词 分词即将句子拆分成常见的词语组合。 中文分词根据实现原理和特点,主要分为基于词典分词算法和基于统计的机器学习算法。 我们主要讨论基于词...
IMDB数据集探索 数据探索与分析。链接:https://github.com/XinToWorld/NLP-/blob/master/IMDB%E7%BB%83%E4%B9...