《精通机器学习:基于R 第二版》学习笔记 1、商业案例 在前面的内容中,我们通过努力建立了一些模型,现在看看我们能否提高这些模型的预测能力。对于...
![240](https://upload.jianshu.io/collections/images/1863263/crop1583976689869.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
《精通机器学习:基于R 第二版》学习笔记 1、商业案例 在前面的内容中,我们通过努力建立了一些模型,现在看看我们能否提高这些模型的预测能力。对于...
《精通机器学习:基于R 第二版》学习笔记 1、前文回顾 前面学习了逻辑斯蒂回归,它被用来预测一个观测属于某个响应变量分类的概率——我们称之为分类...
《精通机器学习:基于R 第二版》学习笔记 1、数据理解和数据准备 lcavol :肿瘤体积的对数值 lweight :前列腺重量的对数值...
《精通机器学习:基于R 第二版》学习笔记 1、数据理解与准备 ID :样本编码 V1 :细胞浓度 V2 :细胞大小均匀度 V3 :细胞...
《精通机器学习:基于R 第二版》学习笔记 1、单变量线性回归 1.1 散点图,可以看到前后有两个明显的离群点 1.2 线性回归 理论上,Mul...
TextRank算法是一个比较耗时的算法,因为它依赖于图计算,需要构成相似度矩阵。当数据量变大的时候,运行时间会呈“几何级”增长。但是对于中小型...
1、导入原始数据并做基本处理 文件共7051行,12个变量。 有几个变量的类型明显不对,其中Create.Date和Last.Modified应...
1、数据整理 2、读取小说文本 3、各章节字数对比 4、中文分词 5、词频对比 6、分别使用频率最高的词
1、酒店评论数据 2、构造text2vec读取文件函数 3、使用构造的函数创建DTM 请注意,DTM具有文档id。它们继承自我们在reader函...
1、导入豆瓣《庆余年》评论数据 2、中文分词并将数据拆分为训练集和测试集 word_tokenizer(strings) 英语分词器jieba ...
专题公告
已案例为依据