《精通机器学习:基于R 第二版》学习笔记 1、前文回顾 前面学习了逻辑斯蒂回归,它被用来预测一个观测属于某个响应变量分类的概率——我们称之为分类...
《精通机器学习:基于R 第二版》学习笔记 1、前文回顾 前面学习了逻辑斯蒂回归,它被用来预测一个观测属于某个响应变量分类的概率——我们称之为分类...
《精通机器学习:基于R 第二版》学习笔记 1、数据理解与准备 ID :样本编码 V1 :细胞浓度 V2 :细胞大小均匀度 V3 :细胞...
《精通机器学习:基于R 第二版》学习笔记 1、单变量线性回归 1.1 散点图,可以看到前后有两个明显的离群点 1.2 线性回归 理论上,Mul...
TextRank算法是一个比较耗时的算法,因为它依赖于图计算,需要构成相似度矩阵。当数据量变大的时候,运行时间会呈“几何级”增长。但是对于中小型...
最近疫情在家没事就开始学习R语言,之前在安装后加载包时很多都会提示有一些小包没有安装,这时候直接安装小包就可以成功加载目的R包了~ 但是,在安装...
安装一些R包:数据包: ALL, CLL, pasilla, airway软件包:limma,DESeq2,clusterProfiler工具包...
1、数据整理 2、读取小说文本 3、各章节字数对比 4、中文分词 5、词频对比 6、分别使用频率最高的词
1、导入原始数据并做基本处理 文件共7051行,12个变量。 有几个变量的类型明显不对,其中Create.Date和Last.Modified应...
1、导入豆瓣《庆余年》评论数据 2、中文分词并将数据拆分为训练集和测试集 word_tokenizer(strings) 英语分词器jieba ...
1、酒店评论数据 2、构造text2vec读取文件函数 3、使用构造的函数创建DTM 请注意,DTM具有文档id。它们继承自我们在reader函...
专题公告
欢迎大家分享自己在完成生信技能树R语言作业时的笔记心得
初级10 个题目:http://www.bio-info-trainee.com/3793.html
中级要求是:http://www.bio-info-trainee.com/3750.html
高级要求是完成20题: http://www.bio-info-trainee.com/3415.html