DANoob - 简书

发简信

DANoob

7
关注
29
粉丝
14
文章
8745

字数
11

收获喜欢

IP属地：宾夕法尼亚州

DANoob

2022-01-31力扣刷题 Easy-最大子序和
题目：Given an integer array nums, find the contiguous subarray (containing at least one n...

190 0 0
DANoob

R语言——运用XGBoost预测北京市房地产价格
数据集：https://www.kaggle.com/ruiqurm/lianjia本数据集包含2010年至2018年1月份链家网站上挂牌出售的二手房信息第一部分：数据准备...

3359 0 4

DANoob

R语言学习笔记：文本分析
文本分析使用的数据：yelp_subset.csv 目标：利用评论预测打分为了简化，把星级分为两类：1-3星为0，4-5星为1 可以通过lasso先筛选出来对于星级贡献更为...

306 0 0
DANoob

R语言学习笔记：网页爬虫
爬虫一定要确认是合法的！合法的！合法的！（重要的事情说三遍）目前大部分顶级期刊不接受爬虫爬取的数据的论文投稿用IMDB网站的乐高大电影网页作为例子：https://www.i...

598 0 0
DANoob

@HOKNANGLO 在研究一种方便的方法……

R语言学习笔记：Logistic模型与选择（一）
针对二分因变量的模型，运用Logistic模型进行训练，意图是把因变量从二元结构变换成整个实数轴如果把二元结构看做事件A发生或者不发生，二元结构就可以转化成从0到1的概率，...

DANoob
2594 2 0
DANoob

R语言学习笔记：主成分分析
Principal Component Analysis：当有多个相似变量，希望提取出“最大公约数”，是重要的降维手法数据：IQ.FULL.csv 美国ASVAB的数据，用...

839 0 1
DANoob

R语言学习笔记：Logistic模型与选择（二）
在获得预测模型之后，我们可以根据模型计算出每个人患心脏病的概率，同时为这个概率划定一条分界线，如概率大于0.5时认为此人有心脏病，概率小于0.5时则认为此人没有心脏病 P(A...

744 0 0

DANoob

未明学院
写了 0 字，被 93 人关注，获得了 163 个喜欢

未明学院专注于通过项目制教学来教授学员数据分析&数据挖掘技能。本着让学习更有趣、让学员的简历不再单薄的教学理念，未明学院为每一组学员设计紧跟企业界热点的数据处理项目，通过项目制学习（PBL）的方式，让学员在掌握数据处理技能的同时，收获一个高含金量的项目经历。未明学院成立一年多来，已经帮助数千位学员实现简历的蜕变，许多学员拿到了诸如中信证券、阿里巴巴等知名企业的全职offer，以及哥伦比亚大学，牛津大学等世界知名学府的研究生offer。
DANoob

R语言学习笔记：Logistic模型与选择（一）
针对二分因变量的模型，运用Logistic模型进行训练，意图是把因变量从二元结构变换成整个实数轴如果把二元结构看做事件A发生或者不发生，二元结构就可以转化成从0到1的概率，...

2594 2 0
DANoob

R语言学习笔记：模型选择（四）岭回归
在之前的代码 lasso1.cv = cv.glmnet (X, Y, alpha = 1, nfolds = 10) 中，alpha = 1为lasso，alpha=0为岭...

1643 0 0
DANoob

R语言学习笔记：模型选择（三）LASSO方法
红点代表均方误差和上下一倍标准差，均方误差越小模型越好；上方数量表明模型仍存在的自变量个数（不一定是单调递减）。第一条虚线处表明均方误差最小值；第二个虚线标出最低点的一倍标准...

12606 0 4
DANoob

R语言学习笔记：模型选择（二）
前面一篇得到19个局部最优模型，接下来需要寻找到全局最优的模型 summary (fit1)$cp summary (fit1)$bic 制成图表： plot (summar...

2498 0 0

DANoob

R语言学习笔记：模型选择（一）
模型的解释力和预测力的区别解释力的标准：R方，调整后R方常用的预测力标准：Cp，AIC，BIC，AUC等等案例：1986年美国各大核心棒球球队队员的表现数据和次年的收入...

3484 0 0
DANoob

R语言学习笔记：广义线性模型
model4 = lm(sales~TV + I(TV^2), data = data) summary (model4) 将tv作为二次项放入回归模型中，I for iso...

1293 0 0
DANoob

R语言学习笔记：线性回归（二）多元线性回归
当只考虑电视广告对销售量的影响的时候，自变量只有一个：y=kx+b，但是同样可以将给定的数据中的Radio和Newspaper加进去，从而控制其他因素对Sales带来的影响，...

1265 0 0
DANoob

R语言学习笔记：线性回归（一）
data = read.csv('Advertising.csv', header = TRUE, stringsAsFactors = FALSE) plot (data$...

1581 0 2
DANoob