240 发简信
IP属地:宾夕法尼亚州
  • 2022-01-31力扣刷题 Easy-最大子序和

    题目:Given an integer array nums, find the contiguous subarray (containing...

  • Resize,w 360,h 240
    R语言——运用XGBoost预测北京市房地产价格

    数据集:https://www.kaggle.com/ruiqurm/lianjia本数据集包含2010年至2018年1月份链家网站上挂牌出售的...

  • R语言学习笔记:文本分析

    文本分析 使用的数据:yelp_subset.csv 目标:利用评论预测打分为了简化,把星级分为两类:1-3星为0,4-5星为1 可以通过las...

  • R语言学习笔记:网页爬虫

    爬虫一定要确认是合法的!合法的!合法的!(重要的事情说三遍)目前大部分顶级期刊不接受爬虫爬取的数据的论文投稿用IMDB网站的乐高大电影网页作为例...

  • Resize,w 360,h 240
    R语言学习笔记:主成分分析

    Principal Component Analysis:当有多个相似变量,希望提取出“最大公约数”,是重要的降维手法 数据:IQ.FULL.c...

  • Resize,w 360,h 240
    R语言学习笔记:Logistic模型与选择(二)

    在获得预测模型之后,我们可以根据模型计算出每个人患心脏病的概率,同时为这个概率划定一条分界线,如概率大于0.5时认为此人有心脏病,概率小于0.5...

  • Resize,w 360,h 240
    R语言学习笔记:Logistic模型与选择(一)

    针对二分因变量的模型,运用Logistic模型进行训练,意图是把因变量从二元结构变换成整个实数轴 如果把二元结构看做事件A发生或者不发生,二元结...

  • Resize,w 360,h 240
    R语言学习笔记:模型选择(四)岭回归

    在之前的代码 lasso1.cv = cv.glmnet (X, Y, alpha = 1, nfolds = 10) 中,alpha = 1为...

  • Resize,w 360,h 240
    R语言学习笔记:模型选择(三)LASSO方法

    红点代表均方误差和上下一倍标准差,均方误差越小模型越好;上方数量表明模型仍存在的自变量个数(不一定是单调递减)。第一条虚线处表明均方误差最小值;...

个人介绍
努力成为DATA SCIENTIST的NOOB