笔记说明 dplyr包是一个用于数据清理的高效r包,也是tidyverse的核心包之一。之前的笔记:用dplyr包进行数据清理-filter()和select()用dplyr...
tidyverse是一组处理与可视化R包的集合,其中ggplot2与dplyr最广为人知。 核心包有以下一些: ggplot2 - 可视化数据 dplyr - 数据操作语法,...
最热门的50个matplotlib图 关联 Correlation 散点图 Scatter plot 带边界的气泡图 Bubble plot with Encircling ...
Cox比例风险模型在肿瘤方面用的多,在临床研究中,考察几个因素对生存期的影响。统计模型是一个经常使用的工具,可以同时分析多个因素的生存情况。另外,统计模型提供了每个因素的效应...
1. 若干问题 1.1 分面和拼图的适用范围 分面:数据在一张表格上,存在若干个分类变量可以给数据分组,这时可以使用分面;拼图:已经产生了多个图(对象),需要拼在一起 1.2...
一、全书提纲 记录全书主要内容和次要内容,整理全书大纲 全书提纲结构图 每章内容记录摘抄 第一章信息图形化:第一印象 第二章集中趋势的量度:中庸之道 第三章分散性与变异性的量...
R中的线性回归函数比较简单,就是lm(),比较复杂的是对线性模型的诊断和调整。这里结合Statistical Learning和杜克大学的Data Analysis and ...
目录 0.问题导入 1.随机生成示例数据 2.默认数据可视化(图1) 3.字母加数字内置顺序排列错误排除 4.字母+数字内置顺序排列错误排除后结果可视化(图2) 5.字符串排...
收集了一些关于统计、数学和编程方面的小抄表,里面是有用的小知识点合集: Rstudio 链接:https://rstudio.com/wp-content/uploads/2...
通过本篇文章大家可以对ML的常用算法形成常识性的认识。没有代码,没有复杂的理论推导,仅是图解,介绍这些算法是什么以及如何应用(例子主要是分类问题)。以后有机会再对单个算法做深...