雨一流 - 简书

IP属地：北京

R语言包
1、聚类常用的包： fpc，cluster，pvclust，mclust 基于划分的方法: kmeans, pam, pamk, clara ...

1017 0 1
数据字典
数据库数据字典表查询： SELECT COL.TABLE_NAME, TT.COMMENTS, COL.COLUMN_NAME...

714 0 0

流程整理
一、基本统计分析 1、描述性统计分析 (1)summary() apply函数族分组描述性统计 group /by/reshape (2)频数...

209 0 0
缺失值处理
一.什么是缺失值，NA与NULL的区别（1）NA表示数据集中的该数据遗失、不存在。在针对具有NA的数据集进行函数操作的时候，该NA不会被直接剔...

1007 0 0
文本挖掘
文本挖掘现在是无处不在啊，之前在工作中涉及到一些文本挖掘的问题，但都不是很深入。最近在复习机器学习算法，看到贝叶斯分类，其中有一类就涉及到文本分...

1043 0 0
交叉表和卡方检验
交叉分类（列联表）和卡方检验交叉分类问题比较和对照是进行科学研究的基本手段。对于间距测度和比例测度的资料，进行分组比较时可以用均数检验、方差...

18885 0 4
R语言常用函数
数据结构一、数据管理 vector：向量 numeric：数值型向量 logical：逻辑型向量 character；字符型向量 list：列...

0.6 3925 0 7

尝试用recharts作图
http://www.cnblogs.com/payton/p/5567778.html library(recharts) barnline<...

1164 0 0
数据
1、三种常见的清洗数据 1）重复值数据定义：把数据结构中，行数据相同的剔除 unique 函数语法： unique (x) 案例：导入csv...

751 0 2