在SPSS中数据整理通常有合并,个案的拆分,排序,分类汇总,加权,重复数据的查找,个案的选择,计算新变量和对变量值的重新编码。这里主要介绍上面三个——分类汇总、计算新变量、对变量值进行编码。
分类汇总是按指定的变量对观测值进行分组,对分组后的数据描述性统计的一种方法。比如说,我们需要求不同性别条件下员工工资得均值。这里有两个变量,一个是性别,一个是工资。当然还可以添加其他变量。
基本指令:“数据”——“分类汇总”
如图所示
将“性别”放入“分组变量”框,将“工资”放入“变量摘要”框。图中还放入了“年龄“变量。其他得指令按上图选择好,点击”确定“。
如图
计算新变量指的是根据数据框中已有的变量数据,通过函数或者自己已有的函数计算出新的变量。比如说,数据中含有语文,数学,英语三个变量,还需要增加这三个变量的平均值变量。
基本指令:”转换“——”计算变量“
点击”确定“后
变量值进行重新编码指的是将某一变量的观测值进行重新定义,比如,根据学生分数对进行等级划分,根据分数段划分为优秀,良好,及格和差四个。这里介绍重新编码为不同变量。
基本指令:转换——重新编码为不同变量
m为均值,将变量m放进数字变量中,输出变量框名称为新变量的名称,写好后,点击”添加“,
然后点击”新值和旧值“
旧值表示我们上面选中的原始数据m变量中的值,新值则是我们重新定义的值,1代表优秀,2代表良好,3代表及格,4代表差。具体是在旧值范围框中选择对应好数值范围,然后在新值对话框中选择对应好的新的变量值。
点击”确定“
这样就添加好了新的变量