1、排序个案
数据编辑敞口中记录数据的先后次序在默认情况下是由录入的先后顺序决定的。
在实际工作中我们可能需要按照某种顺序来观察数据,如:按ID,按销售额的高低...
对于单变量排序,我们只需要右键变量名,选择“升序排列”或“降序排列”;但是对于多变量排序则需要使用“排序个案”功能。
1)在多重排序中,变量名的次序很重要,先指定的变量名在排序时必然优先于后指定的变量。即先按照第一个变量进行升序或降序排列,对于第一个变量的取值相同时在按照第二个变量的规则进行排序,以此类推。
2)每个变量都是独立的,可以指定第一个变量按照升序,第二个变量按照降序,第三个...
2、选择个案
很多时候我们不需要分析全部的数据,而是按要求分析其中的一部分,比如分析某一个月份、或只分析男性等
我们需要使用到“选择个案”功能
1)全部个案
2)如果条件满足:
只分析满足指定条件的记录,点击“如果”按钮会打开用于定义筛选条件的对话框。
3)随机个案样本
可以按照百分比抽取记录,或者精确的从前若干个记录中抽取多少条记录。
4)基于时间或个案全距
使用下方的“范围”按钮设定范围:第一个个案是哪个,最后一个个案是哪个
5)使用筛选器变量
需要选择一个筛选指示变量,当改变量取值为1的记录将被选中,进行之后的分析。
“输出”框用于设置没有选中的记录的处理方式:
1)过滤掉未选择的个案
未选中的个案不包括在分析中,但是保留在数据集中,生成一个新的变量filter--$,对于选定的个案标记为1,否则标记为0
2)将选定的个案复制到新数据集中
把选定的个案重新生成一个数据集,未选中的个案不包括在新数据集中,原始数据保持不变
3)删未选定个案
直接从数据集中删除未选定的个案
3、个案加权
加权个案会给不同的个案赋以不同的权重,以改变个案在统计分析中的重要性。
一般而言,在如下两种情况下需要进行该操作:
1)以频数格式录入的数据
在默认情况下,数据集中的每一行就是一条原始记录,但有时候另加一个频数变量用于记录该数值共出现了多少次,这时候就需要使用“加权个案”将数据指定为频数格式。
2)案例数据抽样权重的调整
如山东省的数据比较重要,江苏省的数据比较次要
4、分类汇总
所谓分类汇总就是按照指定的分类变量对个案进行分组,并按照分组对变量求指定的描述统计量,结果可以存入新数据文件中,也可以替换当前数据文件。
如希望了解不同性别学生的平均分情况,就需要先对数据按照性别进行分类,然后在求出各性别学生的平均分,这其实就是一个分类汇总的过程。
在SPSS中,数据文件的分类汇总是经过一下三个步骤完成的:
1)指定分组变量和汇总变量
分组变量:根据分组变量的值,将个案分在一组。分组变量的每个唯一组合定义一个组,创建新的汇总数据文件时,所有分组变量保存在新文件中,同事保留其现有的名称和字典信息。分组变量(如果已指定)可以是数值型或字符串型
汇总变量:源变量用于汇总函数,以创建新的汇总变量。汇总变量的名称紧跟一个可选的变量标签、汇总函数的名称和源变量名称(用括号括起来)
2)自动根据分类变量的取值将记录分成若干类,并对每类记录分别计算汇总变量的描述统计量
3)将分类汇总的计算结果加以输出
但是为了方便用户,整个操作过程都在一个统一的对话框中进行设定,如下:
1)“分组变量”列表框:用于选择分组变量,可以有多个
2)“变量摘要”列表框:用于选择被汇总的变量,可以有多个,包括对同意变量的多重不同汇总方式
3)“函数”按钮
4)“变量名与标签”按钮:用于定义新生成的汇总变量的名称和标签
5)“个案数”复选框:用于定义一个新变量以存储同组的个案数
6)“保存”框组:设定汇总结果的具体输出方式,可以将汇总后的结果直接加入当前的数据文件中,也可以定义一个新文件一存储汇总的结果,或者用汇总的结果替换原来的数据。
示例:计算不同性别不同年龄的学生的各科平均分