一.数据的直接来源
概念: 数据的直接来源也称为一手数据或原始数据,是指通过自己的调查或实验活动直
接获得的一手数据,其收集方法主要有实验方法和非实验方法
特点: 一手数据的时效性和相关性好,但收集成本较二手数据要高很多
1-1. 实验方法
实验方法的基本逻辑:
有意识地改变某个变量的情况,然后看另一个变量变化的情况,如果第二个变量随着第一个变量的变化而变化,就说明变量1对变量2有影响,即控制变量
统计在实验法中的作用:
- 可以确定进行实验所需要的单位的个数,以保证实验可以达到统计显著的结果
- 将统计的思想融入实验设计,可以使实验设计符合统计分析的标准
- 统计提供了提供尽可能最有效地同时研究几个变量影响的方法
- 在对实验数据进行分析时,根据研究的需要,统计可以提供最恰当的分析方法
1-2. 非实验方法
数据直接来源的非实验方法就是抽样,其中抽样可以分为两类:概率抽样 和 非概率抽样,其中概率抽样也区分为等概率抽样和不等概率抽样。
为了不使篇幅过长,本文采用列表来表示常用的概率抽样方法、非概率抽样方法以及在抽样之后所用到的调查方法。
常用的概率抽样方法
①. 简单随机抽样
-
概念: 简单随机抽样是从包括总体N个单位的抽样框中随机地、一个个地抽取n个单
位作为样本,每个单位的入样概率是相等的 -
特点: 简单、直观,在抽样框完整时,可以直接从中抽取样本,由于抽取的概率相
同,用样本统计量对目标量进行估计及计算估计量误差都比较方便 -
局限性:
- ⑴. 它要求将包含所有总体单位的名单作为抽样框,当N很大时,构造这样的抽样
框不容易 - ⑵. 这种方法抽出的单位很分散,给实施调查增加了困难
- ⑶. 这种方法没有利用其他辅助信息以提高估计的效率
- ⑴. 它要求将包含所有总体单位的名单作为抽样框,当N很大时,构造这样的抽样
②. 分层抽样
-
概念: 是将抽样范围按某种特征或某种规律划分为不同的层,然后从不同的层中独
立、随机地抽取样本 -
优点:
- ⑴. 保证了样本中包含有各种特征的抽样单位,样本的结构与总体的结构比较相
近,可以提高估计的精度 - ⑵. 这种方法在一定条件下为组织实施调查提供了方便;(当层是按行业或行政区
划进行划分时)
- ⑴. 保证了样本中包含有各种特征的抽样单位,样本的结构与总体的结构比较相
③. 整群抽样
-
概念: 将总体中若干个单位合并为群,抽样时直接抽取群,然后对中选群中的所有单
位全部实施调查 -
优点:
- ⑴. 抽取样本时只需要群的抽样框,大大简化了编制抽样框的工作量
- ⑵. 群通常由隶属于同一系统的单位所构成,调查地点相对集中,节省了调查费
用,方便了调查的实施
- 缺陷: 估计的精度较差
④. 系统抽样
-
概念: 将总体中的所有单位按一定顺序排列,在规定的范围内随机抽取一个单位作为
初始单位,然后按事先制定好的规则确定其他抽样单位 -
优点:
- ⑴. 操作简便
- ⑵. 如果有辅助信息,对总体内的单位进行有组织的排列,可以有效地提高估计的
精度
- 缺点: 对估计量方差的估计比较困难
⑤. 多阶段抽样
-
概念:先抽取群,但不是调查群内的所有单位,而是进一步抽样,从选中的群众抽取
出若干个单位进行调查;(这种属于二阶段抽样) -
优点:
- ⑴. 具有整群抽样的优点,保证了样本相对集中,节约了调查费用
- ⑵. 不需要包含所有低阶段抽样单位的抽样框
- ⑶. 由于实行再抽样,所以调查单位可以在更广的范围内展开
常用的非概率抽样方法
①. 方便抽样
- 概念: 指调查过程中,调查员依据方便的原则,自行确定作为样本的单位
- 优点: 容易实施,调查成本低
- 缺点: 样本的确定带有随意性,将调查结果推广到总体没有任何意义
②. 判断抽样
-
概念: 指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为
样本。 - 优点: 抽样成本较低、容易操作
③. 自愿样本
-
概念: 指被调查者自愿参加,称为样本中的一份子,向调查人员提供相关信息;(如
网上发问卷)
④. 滚雪球抽样
-
概念:在滚雪球抽样中,首先选择一组调查单位,对齐实施调查之后,再请他们提供
另外一些属于研究总体的调查对象,调查人员根据所提供的线索,继续进行调
查; -
优点:
- ⑴. 容易找到属于特定群体的被调查者,调查成本较低
- ⑵. 适合用于对稀少群体的调查
⑤. 配额抽样
-
概念: 首先将总体中的所有单位按一定的标志分为若干类,然后再每个类别中采用方
便抽样或判断抽样的方式选取样本单位 -
优点:
- ⑴. 抽样操作简单,可以保证总体中不同类别的单位都能包括在所选取的样本中,
使样本的结构和总体的结构类似 - ⑵. 在配额抽样中,可以按单一变量控制,也可以按交叉变量控制(交叉变量配额
控制可以保证样本的分布更为均匀)
- ⑴. 抽样操作简单,可以保证总体中不同类别的单位都能包括在所选取的样本中,
抽样后的调查方法
①. 自填式
- 概念: 指在没有调查员协助的情况下由被调查者自己填写,完成调查问卷
-
优点:
- ⑴. 调查组织者对自填式方法的管理相对容易,只要把问卷正确送到被调查者手中
即可 - ⑵. 成本最低,增加样本量对调查费用的影响很小,所以可以进行大范围的调查
- ⑶. 对被调查者有利,他们可以选择方便的时间填写,可以参考相关记录而不必依
靠记忆回答 - ⑷. 由于调查员不在场,因此可以在一定程度上减少被调查者回答敏感问题的压力
- ⑴. 调查组织者对自填式方法的管理相对容易,只要把问卷正确送到被调查者手中
-
缺点:
- ⑴. 问卷的回收率低;(通常需要做很多跟踪回访工作以取得较高的回收率)
- ⑵. 自填式方法不适合结构复杂的问卷
- ⑶. 自填式方法对调查的内容有所局限
- ⑷. 自填式方法的调查周期通常都比较长,调查人员需要对问卷的递送和回收方法
进行仔细的研究和选择 - ⑸. 对于数据搜集过程中出现的问题,一般难以及时采取调改措施
②. 面访式
- 概念: 指现场调查员与被调查者面对面,调查者提问、被调查者回答这种调查方式
-
优点:
- ⑴. 提高了调查的回答率
- ⑵. 提高了调查数据的质量
- ⑶. 可以对识字率低的群体实施调查
- ⑷. 由于调查问卷式由经过训练的调查员所控制的,所以在问卷设计中可以采用更
多的技术手段,使得调查问题的组合更为科学、合理 - ⑸. 在面访调查中,还可以借助其他调查工具以丰富调查内容
- ⑹. 对数据搜集所花费的时间可以进行调节;(加快或减慢都可以)
-
缺点:
- ⑴. 调查的成本较高;(调查费用与样本量关系十分密切)
- ⑵. 面访的方式的调查中对质量的控制有一定的难度,调查的数据质量与调查员的
工作态度、责任心有直接关系 - ⑶. 对于敏感问题,除非对调查员进行角色筛选,对调查员的访谈技巧进行专门的
技术培训,否则在面对面的条件下,被调查者通常不会像自填式方法下那样放
松
③. 电话式
- 概念: 指调查人员通过打电话的方式向被调查者实施调查;
-
优点:
- ⑴. 速度快,能够在很短的时间内完成调查
- ⑵. 特别适合样本单位十分分散的情况,数据搜集的成本低
- ⑶. 电话调查对调查员也是安全的;(不需要去偏僻的地区)
- ⑷. 电话调查中,对访问过程的控制较为容易,因为调查员的工作地点都在一起,
调查遇到的问题可以得到及时处理和解决,调查督导对访问实施监听也很容易
-
局限性:
- ⑴. 在电话使用率不高的地区,电话调查会受到限制
- ⑵. 使用电话进行访问的时间不能太长,人们不愿意通过电话进行冗长的交谈,在
被访问者对调查内容不感兴趣时更是如此 - ⑶. 电话调查所使用的问卷要简单
- ⑷. 与面访式相比,电话调查在被访问者不愿意接受调查时要说服他们就更为困难
④. 观察式
- 概念:通过直接观测的方法获取信息
二.数据的间接来源
概念: 数据的间接来源指的是数据是由别人通过调查或实验的方法搜集的,使用者只是
找到它们并加以使用(从这种途径收集到的数据称为间接来源的数据)
来源: 间接数据来源包括两种,系统内部和系统外部。系统内部是指统计部门和各级政
府部门公布的有关资料等,而系统外部指经营活动过程中的各种统计报表等
优缺点:
-
①. 优点
- ⑴. 搜集容易
- ⑵. 采集数据的成本低,而且能很快得到
- ⑶. 二手数据的作用比较广泛,除了分析所要研究的问题,这些资料还可以提供研
究问题的背景,帮助研究者更好地定义问题,检验和回答某些假设和疑问,寻
找研究问题的思路和途径
-
②. 局限性
- ⑴. 二手资料不是为特定的研究问题而产生的,所以在回答所研究的问题方面可能
有欠缺;(因此,在使用二手资料前,对二手资料进行评估是有必要的) -
⑵. 针对性不够
- ⑴. 二手资料不是为特定的研究问题而产生的,所以在回答所研究的问题方面可能