统计学 -- 数据的来源

数据搜集方法.png

一.数据的直接来源

概念: 数据的直接来源也称为一手数据或原始数据,是指通过自己的调查或实验活动直
    接获得的一手数据,其收集方法主要有实验方法非实验方法

特点: 一手数据的时效性和相关性好,但收集成本较二手数据要高很多

1-1. 实验方法

实验方法的基本逻辑:

有意识地改变某个变量的情况,然后看另一个变量变化的情况,如果第二个变量随着第一个变量的变化而变化,就说明变量1对变量2有影响,即控制变量

统计在实验法中的作用:

  • 可以确定进行实验所需要的单位的个数,以保证实验可以达到统计显著的结果
  • 将统计的思想融入实验设计,可以使实验设计符合统计分析的标准
  • 统计提供了提供尽可能最有效地同时研究几个变量影响的方法
  • 在对实验数据进行分析时,根据研究的需要,统计可以提供最恰当的分析方法

1-2. 非实验方法

  数据直接来源的非实验方法就是抽样,其中抽样可以分为两类:概率抽样非概率抽样,其中概率抽样也区分为等概率抽样和不等概率抽样。
  为了不使篇幅过长,本文采用列表来表示常用的概率抽样方法、非概率抽样方法以及在抽样之后所用到的调查方法。

           常用的概率抽样方法

①. 简单随机抽样

  • 概念: 简单随机抽样是从包括总体N个单位的抽样框中随机地、一个个地抽取n个单
        位作为样本,每个单位的入样概率是相等的
  • 特点: 简单、直观,在抽样框完整时,可以直接从中抽取样本,由于抽取的概率相
        同,用样本统计量对目标量进行估计及计算估计量误差都比较方便
  • 局限性:
    • ⑴. 它要求将包含所有总体单位的名单作为抽样框,当N很大时,构造这样的抽样
         框不容易
    • ⑵. 这种方法抽出的单位很分散,给实施调查增加了困难
    • ⑶. 这种方法没有利用其他辅助信息以提高估计的效率

②. 分层抽样

  • 概念: 是将抽样范围按某种特征或某种规律划分为不同的层,然后从不同的层中独
        立、随机地抽取样本
  • 优点:
    • ⑴. 保证了样本中包含有各种特征的抽样单位,样本的结构与总体的结构比较相
         近,可以提高估计的精度
    • ⑵. 这种方法在一定条件下为组织实施调查提供了方便;(当层是按行业或行政区
         划进行划分时)

③. 整群抽样

  • 概念: 将总体中若干个单位合并为群,抽样时直接抽取群,然后对中选群中的所有单
        位全部实施调查
  • 优点:
    • ⑴. 抽取样本时只需要群的抽样框,大大简化了编制抽样框的工作量
    • ⑵. 群通常由隶属于同一系统的单位所构成,调查地点相对集中,节省了调查费
         用,方便了调查的实施
  • 缺陷: 估计的精度较差

④. 系统抽样

  • 概念: 将总体中的所有单位按一定顺序排列,在规定的范围内随机抽取一个单位作为
        初始单位,然后按事先制定好的规则确定其他抽样单位
  • 优点:
    • ⑴. 操作简便
    • ⑵. 如果有辅助信息,对总体内的单位进行有组织的排列,可以有效地提高估计的
         精度
  • 缺点: 对估计量方差的估计比较困难

⑤. 多阶段抽样

  • 概念:先抽取群,但不是调查群内的所有单位,而是进一步抽样,从选中的群众抽取
       出若干个单位进行调查;(这种属于二阶段抽样)
  • 优点:
    • ⑴. 具有整群抽样的优点,保证了样本相对集中,节约了调查费用
    • ⑵. 不需要包含所有低阶段抽样单位的抽样框
    • ⑶. 由于实行再抽样,所以调查单位可以在更广的范围内展开


           常用的非概率抽样方法

①. 方便抽样

  • 概念: 指调查过程中,调查员依据方便的原则,自行确定作为样本的单位
  • 优点: 容易实施,调查成本低
  • 缺点: 样本的确定带有随意性,将调查结果推广到总体没有任何意义

②. 判断抽样

  • 概念: 指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为
        样本。
  • 优点: 抽样成本较低、容易操作

③. 自愿样本

  • 概念: 指被调查者自愿参加,称为样本中的一份子,向调查人员提供相关信息;(如
        网上发问卷)

④. 滚雪球抽样

  • 概念:在滚雪球抽样中,首先选择一组调查单位,对齐实施调查之后,再请他们提供
        另外一些属于研究总体的调查对象,调查人员根据所提供的线索,继续进行调
        查;
  • 优点:
    • ⑴. 容易找到属于特定群体的被调查者,调查成本较低
    • ⑵. 适合用于对稀少群体的调查

⑤. 配额抽样

  • 概念: 首先将总体中的所有单位按一定的标志分为若干类,然后再每个类别中采用方
        便抽样或判断抽样的方式选取样本单位
  • 优点:
    • ⑴. 抽样操作简单,可以保证总体中不同类别的单位都能包括在所选取的样本中,
         使样本的结构和总体的结构类似
    • ⑵. 在配额抽样中,可以按单一变量控制,也可以按交叉变量控制(交叉变量配额
         控制可以保证样本的分布更为均匀)


            抽样后的调查方法

①. 自填式

  • 概念: 指在没有调查员协助的情况下由被调查者自己填写,完成调查问卷
  • 优点:
    • ⑴. 调查组织者对自填式方法的管理相对容易,只要把问卷正确送到被调查者手中
         即可
    • ⑵. 成本最低,增加样本量对调查费用的影响很小,所以可以进行大范围的调查
    • ⑶. 对被调查者有利,他们可以选择方便的时间填写,可以参考相关记录而不必依
         靠记忆回答
    • ⑷. 由于调查员不在场,因此可以在一定程度上减少被调查者回答敏感问题的压力
  • 缺点:
    • ⑴. 问卷的回收率低;(通常需要做很多跟踪回访工作以取得较高的回收率)
    • ⑵. 自填式方法不适合结构复杂的问卷
    • ⑶. 自填式方法对调查的内容有所局限
    • ⑷. 自填式方法的调查周期通常都比较长,调查人员需要对问卷的递送和回收方法
         进行仔细的研究和选择
    • ⑸. 对于数据搜集过程中出现的问题,一般难以及时采取调改措施

②. 面访式

  • 概念: 指现场调查员与被调查者面对面,调查者提问、被调查者回答这种调查方式
  • 优点:
    • ⑴. 提高了调查的回答率
    • ⑵. 提高了调查数据的质量
    • ⑶. 可以对识字率低的群体实施调查
    • ⑷. 由于调查问卷式由经过训练的调查员所控制的,所以在问卷设计中可以采用更
         多的技术手段,使得调查问题的组合更为科学、合理
    • ⑸. 在面访调查中,还可以借助其他调查工具以丰富调查内容
    • ⑹. 对数据搜集所花费的时间可以进行调节;(加快或减慢都可以)
  • 缺点:
    • ⑴. 调查的成本较高;(调查费用与样本量关系十分密切)
    • ⑵. 面访的方式的调查中对质量的控制有一定的难度,调查的数据质量与调查员的
         工作态度、责任心有直接关系
    • ⑶. 对于敏感问题,除非对调查员进行角色筛选,对调查员的访谈技巧进行专门的
         技术培训,否则在面对面的条件下,被调查者通常不会像自填式方法下那样放
         松

③. 电话式

  • 概念: 指调查人员通过打电话的方式向被调查者实施调查;
  • 优点:
    • ⑴. 速度快,能够在很短的时间内完成调查
    • ⑵. 特别适合样本单位十分分散的情况,数据搜集的成本低
    • ⑶. 电话调查对调查员也是安全的;(不需要去偏僻的地区)
    • ⑷. 电话调查中,对访问过程的控制较为容易,因为调查员的工作地点都在一起,
         调查遇到的问题可以得到及时处理和解决,调查督导对访问实施监听也很容易
  • 局限性:
    • ⑴. 在电话使用率不高的地区,电话调查会受到限制
    • ⑵. 使用电话进行访问的时间不能太长,人们不愿意通过电话进行冗长的交谈,在
         被访问者对调查内容不感兴趣时更是如此
    • ⑶. 电话调查所使用的问卷要简单
    • ⑷. 与面访式相比,电话调查在被访问者不愿意接受调查时要说服他们就更为困难

④. 观察式

  • 概念:通过直接观测的方法获取信息


二.数据的间接来源

概念: 数据的间接来源指的是数据是由别人通过调查或实验的方法搜集的,使用者只是
   找到它们并加以使用(从这种途径收集到的数据称为间接来源的数据)

来源: 间接数据来源包括两种,系统内部和系统外部。系统内部是指统计部门和各级政
   府部门公布的有关资料等,而系统外部指经营活动过程中的各种统计报表等

优缺点:

  • ①. 优点
    • ⑴. 搜集容易
    • ⑵. 采集数据的成本低,而且能很快得到
    • ⑶. 二手数据的作用比较广泛,除了分析所要研究的问题,这些资料还可以提供研
         究问题的背景,帮助研究者更好地定义问题,检验和回答某些假设和疑问,寻
         找研究问题的思路和途径
  • ②. 局限性
    • ⑴. 二手资料不是为特定的研究问题而产生的,所以在回答所研究的问题方面可能
         有欠缺;(因此,在使用二手资料前,对二手资料进行评估是有必要的)
    • ⑵. 针对性不够


      结束语.jpeg
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,088评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,715评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,361评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,099评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,987评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,063评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,486评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,175评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,440评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,518评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,305评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,190评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,550评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,152评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,451评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,637评论 2 335

推荐阅读更多精彩内容

  • 弹指已十年,岁月催红颜。 回首不复返,怆然低声叹。 少年不知情,把酒尽言欢。 望空有悔意,奈何知错晚。 忆起往昔人...
    劉慧剛阅读 295评论 5 3
  • 当面向大海,我感受到人生如轻舟,随风漂流;当面向高山,我感受到生命如旅程,越挫越勇。不禁沉思:人活着,该以怎样的姿...
    Nb0WSw70阅读 219评论 0 0
  • 我是一名初二女孩子的妈妈,昨天老师因为孩子上课看手机让我去学校了,和老师交流后发现她不止是带手机这件事,还有...
    炫紫不迷茫阅读 644评论 6 49