抽样设计
(一)抽样调查概述
1.概念:从研究对象的总体中抽取一部分单位作为样本进行调查,据此推断有关总体的数字特征。“总体”是所要调查对象的全体组成的集合,必须具备大量性、同质性、变异性三个特征。组成总体的各研究对象称为“总体单位”。“样本”是总体的一部分,是由从总体中按一定程序抽选出来的那部分总体单位所组成的集合。
2.特点有5项:是非全面调查、样本按随机的原则抽取(代表性强)、以抽取的全部样本单位作为一个“代表团”代表总体、样本数量有保证、调查结果的准确程度较高。因此,抽样调查被认为是非全面调查方法中推算和代表总体最完善、最有科学根据的方法。
3.步骤:界定总体——制订抽样框——分割总体——决定样本规模——确定调查的信度和效度——决定抽样方式——实施调查并推测总体。
(二)概率抽样方法:让总体中的每个单位都有一个已知的、不为零的概率进入样本。有三个特点:概率抽样以随机原则为基础、必须通过一定的随机化程序来实现、抽样误差是可计算和可控制的。因此,可排除调查者的主观影响。
具体有以下五种方法:
1.简单随机抽样 ——最基本的抽样
也称纯随机抽样,对总体单位不进行任何分组排列,仅按随机原则直接从总体中抽取样本,使总体中的每一个单位均有同等的被抽取机会。理论上最容易处理,适用于总体规模不太大的情况。
2.等距抽样——广泛应用的抽样
也称为系统抽样或机械抽样。首先它将总体中各单位按一定顺序排列,根据样本容量的要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位。
排序(可按有关标志、无关标志及自然状态排,例如在购买力调查中,按收入多少由低至高排序,也可按户口册、姓氏笔划排。)——定间隔——随机定起点——等间隔抽样。
按照具体实施等距抽样的做法,等距抽样可分为:直线等距抽样、对称等距抽样和循环等距抽样三种。
等距抽样的主要优点是:第一,易于实施,工作量少。第二,样本在总体中的分布比较均匀,故而抽样误差小于或至多等于简单随机抽样,即较为精确;因此,等距抽样成为的一种抽样方法。
缺点:由于等距抽样是以总体单位的无规律排列为前提的,如果总体单位的排列出现规律的周期性时,就可能出现系统偏差。
3.分层抽样
所谓分层抽样,就是先将总体按照一种或几种特征分为几个子总体(类、群),每一个子总体称为一层,然后从每一层随机抽取样本,将子样本合在一起,即为总体的样本。即分类随机抽。按照各层之间的抽样比是否相同,分层抽样可分为等比例分层抽样与非等比例分层抽样两种。
分层抽样的主要优点有:(1)总体内部分层明显时,能够提高样本的代表性,从而提高推断总体的精确性;(2)适用于既要对总体参数进行推断,也要对各子总体(层)的参数进行推断的情形,例如一项全国性抽样调查,若以省为层那么调查以后既可进行全国性的统计,也可获得各省的统计数据;(3)灵活方便,便于组织实施。
局限性:调查者必须对总体情况有较多的了解,否则无法进行恰当分层。
4.整群抽样
整群抽样是先将总体中各单位归并成若干个互不交叉重复的群(或“集合”),然后以群为抽样单位,从总体中抽取若干个群体作为样本,而对中选群内的所有单位进行全面调查的抽样方式。例如,要调查北京市小学生近视眼比例有多大,就可把全市小学生按所在学校分,先对所有小学校进行抽样,对抽中的学校所包括的学生再进行全面调查。整群抽样特别适用于缺乏总体单位的抽样框。应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异大,群间差异小。
整群抽样的主要优点是易于取得抽样框,便于组织,可以节省人力、物力和财力。最大缺点是样本分布不均匀,样本的代表性差,抽样误差较大。
5.多阶段抽样
也称为多级抽样,是指在抽取样本时,分为两个或两个以上的阶段从总体抽取样本的一种抽样方式。其具体操作过程是:第一阶段,将总体分为若干个一级抽样单位从中抽选若干个一级抽样单位入样;第二阶段,将入样的每个一级单位分成若干个二级单位,从入样的每个一级单位中各抽选若干个二级抽样单位入样,依此类推,直到获得样本。 接上例,第一阶段先抽学校,第二阶段从抽中的学校中抽取部分年级作为样本,第三阶段从被抽中的年级的所有班级中再抽取部分班级作为样本,第四阶段从抽中的班级中再抽取部分学生进行调查。
相对于分层抽样和整群抽样,多阶段抽样的优点在于适用于抽样调查的面特别广,相对地可以节省调查费用。其主要缺点是抽样时较为麻烦,而且由样本对总体进行估计比较复杂。