|
16
160
抽样法 1(sampling procedures)(110-2)。被抽查的这一部分人口叫作一个样本 2(sample)。一个总体是作为调查研究对象所有单位(elements3)的一个集群。一个抽样单位 4(sampling unit)(110-2)、家庭(115-1)或户(110-3),抽样单位则可以是个人、户、住宅区、市或地区。样本包含许多按照抽样方案 5(sampling scheme)或抽样计划 5(sampling plan)抽选出来的抽样单位。
161
用随机办法抽取各个单位而得到的样本,叫作随机样本 1(random sample)或概率样本 1(probability sample)。如果有一张列有全部抽样单位的完整的清单,就叫作一个抽样框架 3(sampling frame)。简单随机抽样 4(simple random sampling)是从抽样框架中随机 2(random)抽取一定比例的单位。这一比例叫作抽样比例 5(sampling fraction)或抽样比 5(sampling ratio)。系统样本 6(systematic sample)是从把抽样单位按顺序编号的框架中有系统地抽取 7(drawn systematically)出来的样本, 按照第n个、第(n+s)个、第(n+2s)个……等单位抽取;在这里,n不大于s,而且数目n是随机抽选的。在整群抽样 8(cluster sampling)中,总体单位不是一个一个抽取,而是一群一群 9(clusters)抽取的。
162
在分层随机抽样 1(stratified random sampling)中,人口按照某些特征被分成很多层 2(strata)(161-4)。各个层就所研究的那些特征而言是会比整个人口更为均匀(134-4)。在抽样时,不同层可以使用不同的抽样比例(161-5)。多级抽样 3(multi-stage sampling)是把样本抽选分几个阶段进行的方法,首先抽选一个由第一级抽样单位 4(primary units)(101-1),再从其中选取第二级抽样单位 6(secondary units)的分支样本 5(sub-sample),这一过程可以逐次进行。如果没有较好的抽样框架时,可以从地图上选取一些地区作为样本。这种方法叫作地区抽样 7(area sampling)。
163
概率样本(161-1)是用随机方法来取得有代表性的样本 1(representative sample),也就是说,该样本除了随机波动外,在所研究的各个特征方面是对这一人口的真实的反映。另一种定额抽样 2(quota sampling)(204-2)会规定其样本中必要包括的各类抽样单位的定额 3(quota)。在定额范围内,调查员可以任意选择抽样单位。
164
人口参数 1(population parameter)是说明一个总体的特征的数值。统计估计 2(statistical estimation)是一种方法,用这种方法可以从样本中估算总体参数的数值。这样的估计值必然包含抽样误差 3(sampling errors),其大小通常用标准误差 4(standard error)来衡量。有时除估计值外,还给出一个可信区间 5(confidence interval),来表明估计值可能存在于某些预定概率之间。当两个数值之间的差别是由于偶然性而出现的,这种情形的概率低于某一称为显著性水平 7(level of significance)的既定数值时,这一差别便称为显著差别 6(significant difference)。例如,若这一差别系偶然出现的,这种情形的概率低于0.05,则这一差别便以5%的水平成为显著差别。除抽样误差外,观察误差 8(observation errors)或回应误差 8(response errors)也会影响估计值。这种误差通常也包括调查员偏误 9(interviewer biases),即调查员在收集原始数据时所造成的系统误差。
* * *
|
![[首页]](/logo-demopaedia-withothers.png)