|
14
140
人口学中最常使用的平均数 1(average或mean)是算术平均数 2(arithmetic average或arithmetic mean)。算术平均数是一系列数值之和除以数值的个数。使用平均数一词而不加补充说明时,通常是指算术平均数。当所观察的数值都是正数时是几何平均数 3(geometric mean或geometric average)。几何平均数是N个数值之积的N次根。当各个不同的项乘以不同的加权系数 5(weighting factor)或称权数 5(weight)以表示其不同的重要性时,所得的是加权平均数 4(weighted average或weighted mean)。中位数 6(median)是把一组 7(set)观察值分为相等两部分的那个数值。众数 8(mode)是一套观察值中最常见的或出现次数最多的那个数值。
141
一批观察值的离散度 1(dispersion、 scatter、variation 或 variability)取决于各数值间的差别 2(differences 或 deviation)。这里仅介绍最常见的几个离散度的指标 3(measures of dispersion)。全距 4(range)是一套数值中最大值和最小值之差。四分位数距 5(interquartile range)(142-2)和第三个四分位数之差。它包括了该批观察值的一半;半四分位数距 6(semi-interquartile range),也叫四分位离差 6(quartile deviation),即四分位数的一半,常被用作一个衡量离散度的指标。平均差或均差 7(mean deviation 或 average deviation)(140-2);方差 8(variance)是这些离差算术平均数的平方;标准差 9(standard deviation)则是方差的平方根。
- 9. 标准差的通用符号是σ。
142
如果把一系列观察值从小向大排列,那么把观察值分成一定比例的那些数值,叫作分位数 1(quantiles),或叫作顺序统计数 1(order statistics)(140-6)已经在前面谈到。其他重要的顺序统计数是四分位数 2(quartiles),十分位数 3(deciles)和百分位数 4(percentiles或centiles)。它们分别把观察值分为四等份、十等份和一百等份。
143
如果一个变量在一定范围内的任何两点之间可以取得无数的值时,这一变量是连续性的 1(continuous)。与此相反的变量叫作非连续性的 2(discontinuous)。如果一个变量只能取得某些孤立的值时,这种变量叫作离散 3(discrete)变量。
144
把人口的各个成员按照—定的特征或变量加以排列,可以构成频数分布 1(frequency distribution),常简称为分布 1(distribution)。各个组的人数——绝对频数 2(absolute frequency 或 class frequency)——对总人数之比叫作该组的相对频数 3(relative frequency)。在人口学中,结构 4(structure) 组合 4(composition) 和分布 1(distribution)三词,经常互换使用来表示如年龄、性别、婚姻状况、职业等特征的分布。结构一词有时在更严格的意义上,只用来表示人口的年龄和性别分布。
- 4. 人口分布一词通常指人口的空间分布。然而,当分布一词与所分析的特征的名称连用时,则是结构或构成的同义词。因此,人们可以看到年龄分布、年龄和性别构成以及年龄和性别结构的说法。
* * *
|
![[首页]](/logo-demopaedia-withothers.png)