The Demopædia Encyclopedia on Population is under heavy modernization and maintenance. Outputs could look bizarre, sorry for the temporary inconvenience
多语言人口学词典 统一的第二版 中文卷
13
警告: 字典中提出的定义已成为人口学家广泛共识的主题,但不一定得到联合国的批准. 请参阅讨论页以获取可能的评论 |
|
13
130
人口统计1一词是指根据观察3所得到的有关人口的数字资料2。用适当的表格(206-1)收集4观察结果后,对资料加以校订5和复核5,以去掉明显的自相矛盾的地方,再将这些资料进行汇总6为某些具有共同特征的组7或类8。数据处理9包括介于收集到统计分析 10*之间的各个步骤(132-1)。
131
数据在处理和汇总之前,通常称为原始数据1,处理和汇总之后则称为基础数据1。基础数据通常包括一系列2的绝对数3,列成统计表4的形式。在这样的统计表中,通常将数据按某些变量5如年龄、子女数目等,或按某些品质特征6 (如性别、婚姻状况等)分类列出。如果同时按几个变量或特征把数据分类列表,这样的统计表叫作交叉分组表7或列联表7。概要表8提供的资料,不如各个单项表9详尽。
- 1. 如果数据是以个人(110-2)作为分析单位时,可以称之为微观数据。不是以个人作为分析单位的,则称为汇总数据或宏观数据,例如一个国家或国内的一个行政单位。微观数据可以从几个来源得到,如实地调查(203-5)或生命登记记录的样本。微观数据的一个新的来源是公开使用的普查样本,它是从普查资料抽取的一个系统样本或随机样本,供人分析使用。
- 7. 列出人口中的一个变量或特征的分布状况的表,通常叫作频数表。
132
基础数据的使用,通常包含两个阶段。分析1的目的在于把观察到的数据分解为不同成分(规模、结构、外在因素和所研究的现象)。综合2则是以各种不同方式把已分开的各个成分重新组合的过程。这两个阶段都要计算3一些有不同名称的指数4(参阅133-)。与基础数据相反,这些指数叫作结果6或综合指数 5*。更为严格的说,指数7(复数为indexes或indices)或指数值是表示某一数量相对于某个基数8之比,通常都是以基数作为100。有些指数是反映复杂情况的合适指标9;比如有时用婴儿死亡率作为衡量一个人口健康状况的指标。
- 3. 计算器是一种可以储存少量数据并进行数字较小的算术和统计计算的机器。计算机是一种可以传输、储存和计算大量数据集的机器系统,它不仅可以进行算术和统计计算,而且可以对数据进行逻辑处理。
133
分析(132-1)的最初阶段之一是将人口总数或事件数与其他人口总数或事件数相比。所得指数有不同的名称。最常用的名称是比 6*,它是用一个数除另一个数所得之商数。当除数和被除数是同一类中的不同类别(比如男人和女人,孩子和女人,不同年龄组等)时可能会使用一些特殊称谓的特定比1,如性别比。比例2是指部分同整体的数量之比。百分比3是用每一百中有多少来表示的比例。率4是一种特殊性质的比,用以表明在一个人口中或一个分人口中在一定时期内(通常为一年)某一事件发生的相对频数5。虽然已经建议对率一词采用这一用法,但其含意却在逐步扩大,而且往往被错用为比的同义词(例如;劳动力参与率,实际上是一个比例)。
- 4. 率通常用千分比表示,凡是使用“率”这一词语而又未附带任何说明时,即意为“千分比”。但是,有些率是用万分比、千万分比或百万分比来表示的,例如分死因死亡率(421-10)。在某些其他情况下,率也可以用每人或百分比来表示。“率”这个字有时可以省略,如人们可以看到千分之十的死亡(率)这样的说法,但并不鼓励这样做。
- 6. 总生育率(参见639-4)是育龄期内分年龄生育率(参见633-9)的总和,因此失去了它的逆时间维度(每年)。这种差异与长度和面积或速度和加速度之间的差异一样重要。 在某些语言中,喜欢用综合指数(参见132-5)这一术语以避免与率的逆时间维度(每年)混淆:综合指数的计算用人口统计事件的数量除以暴露的时间或人年。 如果使用的话,总生育率表达式中的术语率是指每名妇女的潜在生育率,这不足以构成一个“率”,但足以构成一个“无量纲比率”。
134
不可重复事件的相对频数(133-5)通常被看作是该事件发生的概率1。这意味着,作为分母的每个个人都有发生这种事件的可能3, 也就是说,必然有一个机会2或风险2使这一事件有可能发生。使用“风险”一词,并不意味着这一事件是人们所不愿意发生的;例如英文中所使用的“结婚风险”一词。人口常常被划分为各种分人口。在部分人口中,各人之间发生某种事件的风险要比在整个人口中的差别小;就风险本身而言,分人口要比相对不均匀的5整个人口更为均匀4。为这样的分人口计算的率叫作分组别率6,以区别用于整个人口的粗率(136-8)。一般率7有时也包含着一定的年龄界限,如一般生育率(633-8)就是这样。
135
分年龄率1,可以逐岁计算,也可以分年龄组计算(分年龄组率 2*)。分持续时间率3则是根据起点事件4或事件起点4(如结婚或前次生育)以来的全部时间长度计算。中心率10是将一年或某一时期(通常为5年)内发生的事件数除以该年或该时期平均人口数6或年中人口数6,或在该年或该时期内有可能经历该事件的人年数7,人年数是以年数来表示的所观察的全体个人在该年或该时期内可能经历该事件的时间总和。率这个词,也常用来表示另一类指标,即将一年或数年内发生的不可重复事件数除以该年初或该时期初所研究的同批人的人数;这种指标,有时叫作消减概率5,或简称概率6,以区别于前面提到的中心率。在本段中,“时期”一词是指—段时间。但时期率8是从划分时间的涵义上有时间变化的意义,也就是指某一年或某几年的率,时期率是与同批人率9或一代人率9相对而言的。
- 5. 商一词,法文中用以表示这一类率,英文中有时也这样使用。
136
临时性1 数据是在不完全或不充分控制和观察下得到的数据。观察完全之后,则代之以最终2数据。用上述两种数据计算的率,分别叫作临时性率3和最终率4。数字发表后又得到新的资料时,可以公布修订率5。校正率6一词,通常是指不完整的数据或者不适当的方法已经产生了误导性的或者会使所得值有局限性的结果并对这样的结果进行了校正,例如对漏查的校正、对移民的校正,对季节变动的校正。标准化率7或者调整率7是为了使某一变量如生育或死亡能在不同人口之间进行比较而设计的,办法是把另一变量(例如年龄)的影响保持不变。有些人口学家则用校正率7一词作为标准化率的同义词。当数据不允许直接估算比率(比如人口较少)时,使用根据高质量数据计算并应用于实际人口的标准率 9*(参见403-6)可提供与实际事件数相近的间接估计预期事件数。未标准化的率则叫作粗率8。虽然未标准化的率可以用来测度实际趋势,但是,在比较具有不同结构(144-4)的人口时,若不加区别地使用会导致作出错误的结论。
137
人口指数(132-7)在大多数情况下是指某一特定的观察时期1的人口现象;大多数的率(参阅133-4)尤其是这样。年率2则是关于12个月长的一段时期。如果收集了多年的观察资料并计算其平均数时,常用平均年率3一词来表示这一平均数。如果所计算的时期不是一年,可以通过乘上一个相应的因子,换算为年率4。有时也要计算关于一段无限短的时间的瞬间率5,例如瞬间死亡率(431-4)或瞬间人口增长率(702-5)。
138
队列分析或同批人分析(103-4)的主要目的是研究人口现象发生的强度1和速度2或间隔2。由一个不可重复事件(201-4)引起的现象的强度,可以用该事件发生的最终频数3计算,或用其补数(1-最终频率)计算。最终频数反映该同批人(116-2)在生存期间,在没有外部影响下经历这一事件那些人的比例。由生育或迁移等可重复事件(201-5)引起的现象,其强度可用该同批人在没有外部影响下会每人平均经历事件次数4来计量。所谓速度或间隔可以定义为在同批人当中与所研究现象有关的各种人口事件在时间上的分布。横断面分析或时期分析(103-5)的结果用时期指标5加以概括表示(相对于队列指标6或同批人指标而言)。时期指标可以有多种多样的方式。有一种常用的方法是,把所观察到的属于各个年龄或各种间隔的率看作是某一个假设同批人7或称综合同批人7的率。
- 3. 最终频数或其补数,按所研究的现象不同而有不同的名称:如产次递进比(637-7)、终生独身频数(521-1*)……。最好不要用比例这个词来作为上述这些名词的组成部分,而只把它用来表示实际观察到的比例。例如,一定要把终生独身的频数同普查中记载的某一年龄的独身者的比例加以区别。
- 4. 对于所观察的每人平均事件数在没有外部影响下一定会观察到的事件数,给予同一名称的情形,并不鲜见(例如死亡率)。遇到这种情形,应当使用不同的词;例如,曾生育子女数(637-2)就可同累积生育率(636-2)区分开。
- 5. 由于在进行真正的同批人分析之前就曾使用横断面分析和假设同批人,所以有些时期指标的名称往往让人感觉它们是属于一批同批人的。这样的用法会产生明显的矛盾。例如,在某些年份,由于很多人补上以前推迟的生育,分产次的出生概率可能会大于1。
* * *
|