13

来自Demopædia
跳转至: 导航搜索


60px Warning : This page is under construction or needs deeper checking. As long as this

shield is here, please consider its contents as provisional.
Please look at the discussion area of this page for deeper details.


引言 | 序言 | 索引
章| 基本概念 索引 1 | 人口统计资料的加工整理 索引 2 | 人口的分布和分类 索引 3 | 死亡和患病 索引 4 | 结婚 索引 5 | 出生 索引 6 | 人口增长和更替 索引 7 | 空间流动 索引 8 | 人口学的经济方面和社会方面 索引 9
节号| 10 | 11 | 12 | 13 | 14 | 15 | 16 | 20 | 21 | 22 | 23 | 30 | 31 | 32 | 33 | 34 | 35 | 40 | 41 | 42 | 43 | 50 | 51 | 52 | 60 | 61 | 62 | 63 | 70 | 71 | 72 | 73 | 80 | 81 | 90 | 91 | 92 | 93


13

130

人口统计 1(population statistics或demographic statistics)一词是指根据观察 3(observation)所得到的有关人口的数字资料 2(numerical data)(206-1)收集 4(collected)到这些资料后加以编辑 5(edited)和复核 5(verified),去掉明显的自相矛盾的地方,再将这些资料进行汇总 6(tabulated)按其共同特征分为不同的 7(groups)和 8(class)。数据处理 9(data processing)(132-1)之间的各个工作步骤。

131

数据在处理和汇总之前,通常称为原始数据 1(raw data 或 crude data),处理和汇总之后则称为基本数据 1(basic data 或 primary data)。基本数据通常包括若干系列 2(series), 绝对数 3(absolute numbers),组合成统计表 4(statistical tables)的形式。在这样的统计表中,通常将资料按某些变量 5(variables) 如年龄、子女数目等,或按某些特征 6(attributes 或 characteristics) (如性别、婚姻状况等),分类列出。如果同时按几个变量或特征,把数据分类列表时,这样的统计表叫作交叉分类汇总表 7(cross-tabulation)。概要表 8(summary tables)提供的资料,不如各个单项表 9(individual tables)详尽。

  • 1. 如果资料是以个人(110-2)作为分析单位时,可以称之为微观资料(micro-dare)。不是以个人作为分析单位的,则称为集体资料(aggregate data)或宏观资料(macro-data),例如一个国家或国内的一个行政单位。微观资料可以从几个来源得到,如实地调查(203-5)或生命登记记录的样本。微观资料的一个新的来源是公开使用的普查样本(census public use sample),它是从普查资料抽取的一个系统样本或随机样本,供个分析使用。
  • 7. 列出人口中的一个变量或特征的分布状况的表,通常叫作频率表(frequency table)。

132

基本数据的使用,通常包含两个阶段。分析 1(analysis)的目的在于把观察到的数字的各个成分(规模、结构、外在因素和所研究的现象)一个个分开。综合 2(synthesis)则是以各种不同方式把已分开的各个成分重新组合的过程。这两个阶段都要计算 3(calculation 或 computation)一些有不同名称的指数 4(indices)(参阅133-)。与基本数据相反,这些指数叫作结果 6(results)。更为严格的说,指数 7(index) 是表示某一数量对一基数 8(base)之比,通常都是以基数作为100。有些指数是说明综合情况的很好的指标 9(indicators);比如有时用婴儿死亡率作为衡量一个人口的卫生状况的指标。

133

分析132-1)的最初阶段之一是将人口总数或事件数与其他人口总数或事件数相比。所得指数有不同的名称。最常用的名称是 1(ratio),它是用一个数除另一个数所得之商数。比例 2(proportion)是指部分同整体的数量之比。百分比 3(percentage)是用每一百中有多少来表示的比例。 4(rate)是一种特殊性质的比,用以表明在一个人口中或一个分人口中在一定时期内(通常为一年)某一事件发生的相对频数 5(relative frequency)。虽然这是对率一词所建议的用法,但其含意却在逐步扩大,而且往往被错用为比的同义词(例如;劳动参加率,实际上是一个比例)。

  • 4. 率通常按千分比表示,凡是使用“率”这一词语而又未附带任何说明时,即意为“千分比”。但是,有些率是用万分比、千万分比或百万分比来表示的,例如分死因死亡率(421-10)。在某些其他情况下,率也可以用每人或百分比来表示。“率”这个字有时可以省略,如人们可以看到“千分之十的死亡(率)”(a mortality of ten per thousand)这样的说法,但并不鼓励这样做。

134

不可重复事件的相对频数(133-5)通常被看作是该事件发生的概率 1(probability)。这意味着,作为分母的每个个人都有显露在这种机遇的可能下 3(exposed to risk), 也就是说,必然有一个机会 2(chance) 或 机遇 2(risk)使这一事件有可能发生。使用“机遇”一词,并不意味着这一事件是人们所不愿意发生的;例如大家所使用的“结婚机遇”一词。人口常常被划分为各种部分人口。在部分人口中,各人之间发生某种事件的机遇要比在整个人口中的差别为小;就机遇而言,部分人口要比相对较杂异的 5(heterogeneous)整个人口更为均匀 4(homogeneous)。为这样的部分人口计算的率叫作分组别率 6(specific rates)(136-8)。一般率 7(general rates)(633-8)就是这样。

135

分年龄率 1(age-specific rates),可以逐岁计算,也可以分年龄组计算。分时间率 3(duration-specific rates)则是根据起点事件 4(baseline event)或事件起点 4(event-origin)(如结婚或前次生育)以来的全部时期计算。中央率 10(central rates)是将一年或某一时期(通常为5年)内发生的事件数除以该年或该时期平均人口数 6(average population)或年中人口数 6(mid-year population),或在该年或该时期内有可能经历该事件的人年数 7(person-years),人年数是以年数来表示的所观察的全体个人在该年或该时期内可能经历该事件的时间总和。率这个词,也常用来表示另一类指标,即将一年或数年内发生的不可重复事件数除以该年初或该时期初所研究的同批人的人数;这种指标,有时叫作消减概率 5(attrition probability),或简称概率 6(probability),以区别于前面捉到的中央率。在本段中,“时期”一词是指—段时间。但时期率 8(period rates)是从划分时间的涵义上有时间变化的意义,也就是指某一年或某几年的率,时期率是与队列率 9(cohort rate) 或一代人率 9(generation rate)相对而言的。

136

临时性 1(provisional) 数据是在不完全或不充分控制和观察下得到的数据。观察完全之后,则代之以最终 2(final)数据。用上述两种数据计算的率,分别叫作临时性率 3(provisional rates)和最终率 4(final rates)。数字发表后又得到新的资料时,可以公布修订率 5(revised rates)。校正率 6(corrected rate)一词,通常是指不完整的数据或者不适当的方法已经产生了会引起错误或者会使所得的值有局限性的结果,而且已经对这样的结果进行了校正,例如对漏查的校正、对移民的校正,对季节变动的校正。标准化率 7(standardized rates)或者调整率 7(adjusted rates)是为了使某一变量如生育或死亡能在不同人口之间进行比较而设计的,办法是把另一变量(例如年龄)的影响保持不变。有些人口学家则用校正率 7(corrected rate)一词作为标准化率的同义词。未标准化的率则叫作粗率 8(crude rates)(144-4)的人口时,若不加区别地使用会导致作出错误的结论。

137

人口指数(132-7)在大多数情况下是指某一特定的观察时期 1(period of observation)的人口现象;大多数的率(参阅133-4)尤其是这样。年率 2(annual rate)则是指12个月长的一段时期。如果收集了多年的观察资料并计算其平均数时,常用平均年率 3(mean annual rate 或 average annual rate)一词来表示这一平均数。如果所计算的时期不是一年,可以通过乘上一个相应的因素,换算为年率 4(converted to an annual basis)。有时,要计算瞬间率 5(instantaneous rates)(431-4)或瞬间人口增长率(702-5)。

138

队列分析或同批人分析(103-4)的主要目的是研究人口现象发生的强度 1(intensity)和速度 2(tempo)或时间 2(timing)(201-4)引起的现象的强度,可以用该事件发生的最终频数 3(ultimate frequency)(116-2)在生存期间,在没有外部影响下经历这一事件队列的比例。由生育或迁移等可重复事件(201-5)引起的现象,其强度可用该队列在没有外部影响下每人平均经历事件次数 4(mean number of events)(103-5)的结果用时期指标 5(period measure)加以概括表示[相对于队列指标 6(cohort measure)而言]。时期指标可以有多种多样的方式。有一种常用的方法是,把所观察到的属于各个年龄或各种间隔的率看作是某一个假设队列 7(hypothetical cohort)或称综合队列 7(synthetic cohort)的率。

  • 3. 最终频数或其补数,按所研究的现象不同而有不同的名称:如产次递进比(637-7)、终生独身频数(515-2*)……。最好不要用比例这个词来作为上述这些名词的组成部分,而只把它用来表示实际观察到的比例。例如,一定要把终生独身的频数同普查中记载的某一年龄的独身者的比例加以区别。
  • 4. 对于所观察的每人平均事件数在没有外部影响下一定会观察到的事件数,给予同一名称的情形,并不鲜见(例如死亡率)。遇到这种情形,应当使用不同的词;例如,曾生育子女数(637-2)就可同累积生育率(636-2)区分开。
  • 5. 由于在进行真正的同批人分析之前就曾使用横断面分析和假设同批人,所以有些时期指标的名称往往让人感觉它们是属于一批同批人的。这样的用法会产生明显的矛盾。例如,在某些年份,由于很多人补上以前推迟的生育,分产次的出生概率可能会大于1

* * *

引言 | 序言 | 索引
章| 基本概念 索引 1 | 人口统计资料的加工整理 索引 2 | 人口的分布和分类 索引 3 | 死亡和患病 索引 4 | 结婚 索引 5 | 出生 索引 6 | 人口增长和更替 索引 7 | 空间流动 索引 8 | 人口学的经济方面和社会方面 索引 9
节号| 10 | 11 | 12 | 13 | 14 | 15 | 16 | 20 | 21 | 22 | 23 | 30 | 31 | 32 | 33 | 34 | 35 | 40 | 41 | 42 | 43 | 50 | 51 | 52 | 60 | 61 | 62 | 63 | 70 | 71 | 72 | 73 | 80 | 81 | 90 | 91 | 92 | 93