13
出自Demopædia
|
13
130
人口統計 1(population statistics或demographic statistics)一詞是指根據觀察 3(observation)所得到的有關人口的數字資料 2(numerical data)(206-1)收集 4(collected)到這些資料后加以編輯 5(edited)和複核 5(verified),去掉明顯的自相矛盾的地方,再將這些資料進行匯總 6(tabulated)按其共同特徵分為不同的組 7(groups)和類 8(class)。數據處理 9(data processing)(132-1)之間的各個工作步驟。
131
數據在處理和匯總之前,通常稱為原始數據 1(raw data 或 crude data),處理和匯總之後則稱為基本數據 1(basic data 或 primary data)。基本數據通常包括若干系列 2(series), 絕對數 3(absolute numbers),組合成統計表 4(statistical tables)的形式。在這樣的統計表中,通常將資料按某些變量 5(variables) 如年齡、子女數目等,或按某些特徵 6(attributes 或 characteristics) (如性別、婚姻狀況等),分類列出。如果同時按幾個變量或特徵,把數據分類列表時,這樣的統計表叫作交叉分類匯總表 7(cross-tabulation)。概要表 8(summary tables)提供的資料,不如各個單項表 9(individual tables)詳盡。
- 1. 如果資料是以個人(110-2)作為分析單位時,可以稱之為微觀資料(micro-dare)。不是以個人作為分析單位的,則稱為集體資料(aggregate data)或宏觀資料(macro-data),例如一個國家或國內的一個行政單位。微觀資料可以從幾個來源得到,如實地調查(203-5)或生命登記記錄的樣本。微觀資料的一個新的來源是公開使用的普查樣本(census public use sample),它是從普查資料抽取的一個系統樣本或隨機樣本,供個分析使用。
- 7. 列出人口中的一個變量或特徵的分布狀況的表,通常叫作頻率表(frequency table)。
132
基本數據的使用,通常包含兩個階段。分析 1(analysis)的目的在於把觀察到的數字的各個成分(規模、結構、外在因素和所研究的現象)一個個分開。綜合 2(synthesis)則是以各種不同方式把已分開的各個成分重新組合的過程。這兩個階段都要計算 3(calculation 或 computation)一些有不同名稱的指數 4(indices)(參閱133-)。與基本數據相反,這些指數叫作結果 6(results)。更為嚴格的說,指數 7(index) 是表示某一數量對一基數 8(base)之比,通常都是以基數作為100。有些指數是說明綜合情況的很好的指標 9(indicators);比如有時用嬰兒死亡率作為衡量一個人口的衛生狀況的指標。
133
分析(132-1)的最初階段之一是將人口總數或事件數與其他人口總數或事件數相比。所得指數有不同的名稱。最常用的名稱是比 1(ratio),它是用一個數除另一個數所得之商數。比例 2(proportion)是指部分同整體的數量之比。百分比 3(percentage)是用每一百中有多少來表示的比例。率 4(rate)是一種特殊性質的比,用以表明在一個人口中或一個分人口中在一定時期內(通常為一年)某一事件發生的相對頻數 5(relative frequency)。雖然這是對率一詞所建議的用法,但其含意卻在逐步擴大,而且往往被錯用為比的同義詞(例如;勞動參加率,實際上是一個比例)。
- 4. 率通常按千分比表示,凡是使用“率”這一詞語而又未附帶任何說明時,即意為“千分比”。但是,有些率是用萬分比、千萬分比或百萬分比來表示的,例如分死因死亡率(421-10)。在某些其他情況下,率也可以用每人或百分比來表示。“率”這個字有時可以省略,如人們可以看到“千分之十的死亡(率)”(a mortality of ten per thousand)這樣的說法,但並不鼓勵這樣做。
134
不可重複事件的相對頻數(133-5)通常被看作是該事件發生的概率 1(probability)。這意味着,作為分母的每個個人都有顯露在這種機遇的可能下 3(exposed to risk), 也就是說,必然有一個機會 2(chance) 或 機遇 2(risk)使這一事件有可能發生。使用“機遇”一詞,並不意味着這一事件是人們所不願意發生的;例如大家所使用的“結婚機遇”一詞。人口常常被劃分為各種部分人口。在部分人口中,各人之間發生某種事件的機遇要比在整個人口中的差別為小;就機遇而言,部分人口要比相對較雜異的 5(heterogeneous)整個人口更為均勻 4(homogeneous)。為這樣的部分人口計算的率叫作分組別率 6(specific rates)(136-8)。一般率 7(general rates)(633-8)就是這樣。
135
分年齡率 1(age-specific rates),可以逐歲計算,也可以分年齡組計算。分時間率 3(duration-specific rates)則是根據起點事件 4(baseline event)或事件起點 4(event-origin)(如結婚或前次生育)以來的全部時期計算。中央率 10(central rates)是將一年或某一時期(通常為5年)內發生的事件數除以該年或該時期平均人口數 6(average population)或年中人口數 6(mid-year population),或在該年或該時期內有可能經歷該事件的人年數 7(person-years),人年數是以年數來表示的所觀察的全體個人在該年或該時期內可能經歷該事件的時間總和。率這個詞,也常用來表示另一類指標,即將一年或數年內發生的不可重複事件數除以該年初或該時期初所研究的同批人的人數;這種指標,有時叫作消減概率 5(attrition probability),或簡稱概率 6(probability),以區別於前面捉到的中央率。在本段中,“時期”一詞是指—段時間。但時期率 8(period rates)是從劃分時間的涵義上有時間變化的意義,也就是指某一年或某幾年的率,時期率是與隊列率 9(cohort rate) 或一代人率 9(generation rate)相對而言的。
136
臨時性 1(provisional) 數據是在不完全或不充分控制和觀察下得到的數據。觀察完全之後,則代之以最終 2(final)數據。用上述兩種數據計算的率,分別叫作臨時性率 3(provisional rates)和最終率 4(final rates)。數字發表后又得到新的資料時,可以公布修訂率 5(revised rates)。校正率 6(corrected rate)一詞,通常是指不完整的數據或者不適當的方法已經產生了會引起錯誤或者會使所得的值有局限性的結果,而且已經對這樣的結果進行了校正,例如對漏查的校正、對移民的校正,對季節變動的校正。標準化率 7(standardized rates)或者調整率 7(adjusted rates)是為了使某一變量如生育或死亡能在不同人口之間進行比較而設計的,辦法是把另一變量(例如年齡)的影響保持不變。有些人口學家則用校正率 7(corrected rate)一詞作為標準化率的同義詞。未標準化的率則叫作粗率 8(crude rates)(144-4)的人口時,若不加區別地使用會導致作出錯誤的結論。
137
人口指數(132-7)在大多數情況下是指某一特定的觀察時期 1(period of observation)的人口現象;大多數的率(參閱133-4)尤其是這樣。年率 2(annual rate)則是指12個月長的一段時期。如果收集了多年的觀察資料並計算其平均數時,常用平均年率 3(mean annual rate 或 average annual rate)一詞來表示這一平均數。如果所計算的時期不是一年,可以通過乘上一個相應的因素,換算為年率 4(converted to an annual basis)。有時,要計算瞬間率 5(instantaneous rates)(431-4)或瞬間人口增長率(702-5)。
138
隊列分析或同批人分析(103-4)的主要目的是研究人口現象發生的強度 1(intensity)和速度 2(tempo)或時間 2(timing)(201-4)引起的現象的強度,可以用該事件發生的最終頻數 3(ultimate frequency)(116-2)在生存期間,在沒有外部影響下經歷這一事件隊列的比例。由生育或遷移等可重複事件(201-5)引起的現象,其強度可用該隊列在沒有外部影響下每人平均經歷事件次數 4(mean number of events)(103-5)的結果用時期指標 5(period measure)加以概括表示[相對於隊列指標 6(cohort measure)而言]。時期指標可以有多種多樣的方式。有一種常用的方法是,把所觀察到的屬於各個年齡或各種間隔的率看作是某一個假設隊列 7(hypothetical cohort)或稱綜合隊列 7(synthetic cohort)的率。
- 3. 最終頻數或其補數,按所研究的現象不同而有不同的名稱:如產次遞進比(637-7)、終生獨身頻數(515-2*)……。最好不要用比例這個詞來作為上述這些名詞的組成部分,而只把它用來表示實際觀察到的比例。例如,一定要把終生獨身的頻數同普查中記載的某一年齡的獨身者的比例加以區別。
- 4. 對於所觀察的每人平均事件數在沒有外部影響下一定會觀察到的事件數,給予同一名稱的情形,並不鮮見(例如死亡率)。遇到這種情形,應當使用不同的詞;例如,曾生育子女數(637-2)就可同累積生育率(636-2)區分開。
- 5. 由於在進行真正的同批人分析之前就曾使用橫斷面分析和假設同批人,所以有些時期指標的名稱往往讓人感覺它們是屬於一批同批人的。這樣的用法會產生明顯的矛盾。例如,在某些年份,由於很多人補上以前推遲的生育,分產次的出生概率可能會大於1。
* * *
|
