The Demopædia Encyclopedia on Population is under heavy modernization and maintenance. Outputs could look bizarre, sorry for the temporary inconvenience
22
|
220
從主要不是為統計目的而設的文件中取得統計數據的過程,叫作摘錄(extraction1(EnglishEntry missing))。一般來說,不論其來源為何,統計資料都是要經過數據處理(processing2(EnglishEntry missing))的。處理可以用手工(manual3(EnglishEntry missing))、機器(mechanical4(EnglishEntry missing))、或電子計算機(electronic5(EnglishEntry missing))進行,也可以用以上幾數方式同時進行。手工處理所使用的設備,最複雜的為台式計算器(desk calculator6(EnglishEntry missing))。機器處理則使用制表機(224—2)或穿孔卡片機(224-3);電子處理使用計算機(132—2*)。不論採用哪種處理方式都要進行以下各種工作過程(types of operations7(EnglishEntry missing)):編輯(editing8(EnglishEntry missing))、匯總(130—6*)、計算(132—3)和制表(table preparation9(EnglishEntry missing))。進行以上工作的複雜程度決定於所選用的處理方式。
221
數據的編輯通常需要先將基本文件(basic document2(EnglishEntry missing))的某些項目進行編碼(coding1(EnglishEntry missing))。編碼方案(coding scheme3(EnglishEntry missing))把每一項目材料與其數字代碼或字母代碼之間建立了一個互相對應關係。代碼簿收集了也說明了某套基本文件所用的編碼方案。編碼方案的目的是為了便於以後對數據進行分組。與編碼方案不同的是分類(classification4(EnglishEntry missing)),它是列載個別代碼的一張表。在表中對每個標題(heading5(EnglishEntry missing))都給予一個或數個號碼。當數據進行編碼之後,它們就變換成為一份可以由機器識別的檔案材料[4](213—3*)。編輯的第二階段工作就是清理(cleaning6(EnglishEntry missing))檔案材料,用有效性核查(validity checks7(EnglishEntry missing))和一致性核查(consistency checks7(EnglishEntry missing))的方式消滅差錯。核查可以在每一統計單位(參閱110—1)的範圍內進行,也可以在不同單位之間對比進行。差錯一經查出之後,可以用自動化方式對原始文件或檔案材料加以修正。
222
對於編輯過的數據需要分組(130-7)和匯總(130-6*),制定出統計表(131—4)。統計表可以用重組(sorting1(EnglishEntry missing))法編制,按照事先確定的規則或按照某一特性,系統地重新組合。重組法可以用手工進行,也可以用機器進行。統計表也可以僅僅是對具有某一特徵的各個單位進行的簡單計數。單位或特徵的選擇可以依據一個或數個數量特徵進行,也可以依據一個或數個數量特徵的各種形式(modalities2(EnglishEntry missing))進行。很少的研究能夠不作計算的,現在計算機(225—2)可以作以前人工很難作的計算。因此數據分析(data analysis3(EnglishEntry missing))技術的發展加強了。確定性模型和隨機性模型(參閱730)經常需要進行大量計算,模擬(730-6)也是如此。
223
制表(220—9)的目的是把數據處理的結果,用列單(listings1(EnglishEntry missing))[統計表(131—4)或統計圖(155—2)]表示出來。這些表和圖在敘述統計(descriptive statistics2(EnglishEntry missing))中是普遍應用的。計算機製圖法computer graphing3(EnglishEntry missing))和計算機地圖學(computer cartography3(EnglishEntry missing))的應用使研究者一開始就大量使用圖表。
224
單純的機器處理(220—4)不包括使用電子設備(electronic equipment1(EnglishEntry missing))。這樣的設備已經取代了過去使用的制表機(tabulating machines2(EnglishEntry missing))或單位記錄機(unit record machines2(EnglishEntry missing)),而且其用途更為廣泛。在大多數情況下,首先將資料進行編碼(221—1*),然後用鍵盤穿孔機(keypunch4(EnglishEntry missing))記錄在穿孔卡片(punch cards3(EnglishEntry missing))上。卡片覆核機(card verifier5(EnglishEntry missing))是用來核查穿孔的準確性的裝置。這兩種單位記錄機依然普遍使用,因為穿孔卡片仍然是將數據輸入計算機的常用的方法。其他類型的單位記錄設備[如卡片分類機(card sorter6(EnglishEntry missing))和制表機(tabulator7(EnglishEntry missing))]的使用已日益減少。越來越多的是,將數據直接輸入磁帶《參閱226—4)或磁盤(參閱226—5)中,而不再用穿孔卡片。
225
人口學的研究大量依靠計算機(computer2(EnglishEntry missing))進行電子數據處理(electronic data processing1(EnglishEntry missing))。硬件(hardware3(EnglishEntry missing))一詞是指機器部件,而軟件(software4(EnglishEntry missing))則向用戶(user5(EnglishEntry missing))提供使用計算機的方法。計算機專家(computer specialists6(EnglishEntry missing))中包括程式設計師(programmers7(EnglishEntry missing)),他負責編寫系統分析員(system analysts9(EnglishEntry missing))所設計的程序(programs8(EnglishEntry missing))。
226
計算機(225—2)的硬件(225—3)有一個或數個中央處理機(central processing units1(EnglishEntry missing))、一個中央存貯器(central memory2(EnglishEntry missing))、一個或一個以上使用磁帶(magnetic tapes4(EnglishEntry missing))或磁盤(disks5(EnglishEntry missing))的大容量存貯裝置(mass storage devices3(EnglishEntry missing))和一套輸入輸出設備(input-output devices6(EnglishEntry missing))。軟件(225—4)是一操作系統(operating system7(EnglishEntry missing)),其任務是使用戶(225— 5)執行用戶的程序(usersprograms8(EnglishEntry missing))和處理程序(processing programs9(EnglishEntry missing))時有效地操縱現有設備(facilities8(EnglishEntry missing))。以上程序都是為解決標準問題而事先編寫好的程序(225—8)。
227
用戶(225—5)可以用編寫程序(225—8)的方法處理其問題。編寫程序時,可以使用普通的程序設計語言(programming language1(EnglishEntry missing)),如 Fortran、Cobol、Basic或Algal,也可以使用為利用存儲在計算機中央存貯器(226—2)中的處理程序(226—9)而設計的專門語言。中央存貯器如同一個數據庫管理系統(data base management system2(EnglishEntry missing)),用它來建立並保持一個數據庫(darabank2(EnglishEntry missing))、一個調查處理程序(survey processing program3(EnglishEntry missing))或一個統計程序包(statistical puckage4(EnglishEntry missing))。向計算機輸入和從計算機接受信息所用的裝置可以因使用的加工處理的方式而不同。在成批處理(batch processing7(EnglishEntry missing))時,標準的輸入和輸出裝置是卡片閱讀機(card reader5(EnglishEntry missing))和行式打印機(line printer6(EnglishEntry missing))。在分時方式(timesharing mode9(EnglishEntry missing))中,控制台(console8(EnglishEntry missing))是進行加工處理的標準的輸入和輸出裝置。在以上兩種方式中,輸入裝置都可以不同計算機放在一個地方,這時,加工處理要用遠程終端設備(remote terminal10(EnglishEntry missing))進行。
- 1. 除了上述的程序設計語言外,為了控制操作系統,也可以使用其他類型語言;這樣的語言,通常稱之為作業控制語言(job control language)。
228
計算機(225-2)處理數據要經歷三個主要階段。第一個階段是數據輸入(data entry1(EnglishEntry missing))或輸入(input1(EnglishEntry missing)),可以使用穿孔卡片(224—3*)進行,也可以使用聯機(on line2(EnglishEntry missing))裝置如鍵盤控制台(227—8)進行。已經存貯在計算機中的數據,既可以經由中央存貯器(226—2)存取,也可以經由本容量存貯裝置(226—3)存取,並將之用作輸入數據。第二個階段是處理(220—2),可以分為兩種主要類型:數值處理(numerical processing4(EnglishEntry missing))和非數值處理(non-numerical processing5(EnglishEntry missing))。統計和算術計算通常屬於數值處理運算,數據控制操作則主要是非數值處理。第三個階段,有時稱之為輸出階段。在這一階段中,可以把處理結果(processed results6(EnglishEntry missing))或輸出(output6(EnglishEntry missing))打印在行式打印機(227—6)上,也可以將其作為文件貯存在大容量存貯裝置(226—3)中,以備進一步處理。也可以把結果輸入繪圖機(plotter7(EnglishEntry missing)),從而將處理結果以圖或象形的方式表達出來。
|