22
出自Demopædia
|
22
220
從主要不是為統計目的而設的文件中取得統計數據的過程,叫作摘錄 1(extraction)。一般來說,不論其來源為何,統計資料都是要經過數據處理 2(processing)的。處理可以用手工 3(manual)、機器 4(mechanical)、或電子計算機 5(electronic)進行,也可以用以上幾數方式同時進行。手工處理所使用的設備,最複雜的為台式計算器 6(desk calculator)(224-2)或穿孔卡片機(224-3);電子處理使用計算機(132-2*)。不論採用哪種處理方式都要進行以下各種工作過程 7(types of operations):編輯 8(editing)(130-6*)、計算(132-3)和製表 9(table preparation)。進行以上工作的複雜程度決定於所選用的處理方式。
221
數據的編輯通常需要先將基本文件 2(basic document)的某些項目進行編碼 1(coding)。編碼方案 3(coding scheme)把每一項目材料與其數字代碼或字母代碼之間建立了一個互相對應關係。代碼簿收集了也說明了某套基本文件所用的編碼方案。編碼方案的目的是為了便於以後對數據進行分組。與編碼方案不同的是分類 4(classification),它是列載個別代碼的一張表。在表中對每個標題 5(heading)[4](213-3*)。編輯的第二階段工作就是清理 6(cleaning)檔案材料,用有效性核查 7(validity checks)和一致性核查 7(consistency checks)(參閱110-1)的範圍內進行,也可以在不同單位之間對比進行。差錯一經查出之後,可以用自動化方式對原始文件或檔案材料加以修正。
222
對於編輯過的數據需要分組(130-7)和匯總(130-6*),制定出統計表(131-4)。統計表可以用重組 1(sorting)法編製,按照事先確定的規則或按照某一特性,系統地重新組合。重組法可以用手工進行,也可以用機器進行。統計表也可以僅僅是對具有某一特徵的各個單位進行的簡單計數。單位或特徵的選擇可以依據一個或數個數量特徵進行,也可以依據一個或數個數量特徵的各種形式 2(modalities)(225-2)可以作以前人工很難作的計算。因此數據分析 3(data analysis)(參閱730-)經常需要進行大量計算,模擬(730-6)也是如此。
223
製表(220-9)的目的是把數據處理的結果,用列單 1(listings)(131-4)或統計圖(155-2)]表示出來。這些表和圖在敘述統計 2(descriptive statistics)中是普遍應用的。計算機製圖法 3(computer graphing)和計算機地圖學 3(computer cartography)的應用使研究者一開始就大量使用圖表。
224
單純的機器處理(220-4)不包括使用電子設備 1(electronic equipment)。這樣的設備已經取代了過去使用的製表機 2(tabulating machines)或單位記錄機 2(unit record machines)(221-1*),然後用鍵盤穿孔機 4(keypunch)記錄在穿孔卡片 3(punch cards)上。卡片複核機 5(card verifier)是用來核查穿孔的準確性的裝置。這兩種單位記錄機依然普遍使用,因為穿孔卡片仍然是將數據輸入計算機的常用的方法。其他類型的單位記錄設備[如卡片分類機 6(card sorter)和製表機 7(tabulator)《參閱226-4)或磁盤(參閱226-5)中,而不再用穿孔卡片。
225
人口學的研究大量依靠計算機 2(computer)進行電子數據處理 1(electronic data processing)。硬件 3(hardware)一詞是指機器部件,而軟件 4(software)則向用戶 5(user)提供使用計算機的方法。計算機專家 6(computer specialists)中包括程序員 7(programmers),他負責編寫系統分析員 9(system analysts)所設計的程序 8(programs)。
226
計算機(225-2)的硬件(225-3)有一個或數個中央處理機 1(central processing units)、一個中央存貯器 2(central memory)、一個或多個使用磁帶 4(magnetic tapes)或磁盤 5(disks)的大容量存貯裝置 3(mass storage devices)和一套輸入輸出設備 6(input-output devices)(225-4)包括操作系統 7(operating system)(225— 5)管理所有設備 8(facilities)和操作用戶的程序 9(users programs)(225-8)都是為解決標準問題而事先編寫好的。
227
用戶(225-5)可以用編寫程序(225-8)的方法處理其問題。編寫程序可以使用普通的程序設計語言 1(programming language)(226-2)中的處理程序(226-9)而設計的專門語言。中央存貯器如同一個數據庫管理系統 2(data base management system),用它來建立並保持一個數據庫 2(databank)、一個調查處理程序 3(survey processing program)或一個統計程序包 4(statistical package)。向計算機輸入和從計算機接受信息所用的裝置可以因使用的加工處理的方式而不同。在成批處理 7(batch processing)時,標準的輸入和輸出裝置是卡片閱讀機 5(card reader)和行式打印機 6(line printer)。在分時方式 9(timesharing mode)中,控制台 8(console)是進行加工處理的標準的輸入和輸出裝置。在以上兩種方式中,輸入裝置都可以不同計算機放在一個地方,這時,加工處理要用遠程終端設備 10(remote terminal)進行。
- 1. 除了上述的程序設計語言外,為了控制操作系統,也可以使用其他類型語言;這樣的語言,通常稱之為作業控制語言(job control language)。
228
計算機(225-2)處理數據要經歷三個主要階段。第一個階段是數據輸入 1(data entry或input)(224-3*)進行,也可以使用聯機 2(on line)(227-8)進行。已經存貯在計算機中的數據,既可以經由中央存貯器(226-2)存取,也可以經由本容量存貯裝置(226-3)存取,並將之用作輸入數據。第二個階段是處理(220-2),可以分為兩種主要類型:數值處理 4(numerical processing)和非數值處理 5(non-numerical processing)。統計和算術計算通常屬於數值處理運算,數據控制操作則主要是非數值處理。第三個階段,有時稱之為輸出階段。在這一階段中,可以把處理結果 6(processed results)或輸出 6(output)(227-6)上,也可以將其作為文件貯存在大容量存貯裝置(226-3)中,以備進一步處理。也可以把結果輸入繪圖機 7(plotter),從而將處理結果以圖或象形的方式表達出來。
* * *
|
