The Demopædia Encyclopedia on Population is under heavy modernization and maintenance. Outputs could look bizarre, sorry for the temporary inconvenience
22
|
22
220
从主要不是为统计目的而设的文件中取得统计数据的过程,叫作摘录1。一般来说,不论其来源为何,统计资料都是要经过数据处理2的。处理可以用手工3、机器4、或电子计算机5进行,也可以用以上几数方式同时进行。手工处理所使用的设备,最复杂的为台式计算器6(224-2)或穿孔卡片机(224-3);电子处理使用计算机(132-2*)。不论采用哪种处理方式都要进行以下各种工作过程7:编辑8(130-6*)、计算(132-3)和制表9。进行以上工作的复杂程度决定于所选用的处理方式。
221
数据的编辑通常需要先将基本文件2的某些项目进行编码1。编码方案3把每一项目材料与其数字代码或字母代码之间建立了一个互相对应关系。代码簿收集了也说明了某套基本文件所用的编码方案。编码方案的目的是为了便于以后对数据进行分组。与编码方案不同的是分类4,它是列载个别代码的一张表。在表中对每个标题5[4](213-3*)。编辑的第二阶段工作就是清理6档案材料,用有效性核查7和一致性核查7(参阅110-1)的范围内进行,也可以在不同单位之间对比进行。差错一经查出之后,可以用自动化方式对原始文件或档案材料加以修正。
222
对于编辑过的数据需要分组(130-7)和汇总(130-6*),制定出统计表(131-4)。统计表可以用重组1法编制,按照事先确定的规则或按照某一特性,系统地重新组合。重组法可以用手工进行,也可以用机器进行。统计表也可以仅仅是对具有某一特征的各个单位进行的简单计数。单位或特征的选择可以依据一个或数个数量特征进行,也可以依据一个或数个数量特征的各种形式2(225-2)可以作以前人工很难作的计算。因此数据分析3(参阅730-)经常需要进行大量计算,模拟(730-6)也是如此。
223
制表(220-9)的目的是把数据处理的结果,用列单1(131-4)或统计图(155-2)]表示出来。这些表和图在叙述统计2中是普遍应用的。计算机制图法3和计算机地图学3的应用使研究者一开始就大量使用图表。
224
单纯的机器处理(220-4)不包括使用电子设备1。这样的设备已经取代了过去使用的制表机2或单位记录机2(221-1*),然后用键盘穿孔机4记录在穿孔卡片3上。卡片复核机5是用来核查穿孔的准确性的装置。这两种单位记录机依然普遍使用,因为穿孔卡片仍然是将数据输入计算机的常用的方法。其他类型的单位记录设备[如卡片分类机6和制表机7《参阅226-4)或磁盘(参阅226-5)中,而不再用穿孔卡片。
225
人口学的研究大量依靠计算机2进行电子数据处理1。硬件3一词是指机器部件,而软件4则向用户5提供使用计算机的方法。计算机专家6中包括程序员7,他负责编写系统分析员9所设计的程序8。
226
计算机(225-2)的硬件(225-3)有一个或数个中央处理机1、一个中央存贮器2、一个或多个使用磁带4或磁盘5的大容量存贮装置3和一套输入输出设备6。软件(225-4)包括操作系统7,其任务是有效地操纵现有设备8使用户(225-5)执行用户的程序9,和为解决标准问题而事先编写好的程序(225-8),即处理程序10。
227
用户(225-5)可以用编写程序(225-8)的方法处理其问题。编写程序可以使用普通的程序设计语言1(226-2)中的处理程序(226-9)而设计的专门语言。中央存贮器如同一个数据库管理系统2,用它来建立并保持一个数据库2、一个调查处理程序3或一个统计程序包4。向计算机输入和从计算机接受信息所用的装置可以因使用的加工处理的方式而不同。在成批处理7时,标准的输入和输出装置是卡片阅读机5和行式打印机6。在分时方式9中,控制台8是进行加工处理的标准的输入和输出装置。在以上两种方式中,输入装置都可以不同计算机放在一个地方,这时,加工处理要用远程终端设备10进行。
- 1. 除了上述的程序设计语言外,为了控制操作系统,也可以使用其他类型语言;这样的语言,通常称之为作业控制语言(job control language)。
228
计算机(225-2)处理数据要经历三个主要阶段。第一个阶段是数据输入1(224-3*)进行,也可以使用联机2(227-8)进行。已经存贮在计算机中的数据,既可以经由中央存贮器(226-2)存取,也可以经由本容量存贮装置(226-3)存取,并将之用作输入数据。这是数据收集 3*的一部分,从提取(220-1)到电子介质上的转录,通过有效性检查(221-7)和一致性检查(221-8)。这两种检查可以在数据输入期间在线工作时进行。第二个阶段是处理(220-2),可以分为两种主要类型:数值处理4和非数值处理5。统计和算术计算通常属于数值处理运算,数据控制操作则主要是非数值处理。第三个阶段,有时称之为输出阶段。在这一阶段中,可以把处理结果6或输出6(227-6)上,也可以将其作为文件贮存在大容量存贮装置(226-3)中,以备进一步处理。也可以把结果输入绘图机7,从而将处理结果以图或象形的方式表达出来。
* * *
|