The Demopædia Encyclopedia on Population is under heavy modernization and maintenance. Outputs could look bizarre, sorry for the temporary inconvenience
“22”的版本间的差异
(→226) |
(→227) |
||
第36行: | 第36行: | ||
=== 227 === | === 227 === | ||
− | {{NonRefTerm|用户}}(225—5)可以用{{NonRefTerm|编写程序}}(225—8)的方法处理其问题。编写程序 | + | {{NonRefTerm|用户}}(225—5)可以用{{NonRefTerm|编写程序}}(225—8)的方法处理其问题。编写程序可以使用普通的{{TextTerm|程序设计语言(programming language|1}}),如 Fortran、Cobol、Basic或Algal,也可以使用为利用存储在计算机{{NonRefTerm|中央存贮器}}(226—2)中的{{NonRefTerm|处理程序}}(226—9)而设计的专门语言。中央存贮器如同一个{{TextTerm|数据库管理系统(data base management system|2}}),用它来建立并保持一个{{TextTerm|数据库(databank|2}})、一个{{TextTerm|调查处理程序(survey processing program|3}})或一个{{TextTerm|统计程序包(statistical package|4}})。向计算机输入和从计算机接受信息所用的装置可以因使用的加工处理的方式而不同。在{{TextTerm|成批处理(batch processing|7}})时,标准的输入和输出装置是{{TextTerm|卡片阅读机(card reader|5}})和{{TextTerm|行式打印机(line printer|6}})。在{{TextTerm|分时方式(timesharing mode|9}})中,{{TextTerm|控制台(console|8}})是进行加工处理的标准的输入和输出装置。在以上两种方式中,输入装置都可以不同计算机放在一个地方,这时,加工处理要用{{TextTerm|远程终端设备(remote terminal|10}})进行。 |
{{Note|1| 除了上述的程序设计语言外,为了控制操作系统,也可以使用其他类型语言;这样的语言,通常称之为{{NoteTerm|作业控制语言(job control language)}}。}} | {{Note|1| 除了上述的程序设计语言外,为了控制操作系统,也可以使用其他类型语言;这样的语言,通常称之为{{NoteTerm|作业控制语言(job control language)}}。}} | ||
2007年11月3日 (六) 10:56的版本
|
220
从主要不是为统计目的而设的文件中取得统计数据的过程,叫作摘录(extraction1(EnglishEntry missing))。一般来说,不论其来源为何,统计资料都是要经过数据处理(processing2(EnglishEntry missing))的。处理可以用手工(manual3(EnglishEntry missing))、机器(mechanical4(EnglishEntry missing))、或电子计算机(electronic5(EnglishEntry missing))进行,也可以用以上几数方式同时进行。手工处理所使用的设备,最复杂的为台式计算器(desk calculator6(EnglishEntry missing))。机器处理则使用制表机(224—2)或穿孔卡片机(224-3);电子处理使用计算机(132—2*)。不论采用哪种处理方式都要进行以下各种工作过程(types of operations7(EnglishEntry missing)):编辑(editing8(EnglishEntry missing))、汇总(130—6*)、计算(132—3)和制表(table preparation9(EnglishEntry missing))。进行以上工作的复杂程度决定于所选用的处理方式。
221
数据的编辑通常需要先将基本文件(basic document2(EnglishEntry missing))的某些项目进行编码(coding1(EnglishEntry missing))。编码方案(coding scheme3(EnglishEntry missing))把每一项目材料与其数字代码或字母代码之间建立了一个互相对应关系。代码簿收集了也说明了某套基本文件所用的编码方案。编码方案的目的是为了便于以后对数据进行分组。与编码方案不同的是分类(classification4(EnglishEntry missing)),它是列载个别代码的一张表。在表中对每个标题(heading5(EnglishEntry missing))都给予一个或数个号码。当数据进行编码之后,它们就变换成为一份可以由机器识别的档案材料[4](213—3*)。编辑的第二阶段工作就是清理(cleaning6(EnglishEntry missing))档案材料,用有效性核查(validity checks7(EnglishEntry missing))和一致性核查(consistency checks7(EnglishEntry missing))的方式消灭差错。核查可以在每一统计单位(参阅110—1)的范围内进行,也可以在不同单位之间对比进行。差错一经查出之后,可以用自动化方式对原始文件或档案材料加以修正。
222
对于编辑过的数据需要分组(130-7)和汇总(130-6*),制定出统计表(131—4)。统计表可以用重组(sorting1(EnglishEntry missing))法编制,按照事先确定的规则或按照某一特性,系统地重新组合。重组法可以用手工进行,也可以用机器进行。统计表也可以仅仅是对具有某一特征的各个单位进行的简单计数。单位或特征的选择可以依据一个或数个数量特征进行,也可以依据一个或数个数量特征的各种形式(modalities2(EnglishEntry missing))进行。很少的研究能够不作计算的,现在计算机(225—2)可以作以前人工很难作的计算。因此数据分析(data analysis3(EnglishEntry missing))技术的发展加强了。确定性模型和随机性模型(参阅730)经常需要进行大量计算,模拟(730-6)也是如此。
223
制表(220—9)的目的是把数据处理的结果,用列单(listings1(EnglishEntry missing))[统计表(131—4)或统计图(155—2)]表示出来。这些表和图在叙述统计(descriptive statistics2(EnglishEntry missing))中是普遍应用的。计算机制图法computer graphing3(EnglishEntry missing))和计算机地图学(computer cartography3(EnglishEntry missing))的应用使研究者一开始就大量使用图表。
224
单纯的机器处理(220—4)不包括使用电子设备(electronic equipment1(EnglishEntry missing))。这样的设备已经取代了过去使用的制表机(tabulating machines2(EnglishEntry missing))或单位记录机(unit record machines2(EnglishEntry missing)),而且其用途更为广泛。在大多数情况下,首先将资料进行编码(221—1*),然后用键盘穿孔机(keypunch4(EnglishEntry missing))记录在穿孔卡片(punch cards3(EnglishEntry missing))上。卡片复核机(card verifier5(EnglishEntry missing))是用来核查穿孔的准确性的装置。这两种单位记录机依然普遍使用,因为穿孔卡片仍然是将数据输入计算机的常用的方法。其他类型的单位记录设备[如卡片分类机(card sorter6(EnglishEntry missing))和制表机(tabulator7(EnglishEntry missing))]的使用已日益减少。越来越多的是,将数据直接输入磁带《参阅226—4)或磁盘(参阅226—5)中,而不再用穿孔卡片。
225
人口学的研究大量依靠计算机(computer2(EnglishEntry missing))进行电子数据处理(electronic data processing1(EnglishEntry missing))。硬件(hardware3(EnglishEntry missing))一词是指机器部件,而软件(software4(EnglishEntry missing))则向用户(user5(EnglishEntry missing))提供使用计算机的方法。计算机专家(computer specialists6(EnglishEntry missing))中包括程序员(programmers7(EnglishEntry missing)),他负责编写系统分析员(system analysts9(EnglishEntry missing))所设计的程序(programs8(EnglishEntry missing))。
226
计算机(225—2)的硬件(225—3)有一个或数个中央处理机(central processing units1(EnglishEntry missing))、一个中央存贮器(central memory2(EnglishEntry missing))、一个或多个使用磁带(magnetic tapes4(EnglishEntry missing))或磁盘(disks5(EnglishEntry missing))的大容量存贮装置(mass storage devices3(EnglishEntry missing))和一套输入输出设备(input-output devices6(EnglishEntry missing))。软件(225—4)包括操作系统(operating system7(EnglishEntry missing)),其任务是有效地为用户(225— 5)管理所有设备(facilities8(EnglishEntry missing))和操作用户的程序(users programs8(EnglishEntry missing))。这些程序(225—8)都是为解决标准问题而事先编写好的。
227
用户(225—5)可以用编写程序(225—8)的方法处理其问题。编写程序可以使用普通的程序设计语言(programming language1(EnglishEntry missing)),如 Fortran、Cobol、Basic或Algal,也可以使用为利用存储在计算机中央存贮器(226—2)中的处理程序(226—9)而设计的专门语言。中央存贮器如同一个数据库管理系统(data base management system2(EnglishEntry missing)),用它来建立并保持一个数据库(databank2(EnglishEntry missing))、一个调查处理程序(survey processing program3(EnglishEntry missing))或一个统计程序包(statistical package4(EnglishEntry missing))。向计算机输入和从计算机接受信息所用的装置可以因使用的加工处理的方式而不同。在成批处理(batch processing7(EnglishEntry missing))时,标准的输入和输出装置是卡片阅读机(card reader5(EnglishEntry missing))和行式打印机(line printer6(EnglishEntry missing))。在分时方式(timesharing mode9(EnglishEntry missing))中,控制台(console8(EnglishEntry missing))是进行加工处理的标准的输入和输出装置。在以上两种方式中,输入装置都可以不同计算机放在一个地方,这时,加工处理要用远程终端设备(remote terminal10(EnglishEntry missing))进行。
- 1. 除了上述的程序设计语言外,为了控制操作系统,也可以使用其他类型语言;这样的语言,通常称之为作业控制语言(job control language)。
228
计算机(225-2)处理数据要经历三个主要阶段。第一个阶段是数据输入(data entry1(EnglishEntry missing))或输入(input1(EnglishEntry missing)),可以使用穿孔卡片(224—3*)进行,也可以使用联机(on line2(EnglishEntry missing))装置如键盘控制台(227—8)进行。已经存贮在计算机中的数据,既可以经由中央存贮器(226—2)存取,也可以经由本容量存贮装置(226—3)存取,并将之用作输入数据。第二个阶段是处理(220—2),可以分为两种主要类型:数值处理(numerical processing4(EnglishEntry missing))和非数值处理(non-numerical processing5(EnglishEntry missing))。统计和算术计算通常属于数值处理运算,数据控制操作则主要是非数值处理。第三个阶段,有时称之为输出阶段。在这一阶段中,可以把处理结果(processed results6(EnglishEntry missing))或输出(output6(EnglishEntry missing))打印在行式打印机(227—6)上,也可以将其作为文件贮存在大容量存贮装置(226—3)中,以备进一步处理。也可以把结果输入绘图机(plotter7(EnglishEntry missing)),从而将处理结果以图或象形的方式表达出来。
|