The Demopædia Encyclopedia on Population is under heavy modernization and maintenance. Outputs could look bizarre, sorry for the temporary inconvenience
多种语言人口词典 根据1982年出版的英文第二版翻译
“22”的版本间的差异
(→220) |
(→221) |
||
第12行: | 第12行: | ||
=== 221 === | === 221 === | ||
− | 数据的 | + | 数据的 编辑 通常需要先将{{TextTerm|基 本 文件(basic document|2}})的某些项目进行{{TextTerm|编码(coding|1}})。{{TextTerm|编码方 案(coding scheme|3}}) 把 每一项目 材料与 其数字代码或字母代码之间 建立了一个互相 对应关系。代码簿 收 集 了也 说明 了 某套基 本 文件所用的编码方 案 。编码方 案 的目的是为了便于以后对数据进行分组。与编码方 案 不同 的是{{TextTerm|分类(classification|4}}) ,它 是列载个 别 代码的一张表。在表中对每个{{TextTerm|标题(heading|5}})都给予一个或数个号码。 当 数据进行编码之后, 它们 就 变换 成为一份可以 由 机器 识别 的{{NonRefTerm|档案材料}}[<sup>4</sup>](213—3*)。 编辑 的第二阶段 工作就 是{{TextTerm|清理(cleaning|6}})档案材料,用{{TextTerm|有效性核查(validity checks|7}})和{{TextTerm|一致性核查(consistency checks|7}})的方式消灭差错 。 核查可以在每一{{NonRefTerm|统计单位}}(参阅110—1)的范围内进行,也可以在不同单位之间对比进行。差错一经查出之后,可以用自动化方式对原始文件或档案材料加以修正。 |
− | |||
=== 222 === | === 222 === |
2007年11月3日 (六) 10:28的版本
|
220
从主要不是为统计目的而设的文件中取得统计数据的过程,叫作摘录(extraction1(EnglishEntry missing))。一般来说,不论其来源为何,统计资料都是要经过数据处理(processing2(EnglishEntry missing))的。处理可以用手工(manual3(EnglishEntry missing))、机器(mechanical4(EnglishEntry missing))、或电子计算机(electronic5(EnglishEntry missing))进行,也可以用以上几数方式同时进行。手工处理所使用的设备,最复杂的为台式计算器(desk calculator6(EnglishEntry missing))。机器处理则使用制表机(224—2)或穿孔卡片机(224-3);电子处理使用计算机(132—2*)。不论采用哪种处理方式都要进行以下各种工作过程(types of operations7(EnglishEntry missing)):编辑(editing8(EnglishEntry missing))、汇总(130—6*)、计算(132—3)和制表(table preparation9(EnglishEntry missing))。进行以上工作的复杂程度决定于所选用的处理方式。
221
数据的编辑通常需要先将基本文件(basic document2(EnglishEntry missing))的某些项目进行编码(coding1(EnglishEntry missing))。编码方案(coding scheme3(EnglishEntry missing))把每一项目材料与其数字代码或字母代码之间建立了一个互相对应关系。代码簿收集了也说明了某套基本文件所用的编码方案。编码方案的目的是为了便于以后对数据进行分组。与编码方案不同的是分类(classification4(EnglishEntry missing)),它是列载个别代码的一张表。在表中对每个标题(heading5(EnglishEntry missing))都给予一个或数个号码。当数据进行编码之后,它们就变换成为一份可以由机器识别的档案材料[4](213—3*)。编辑的第二阶段工作就是清理(cleaning6(EnglishEntry missing))档案材料,用有效性核查(validity checks7(EnglishEntry missing))和一致性核查(consistency checks7(EnglishEntry missing))的方式消灭差错。核查可以在每一统计单位(参阅110—1)的范围内进行,也可以在不同单位之间对比进行。差错一经查出之后,可以用自动化方式对原始文件或档案材料加以修正。
222
对于校订过的数据,极少直接使用;还要把它们加以分组(130-7)和汇总(130-6*),通常以统计表(131—4)的形式表示出来。统计表可以用分类(sorting1(EnglishEntry missing))法编制,是按照事先确定的规则对一套资料的各个单位的重新组合的结果。分类可以用手工进行,也可以用机器进行。统计表也可以仅仅是对具有某一特征的各个单位进行的简单计数。单位或特征的选择,可以依据一个或数个数量特征的各个值进行,也可以依据一个或数个数量特征的各种形式(modalities2(EnglishEntry missing))进行。不进行计算(无论是简单的还是复杂的,孤立的还是重复的),就无法进行研究,现在,计算机(225—2)可以进行以前人工很难进行的计算。由于有了这种能力,便导致了数据分析(data analysis3(EnglishEntry missing))技术的发展。确定性模型和随机性模型(参阅730)经常需要进行大量计算,模拟(730-6)也是如此。
- 1. Sorting, n. (名),分类,sort,v. (动),分类。
223
制表(220—9)阶段的目的,在于在表(listings1(EnglishEntry missing))[数表(131—4)或图表(155—2)]中一目了然地看出加工整理的结果。这些数表和图表在表述统计(descriptive statistics2(EnglishEntry missing))中是普遍应用的。计算机制图(computer graphing3(EnglishEntry missing))和计算机制图学(computer cartography3(EnglishEntry missing))的应用,使我们有可能在开始阶段就大量使用图表。
224
单纯的机器加工整理(220—4)不包括使用电子设备(electronic equipment1(EnglishEntry missing))。电子设备已经取代了过去使用的制表机(tabulating machines2(EnglishEntry missing))或单位记录机(unit record machines2(EnglishEntry missing)),而且其用途更为广泛。在大多数情况下,首先将资料进行编码(221—1*),然后用键盘穿孔机(keypunch4(EnglishEntry missing))记录在穿孔卡片(punch cards3(EnglishEntry missing))上。卡片复核机(card verifier5(EnglishEntry missing))是用来核查穿孔的准确性的装置。这两种单位记录机依然普遍使用,因为穿孔卡片仍然是将数据输入计算机的常用的方法。其他类型的单位记录设备[如卡片分类机(card sorter6(EnglishEntry missing))和制表机(tabulator7(EnglishEntry missing))]的使用已日益减少。越来越多的是,将数据直接输入磁带《参阅226—4)或磁盘(参阅226—5)中,而不再用穿孔卡片。
- 3. Punch cards或punched cards,穿孔卡片。
- 4. Keypunch,键盘穿孔机,或card punch,卡片穿孔机。
225
人口学研究极大地依靠使用计算机(computer2(EnglishEntry missing))进行电子数据处理(electronic data processing1(EnglishEntry missing))。硬件(hardware3(EnglishEntry missing))一词是指机器部件,而软件(software4(EnglishEntry missing))则向用户(user5(EnglishEntry missing))提供使用计算机的方法。计算机专家(computer specialists6(EnglishEntry missing))中包括程序员(programmers7(EnglishEntry missing)),他负责编写系统分析员(system analysts9(EnglishEntry missing))所设计的程序(programs8(EnglishEntry missing))。
226
计算机(225—2)的硬件(225—3)有一个或数个中央处理机(central processing units1(EnglishEntry missing))、一个中央存贮器(central memory2(EnglishEntry missing))、一个或一个以上使用磁带(magnetic tapes4(EnglishEntry missing))或磁盘(disks5(EnglishEntry missing))的大容量存贮装置(mass storage devices3(EnglishEntry missing))和一套输入输出设备(input-output devices6(EnglishEntry missing))。软件(225—4)是一操作系统(operating system7(EnglishEntry missing)),其任务是使用户(225— 5)执行用户的程序(usersprograms8(EnglishEntry missing))和处理程序(processing programs9(EnglishEntry missing))时有效地操纵现有设备(facilities8(EnglishEntry missing))。以上程序都是为解决标准问题而事先编写好的程序(225—8)。
227
用户(225—5)可以用编写程序(225—8)的方法处理其问题。编写程序时,可以使用普通的程序设计语言(programming language1(EnglishEntry missing)),如 Fortran、Cobol、Basic或Algal,也可以使用为利用存储在计算机中央存贮器(226—2)中的处理程序(226—9)而设计的专门语言。中央存贮器如同一个数据库管理系统(data base management system2(EnglishEntry missing)),用它来建立并保持一个数据库(darabank2(EnglishEntry missing))、一个调查处理程序(survey processing program3(EnglishEntry missing))或一个统计程序包(statistical puckage4(EnglishEntry missing))。向计算机输入和从计算机接受信息所用的装置可以因使用的加工处理的方式而不同。在成批处理(batch processing7(EnglishEntry missing))时,标准的输入和输出装置是卡片阅读机(card reader5(EnglishEntry missing))和行式打印机(line printer6(EnglishEntry missing))。在分时方式(timesharing mode9(EnglishEntry missing))中,控制台(console8(EnglishEntry missing))是进行加工处理的标准的输入和输出装置。在以上两种方式中,输入装置都可以不同计算机放在一个地方,这时,加工处理要用远程终端设备(remote terminal10(EnglishEntry missing))进行。
- 1. 除了上述的程序设计语言外,为了控制操作系统,也可以使用其他类型语言;这样的语言,通常称之为作业控制语言(job control language)。
228
计算机(225-2)处理数据要经历三个主要阶段。第一个阶段是数据输入(data entry1(EnglishEntry missing))或输入(input1(EnglishEntry missing)),可以使用穿孔卡片(224—3*)进行,也可以使用联机(on line2(EnglishEntry missing))装置如键盘控制台(227—8)进行。已经存贮在计算机中的数据,既可以经由中央存贮器(226—2)存取,也可以经由本容量存贮装置(226—3)存取,并将之用作输入数据。第二个阶段是处理(220—2),可以分为两种主要类型:数值处理(numerical processing4(EnglishEntry missing))和非数值处理(non-numerical processing5(EnglishEntry missing))。统计和算术计算通常属于数值处理运算,数据控制操作则主要是非数值处理。第三个阶段,有时称之为输出阶段。在这一阶段中,可以把处理结果(processed results6(EnglishEntry missing))或输出(output6(EnglishEntry missing))打印在行式打印机(227—6)上,也可以将其作为文件贮存在大容量存贮装置(226—3)中,以备进一步处理。也可以把结果输入绘图机(plotter7(EnglishEntry missing)),从而将处理结果以图或象形的方式表达出来。
|