香港洪兴帮和东星帮:第十一章  资料的审核与整理

来源:百度文库 编辑:九乡新闻网 时间:2024/04/30 03:54:39
第十一章  资料的审核与整理

学习要求:了解资料审核与整理的内容、步骤;掌握资料的检查、分类、汇总和编辑方法;了解数据资料的编码、登录、输入与检查的方法及过程,能制作简单的统计图表。

第一节? 资料的审核
  资料的审核是对收集到的原始资料进行审查与核实的过程。审核的原则为:真实性、标准性、准确性、完整性。

一,对第一手资料的审核
  资料一般可分为第一手资料和第二手资料。第一手资料包括观察、访问记录和问卷资料。对观察、访问资料的审核是要检查、核对资料的真实性、准确性和适用性。对问卷资料的审核要注意:(1)资料的完整性;(2)有没有逻辑错误;(3)回答的可靠性。

二、对第二手资料的审核
  第二手资料可分为书面文献和统计文献。对书面文献要注意弄清:(1)文献的来源、背景;(2)编写的时间;(3)文献的真伪性、可信性。对统计文献的审核要注意;
  (1)指标的定义和分组的标准问题;? (2)指标的统计总体范围。

第二节  资料的整理
资料整理是对原始资料进行简化、分类、汇总,使之更加条
理化、系统化且宜于分析的过程。
分类或分组是根据对象的某些特征将其区分为不同种类。分类可在调查前,也可在调查之后进行。分类的方法有现象分类与本质分类。分类标志可选择品质标志或数量标志。对于观察、访问记录,可在分类的基础上进行汇总和编辑,如按时间顺序或按事件、人物整理记录,并将其汇编成适于查找的档案。

第三节? 资料汇总的技术
数据资料包括问卷资料、统计资料、测验结果以及结构化的观察数据等。其汇总技术有两种:手工汇总与计算机汇总。计算机汇总的程序是编码、登录、录入和程序编制。

一、资料汇总的一般程序
问卷资料一般是由多项调查内容组成的,它反映了每一个案对各项问题的具体回答。每一项问题有多种回答,所谓编码是给每一个回答类别编一个特定的号数,使回答类别与不同的数字建立一一对应的关系,使文字回答转换为数据形式。
编码册标明了各项调查题目及各种类别的编号,以便于登录和查找。编码册的设计要考虑:(1)封闭性问题的编码;(2)开放性问题的编码; (3)无回答问题的编码。编码的方式有两种: (1)先编码;(2)后编码。所谓登录是将问卷中的回答转录到特定的表格中。登录的方式主要有:  (1)转录表;  (2)问卷页边登录。
数据的计算机录入是将登录表中的数据送人计算机储存起来,并将每一个案的数据档案汇总起来以备调用。输入后,要对数据进行检查,以减少和消除登录误差和输入误差。检查的主要方法:(1)逻辑检查;(2)幅度检查。

二、电子计算机汇总的步骤
汇总的技术有两种:手工汇总和计算机汇总。
计算机汇总大致分四个步骤:编码、登录、录入和程序编制。
(一)编码
1.操作方法:编码是将问卷中的信息数字化,转换成统计软件和统计程序能够识别的数字,这项工作是一种信息代换的过程。编码工作主要是建立编码手册,编码手册记录着每一个数字所表示的实际意义,它相当于打电报的密码手册。
2.开放性回答的后编码

(二)登录
登录是将编好码的问卷资料过录到资料卡片上去,以便于将它们输入到计算机的磁带、软盘或硬盘上去。

三)录入
录入是将登录在资料卡片上的数据录入到计算机的存储设备(磁带、软盘、硬盘)上,其工作性质同登录相同。所不同的是登录的操作是在资料卡片上进行,录入是在计算机的终端机上进行。

(四)程序编制
编制程序是一项技术工作,它要求编制者会应用计算机语言。但现在这项工作已由软件工作者为我们做好,我们只需会使用软件包就行了。有很多软件包可以用,最常用的是SPSS软件包(社会科学统计软件包)

三、一个资料整理的实例
某部门对本系统60岁以上的成员做过一次普查。我们摘选该调查表的一部分。
1.姓名       
2.年龄       
3.业务专长       
4.家庭居住面积       
a.20平方米以下(   )
b.20—45平方米(   )
c.45—65平方米(   )
d.65平方米以上(   )
5.您是否退休?
a.已退休(   )
b,延期退休(   )
c.暂缓退休(   )
d.该退未退(   )
6.你不愿意退休的理由:(只能填一项)
a.身体健康尚能工作(   )
b.担心青黄不接影响工作(   )
c.无所事事空虚苦闷(   )
d.认为退休输得不合理,等待新精神(   )
这个调查共提出60个问题,收集了50000份问卷,用手工整理工作量太大,而且难免会出差错,所以要采用计算机整理。

(一)编制编码手册
上面列出的六个问题可以分为两种类型,一是开放性问题(1、2、3题),二是封闭式问题(4、5、6题)。开放性问题是后分类,要先解决类别问题。其步骤是先将答案通阅一遍,然后概括、归纳,要注意穷尽性和互斥性原则。比如业务专长这个问题,通阅后归纳出了29个类别共250多种专长,那么就用数码的前两位代表类别,后一位代表该类别中的不同专业。如规定文学类别编码是00,其中搞文学概论的编码是001,外国文学是006,封闭性问题的分类是在调查前制定好的,所以只是指派数字的问题。表11-1是这次调查编码手册的一部分。
表11-1? 编码手册示例片段
1.资料卡片上的列数(即格)。如第1—5格,意味着资料卡片上的每一个个案的第1—5列的记录是被调查者的姓名编码。第1—5列是5位数,它的编码可以从00001—99999。
2.问题号码。编码手册上的问题号码和问卷或调查表上的题号是一致的。
3.项目名称。这是指问卷中所要调查的问题或项目是什么。
4.编码的内容说明。这是指该问题或项目中各个数字的具体含义,卡片的第一行读到这样的数字000165089441,这时我们可以根据编码手册转译过来,即第00001号被调查者,年龄是65岁,业务专长是国际贸易,住宅面积65平方米以上,属于该退未退的工作人员,未退休的理由是身体健康尚能工作。
在编码过程中还要考虑到给问卷表中无回答和不知道的答案一个数字编码。给无回答答案的编码最常用的是0,对需要不止一个格的可以重复所给的数字(如00或000);给“不知道”答案的编码常为9或99,999。

(二)根据编码手册将问卷或调查表上的资料数字化,再过录到资料卡片上去。
首先将每张问卷上的调查资料根据编码手册的指导转换成数字并填写在问卷右侧的短线上,然后就可过录到登录卡(资料卡片)上。通用的登录卡是每张80列25行(见表11—2)。登录卡可以自制,每张80列是个死规定(因为个人计算机屏幕的宽度是80字节,为了录入检查方便,登录卡的宽度应和屏幕宽度一致),每张的行数可以自由掌握。

(三)将登录在资料卡片上的资料输入到计算机内
现在处理数据的软件包有SPSS、SAS等。操作者通过按键将登录卡上的数据敲入计算机,同时屏幕显示数据,在条件较好的计算机站里,录入后可以利用计算机来查错、纠错。查错的程序有两种:第一种是检查输入信息的有效性,即对数码进行幅度检查。幅度检查的方法主要是检查资料的子项是否都在规定的幅度范围内。例如,关于性别的调查项目答案只有两个:男、女,如果男=1,女=2;那么这个项目的答案幅度是1—2,不可能有3—4等数码。幅度检查就是要把那些超越幅度的错误找出来。第二种是检索输入信息相互之间的一致性,即对数码进行逻辑检查。逻辑检查主要是检查同一份问卷中,不同问题的答案是否相互矛盾。

(四)向计算机发布指令,通过计算机来整理资料
当资料全部输入磁盘或磁带后,就可输入指令整理资料了。

第四节? 统? 计? 表
在整理数据资料时,常常要制作一些简单的统计图表来说明
调查的汇总结果。统计图分为圆形图、条形图、直方图、曲线图等。统计图的特点是简明、直观、易于理解。统计表的特点是条理性强、便于调查比较。简单统计图(单变量表)的结构与设计:(1)简单表;(2)简单分组表。

一、统计表的结构、种类及制作方法
1、统计表的结构
由标题、横标目(主项)、纵标目(纵向)、数字四部分组成。
2、统计表的类型
(1)按主词结构:简单分组表、分组表、复合表;
(2)按照宾词结构:简单设计、复杂设计。
3、统计表的制作
(1)简单明了;
(2)格式开口;
(3)栏目下面加编号;
(4)表注简明扼要;
(5)横栏合计放最后,纵栏合计放最前。

二、统计图的种类及制作方法
统计图是用几何图形或象形图来显示社会现象数量特征的一种重要工具。
特点:直观、形象、生动。
作用:表明内部结构、对比关系、发展趋势、分布状况、依存关系。(P272)
1、几何图:条形图、平面图、立体图、曲线图;
2、象形图;
3、统计地图;
4、复合图。