资料的整理与分析特训(ppt 59页).ppt_第1页
资料的整理与分析特训(ppt 59页).ppt_第2页
资料的整理与分析特训(ppt 59页).ppt_第3页
资料的整理与分析特训(ppt 59页).ppt_第4页
资料的整理与分析特训(ppt 59页).ppt_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,1,资料的整理和分析,1,2,资料整理的定义,资料整理主要是指对文字资料和对数字资料的整理。它是根据调查研究的目的,运用科学的方法,对调查所获得的资料进行审查、检验,分类、汇总等初步加工,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的过程。 对原始资料进行审核、分组、汇总、描述和归纳,使之条理化和便于统计分析和推断。,1,3,资料整理的意义,资料整理是资料研究的重要基础,是提高调查资料质量和使用价值的必要步骤,是保存资料的客观要求。,1,4,资料整理的原则,真实性 合格性 准确性 完整性 系统性 统一性 简明性 新颖性,1,5,资料整理的分类,根据信息资料的性质、内容或特征

2、进行分类。要按一定的标准将所研究课题的有关信息资料分成不同的组或类。,从资料来源来分,可以分为网上资料、书本资料、观察体验资料;,从表现形式上分,可以分为文字资料、图像资料、录音资料等。,从资料的性质来考虑,资料还可以分为定量资料(主要是各种数据)与定性资料(主要是文字材料)。,1,6,文字资料的整理,在社会调查研究中,定性资料基本上都是文字资料,因此一般也把文字资料整理称作定性资料整理。由于文字资料在来源上存在差异,所以其整理方法也略不同。,通常情况下可划分为审查、分类和汇编三个基本步骤。,1,7,文字资料的整理一:审查,有些研究,需要收集的资料比较多,面对这成堆的资料,首要的任务就是要在初

3、步阅读(当然需要做简单的分析)的基础之上做适当的筛选。筛选的主要目的在于“去伪存真”,“由表及里”,即只保留对本课题研究有参考价值的资料而删去其余。 文字资料的审查,主要解决其真实性、准确性和适用性问题。,1,8,最后,要做到不真实的予以淘汰,不准确的予以核实准确,不全面的补全找齐。,通常,对于“理胜资料”要求它有:可靠性,正确性,权威性; 对于事实资料要求它有:真实性,典型性,浓缩性。,1,9,文字资料的整理二:分类,文字资料的分类,就是将资料分门别类,使得繁杂的资料条理化、系统化,为找出规律性的联系提供依据。,定义,1,10,比如对某一课题资料,可以按历史线索分类; 可以按不同的观点分类;

4、 可以按研究的问题的性质分类; 还可以按子课题分类,等等。,分类的方法,1,11,文字资料的整理三:汇编,文字资料的汇编,主要是指根据调查研究的实际要求,对分类完成之后的资料进行汇总、编辑,使之成为能反映调查对象客观情况的系统、完整的材料。,汇编的定义,1,12,首先:根据研究目的要求和研究对象客观情况,确定合理的逻辑结构,对资料进行初次加工。如:给各种资料加上标题,重要的部分标上各种符号,对各种资料按照一定的逻辑结构编上序号等。,汇编的步骤,1,13,其次:要求汇编好的资料要井井有条、层次分明,能系统完整地反映研究对象的全貌。 第三:用简短明了的文字说明研究对象的客观情况,并注明资料来源和出

5、处。,1,14,数据资料的整理,数据资料是调查研究中定量分析的依据,因此数据资料的整理也叫定量资料的整理。,1,15,数据资料的整理一: 一般程序,在资料的整理阶段,为了便于得出正确的调查结论,需要对数据资料作进一步的处理,其一般程序包括: 数字资料检验、分组、汇总和制作统计表或统计图几个阶段。,1,16,检验,主要是对数字资料的完整性和正确性进行检验,以确保更加准确的研究结果。,一般程序1,分组就是把调查的数据按照一定的标志划分为不同的组成部分。,一般程序2,1,17,汇总就是根据调查研究目的把分组后的数据汇集到有关表格中,并进行计算和加总,集中、系统地反映调查对象总体的数量特征。数据的汇总

6、可分为手工汇总和机械汇总。,经过了汇总的数字资料,一般要通过表格或图形表现出来,最常见的方式就是统计表和统计图。,一般程序3,一般程序4,1,18,统计表,统计资料的基本表现形式,也是最常见的形式。 使得数据具有条理性、清晰易懂、便于比较和分析。 形式:标题、纵列标题、横列标题、表体 类型:简单表(一组横标目和一组列标目) 复合表(多组横标目和一组列标目、一 组横标目和多组列标目、多组横标目和多 组列标目),1,19,利用点、线、面、体形象、直观地表示统计资料的基本特征和变化趋势。,统计图,1,20,一、条形图 利用平行柱型的长短表示数的大小。 适用于分类资料和离散性数量资料的频率分布,1,2

7、1,二、直方图 利用距形面积表示各组中数据出现的频数。 适用于连续性资料的频率分布,1,22,1,23,三、饼图 利用扇形面积表示不同类别的频率,可采用不同 的色彩。 适用于类别不多的分类资料的频率分布。,1,24,1,25,1,26,四、线形图 利用曲线表示数据的动态变化趋势。 不同的指标可以分别用不同的形式来表示,以示 区别,1,27,1,28,统计表与统计图,统计表:信息量大、精确的数值。 不仅反映资料的特征和趋势,还可以提供 更详细的信息。 统计图:形象、生动、直观 主要反映资料的主要特征和趋势,经常需要统计表结合统计图来说明问题;根据研究目的灵活应用;统计表应用更多、更常见。,1,2

8、9,即运用科学的分析方法对所占有的信息资料进行分析,研究特定课题的现象、过程及内外各种联系,找出规律性的东西,构成理论框架。,资料分析的定义,1,30,对资料的分析,从方法论角度,一般可分为定性分析和定量分析,而且通常在实际分析过程中,要把这两种方法结合起来,交互使用。 定性分析与定量分析相互补充,相得益彰,处在统一的连续体之中,定性分析为定量分析提供基础,定量分析的结果要通过定性分析来解释和理解。,资料分析的方法,1,31,对资料的质的规定性做(整体的)分析,除了要运用一些哲学的观点和方法如辩证唯物主义和历史唯物主义、分析哲学、现象学、解释学等外, 主要使用诸如比较、归纳、演绎、分析、综合等

9、逻辑方法;同时还要求对分析结果的信度、效度和客观度等可靠性指标进行检验和评价。,文字资料的分析: 定性分析方法,1,32,定量分析的适用情况,第一种情况:如果收集到的资料已经是一些数据,我们只需根据条件和需要选用适当的统计分析方法进行处理和分析便可;,1,33,第二种情况:对收集到的定性资料做进一步的定量分析。 比如要研究某一学科的结构问题,我们可能收集了这一学科及相关学科的许多版本的教材(包括现在的和过去的),显然首先需要进行比较,如何比较?可能就需要数量化处理,定量分析;还比如要对学生在某一门学科学习中的错误进行分析,收集到各种事实的文字材料之后,定量分析可能也是十分重要的。,1,34,定

10、量分析的方法一,描述统计,主要用于特征分析,即通过一些概括性量数来反映数据的全貌和特征。,1,35,描述数据集中趋势的量数,如算术平均数,几何平均数,中位数,众数;,描述统计方法的分类,用来描述数据分布特征的概括性量数主要有:,反映数据间彼此差异的程度的量数,如全距,平均差,方差,标准差;,1,36,WACS-RC解释,一、FIQ 分等 理论分布 估计范围 二、VIQ PIQ 差异 15 三、分测验 IQ水平 平均分100 标准差15 与常模比较 分测验水平:平均分10 标准差3 与自己比较 一个标准差3分 强项 弱项,1,37,反映原始数据在所处分布中地位的量数,如百分位分数,百分等级分数,

11、标准分数,T分数等;,1,38,正态分布标准分系统,1,39,当事物之间存在联系但又不能直接做出因果关系的解释时,可用一些合理的指标对相关事物的观测值进行相关分析,其相关程度用相关系数表示,如有积差相关,等级相关,质量相关(点二列相关、双二列相关);等等。,1,40,推论统计,即在无法直接估计总体参数的情况下,只能采用抽样方式对样本进行研究,并由样本统计量对事物的总体做出统计的推论和估计。它包括两个方面内容:总体参数估计,即根据样本的数字特征推断总体的相应的数字特征,它又有点估计和区间估计之分;假设检验。在许多研究中(比如比较两种教学方法、两种教材的优劣),首先需要提出一个假设(比如:谁比谁在

12、什么状态下要好或者差或其他),这一假设合理或者正确与否,需要抽取样本用其统计量进行检验。通常根据总体是否从正态分布,将其分为参数检验和非参数检验,前者如Z检验,t检验,X2检验,方差分析等;后者有中数检验,符号检验,符号秩次检验,U检验,秩次方差分析等。,定量分析的方法二,1,41,多元统计。由于影响教育教学现象的因素不是单-的,而是多方面的、多层次的、多特征的,因而要分析这些因素之间的各种关系需要用多元统计方法。多元分析的基本方法主要有:回归分析。对于两个具有不确定关系的变量,上述的相关系数可以对其两变量是否相关做出定性描述,对其相关程度做出总的定量描述,但是如何通过自变量的值去估计和预测因

13、变量的发展变化,相关分析无能为力,这时需要用回归分析。它一般分为一元线性回归和多元线性回归两种;因素分析(和主成分分析)。当描述事物性质的变量比较多时,常常需要从中提取较少的几个主要的一般因素(或称共同因素)(并依据一定的方式对所获得的一般因素作、做出较为合理的解释),这时就需要使用因素分析法;聚类分析(也称分类分析或数值分类。即凭借变量指标的定量分析对变量实施分类(如果类别已经清楚,只需归类;如果事先并不清楚类别,这时就是寻求一种规则进行新的恰当的分类),使同类的变量比较均质,而不同类的变量差异比较大;还有其它方法,如图分析和模糊综合评判等等。,定量分析的方法三,1,42,在数理统计中,平均

14、数是用来反映一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有: 1. 算术平均数 2. 中位数(M) 3. 众数(Mo) 4. 几何平均数(M g) 5. 调和平均数(H),集中趋势的度量,1,43,意义: 作为一个资料的代表,指资料中各变数集中 较多的中心位置,用来与另一资料相比较。不同的 平均数适合于不同的数据资料。 例如:不同国家、地区、种族之间身高、体重等的 比较;不同品种的家畜、家禽之间生产性能 的比较,1,44,主要内容: 一、算术平均数 二、中位数、众数、几何平均数和调和平均数 三、5 种平均数的关系和评价,1,45,算术平均数,一、定义 一组资料中,所有观测值的总和除

15、以其个数所得到的商,称为算术平均数,简称平均数或均数。最常用的一种集中趋势度量指标。 样本的平均数记为 总体平均数记为,1,46,:第i个观察值或变数 n:观察值或变数的个数 :求和符号(sigma),计算公式:,1,47,一、直接法: 例2.1:5头猪的体重分别为70、72、80、83、 88kg,问 5头猪的算术平均数是多少?,从计算结果看5头猪都距78.6(kg)不远,所以平均数是数量资料的代表值。,上述计算方法称为直接法,适用于样本小,即资料内包含变数个数不多,一般在30个变数以下未经分组的资料。,1,48,二、加权法 1. 分类资料:每个类别在某个指标上取相同的值。 2. 计数资料和

16、连续性资料:频率分布表 加权法,即计算时先将各个变数乘上它的权数,再经过总和,然后除以权数的总合,称为加权平均数。,1,49,xi=变数值 fi=变数值xi出现的频数,计算公式:,定义:n个非负数的乘积开n次方的根称为几何平均 数,用 G 表示。,为了计算方便,各变数先取对数,再相加除以n,即为logG,再求其反对数,即为G值。,几何平均数,1,51,从公式可以知道:几何平均数就是首先将原数据转换为对数;然后求对数值的算数平均数;最后再取反对数还原。 几何平均数用于以百分率、比例表示的数据资料,如增长率、利率、药物效价、抗体滴度等。 能够消弱数据中个别过分偏大值的影响。,1,52,加权法:分类

17、资料或计数和连续性资料,对数形式,例2.4 P15,1,53,定义:各观察值倒数的平均数的倒数,适用于极端右偏态,例33页,调和平均数,简单调和平均数,加权调和平均数,1,54,从公式可以知道:调和几何平均数就是首先将原数据转换为倒数;然后求倒数值的算数平均数;最后再取倒数还原。 调和平均数主要用于速度类资料,或者数据中有个别极端大的值的情况。,1,55,定义:将n个观察值从小到大依次排队,位于中间的那个观察值称为中位数。,中位数(Md),1,56,适用于偏态分布的资料。 例:2.5 现有一窝仔猪的出生重资料为:1.4,1.0,1.3,1.2,1.6kg,试求其中位数。 解:首先将数据资料排序:1.0,1.2,1.3,1.4, 1.6;然后计算中位数: (n+1)/2=(5+1)/2=3;Md=X3=1.3 如果增加一头仔猪,出生重为1.8kg,计算中位数: n/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论