版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章第三节数据处理技术一、数据整理二、描述统计三、推断统计数据预处理的核心环节一、数据的检查基础关键完整性检查检查内容:是否漏填、重复方法:逐项核对,确保无缺失值正确性检查检查内容:是否真实可靠方法:逻辑检查、计算检查检查示例逻辑检查:年龄填"150岁"→明显错误计算检查:各选项百分比之和应为100%(数量分类)(品质分类)二、数据的分类量化数据说明:按数值大小分组示例:成绩高低、收入多少类别数据说明:按性质、类别分组示例:性别、年级、态度等级三、数据的排序顺序排列找出最大值、最小值等级排列确定名次(成绩高→等级高)频数排列编制频数分布表一、数据整理二、描述统计教育研究中的描述统计是对针对教育现象进行调查和实验所获取的大量数据进行分析,从而进一步描述一组数据的全貌,既能使研究者了解事物的性质,又可作为对事物进行推断统计的依据。描述统计中主要涉及三个核心内容:描述统计量、描述统计表和描述统计图。二、描述统计——描述统计量二、描述统计——描述统计量
二、描述统计——描述统计量
二、描述统计——描述统计量分布趋势指标1.峰度(Kurtosis)峰度是用于描述某变量所有取值分布形态陡缓程度的统计量,该统计量是与正态分布相比较的量。峰度=0表示其数据分布与正态分布的陡缓程度相同;峰度>0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度<0表示比正态分布的高峰要平坦,为平顶峰。2.偏度(Skewness)偏度是描述某变量所有取值分布形态对称性的统计量,该统计量也是与正态分布相比较的量。偏度=0表示其数据分布形态与正态分布偏度相同;偏度>0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;偏度<0表示负偏差数值较大,为负偏或左偏,即有一条长尾巴拖在左边。偏度的绝对值越大,表示分布形态的偏斜程度越大。数据分布的峰态特征数据分布的偏态特征二、描述统计——描述统计表在教育统计中,对数据进行描述统计的常见表格格式为三线表。三线表的组成要素包括:表序、表题、项目栏、表体、表注等部分。根据研究的目的及需要,描述统计表中呈现若干描述统计量的值。例如,在描述分类变量时,三线表中通常呈现的描述统计量为频数,形成频数分布表;描述连续变量时,三线表中通常呈现的描述统计量包括均值、标准差、最大值、最小值、样本量等,形成描述统计表。例如要获悉某年级男女生比例,经统计后按性别归类绘制频数分布表例如为了描述某班级学生的三门学科成绩的具体表现情况频数分布表描述统计表二、描述统计——描述统计图描述统计图借助于更为直观和形象的图形来表示数据的分布特点、相关程度以及数据发展趋势。常用的描述统计图有条形图、线形图、饼状图、直方图等。1.条形图(BarCharts)条形图(BarCharts)又称“直条图”,是用直条的长短表示统计量的图形,主要用以比较性质相似的间断性材料。2.线形图(LineCharts)线形图通常用于描述连续性数据的分布状况及变化趋势。二、描述统计——描述统计图3.饼状图(PieCharts)饼状图用于表示间断性资料的构成比例关系。圆饼中扇形面积的大小通常表示不同类别所占的频数或频率。4.直方图(Histogram)直方图是用条形的长短来表示连续性变量的频数分布。在直方图中,横轴表示连续变量的分组组距(通称同时显示组中值),纵轴表示各组的频数,纵轴方向的面积表示频数分布。三、推断统计三、推断统计——假设检验1.假设检验的定义假设检验即根据总体的理论分布和小概率原理,对已知或完全不知道的总体提出两种彼此独立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受哪种假设的推断。2.小概率原理概率很小的事件在一次抽样中实际是几乎不可能发生的。3.假设检验的几个基本概念(1)零假设H0:在统计学中,把需要通过样本去推断正确与否的命题,称为零假设,又称为原假设或虚无假设。(1)备择假设HA:与零假设逻辑对立的假设。
0=(1)显著水平
:确定一个事件为小概率时间的标准。在教育研究中α常取0.01、0.05、0.14.假设检验的步骤提出零假设(H0:μ0=μ)和备择假设(HA:μ0≠μ)→确定显著性水平α(即否定H0的概率标准)→确定统计量(常用平均数、方差、标准差)→计算统计量和确定假设H0成立的相伴概率P→判断是否接受零假设→得出结论推断统计是指研究者依据样本得出的结果而对总体进行的判断。统计推断包括假设检验和参数估计。三、推断统计——样本均值差异的显著性检验1.单样本T检验适用范围:检验某一样本(平均数x)所属的总体平均数μ是否和某一指定的总体平均数μ0相同。若相同,则说明该样本属于这个以μ0为平均数的指定总体;若不相同,则说明该样本所属的总体与这个指定总体不同,即存在显著差异。2.独立样本T检验适用范围:检验两个样本(平均数分别为x1和x2)所属的总体平均数μ1和μ2是否存在显著差异,即检验两个样本是否来自同一总体。若不存在显著差异,则说明两个样本来自同一总体;若存在显著差异,则说明两个样本来自不同的总体。3.配对样本T检验适用范围:检验两个配对样本(平均数分别为x1和x2)所属的总体平均数μ1和μ2是否存在显著差异,此处的配对包括同源配对和自身配对两种方式。4.方差分析适用范围:方差分析用于两个或两个以上样本均值差异的显著性检验。方差分析有一个比较严格的前提条件,即不同水平下,各总体均值服从方差相同的正态分布。方差分析可具体分为单因素方差分析和多因素方差分析。三、推断统计——样本均值差异的显著性检验单样本t检验SPSS实操案例第一步,打开单样本t检验对话框,分析(Analyze)→比较平均值(CompareMeans)→单样本T检验(One-SampleTTest)→打开单样本T检验(One-SampleTTest)的对话框第二步,选择检验变量,在对话框左侧的候选变量列表框中选择一个或几个变量,然后单击按钮将其置于检验变量框【TestVariable(s)】中第三步,单击“选项【Options】”按钮打开选项设置对话框,将显著性水平设置为0.05,即把置信水平后面的值设为95%第四步,单击“确定【OK】”按钮完成,输出结果如下。三、推断统计——样本均值差异的显著性检验独立样本t检验SPSS实操第一步,打开独立样本t检验对话框,选择分析(Analyze)→比较平均值(CompareMeans)→独立样本T检验(Independent-SamplesTTest)→打开独立样本T检验(Independent-SamplesTTest)的对话框第二步,选择检验变量和分组变量,在对话框左侧的候选变量列表框中选择检验变量和分组变量,然后单击按钮将其置于检验变量【TestVariable(s)】和分组变量【GroupingVariable】框中第三步,单击“定义组【DefineGroups】”按钮对组别进行定义第四步,单击“选项【Options】”按钮打开选项设置对话框,将显著性水平设置为0.05,即把置信水平后面的值设为95%,第五步,单击“确定【OK】”按钮完成,输出结果三、推断统计——样本均值差异的显著性检验配对样本t检验SPSS实操第一步,打开配对样本t检验对话框,选择分析(Analyze)→比较平均值(CompareMeans)→配对样本T检验(Paired-SamplesTTest)→打开独立样本T检验(Paired-SamplesTTest)的对话框第二步,在配对样本T检验(Paired-SamplesTTest)对话框左侧的候选变量列表框中选择一对或几对变量,将其移入成对变量【PairedVariables】框中进行检验第三步,单击“选项【Options】”按钮打开选项设置对话框,将显著性水平设置为0.05,即把置信水平后面的值设为95%,第四步,单击“确定【OK】”按钮完成,输出结果三、推断统计——样本均值差异的显著性检验单方差分析SPSS实操单因素ANOVA检验(One-WayANOVA)→选择因变量和因子→对比(Contrasts)→事后多重比较(PostHocMultipleComparisons)→选项(Options)→确定(OK)“One-WayANOVA”“Contrasts”三、推断统计——样本均值差异的显著性检验单方差分析SPSS实操“PostHocMultipleComparisons”“Options”三、推断统计——样本均值差异的显著性检验单方差分析SPSS实操三、推断统计——相关分析相关分析用于描述事物数量特征的变量之间通常存在一定的关系。变量之间线性相关程度的强弱用适当的统计指标表示出来的过程就是相关分析。相关系数r的取值范围为[-1,+1]
,相关系数的绝对值越接近1表明相关程度越高。正相关:若0
r1,表明变量之间存在正相关关系,即两个变量的相随变动方向相同。负相关:若-1
r
0,表明变量之间存在负相关关系,即两个变量的相随变动方向相反。相关分析依据变量的类型及特征大体可以分为两类:第一类,皮尔逊简单相关分析,用于两列符合正态分布的连续变量,输出皮尔逊相关系数;第二类,等级相关分析,包括斯皮尔曼相关和肯德尔相关分析,用于定序变量或不满足正态分布的数据,分别输出斯皮尔曼相关系数或肯德尔相关系数三、推断统计——相关分析相关分析SPSS实操1.分析→相关→双变量,勾选相关系数框中的“皮尔逊”2.选择检验变量3.单击“选项”按钮打开选项设置对话框,勾选“平均值和标准差”三、推断统计——相关分析相关分析SPSS实操4.单击“确定”按钮完成,输出结果。三、推断统计——回归分析回归分析回归分析根据其涉及变量的类型及数据结构等特征可以划分为一般线性回归、逻辑回归、多层线性回归等多种形式一般线性回归使用最佳的拟合线在因变量(Y)和一个或多个自变量(X)之间建立一种关系,因此一般线性回归模型可具体分为一元线性回归模型(一个自变量)和多元线性回归模型(多个自变量)。一元线性回归模型:Y=β0+β1X+ε其中,X为自变量,Y为因变量,β0为截距,β1为回归系数(表明自变量与因变量的相关程度),ε为随机误差(其他随机因素引起Y的变化部分)。多元线性回归方程:Y=β0+β1X1+β2X2+···+βnXn+ε其中,β1、β2···βn为偏回归系数,如β1表示在其他自变量保持不变的情况下,自变量X1变动一个单位,因变量Y平均变动β1个单位。三、推断统计——回归分析回归分析SPSS实操1.分析→回归→线性→打开线性回归的对话框,选择变量2.单击“统计”按钮打开统计设置对话框,勾选“估算值”、“模型拟合”、“R方变化量”、“描述”、“德宾-沃森”、“共线性诊断”三、推断统计——回归分析回归分析SPSS实操第四步,单击“确定”按钮完成,输出结果。从原始数据到研究结论的科学转化路径1数据整理检查:完整性、正确性分类:量化数据、类别数据排序:顺序、等
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年创业意识培训测试题及答案
- 2026年狼人杀进阶测试题及答案
- 2026年关于生命的测试题及答案
- 2026年医疗租赁采购供应协议
- 2026年度强弱电工程合同书
- 2026年金融改造房屋租赁协议
- 2026年深度合作餐饮加盟合同书
- 2026新型能源面试题及答案
- 2026徐州液压面试题目及答案
- 2026学校面试题模板及答案
- 基于舞弊三角理论的广东榕泰财务舞弊成因与治理探讨
- 环境法(第七版)课后答案第一编
- 消防工程造价公开课课件
- 2025年广东省中考招生考试数学真题试卷(真题+答案)
- 【生物】2025年中考生物曲线分析图(七年级下册)
- 临时用电施工组织设计-临时用电施工方案
- 小儿常见急症识别与急救处理指南
- T/CACEM 22.1-2022校车运营服务管理第1部分:基本要求
- 起重机运输合同协议
- 车站技术作业图表填记方法课件
- 《初中数学创新教学与发展学生思维能力的研究》课题实施研究计划
评论
0/150
提交评论