版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十章统计分析华南师范大学教育科学学院宋宇什么是教育统计学定义:教育统计学是运用数理统计的原理和方法研究教育问题的一门应用科学。
它的主要任务是研究如何整理、分析由教育调查和教育实验等途径所获得的数字资料,并以此为依据,进行科学推断,从而解释蕴含在教育现象中的客观规律。教育统计学的内容—描述统计+推断统计描述统计描述统计是对已获得的数据进行整理、概括,显现其分布特征的统计方法。主要内容:(1)编制统计表
(2)绘制统计图
(3)计算统计量:集中趋势(平均数、中位数、众数);
离散趋势(方差、标准差);分布形态(峰态、偏态);
相关量等作用:(1)对收集来的数据进行整理、归纳、减缩和概括。
(2)帮助研究者了解和认识数据。
(3)清晰地表现数据的分布特征教育统计学的内容—描述统计+推断统计推断统计根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测,这种统计方法称为推断统计。推断统计的内容包括:(1)参数估计。利用样本信息推断总体特征的估计。例如,利用样本的平均数对总体平均数进行估计(2)假设检验。利用样本信息来判断对总体的假设是否成立。例如,对总体分布是否服从某种分布的假设检验,t检验,总体平均数之差的假设检验。作用:根据已知(样本)的情况,在一定概率意义上估计、推断未知(总体)的情况。变量分类:根据变量性质不同,可以划分为定类变量(称名变量)、定序变量、定距变量、定比变量。变量定类变量1.只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序的先后2.在数据处理中,对定类变量的观察结果进行人为的赋值与编码从而得到定类数据。3.定类数据只是符号,没有量方面的实际意义,一般不能进行加、减、乘、除运算。定序变量1.指可以就事物某一属性的多少或大小按次序将各事物加以排列的变量,具有等级性和次序性的特点2.在数据处理中,常用有序的整数来表示顺序变量的各种观测结果,从而得到定序数据。3.数据之间不具有相等的单位,也不具有绝对的数量大小和零点,只能反映位次顺序的关系。定距变量1.定距变量可以表明量的相对大小之外,还具有相等的单位。2.零点相对或没有绝对零点。不能做乘除运算,来反映两个数据之间的倍数关系。定比变量定比变量可以表示数量的大小,有相等单位,还有绝对零点。可以进行加、减、乘、除运算,方便对个体的测量结果进行比较。变量测量等级举例可能取值性质定类性别男1、女2分类,无量信息定序文化程度文盲、…、大学大于小于信息定距摄氏温度-10、0、100精确测量距离定比人数1、…、15可测量比值=,≠>,<+.-×,÷定类尺度√定序尺度√√定距尺度√√√定比尺度√√√√总体和样本总体是我们所研究的具有某种共同特性的个体的总和。总体中的每个单位成为个体。样本是从总体中抽取的作为观察对象的一部分个体。当对总体某种特性进行研究时,限于人力、物力、经费和时间,不可能将总体中的每一个个体意义进行观测,往往需要从中抽取一部分个体,作为样本进行观察、分析,然后根据样本所获得的信息,在一定可靠度上推断总体。总体中所包含的个体数目,一般用N表示;样本中包含的个体数目称为样本容量,一般用n表示。样本中个体数目大于30,一般为大样本,等于或小于30称为小样本。统计量和参数样本上的数字特征是统计量总体上的数字特征是参数在进行统计推断时,根据样本统计量来推断总体相应的参数。统计图的种类四种统计图:定类、定序变量(离散变量):条形图、圆形图定距、定比变量(连续变量):折线图、直方图分布的概念本身就有图形的意思,变量值的离散、聚集能够用图形表现出来。条形图用直条的长短表示统计事项数量的图形。按图形中被比资料的组数不同,可分为单式和复式两种。被比事物是一组资料的,称为单式条形图;被比事物含两组或两组以上资料的,称为复式条形图。按条形图排列的方向,分为纵条图和橫条图。作用:用来比较性质相似的离散型变量,定类、定序变量。绘制规则:纵条图以横轴为基线,橫条图以纵轴为基线。条宽应一致,宽度虽与数量大小无关,但是为了美观,宽窄应适当。两排条形之间应有间隔。一组资料的不同组之间不留间隔。各条形应按一定的顺序排列(时间前后、数字大小、等级次序等)直条的顶端和下端不要注写数字。在绘制复式条形图时,若两组数比事物总频数不同,尺度线应用百分比表示。圆形图圆形图是用来表示间断性资料构成比的图形。圆形的面积表示一组数据的整体,各部分的比重一般用百分比表示。作用:表示个组成部分所占的比重。绘制步骤1)各组成部分所占百分比。2)求各组成部分的中心角度数、3)以园的下半径或上半径为基线,按被比事物特定顺序,根据各部分的角度数,以顺时针方向进行绘制。4)若比较两组性质类似资料的构成比,可绘制直径相同、图中各部分内容排列顺序一致的两个圆相比较。教科书13页图2.4线形图用线形图用来表示连续性资料。作用:表示两个变量之间的函数关系;一种事物随另一事物变化的情况;某种事物随时间推移的发展趋势。绘制方法1)一般横轴表示时间或自变量,纵轴表示频数或因变量。横轴可标出连续变量各组的上、下限或组中值,纵轴从0开始,标出频数或因变量的数值。2)在横轴各组中点,纵轴频数或因变量高度上描点,然后用直线连接每相邻的两点。3)图形线应按实际数字绘成折线,不要任意改为光滑曲线。4)图中几条相互比较的图形线,不宜过多,一般不超过五条,以免发生观察困难。每根图形线可以用不同形式表示,并用图例加以说明。频数分析定义频次分布:指的是一个概念或变量,它的各个情况出现的次数或频次,所以又称频次分布(Frequencydistribution)。将其用表格形式表示出来称为频数分布表。频数也称次数,是对总数据按某种标准进行分组,统计出各个组内所含个体的个数。通过频数分析,可以清楚、准确地了解各变量的取值和分布情况。集中量定义用某些典型的变量值或特征值(根据变量值计算出来的值)来代表全体变量值,这个典型的变量值或特征值就称作集中量或集中趋势测量值(CentralTendency)。集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。集中趋势测量的目的(1)选出的集中趋势最有代表性(最典型或者最平均);(2)损失的信息最少,或者说所产生的误差最小。常用的集中量有平均数、中位数、众数。差异量概念表示一组数据变异程度或离散程度的量称为差异量。差异量越大,表示数据的分布范围越广,越不整齐;差异量越小,表示数据分布的越集中,变动范围示。常用的差异量全距、四分位距、百分位距、平均差、方差、标准差、差异系数偏态与峰态在考虑数据分布特征时,可以用偏态量和峰态量来帮助判断。偏态当数据呈现正态分布时,平均数、中位数、众数合为一点当数据呈现正偏态/右偏态时,平均数>中位数>众数当数据呈现负偏态/左偏态时,平均数<中位数<众数峰态一个频数分布,若平均数周围频数比例越大,分布形态越高狭;若平均数周围频数比例越小,分布形态越地阔。高狭峰/尖峰分布低阔峰/扁平分布概率与分布必要性推断统计,利用从样本得到的数据信息,对数据所属总体的某种特征,做出具有一定可靠程度的估计和推断,概率分布理论就是说明这种可靠程度的依据。概率1)随机现象:那些不确定的、可能发生也可能不发生的现象。2)随机事件或者事件:这些随机现象的结果以及这些结果的集合。3)概率:这些随机事件发生的可能性的大小。(理论定义而非操作定义)参数估计根据样本统计量对相应总体参数所作的估计叫总体参数估计。总体参数估计分为点估计和区间估计。点估计:用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。假设检验的基本原理概念利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。基本原理当对某一总体参数进行假设检验时,(1)从总体中随机抽取一个样本,计算出统计量的值。(2)根据经验对相应总体参数提出一个假设值,这个假设是说:这个样本统计量的值是这个假设总体参数值的一个随机样本,即这个样本是来自于这个总体,而样本统计量的值与总体参数值之间的差异是由抽样误差所致。根据这一假设,可以认为,像这样的一切可能样本统计量的值,应当以总体参数值(假设的)为中心形呈该种统计量的一个抽样分布。如果这个随机样本统计量的值在其抽样分布上出现的概率较大,这时只好保留这个假设,就是说,不得不承认这个样本来自于总体,而样本统计量的值与总体参数值的差异是由抽样误差所致。如果这个随机样本统计量的值在其抽样分布上出现的概率极小,根据小概率事件在一次随机抽样中几乎是不可能发生的,于是不得不否定这个样本统计量的值是来自于这个总体参数值的假设。同时,也不得不承认样本统计量的值与总体参数值(假设的)差异不是由抽样误差所致,而是存在着本质差异。因此称这个样本统计量的值与假设的总体参数值差异显著。几个关键概念——假设假设检验一般有两个相互对立的假设。即零假设(或称原假设、虚无假设)和备择假设(或称研究假设、对立假设)。零假设:关于当前样本所属的总体与假设总体无区别的假设。它往往是研究者根据样本期待拒绝的假设。零假设用Ho表示。备择假设:是与零假设相互排斥的假设。它是关于当前样本所属的总体与假设总体相反的假设,是研究者根据样本信息期待证实的假设。是根据样本信息否定了零假设时,应当采取的假设。用H1表示。假设检验是从零假设出发,视其被拒绝的机会,如果根据样本的信息,不得不否定零假设的真实性时,就不得不承认备择假设的真实性→拒绝零假设而接受备择假设。根据样本的信息不能否定零假设的真实性时,就保留零假设而拒绝备择假设。显著性水平样本统计量的值在以总体参数值为中心的抽样分布上出现的概率,小到什么程度才算小概率事件发生了呢?才拒绝原假设呢?统计学上把拒绝零假设的概率称为显著性水平。用α表示显著性水平一般为0.05或0.01,对应的是95%或99%的可靠度显著性水平越高(α值越小),越不容易拒绝零假设,推断的可靠性越大;显著性水平越低(α值越大),越容易拒绝零假设,推断的可靠性越小把拒绝性概率放置于理论抽样分布的两侧,称为双尾(双侧)检验;如将拒绝性概率至于一侧,称为单尾检验。一、SPSS软件简介1.发展简史1968年,由三个斯坦福大学生创建(StatisticalPackageforSocialScience)StatisticalProductandServiceSolutions(1992年,自SPSS11起推出windows版本PredictiveAnalyticsSoftware(改名引起了用户的不满)2009年,IBM收购,仍然延续SPSS的名称。收购之后已经推出19.0,20.0,21.0,22.0等几个版本。风格上,也变成了IBM的蓝色界面二、SPSS软件简介2.SPSS的主要特点与SAS和STATA一起作为当今三大商业统计软件,功能上各有千秋具有完善的交互式视窗操作界面,这也是与其他软件显著不同的地方。用户可以直接通过窗口来操作(当然不仅这一种方法)易学易用,容易上手《SPSS基础分析教程》北京大学出版社,刘爱玉、田志鹏数据视图基本名称含义数据视图窗口:可用于查看、录入和修改数据图中呈现的列是变量(variable),即每一列代表一个变量。图中呈现的行是个案,即每一行代表一个个体、一个观测、一个样品,在spss中统称为个案(case)图中出现的单元格,可以输入每个个案/调查者(case)对于某一个问题回答的结果,或者是在某个变量(variable)下的值。变量视图基本名称含义变量视图窗口:对变量进行定义和修改。主要功能:定义变量名,选择数据录入形式,确定数据宽度,决定小数点位数,定义变量标签,定义变量标签值,定义缺失值,选择数据显示列的位数,显示数据对齐方式,数据测度类型,定义变量分析功能。数据录入数据录入时研究者利用spss进行统计分析的必要前提,这一工作就是要把我们通过问卷调查获得的资料转变为SPSS能够识别的原始数据文件。步骤:【见教科书第37页,问卷,录入】(1)输入变量(2)设置变量属性(3)输入数据设置变量及其属性定类、定序变量:对其类别进行编码和赋值定距、定比变量:直接写数字单项选择题:一般是定类、定序变量。多项选择题:一般是定类、定序变量。把每一选项作为一个二级变量,对“是”“否”分别编码,“是”代表选择了这一选项,“否”代表没有选这一选项;然后对“是”“否”进行赋值。排序题:把顺序分别作为二级变量。补充说明SPSS21.0以及SPSS22.0下载地址:
/s/146sdm
(21.0)/s/1jIMMgBG
(22.0)学习资源:一定要多参考“帮助文件”!!第四章SPSS数据文件的编辑与管理SPSS数据分析教程北京大学出版社数据文件的编辑和管理增加或删除数据的变量、个案查找、替换数据数据排序、行列变换数据文件的合并、分类汇总
选择个案与抽取样本频次分析与描述统计掌握生成变量频次统计表的方法输出常用的描述统计量
理解常用描述统计量的含义掌握条形图、饼图和直方图的制图方法掌握定距变量的描述统计方法学会自动生成标准分
了解探索性描述分析方法第六章频次表与描述统计分析SPSS数据分析教程北京大学出版社数据变换的必要为了使数据在分析时更加具有教育学意义和实际意义例如:文化程度在大专及以上与文化程度在高中以下的比较更加有意义为了使变量满足复杂统计分析的条件用【转换】对变量重新编码
主要功能:转换原始变量编码将连续型的变量重新编码为定类/定序变量选项:【转换】菜单,【重新编码为不同变量】注:如果选择【重新编码为相同变量】会改变原来变量的数据结构,因此少选用该功能。【名称】【标签】对新生成的变量进行界定,注需要点选“更改”【旧值与新值】进行数据转换【如果】可以选
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 运城幼儿师范高等专科学校《人体运动学》2025-2026学年期末试卷
- 长春大学《法律逻辑学补充》2025-2026学年期末试卷
- 阳泉职业技术学院《口腔组织病理学》2025-2026学年期末试卷
- 2024年河中石兽教学课件(16篇)
- 2024年全国中级会计职称之中级会计财务管理考试黑金试卷附答案
- 2024年信息技术20教研研修计划
- 天津基础冬季施工方案(3篇)
- 幕墙的实际施工方案(3篇)
- 徐闻直播营销方案(3篇)
- 挖淤泥土施工方案(3篇)
- 养殖场建设项目可行性研究报告范本
- GB/T 7991.6-2025搪玻璃层试验方法第6部分:高电压试验
- 2025年卫生院关于医疗机构高额异常住院费用专项自查报告
- 《反窃电电子数据提取与固定技术规范》
- 消防员文职考试题及答案
- 禾字的教学课件
- 小班篮球班本课程汇报
- 人防工程保密管理办法
- 叶酸补服培训课件
- GB/T 45897.2-2025医用气体压力调节器第2部分:汇流排压力调节器和管道压力调节器
- 桑叶的作用与功效及副作用降血糖
评论
0/150
提交评论