




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教育统计学第一章 绪论一、什么是教育统计学:教育统计学是运用数理统计的原理和方法,研究教育问题的一门应用科学。主要任务是研究如何搜集、整理、分析由教育调查和教育试验所获得的数字资料,并以此为依据,进行科学推断,揭示教育现象所蕴含的客观规律。二、统计学的分类:描述统计 推断统计 理论统计 应用统计描述统计: 描述统计就是对已获得的数据进行整理、概括,显现其分布特征的统计方法.推断统计: 根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。(内容:参数估计和假设检验 目的:对总体特征作出推断)三、具有以下三个特性的现象,称为随机现象第一,一次试验有多种可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。(延迟满足)四、样本容量(样本包含的个体数目 大样本 n30小样本 n30五、参数和统计量参数(parameter)l 描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。l 所关心的参数主要有总体均值(m)、标准差(s)、总体比例(p)等l 总体参数通常用希腊字母表示统计量(statistic)l 用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数l 所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等l 样本统计量通常用小写英文字母表示 l 参数与统计量的符号系统 第二章 数据的处理一、名义、顺序、等距、比率名义变量:是指一事物与其他事物在属性、类别上不同。 1表示男,0表示女,但这里的1,0并不说明事物间差异的大小,只是分类的符号而已,即名称变量不说明事物之间差别的大小,作比较时,只能说明被比事物相同,还是不同顺序变量(ordinal variable)。顺序变量:是事物的某一属性的多少或大小按顺序排列起来的变量。 如教师按能力大小或成绩高低排列等级:1,2,3,这一系列数据表明“大于”某某,即第1高于第2,第2高于第3,而相邻两个等级的间隔是不等距的,即1与2和2与3之间并不等距。只有等级上的差别,是一种既无相等单位又无绝对零点的变量。 等距变量:在能力测验或知识测验中,或甲生得80分,乙生得60分,进行比较时我们可以说甲生比乙生多20分,但却不能以倍数来表示。这是因为这类数据只具有相等的单位,而没有绝对的零点。这类变量虽然有0分,但是这个0分是人为确定的。譬如某一个学生在数学测验中得了0分,我们并不能说他不没有一点数学能力或知识,这就像摄氏温度一样,0度并不意味着没有温度。比率变量:比率变量是一种既有相等的单位,又有绝对零点的变量,又称等比变量,像人的身高、体重、距离、时间、教育投资、学校固定资产金额等均属于这种变量。 第三章 集中量一、集中量的定义:代表一组数据典型水平或集中趋势的量称为集中量;用途有二,一是可以作为一组数据的代表值;二是可以进行组与组之间的比较。常用的集中量有算术平均数、中位数、众数等。二、算术平均数的优缺点1.算术平均数:最常用,优点也最多。优点:(1)感应灵敏(2)严密确定(3)简明易懂,计算简便(4)适合代数运算(5)受抽样变动的影响较小缺点:(1)易受两极端数值的影响(2)有一两个数据模糊不请时,无法计算。这时通常选择中位数。三、算术平均数计算:是所有观察值的总和除以总频数所得之商,简称平均数或均数、均值。四、中位数的算法总频数为奇数 如n=25为奇数,n+1/2=26/2=13,所以中位数为位于第13号的那个,总频数为偶数中位数为第15号和16号数值的平均,即(88+89)2=88.5。五、百分位数(概念):百份位数是位于以一定顺序(一般是由小到大)排列的一组数据中某一百分位置的数值。百分位通常用第几百分位来表示,如第五百分位,它表示在所有测量数据中,测量值的累计频次达5%。以身高为例,身高分布的第五百分位表示有5%的人的身高小于此测量值,95%的身高大于此测量值。 例:P80=75 有80%的人得分低于75 p80=- 有80%的人得分低于该分数六、众数的求法:先把数据列出来,然后找出现频数最大的数,即为众数第四章 差异量一、差异量的定义:表示一组数据变异程度或离散程度的量称为差异量 常用的差异量指标有:方差;标准差二、方差与标准差的优缺点:1.优点:反应灵敏;严密确定;适合代数计算;计算简单;用样本数据推断总体差异量时,方差和标准差是最好的估计量。一般和算术平均数结合在一起使用。2.缺点:不太容易理解;易受两极端数值的影响;有个别数值模糊时,无法计算;单位的平方不好理解。三、偏态量(skew):是描述次数分布的偏态方向和程度的量数。正偏态 负偏态当SK=0时分布呈对称形,当SK0时分布为正偏态,当SK0时分布为负偏态。SK的绝对值越大,偏斜度越大。若偏态系数为正(S0) 表示成绩分布是正偏态,S越大,分数越集中在低分端; 若偏态系数为负(S0) 表示成绩分布是负偏态,S越大,分数越集中在高分端;考试难度大,学生得分普遍低,呈正偏态; 考试难度小,学生得分普遍高,呈负偏态.n 高狭峰:S较小,分数分布高窄,集中在平均数两侧。n 低阔峰:S较大,分数分布低阔,散布较广。n 正态峰:分布介于高峰态和低峰态之间。第五章 参数估计一、推断统计:推断统计是研究如何利用样本数据来推断总体特征的统计方法。 点估计含义:直接用样本统计量的值作为总体参数的估计值,样本均值就是总体均值m的一个估计量。如果样本均值 x = 3 , m 的估计值点估计的理论依据1。对称分布的中位数与平均数重合,其样本平均数 就是总体平均数和总体中位数的无偏估计量,也是一致估计量. 2。根据中心极限定理,只要样本容量足够大,就可以近似地用正态分布去描述它. 3。一般情况下,样本平均数是比样本中位数更有效的估计量,因为在大量样本中,样本平均数的平均误差比样本中位数的平均误差小.二、 良好点估计量的条件 无偏性 一致性 有效性 区间估计:一定概率条件下样本统计量估计总体参数可能落入范围估计一个包含总体参数在内的区间,通常用区间的大小或者实际参数落在某个区间的概率两种方式表达区间估计的结果1. 根据一个样本的观察值给出总体参数的估计范围2. 给出总体参数落在这一区间的概率3.例如: 总体均值落在5070之间,置信度为 95%1)置信区间定义:置信区间是指在特定的可靠性(即置信系数)要求下,估计总体参数所落的区间范围,亦即进行估计的全距。 置信区间的涵义: 以95%的可信区间为例,对于某一个区间而言,它包含总体均数的可能性为95%,而不包含总体均数的可能性仅为5%。因此在实际应用中,以这种方法估计总体均数犯错误的概率仅为5%。 2)置信系数(置信度) 定义:置信系数是指被估计的总体参数落在置信区间内的概率 D ,或以1-a 表示。置信系数是用来说明置信区间可靠程度的概率,也是进行正确估计的概率。n 符号:D(Degree of reliability),或 1-an 别名:置信水平、置信系数、置信概率 n 常用值:D(1-a)=.95 D(1-a)=.99三、显著性水平:统计学中把这种拒绝零假设的概率,显著性水平是统计推断时,可能犯错误的概率。a值和可靠度之间的关系是:两者之和为1。a值越大,可靠度就越低;a值越小,可靠度就越高。一个置信系数同时反映了在做出一个估计时所犯错误的小概率( ),即可靠性为95%时,意味着犯错误的概率为5%;可靠性为99%时,意味着犯错误的概率为1%。显著性检验的一般步骤:1.提出假设 2.选择检验统计量并计算其值 3.确定检验形式 4.统计决断双侧Z检验统计决断规则|Z|与临界值的比较P值检验结果|Z|0.05不显著1.96 |Z|2.580.01P 0.05 显著|Z| 2.58P 0.01极其显著单侧Z检验统计决断规则|Z|与临界值的比较P值检验结果|Z|0.05不显著1.65 |Z|2.330.01P 0.05 显著*|Z| 2.33P 0.01极其显著*四、正态分布区间与横轴围成的面积为 1 五、假设检验的步骤A、提出原假设和备择假设 B、确定适当的检验统计量 C、规定显著性水平aD、计算检验统计量的值 E、作出统计决策第六章 平均数差异检验一、独立样本定义:两个样本内的个体是随机抽取的,它们之间不存在一一的对应关系。二、 两独立样本T检验:是根据样本数据对两个样本来自的两独立总体的均值是否有显著差异进行推断。SPSS13.0操作:Analyzecompare meansIndependent samples T test n 前提条件:1、两样本应该是相互独立的。2、样本来自的两个总体应该服从正态分布。n 样本平均数与总体平均数之间差异的假设检验又叫做总体平均数的显著性检验。如果某个样本平均数与总体平均数的差异达到了显著性水平就可以推翻零假设,可以认为这个样本不是来自该总体,而是来自其他总体;如果这个样本平均数与总体平均数的差异未达到显著性水平,则要接受零假设,这时就得承认这个样本来自该总体。n 将介绍如何由两个样本平均数之差检验两个相应总体平均数之差的显著性。如果某两个样本平均数之间的差异达到了一定的限度,即达到了显著性水平,就可以认为这两个样本来自不同的总体,或者说,这两个样本各自所代表的总体之间有真正的差异;如果两个样本平均数之间的差异不显著,则可以认为,这两个样本平均数之间的差异是由抽样误差造成的,它们所来自的总体的平均数相等或就来自同一个总体。基本原理:与一个样本平均数与总体平均数差异的检验相同。首先对两个相应的总体平均数之间提出没有差异的虚无假设和有差异的备择假设,然后考察虚无假设成立的概率如何。如果概率较小,就拒绝虚无假设,接受备择假设,说明两个总体平均数差异显著;反之,则说明两个总体平均数差异不显著。n t检验统计决断规则n |t|与临界值的比较n P值n 检验结果n |t|0.05n 不显著n t(df)0.05 |t| t(df)0.01 n 0.01P 0.05n 显著 *n |t| t(df)0.01 n P 0.01n 极其显著*n三、配对样本的两种情况:(1)用同一测验对同一组被试在试验前后进行两次测验,所获得的两组测验结果是相关样本。(2)根据某些条件基本相同的原则,把被试一一匹配成对,然后将每对被试随机地分入实验组和对照组,对两组被试施行不同的实验处理之后,用同一测验所获得的测验结果,也是相关样本。配对样本T检验:SPSS13.0操作:Analyzecompare meanspaired samples T test 四、什么时候进行配对样本t检验,什么时候进行独立样本T检验 方差分析l 一、方差分析的概念:方差分析是检验多个样本均数间差异是否具有统计意义的一种统计学方法。 单因素方差分析一、 定义:单因素方差分析测试摸一个控制变得不同水平是否给观察变量造成了显著差异和变动, 例:培训是否给学生造成显著影响SPSS13.0操作方法:Analyzecompare meansone-way ANOVAfactor 自变量 dependent list 因变量(1各自变量,多个因变量) 相关分析n 一、相关的概念两个变量之间不精确、不稳定的变化关系称为相关关系。它与事物之间普遍存在的另外两种关系即因果关系和共变关系是不同的。n 二、积差相关 :n 当两个变量都是正态连续变量,两者之间呈线性关系时,表示这两个变量之间的相关。 n 三、点二列相关:n 当两列变量中一个是正态连续变量,而另一个是真正的二分名义变量,表示这两个变量之间的相关,称为点二列相关n 四、相关系数nn五、相关系数的取值范围相关系数的取值范围在1和+1之间,即1r+1。其中: 若0r1,表明变量之间存在正相关关系,即两个变量的相随变动方向相同; 若1r0,表明变量之间存在负相关关系,即两个变量的相随变动方向相反; 六、解释正负值的意义 Z分数在一次测验中比较学生语文、数学、英语成绩(不同质的一般不能比较)要将数据转换为Z分数,可进行比较 SPSS13.0操作:Analyzedescriptive statistics descriptive
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 养猪专业试题及答案
- 养殖专业试题及答案
- 财务相关专业试题及答案
- 绿化专业面试题及答案
- 甘肃省金太阳2026届高三9月开学联考(26-1002C)物理(含答案)
- 飞机多学科优化设计MDO提纲
- 火电燃料专业试题及答案
- 湖南省百师联盟2024-2025学年高二上学期1月期末检测生物学试卷(含答案)
- 河北省石家庄高新区外国语学校2025-2026学年八年级上学期开学测试英语试卷(含答案)
- 福建省泉州市安溪县2024-2025学年高二上学期11月期中考试语文试卷(含答案)
- 消毒灭菌效果监测报告
- 2025年软工导论期末试题及答案
- 房子赠与给子女合同范本
- 医疗器械临床评价报告模板
- 2025年国防教育知识竞赛试题(附答案)
- 沐足行业严禁黄赌毒承诺书
- 六年级上册道德与法治全册教学课件
- 工程现场踏勘调查报告记录
- 北邮课程设计实用低频放大电路课件
- 总监施工现场带班巡视检查记录表
- 装表接电PPT.
评论
0/150
提交评论