下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、教育统计学第一章 绪论一、什么是教育统计学:教育统计学是运用数理统计的原理和方法,研究教育问题的一门应用科学。主要任务是研究如何搜集、整理、分析由教育调查和教育试验所获得的数字资料,并以此为依据,进 行科学推断,揭示教育现象所蕴含的客观规律。二、 统计学的分类:描述统计 推断统计 理论统计 应用统计描述统计:描述统计就是对已获得的数据进行整理、概括,显现其分布特征的统计方法推断统计:根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。(内容:参数估计和假设检验目的:对总体特征作出推断)三、具有以下三个特性的现象,称为随机
2、现象第一,一次试验有多种可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。(延迟满足)四、 样本容量 (样本包含的个体数目大样本n 30小样本n v 30五、参数和统计量参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。所关心的参数主要有总体均值()、标准差()、总体比例()等总体参数通常用希腊字母表示统计量(statistic)用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数所关心的样本统计量有样本均值(X)、样本标准差(s)、样本比例(p)等样本统计量通常用小
3、写英文字母表示参数与统计量的符号系统第二章数据的处理一、名义、顺序、等距、比率 名义变量:是指一事物与其他事物在属性、类别上不同。1表示男,0表示女,但这里的1, 0并不说明事物间差异的大小,只是分类的符号而已,即名称变量不说明事物之间差别的大小,作比较时,只能说明被比事物相同,还是不同顺序变量(ordinal variable )。 顺序变量:是事物的某一属性的多少或大小按顺序排列起来的变量。如教师按能力大小或成绩高低排列等级:1,2, 3,;这一系列数据表明 大于”某某,即第1高于第2,第2高于第3,-而相邻两个等级的间隔是不等距的,即1与2和2与3之间并不等距。只有等级上的差别,是一种既
4、无相等单位又无绝对零点的变量。 等距变量:在能力测验或知识测验中,或甲生得80分,乙生得60分,进行比较时我们可以说甲生比乙生多20分,但却不能以倍数来表示。这是因为这类数据只具有相等的单位,而没有绝对的零点。这类变量虽然有0分,但是这个0分是人为确定的。譬如某一个学生在数学测验中得了0分,我们并不能说他不没有一点数学能力或知识,这就像摄氏温度一样,0度并不意味着没有温度。 比率变量:比率变量是一种既有相等的单位,又有绝对零点的变量,又称等比变量,像人的身 高、体重、距离、时间、教育投资、学校固定资产金额等均属于这种变量。第三章集中量一、 集中量的定义:代表一组数据典型水平或集中趋势的量称为集
5、中量;用途有二,一是可以 作为一组数据的代表值;二是可以进行组与组之间的比较。常用的集中量有算术平均数、中位数、众数等。二、算术平均数的优缺点1. 算术平均数:最常用,优点也最多。优点:(1)感应灵敏(2)严密确定(3)简明易懂,计算简便(4)适合代数运算(5)受抽样变动的影响 较小缺点:(1)易受两极端数值的影响(2)有一两个数据模糊不请时,无法计算。这时通常选择中位数。三、 算术平均数计算:是所有观察值的总和除以总频数所得之商,简称平均数或均数、均值Xi X2XnX 。N四、中位数的算法总频数为奇数如n=25为奇数,n+1/2=26/2=13, 所以中位数为位于第 13号的那个,总频数为偶
6、数中位数为第15号和16号数值的平均,即(88+89)2=o五、百分位数(概念):百份位数是位于以一定顺序(一般是由小到大)排列的一组数据中某一百分位置的数值。百分位通常用第几百分位来表示,如第五百分位,它表示在所有测量数据中,测量值的累计频次达5%。以身高为例,身高分布的第五百分位表示有5%的人的身高小于此测量值,95%的身高大于此测量值。 例:P80=75 有80%的人得分低于75卩80=-有80%的人得分低于该分数六、众数的求法: 先把数据列出来,然后找出现频数最大的数,即为众数第四章差异量一、差异量的定义:表示一组数据变异程度或离散程度的量称为差异量常用的差异量指标有:方差;标准差二、
7、方差与标准差的优缺点:1. 优点:反应灵敏;严密确定;适合代数计算;计算简单;用样本数据推断总体差异量时,方差和标准差 是最好的估计量。一般和算术平均数结合在一起使用。2. 缺点:不太容易理解;易受两极端数值的影响;有个别数值模糊时,无法计算;单位的平方不好理解、偏态量(skew):是描述次数分布的偏态方向和程度的量数。正偏态M0MdX当SK=0时分布呈对称形,当 SK0时分布为正偏态,当 SK0)表示成绩分布是正偏态,S越大,分数越集中在低分端;若偏态系数为负(S0)表示成绩分布是负偏态,S越大,分数越集中在高分端;考试难度大,学生得分普遍低,呈正偏态;考试难度小,学生得分普遍高,呈负偏态.
8、高狭峰:S较小,分数分布高窄,集中在平均数两侧。低阔峰:S较大,分数分布低阔,散布较广。正态峰:分布介于高峰态和低峰态之间。第五章参数估计一、推断统计:推断统计是研究如何利用样本数据来推断总体特征的统计方法。点估计含义:直接用样本统计量的值作为总体参数的估计值,样本均值就是总体均值的一个估计量。如果样本均值x = 3 ,的估计值点估计的理论依据 1。对称分布的中位数与平均数重合,其样本平均数就是总体平均数和总体中位数的无偏估计量,也是一致估计量.2。根据中心极限定理,只要样本容量足够大,就可以近似地 用正态分布去描述它.3。一般情况下,样本平均数是比样本中位数更有效的估计量,因为在大量样本中,
9、样本平均数的平均误差比样本中位数的平均误差小二、良好点估计量的条件无偏性一致性有效性区间估计:一定概率条件下样本统计量估计总体参数可能落入范围估计一个包含总体参数在内的区间,通常用区间的大小或者实际参数落在某个区间的概率两种方式表达区间估计的结果1. 根据一个样本的观察值给出总体参数的估计范围2. 给出总体参数落在这一区间的概率3. 例如:总体均值落在5070之间,置信度为 95%1)置信区间定义:置信区间是指在特定的可靠性(即置信系数)要求下,估计总体参数所落的区 间范围,亦即进行估计的全距。置信区间的涵义:以95%的可信区间为例,对于某一个区间而言,它包含总体均数的可能性为95%,而不包含
10、总体均数的可能性仅为5%。因此在实际应用中,以这种方法估计总体均数犯错误的概率仅为5%。2)置信系数(置信度)定义:置信系数是指被估计的总体参数落在置信区间内的概率D,或以1-a表示。置信系数是用来说明置信区间可靠程度的概率,也是进行正确估计的概率。符号:D( Degree of reliability ),或 1-别名:置信水平、置信系数、置信概率常用值:D( 1-)=.95 D( 1-)=.99三、显著性水平:统计学中把这种拒绝零假设的概率,显著性水平是统计推断时,可能犯错误的概率。 值和可靠度之间的关系是:两者之和为1。 值越大,可靠度就越低;值越小,可靠度就越高。一个置信系数同时反映了
11、在做岀一个估计时所犯错误的小概率(),即可靠性为95%时,意味着犯错误的概率为 5%;可靠性为99%时,意味着犯错误的概率为 1%。显著性检验的一般步骤:1.提出假设2.选择检验统计量并计算其值3.确定检验形式4.统计决断双侧Z检验统计决断规则Z与临界值的比较P值检验结果Z 1P1不显著Z P显著ZP极其显著单侧Z检验统计决断规则Z与临界值的比P值检验结果较Z P不显著Z P显著*ZP极其显著*四、正态分布区间与横轴围成的面积为1五、假设检验的步骤A、提出原假设和备择假设B、确定适当的检验统计量C规定显著性水平D、计算检验统计量的值E、作出统计决策第六章平均数差异检验一、独立样本定义: 两个样
12、本内的个体是随机抽取的,它们之间不存在一一的对应关系。二、两独立样本 T检验:是根据样本数据对两个样本来自的两独立总体的均值是否有显著差 异进行推断。操作:Analyze compare means Independent samples T test前提条件:1、两样本应该是相互独立的。2、样本来自的两个总体应该服从正态分布。样本平均数与总体平均数之间差异的假设检验又叫做总体平均数的显著 性检验。如果某个样本平均数与总体平均数的差异达到了显著性水平就可 以推翻零假设,可以认为这个样本不是来自该总体,而是来自其他总体; 如果这个样本平均数与总体平均数的差异未达到显著性水平,则要接受零假设,这时
13、就得承认这个样本来自该总体。将介绍如何由两个样本平均数之差检验两个相应总体平均数之差的显著 性。如果某两个样本平均数之间的差异达到了一定的限度,即达到了显著性水平,就可以认为这两个样本来自不同的总体,或者说,这两个样本各自所代表的总体之间有真正的差异;如果两个样本平均数之间的差异不显 著,则可以认为,这两个样本平均数之间的差异是由抽样误差造成的,它们所来自的总体的平均数相等或就来自同一个总体。基本原理:与一个样本平均数与总体平均数差异的检验相同。首先对两个相 应的总体平均数之间提出没有差异的虚无假设和有差异的备择假设,然后考 察虚无假设成立的概率如何。如果概率较小,就拒绝虚无假设,接受备择假
14、设,说明两个总体平均数差异显著;反之,则说明两个总体平均数差异不显 著。t检验统计决断规则tt(df)P不显著1t(df)t t(df)P显著*tt(df)P极其显著*t与临界值的比较P值检验结果三、配对样本的两种情况:(1)用同一测验对同一组被试在试验前后进行两次测验,所获得的两组测验结果是相关样本。(2)根据某些条件基本相同的原则,把被试匹配成对,然后将每对被试随机地分入实验组和对照组,对两组被试施行不同的实验处理之后,用同一测验所获得的测验结果,也是相关样本。配对样本 T 检验:操作 :Analyzecompare meanspaired samples T test四、什么时候进行配对
15、样本t检验,什么时候进行独立样本 T检验方差分析、方差分析的概念:方差分析是检验多个样本均数间差异是否具有统计意义的一种统计学方法。单因素方差分析定义:单因素方差分析测试摸一个控制变得不同水平是否给观察变量造成了显著差异和变动,例:培训是否给学生造成显著影响操作方法: Analyzecompare meanone-way ANOVAfactor 自变量 dependent list 因变量 (1各自变量,多个因变量)相关分析、相关的概念两个变量之间不精确、不稳定的变化关系称为相关关系。它与事物之间普遍存在的另外两种关系即因果关系和共变关系是不同的。二、积差相关:当两个变量都是正态连续变量,两者
16、之间呈线性关系时,表示这两个变量之间的相关。三、点二列相关:当两列变量中一个是正态连续变量,而另一个是真正的二分名义变量,表示这两个变量之间的相关,称为点二列相关四、相关系数衡鼠k恸之何”或称变尿Z间线件柑关 程度的强弱芹用适当的统计指标丧示出来 这个过觀就是和天分析。和关分析的力決较 3,比较口接和常用的种是绘制觀虑图。 图形昴然能养尚观展现变韶Z可的相关关 系,但不很粘确“为了龍:够山加涉矶1地掷坯变hi之冋的线 tt+H XfMJS可以通过计算相关系数来进行 相X分析。和处系数圮衡谥变醸之问和为碎 反的一个吐俏如果相关系数绘根捌总休仝 部敎拥1漳的.称为总体相关系敎记为c 如果址根挣;柑
17、 木数抓讥 算ifu来的, 则称为+Y 卞商I关祭数.心为 宀 件统订 学中, 桜用 tr永和关游数厂来卅断总休的关秦数,五、相关系数的取值范围相关系数的取值范围在-1和+1之间,即-1 r +1。其中:若Ov r 1,表明变量之间存在正相关关系,即两个变量的相随变动方向相同;若-1 r v 0,表明变量之间存在负相关关系,即两个变量的相随变动方向相反;在说明变駐Z间线性和关程度时根据经验可将相关捉度分为以下几种惜况: 当州旨时.觇为高展相关: 0,5hO.N时,视为中度相关;仇3荃卜|帖时,视为低度相关: (U时,说明变帛之间的相关程投极 弱.可视为不相关. 为| = 1时.其中一个变量的取值完全取决于另 个变星,二者即为函数关系帛 若厂=+1衣明变量之问完全正相关星 若丁1,表明变最:之问記全负相关; 当7 =O时,说明变量:之问不存在线性 相关关系,但这并不排除变量之间存在 其他非线性关系的口丁能中在一般情况卜,总体相关系数Q是未知 的,我们往往杲用样木相关系数作为总体 相关系数戸的佔计値。但由于存在样木抽样 的随机性,样木相关系数幷不能也接反映总 体的相关程度。六、解释正负值的意义Z分数在一次测验中比较学生语文、数学、英语成绩(不同质的一般不能比 较)要将数据转换为Z分数,可进行比较操作: Analyzdescriptive statisticsdesc
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年天津市房屋买卖合同样本
- 促进健康媒体生态实施办法
- 2025商业购销合同模板
- 2025年单位年终个人工作总结(5篇)
- 2025年辅警招聘考试简答题题库(答案+解析)
- 2025年补偿贸易简单借款合同范本
- 在2025年新任职领导干部廉政谈话会上的表态发言
- 2025年下半年唐山市人才市场为唐山博创口腔医院招考医务人员易考易错模拟试题(共500题)试卷后附参考答案
- 2025年下半年哈尔滨理工大学招考工作人员易考易错模拟试题(共500题)试卷后附参考答案
- 2025年下半年咸宁市咸安区城管局招聘易考易错模拟试题(共500题)试卷后附参考答案
- 县域精神富有评价指南
- 语义计算中的本体论构建方法
- DB32T3748-2020 35kV及以下客户端变电所建设标准
- 职业暴露应急预案及处理流程
- 鄂尔多斯市普通住小区物业管理服务等级标准和收费指导价格
- 六年级数学上册第一单元测试卷及答案
- 附录C.1 陆上风电、光伏建设项目质量验收范围划分1
- 国开电大《当代中国政治制度》形考任务1-4答案
- 郭德纲于谦经典相声《我要穿越》台词
- 深圳市龙岗区2023年九年级上学期《数学》期中试题与参考答案
- 四川省绵阳市绵阳中学英才学校2022-2023学年小升初数学自主招生备考卷含答案
评论
0/150
提交评论