第三章推断统计1_第1页
第三章推断统计1_第2页
第三章推断统计1_第3页
第三章推断统计1_第4页
第三章推断统计1_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、southwestern university教育统计篇教育统计篇第三章第三章 推断统计推断统计第三章第三章 推断统计推断统计一、标准分数一、标准分数标准分数的含义标准分数的含义 标准分数是从原始分数转化而来的一种分数,标准分数是从原始分数转化而来的一种分数,又称为又称为z分数。是将原始数据与其所在数据组的分数。是将原始数据与其所在数据组的平均数之差除以所在数据组的标准差所得之商。平均数之差除以所在数据组的标准差所得之商。其公式为:其公式为:xxxz标准分数的性质标准分数的性质v标准分数是以标准差为单位的一种量数。标准分数是以标准差为单位的一种量数。v把一组原始数据转化成把一组原始数据转化成z

2、分数之后,这组分数之后,这组z分数分数的平均数为的平均数为0,标准差为,标准差为1。v标准分数值的大小和正负可以反映某一个数据标准分数值的大小和正负可以反映某一个数据在全体数据中的地位。在全体数据中的地位。v1.在教育测验、评价中的应用。在教育测验、评价中的应用。v明确每个原始分数在总体分布中的相对地位;明确每个原始分数在总体分布中的相对地位;v比较不同测验成绩的优劣;比较不同测验成绩的优劣;v计算不同测验的总分和平均分。计算不同测验的总分和平均分。v2.在统计推断中的应用。在统计推断中的应用。标准分数的应用标准分数的应用v例:某中学初一全体学生期中考试语文和数学例:某中学初一全体学生期中考试

3、语文和数学成绩记为成绩记为x和和y,请用标准分数来比较张、王,请用标准分数来比较张、王两个同学总成绩的优劣。两个同学总成绩的优劣。方法:分别计算两个同学两项测验成绩的标准分数,然后求他们标准分数的总和,从而比较出他们总成绩的优劣。v解:张同学成绩的标准分数分别为:解:张同学成绩的标准分数分别为:v两个标准分数的和为:两个标准分数的和为:1 + 1.5 = 0.5v同理,可求出王同学成绩的标准分数分别为同理,可求出王同学成绩的标准分数分别为1和和0.5,二者之和为,二者之和为1.5v 因为因为0.51.5,所以,张同学的总成绩没,所以,张同学的总成绩没有王同学好。有王同学好。5 . 120659

4、5187567yyxxyyzxxz二、正态分布与标准正态分布二、正态分布与标准正态分布v正态分布又称为常态分布,是一种连续型随机变正态分布又称为常态分布,是一种连续型随机变量的概率分布。量的概率分布。正态曲线的特点正态曲线的特点v曲线不止一条,而是有一个正态曲线族。曲线不止一条,而是有一个正态曲线族。v曲线随着分布的曲线随着分布的、n的变化而变化。的变化而变化。v曲线在平均数处为最高点。曲线在平均数处为最高点。v以平均数为中心,形成中间高,两侧逐渐降低以平均数为中心,形成中间高,两侧逐渐降低的对称分布。的对称分布。v以横轴为渐进线。以横轴为渐进线。标准正态分布标准正态分布v平均数为平均数为0,

5、标准差为,标准差为1的正态分布。的正态分布。v标准正态曲线是一个以标准正态曲线是一个以z=0(平均数)为中(平均数)为中心的双侧对称曲线,曲线在心的双侧对称曲线,曲线在z=0处为最高点,处为最高点,两侧逐渐降低,并无限延伸,但永不与基线相两侧逐渐降低,并无限延伸,但永不与基线相交。交。v由于把一组原始数据转化成由于把一组原始数据转化成z分数之后,这分数之后,这组组z分数的平均数为分数的平均数为0,标准差为,标准差为1,因此,因此,只要将自变量只要将自变量x转化成标准分数转化成标准分数z,就可以,就可以将任何一个正态分布转化为标准正态分布。将任何一个正态分布转化为标准正态分布。标准正态分布表标准

6、正态分布表v结构:结构:vz值(值(z0)vy值:值:z值的纵线高度(概率)值的纵线高度(概率)vp值:某个值:某个z值到值到z=0之间的概率之间的概率v用途:用途:v已知已知z值查值查y值、值、p值值v已知已知p值查值查z值、值、y值值三、总体参数估计三、总体参数估计v参数估计:根据样本统计量对相应的总体参参数估计:根据样本统计量对相应的总体参数进行的估计。分为点估计和区间估计。数进行的估计。分为点估计和区间估计。v点估计:用某一样本统计量的值去估计相应点估计:用某一样本统计量的值去估计相应总体参数的值。例如,用一个样本平均数的值总体参数的值。例如,用一个样本平均数的值估计总体平均数的值,以

7、估计总体平均数的值,以s估计总体标准差。估计总体标准差。区间估计区间估计v1.区间估计:以样本统计量的抽样分布为理论区间估计:以样本统计量的抽样分布为理论依据,按一定的概率要求,由样本统计量的值依据,按一定的概率要求,由样本统计量的值估计总体参数值的所在范围(区间)。估计总体参数值的所在范围(区间)。v2.置信度:估计的可靠程度,通常取置信度:估计的可靠程度,通常取0.95或或0.990.99。v3.置信区间:估计出的参数所在区间。置信区间:估计出的参数所在区间。4.区间估计的基本原理区间估计的基本原理v明确相应统计量的分布形态和特征;明确相应统计量的分布形态和特征;在一定在一定的置信度下,推

8、测样本统计量将落在以总体参数的置信度下,推测样本统计量将落在以总体参数为中心的一个什么样的区间内;为中心的一个什么样的区间内;v对数学式子进行简单变形,即可在同样的置信对数学式子进行简单变形,即可在同样的置信度下,推测以样本统计量的观测值为中心的某个度下,推测以样本统计量的观测值为中心的某个包含总体参数的区间范围,也即是置信区间。包含总体参数的区间范围,也即是置信区间。四、假设检验四、假设检验v假设检验的基本原理假设检验的基本原理v假设:用统计术语对总体参数或分布所作的假定假设:用统计术语对总体参数或分布所作的假定性说明。性说明。v假设检验:根据一定概率,利用样本信息对总体假设检验:根据一定概

9、率,利用样本信息对总体参数或分布的某一假设作出拒绝或保留的决断。参数或分布的某一假设作出拒绝或保留的决断。v假设检验是推断统计的重要内容。假设检验是推断统计的重要内容。新旧科学课程对初中生科学抽象思维新旧科学课程对初中生科学抽象思维能力影响的比较研究能力影响的比较研究 v摘要摘要:v根据青少年科学抽象思维能力的结构及表现,设根据青少年科学抽象思维能力的结构及表现,设计了计了青少年科学抽象思维能力测验青少年科学抽象思维能力测验,分别对,分别对使用新旧课程培养的使用新旧课程培养的138名初中生进行了测量,名初中生进行了测量,比较了新旧课程对初中生科学抽象思维能力的影比较了新旧课程对初中生科学抽象思

10、维能力的影响。结果表明,使用新课程学生的科学抽象思维响。结果表明,使用新课程学生的科学抽象思维能力显著高于使用旧课程的学生,但对于不同类能力显著高于使用旧课程的学生,但对于不同类型学校以及不同性别的学生,差异的表现不同。型学校以及不同性别的学生,差异的表现不同。v教育研究与实验教育研究与实验 2008年年 第第01期期 假设检验的步骤假设检验的步骤v提出原假设和备择假设(相互对立)提出原假设和备择假设(相互对立)v原假设(零假设)原假设(零假设) h0:v备择假设备择假设 h1:v选择和计算检验统计量选择和计算检验统计量v根据检验形式,选择公式,利用样本信息计根据检验形式,选择公式,利用样本信

11、息计算检验统计量的值。算检验统计量的值。v统计决断统计决断v根据显著性水平查相应的理论概率分布表,根据显著性水平查相应的理论概率分布表,寻找相应的临界值。把计算结果与临界值作寻找相应的临界值。把计算结果与临界值作比较,再根据决断规则作决断。比较,再根据决断规则作决断。假设检验的方法假设检验的方法v是一种概率意义上的反证法。是一种概率意义上的反证法。v它从它从“零假设是真零假设是真”出发,根据样本计算出一出发,根据样本计算出一个统计量的值进行推理,如果出现矛盾则拒绝个统计量的值进行推理,如果出现矛盾则拒绝零假设而接受备择假设,反之则接受零假设。零假设而接受备择假设,反之则接受零假设。v判断是否出

12、现矛盾的依据是小概率事件原理。判断是否出现矛盾的依据是小概率事件原理。v小概率事件:发生可能性很小的事件。小概率事件:发生可能性很小的事件。v小概率事件原理:小概率事件在一次抽样中不小概率事件原理:小概率事件在一次抽样中不会发生。会发生。v显著性水平(显著性水平():确定小概率事件的概率范):确定小概率事件的概率范围,通常围,通常=0.05或或0.01。这也就是拒绝零。这也就是拒绝零假设的区域。假设的区域。临界值临界值v划分保留与拒绝区域的界限值。可查与检验统计划分保留与拒绝区域的界限值。可查与检验统计量相应的分布表来寻找临界值。量相应的分布表来寻找临界值。v例如,对于正态分布,在例如,对于正

13、态分布,在0.050.05的显著性水平上的显著性水平上, ,双双侧检验的拒绝区域在分布的两个尾端侧检验的拒绝区域在分布的两个尾端, ,面积各为面积各为0.025, z0.025, z的临界值为的临界值为-1.96-1.96和和+1.96+1.96。v双侧检验:把拒绝双侧检验:把拒绝零假设的零假设的概率(显著性水平概率(显著性水平)分置于理论抽样分布的两侧,在)分置于理论抽样分布的两侧,在抽样分布抽样分布的两侧尾端各有一个拒绝区,其面积各为的两侧尾端各有一个拒绝区,其面积各为/2/2。v单侧检验:把拒绝单侧检验:把拒绝零假设的零假设的概率(显著性水平概率(显著性水平)置于理论抽样分布的一侧,)置

14、于理论抽样分布的一侧,拒绝零假设的拒绝零假设的区域在抽样分布的一侧尾端(左侧或右侧)区域在抽样分布的一侧尾端(左侧或右侧), ,面积为面积为。平均数差异的显著性检验平均数差异的显著性检验v根据两个样本平均数之差检验两个相应总体根据两个样本平均数之差检验两个相应总体平均数之差的显著性,即推断两个总体的平平均数之差的显著性,即推断两个总体的平均数相同或不相同。均数相同或不相同。v常用双侧检验常用双侧检验, ,其假设为:其假设为:vh0: 两个总体平均数差异不显著两个总体平均数差异不显著v( 1=2)v h1: 两个总体平均数差异显著两个总体平均数差异显著 (12) 检验方法检验方法v先判断样本是相

15、互独立还是相关,再根据样本的先判断样本是相互独立还是相关,再根据样本的容量来决定具体的检验方法。容量来决定具体的检验方法。v大样本一般采用大样本一般采用z检验检验. (利用分布,即正态分布,利用分布,即正态分布,进行的检验。)进行的检验。)v小样本采用小样本采用t检验检验. (利用利用t分布进行的检验。)分布进行的检验。)独立样本独立样本v两个样本内的个体是随机抽取的,它们之间不两个样本内的个体是随机抽取的,它们之间不存在一一对应关系。存在一一对应关系。v两个独立样本的容量可能相等,也可能不等。两个独立样本的容量可能相等,也可能不等。v独立大样本:两个独立样本的容量都大于独立大样本:两个独立样

16、本的容量都大于30。v独立小样本:两个样本容量都小于独立小样本:两个样本容量都小于30,或其,或其中一个小于中一个小于30的两个独立样本。的两个独立样本。相关样本相关样本v两个样本内的个体之间存在一一对应的关系。两个样本内的个体之间存在一一对应的关系。v两个相关样本的样本容量相等。两个相关样本的样本容量相等。v类型类型:v配对组:根据某些条件基本相同的原则,把被试配对组:根据某些条件基本相同的原则,把被试匹配成对,然后将每对被试随机地分入两个组里,匹配成对,然后将每对被试随机地分入两个组里,接受不同的处理,用同一个测验所获得的两组测接受不同的处理,用同一个测验所获得的两组测验结果。验结果。v同

17、一组对象的不同测试结果:同一组对象的不同测试结果:v同组被试在实验前后的测验结果;同组被试在实验前后的测验结果;v同组被试在两种实验条件下的测验结果。同组被试在两种实验条件下的测验结果。独立大样本检验独立大样本检验。可能相等和分别为两个样本的容量差;分别表示两个样本标准均数;分别表示两个样本的平,在式中,2121212122212121,nnnnxxnnxxzxxxx相关大样本检验相关大样本检验。为两个样本的相关系数为样本容量;表示两个样本的标准差,;表示两个样本的平均数,在式中,rnxxnrxxzxxxxxx21212122212112v 例:对人的实验班在实验前和实验后进行测试,例:对人的

18、实验班在实验前和实验后进行测试,检验实验有无显著效果。检验实验有无显著效果。v 分析:分析:v 实验前后测验分数平均数差异的显著性检验(两个实验前后测验分数平均数差异的显著性检验(两个总体平均数差异的显著性检验)总体平均数差异的显著性检验)v 同一组对象的两次测验分数属于相关样本,样本容同一组对象的两次测验分数属于相关样本,样本容量超过,是大样本量超过,是大样本v 检验方法:相关大样本检验方法:相关大样本z检验。检验。vh0:1=2 h1:12v 两个样本为独立大样本,计算两个样本为独立大样本,计算z值:值:v v .,根据双侧,根据双侧z检验的决断规检验的决断规则作出决断:则作出决断:接受零

19、假设,即男女生测验接受零假设,即男女生测验成绩没有显著差异。成绩没有显著差异。45. 11745 .101805 .112 .785 .7622z独立小样本独立小样本t检验检验2,112212121212122221121nndfnnnnnnnnnnxxtxx。可能相等和是两个样本的容量、在式中相关小样本相关小样本t检验检验1,12212121222121ndfnrxxnrxxtxxxxxx为样本容量。;为两个样本的相关系数;分别为两个样本标准差;分别为两个样本平均数,在式中,v例:例:10对学生分别接受两种实验,根据他们对学生分别接受两种实验,根据他们的统一测验成绩检验两种实验的效果有无显的

20、统一测验成绩检验两种实验的效果有无显著差异。著差异。v分析:分析:v两组测验分数平均数差异的显著性检验两组测验分数平均数差异的显著性检验v相关小样本(配对组统一测验分数)相关小样本(配对组统一测验分数)v检验方法:相关样本检验方法:相关样本t检验检验v 2检验检验 v是对样本的频数分布所来自的总体分布是否是对样本的频数分布所来自的总体分布是否服从某种理论分布或假设分布所作的检验。服从某种理论分布或假设分布所作的检验。即根据样本的频数分布来推断总体的分布。即根据样本的频数分布来推断总体的分布。v数据类型:点计数据数据类型:点计数据单向表单向表2检验检验v单向表是把实测的点计数据按一种分类标准编制单向表是把实测的点计数据按一种分类标准编制而得的表。而得的表。例:从某校随机抽取例:从某校随机抽取50个学生,其中男生个学生,其中男生27人,人,女生女生23人,问该学校男女生人数是否有显著差异?人,问该学校男女生人数是否有显著差异?双向表双向表2检验检验v双向表是把实测的点计数据按两种分类标准编制双向表是把实测的点计数据按两种分类标准编制而得的表,也称为列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论