教育统计学07讲抽样分布.ppt_第1页
教育统计学07讲抽样分布.ppt_第2页
教育统计学07讲抽样分布.ppt_第3页
教育统计学07讲抽样分布.ppt_第4页
教育统计学07讲抽样分布.ppt_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育统计学06讲抽样分布,内容简介,抽样分布样本平均数的抽样分布样本方差的抽样分布,引子,3,4,5,6,7,一、抽样分布,总体分布总体内个体观察值的次数分布或概率分布样本分布样本内个体观察值的次数分布或概率分布注意:一次抽样的样本分布不一定和总体分布相同。从总体中反复抽取多个相同容量的样本,这些样本具有不同的个体、不同的数值、不同的平均值等。,一、抽样分布,抽样分布指某种样本统计量(如平均值,方差)的概率分布。通过收集来自同一总体相同样本容量的无限个样本的某种样本统计量的值得到理论概率分布。理论上来说,若总体容量为,样本容量为n,有放回地抽取所有可能的样本数为n种。所以,实验性的抽样分布是为了能使人们更容易理解,实质上是一个理论性的抽样分布。通过分析所有样本的某种统计量所构成总体的分布特征,获得样本统计量与总体参数的关系,进而以此为依据在一定可靠程度上推论总体特征(总体参数)。,样本平均数的抽样分布,样本方差的抽样分布,二、样本平均数的抽样分布,样本平均数的抽样分布具有如下特点样本平均数集中在总体均值附近样本平均数的抽样分布近似正态分布有放回随机取样的所有可能样本平均数的均值等于总体均值,样本平均数的标准差等于总体标准差除以样本容量的算术平均根注:为了与观测值的分布相区别,称样本统计量抽样分布的标准差为统计量的标准误(standarderror,SE)。如样本平均数的标准误记为,二、样本平均数的抽样分布,统计量的标准误是统计量离散程度的指标,它反映各样本统计量与总体参数的接近程度。标准误越大,表明样本统计量与总体参数的离散程度越大,用样本统计量估计总体参数的可靠性越低。思考:什么因素影响样本统计量离散程度(标准误)大小?,二、样本平均数的抽样分布,中心极限定理从总体中抽取样本容量为n的简单随机样本,当样本容量很大时,样本均值的抽样分布可用正态分布近似。样本容量应该达到多大时,我们才可以假定能够使用中心极限定理?当总体分布是对称钟形形状时,样本容量为5-10即可当总体分布严重偏斜或明显非正态,则需要更大的样本容量,一般应大于等于30可以适用。,中心极限定理对三个总体的示意图,总体正态样本平均数抽样分布,总体非正态样本平均数抽样分布,(一)平均数的抽样正态分布,平均数抽样分布正态分布应用,应用1:117例7.6应用2:已知全校学生英语成绩呈正态分布,为7.07,从这个总体中随机抽取一个样本容量为36的样本,计算出样本平均值为79分,试问总体均值的取值。(置信度取0.95)注:显著性水平、置信度1-、置信区间,(二)平均数的抽样t分布,若总体标准差未知,无论样本容量多大,样本平均数的抽样分布服从:自由度(degreeoffreedom,df)为n-1的t分布平均数抽样分布的均值平均数抽样分布的标准差统计量t分布特点介绍t分布表使用介绍,t分布特征,1以0为中心,左右对称的单峰分布;2t分布是一簇曲线,其形态变化与自由度df大小有关。自由度越小,t分布曲线越低平;自由度越大,t分布曲线越接近标准正态分布曲线,如图.3.当自由度大于等于30时,t分布近似正态分布。(请大家仔细查看t分布表,当自由度超过30时,t值十分接近标准正态分布中相同概率下的Z值),t分布表的使用,不同统计教材提供的表可能不同,t统计量,说明计算得到的统计量t大于12.706,小于-2.706的概率为0.05,一、样本平均数抽样分布表,118表总结以下两条:无论总体是否正态,当样本容量30以上时,样本平均数抽样分布近似正态分布当总体方差未知时,样本平均数抽样分布服从t分布,但若同时样本容量30以上,可用正态分布近似,运用,根据样本平均数估计总体平均数例1总体正态,总体均值为,标准差已知例2总体正态,总体均值为,标准差未知例3总体非正态,总体均值为,标准差已知例4总体非正态,总体均值为,标准差未知,1.总体正态,总体均值为,标准差已知,此种情况下,样本平均数例:已知全校学生英语成绩呈正态分布,为7.07,从这个总体中随机抽取一个样本容量为36的样本,计算出样本平均值为79分,试问总体均值的取值。(置信度取0.95)注:显著性水平、置信度1-、置信区间,1.总体正态,总体均值为,标准差已知,已知全校学生英语成绩呈正态分布,为7.07,从这个总体中随机抽取一个样本容量为36的样本,计算出样本平均值为79分,试问总体均值的取值。(置信度取0.95)解:,2.总体正态,总体均值为,标准差未知,样本平均数服从t分布例:假设大学生词汇记忆任务测试成绩服从正态分布,总体标准差未知,从中抽取一个容量为10的样本,求得平均数为78,样本方差为8,问总体参数的0.95置信区间.,2.总体正态,总体均值为,标准差未知,假设大学生词汇记忆任务测试成绩服从正态分布,总体标准差未知,从中抽取一个容量为10的样本,求得平均数为78,样本方差为8,问总体参数的0.95置信区间.解:,3.总体非正态,总体均值为,标准差已知,由于总体非正态,平均数抽样分布未知,若样本容量大于等于30,则可根据中心极限定理,认为样本平均数的抽样分布近似正态分布.例:已知全校学生英语成绩非正态,为7.07,从这个总体中随机抽取一个样本容量为36的样本,计算出样本平均值为79分,试问总体均值的取值。(置信度取0.95),3.总体非正态,总体均值为,标准差已知,已知全校学生英语成绩非正态,为7.07,从这个总体中随机抽取一个样本容量为36的样本,计算出样本平均值为79分,试问总体均值的取值。(置信度取0.95)解:,4.总体非正态,总体均值为,标准差未知,在样本量大的情况下,由于总体方差未知,样本平均数抽样分布服从自由度为n-1的t分布。当自由度大于30时,t分布近似正态分布,所以也可以直接用正态分布处理。例:某班49人期末考试成绩为85分,标准差为6,假设此项考试能反映学生的学习水平,试推论该班全部学生的真实成绩分数。,4.总体非正态,总体均值为,标准差未知,某班49人期末考试成绩为85分,标准差为6,假设此项考试能反映学生的学习水平,试推论该班全部学生的真实成绩分数。解:,三、样本方差的抽样分布,样本方差的抽样分布服从2(卡方)分布,2分布,三、样本方差的抽样分布,已知某测验分数呈正态分布,随机抽取其中一个样本n=10,s2n-1=0.286,求该测验分数总体方差2的0.95置信区间。,三、样本方差的抽样分布,已知某测验分数呈正态分布,随机抽取其中一个样本n=10,s2n-1=0.286,求该测验分数总体方差2的0.95置信区间。解题思路:根据前述性质我们知道,(n-1)乘以样本方差与总体方差之间之比服从卡方分布。,解,根据卡方分布表,可查得df10-19,显著性水平0.05时两侧的临界值(卡方分布表使用)。,练习,例:在校大学生每月平均支出是480元,标准差为20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论