单样本显著性检验.ppt_第1页
单样本显著性检验.ppt_第2页
单样本显著性检验.ppt_第3页
单样本显著性检验.ppt_第4页
单样本显著性检验.ppt_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章单样本显著性检验,第一节导论:平均数的抽样分布,1.如何比较抽样分布的均数与样本来自的总体均数?,2.当增加抽样分布的样本量时,样本平均数如何变化?,例1=50,=1040分到60分之间呢?,图5-1a,随机抽取一个大样本,其个体分数的分布见图5-1(a),如果抽取样本量N=3的100个个样本,计算每个样本平均数,图5-1b,如果抽取N=20的100个个样本,计算每个样本平均数,图5-1c,样本平均数与总体平均数相差较小,如果抽取样本容量N=40的100个样本,计算每个样本平均数,图5-1d,从总体抽取一个样本的分布,总面积的68%,=个体分数方差,样本平均数的分布,总面积的68%,=样本均数的方差,=样本均数的标准差,样本平均数的平均数的标准差,就称为均数的标准误(standarderrorofmean),如果总体标准差已知,则标准误:,5-1,如果总体标准差未知,则标准误:,5-2,无论总体标准差已知还是未知,标准误的大小取决于总体的变异与样本大小。,标准误=,=50=2,总体中个体分数,小样本,大样本,第二节统计假设检验:已知总体均数和标准差,图a,知总体和,从中抽取大量样本,见图b,图b,可以描述这些大量样本的平均数和标准差,可用来确定正态曲线下的概率值。,图c,通过已知正态分布的概率关系,可计算任意一个样本的平均数有关的概率,2.1样本平均数落在特定区间的概率,如前述,任一正态变量都可转化为标准正态分布,可根据z分数与正态曲线下的面积关系求概率,换言之,任给一个原始分数,只要知道该分数之外的面积比例,就可以知道与此相应的z值。,同理,任给一个样本平均数,只要知道该平均数之外的面积比例,就可以知道与此相应的z值,=2/2=1,P(z1)=0.1587,例2:已知=50,=10,从该总体随机抽取一个N=25的样本,问该52的概率为多少?,P(48X52)=P(-1z1)=20.34=68%,2.2样本平均数的假设检验,1.H0:20,2.H1:20,3.统计检验:因为已知,所以使用z检验,4.显著性水平:=0.01单尾,5.抽样分布:正态概率曲线,6.拒绝H0的临界区间:|z|2.33,例5-2安眠药睡眠时间服从正态分布,标准差1.5小时,10人服用后,测得平均睡眠时间为21.15小时,该批号安眠药睡眠时间的总体均数是否高于20小时?,因为z2.33,所以P0.01,拒绝H0,差异有统计学意义。可以认为该批安眠药睡眠时间的总体均数高于20小时。犯错误的风险为0.01。,例5-2安眠药睡眠时间服从正态分布,标准差1.5小时,10人服用后,测得平均睡眠时间为21.15小时,该批号安眠药睡眠时间的总体均数是否高于20小时?,第三节通过样本数据进行参数估计点估计,人口普查中的资料可以获得总体信息,多数情况不能获得总体信息,尽管如此,我们仍然可以采用样本统计量推测总体参数。,实际工作中是抽取单一样本,利用样本统计量对总体进行的估计称为点估计。,已知方差,用方差描述样本的变异有没有问题?,没有问题,再问:用方差估计总体方差有没有问题?,答:有问题,一般地,样本方差估计总体方差是偏低的。,如果用大样本估计总体方差,得到的是无偏估计:,2的无偏估计:,5-3,的无偏估计:,5-4,因此,平均数抽样分布的总体方差估计值:,5-5,平均数抽样分布的标准误:,5-6,或者,本课件一律采用下式计算标准误:,5-7,表5-1温习平均数、方差和标准差的符号,S,标准差,S2,2,2,方差,0,平均数,样本统计量(经验上的),总体参数(理论上的),平均数抽样分布的无偏总体估计(经验上的),平均数的抽样分布参数(理论上的),图5-6样本数据可以用来估计总体方差(2)的无偏估计以及平均数的标准误,样本方差越大,总体方差的估计值和平均数的估计标准误也越大,样本数据,或,第四节参数未知时统计假设检验t检验,如果总体方差已知,用,如果总体方差未知,用,图5-7当自由度=3,10和时,t分布于标准正态分布的比较,注:自由度是指对一组数据进行一定的控制之后,可以自由变化的数据个数。,假设有四个数:18、23、27、32,和是多少?平均数是多少?,这四个数的和是100,平均数是=25,(1825)+(2325)+(2725)+(3225)=(7)+(2)+2+7=0,如果必须根据平均数计算离差,那么只有第四个固定,其他三个可以自由变化。自由度f=4-1=3,推而广之:任意一个样本,我们对它只有一个限制条件,那么这个样本的自由度就是N-1,今后我们使用t分布进行各种检验,会用各种不同的自由度。,需要说明的是,t检验是一种稳健的检验,这就意味着即使总体分布严重偏离正态分布,t检验的统计推论也是相当有效的,这个结论是由中心极限定理决定的。我们我们怀疑分布是否符合正态性,明智的做法是增加样本量。,4.1t分布的特点,t分布与标准正态分布一样,关于平均数0对称。,t分布的离散程度比正态分布大,见图5.8当未知时,用z检验代替t检验,会冒很大的风险去拒绝一个真实的虚无假设,所以犯类错误的危险非常大。增大t值可以界定出拒绝区域,临界值为3.182。0.05的拒绝区域:|t|3.182,t分布的临界值表,与正态分布不同,t分布的临界值(criticalvalue)是指与各种显著性水平相对应的临界值区域的对应值。查表时,先找到df=3,按双尾=0.05往下找到临界值t=3.182。一旦算的的t值大于3.182,就拒绝H0.,4.2未知时的统计假设检验:单样本情况,1.H0:1.9,2.H0:1.9,3.统计检验:因为未知,所以使用t检验,4.显著性水平:=0.05,单尾,5.抽样分布:自由度df=16-1=15的t分布,6.拒绝H0的临界区间:|t|1.753,例5-4人体注射麻疹疫苗后的抗体强度服从正态分布,从某厂产品随机抽取疫苗为16人注射,测得抗体强度为,因为t=2.5082,|t|1.753,按0.05单尾拒绝虚无假设,差别有统计学意义,可以认为该厂产品平均抗体强度高于1.9。,第五节参数估计:区间估计,除了点估计。推论统计还包括区间估计。,区间估计(intervalestimation)是指包括总体真值的范围所作的估计。,例5:成都电视台8月初报道有1名13岁的肥胖儿童名叫浩浩的,体重达到230斤,假如你不知道他的真实体重,你凭什么猜测他的体重呢?你有多大把握说他的体重是230斤呢?,一般是通过观察,凭借印象猜测他是200斤,这个就叫“点估计”,如果猜测体重大约在200240斤,就称为区间估计。,第六节置信区间与置信限(第45、46页),总体均数真值落入的区间,就称为置信区间。(confidenceinterval),置信界限称为置信限(confidencelimit),=0.05的置信区间称为95%的置信区间。=0.01的置信区间称为99%的置信区间。,例5在例4中,已知,n=9,计算人工人参总体M物质含量99%的置信区间。,所以0的下限=,=42.363.3550.466,=42.361.56=40.80,上限=42.36+1.56=43.92,解释置信区间需注意的问题:,在计算总体均数可能落入的区间时,我们不知道计算的样本平均数正确的概率有多大,也就不能够确定总体均数为的概率是95%还是99%。我们计算的概率不是针对总体均数,而是针对区间内包含总体均数的概率。,从总体中重复抽取100个样本,理论上有95的区间包含总体均数,大约有5个不包含。,这里的C表示总体均数的置信区间,而非概率,小结,1.样本平均数的分布服从正态分布。,从总体中抽取一个大样本,2.平均数抽样分布的总体平均数等于总体平均数,3.平均数的标准误等于总体标准差除以样本量的平方根。即:,4.如果已知,可选择z统计量和相应的标准正态分布。进行单样本的z检验。,5.如果未知,进行单样本的假设检验,可以通过统计量来估计总体参数,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论