第四节--抽样分布PPT课件_第1页
第四节--抽样分布PPT课件_第2页
第四节--抽样分布PPT课件_第3页
第四节--抽样分布PPT课件_第4页
第四节--抽样分布PPT课件_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四节抽样分布,总体分布:总体内个体数值的频数分布。样本分布:样本内个体数值的频数分布。抽样分布:某一种统计量的频数分布。抽样分布是一种理论的概率分布,是统计推断的理论依据。,.,1,总体分布:所有元素出现概率的分布。是简单意义上的随机变量对应的频次分布。总体分布往往是未知的,很多场合不可能获取得对所有个体元素的观察值。当然有些时候可以通过理论计算进行假定。样本分布:选择的样本在随机变量上的对应的频次分布,样本分布实际上也在趋向总体分布。样本分布和总体分布的本质是一样,区别就在于选取的数据不一样,一个是总体(N个),一个是样本(n个)抽样分布是对样本统计量概率分布的一种描述方式。这个和上面两个是截然不同的概念。虽然统计量也是随机变量,但是本身来说,是经过处理的变量。在使用时需要计算任意n个样本的统计量,然后将数据进行分布查看。由样本n个观察值计算的统计量的概率分布就是抽样分布。抽样分布有什么特征,抽样分布是什么样的分布,这要根据总体是否正态、总体方差是否已知、样本统计量是什么等因素确定。,2,.,一、正态分布与渐进正态分布,(一)如果总体呈正态分布,且总体方差已知,那么,样本平均数的抽样分布为正态分布。此时,样本平均数的平均数等于总体平均数,样本平均数在抽样分布上的标准差,等于总体标准差除以N的平方根。,.,3,(二)如果总体不呈正态分布,但2已知,且样本容量较大,此时,样本平均数的抽样分布接近正态分布。上述两种情况,都可以将样本平均数转化成标准分数:,.,4,(三)如果总体呈正态分布,总体方差未知,样本是大样本,那么,样本平均数的抽样分布为渐进正态分布。(四)依随机取样的原则,自正态分布的总体中抽取容量为n的样本,当n足够大时(n30),样本方差及标准差的分布,渐趋于正态分布。,.,5,二、t分布,当总体为正态分布,但总体方差未知,而且N30时,样本平均数的分布为t分布。(一)什么是t分布若干个来自已知平均数为U,而方差未知的正态分布总体的样本统计量的分布。t分布是统计分析中应用较多的一种随机变量函数的分布,是统计学者高赛特(Goeset)1908年在以笔名Student发表的一篇论文中推导的一种分布。,.,6,(二)t分布的特征,1.t分布的平均值为0。2.t分布是以过平均值0的垂线为轴的对称分布,分布左侧t为负值,分布右侧t为正值。3.t变量取值在-+之间。4.当样本容量趋于+时,t分布为正态分布。5.t分布的形态随自由度的变化而变化,呈一簇分布形态(即自由度不同的t分布形态也不同);t分布的峰狭窄尖峭,尾长而翘得高。,.,7,t分布与标准正态分布的比较,相同点:1.以过平均数的直线为轴,两侧对称;2.曲线在平均数这一点上有最高点;3.曲线从中央点向两侧逐渐下降,但永远不与基线相交;4.曲线下的面积为1,以平均数为界,左右各占0.5。不同点:t分布随自由度的变化,是一簇分布;标准正态分布不随自由度的变化而变化。联系:当自由度趋于无穷大时,t分布接近标准正态分布。,.,8,(三)自由度,指总体参数估计量中变量值自由变化的个数,用符号df表示。任何变量中可以自由变化的数目。自由度(degreeoffreedom,df)在数学中能够自由取值的变量个数,如有3个变量x、y、z,但x+y+z=18,因此其自由度等于2。在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。通常df=n-k。其中n为样本含量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。自由度通常用于抽样分布中。,.,9,统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的自变量的个数,称为该统计量的自由度。统计学上的自由度包括两方面的内容:首先,在估计总体的平均数时,由于样本中的n个数都是相互独立的,从其中抽出任何一个数都不影响其他数据,所以其自由度为n。在估计总体的方差时,使用的是离差平方和。只要n-1个数的离差平方和确定了,方差也就确定了;因为在均值确定后,如果知道了其中n-1个数的值,第n个数的值也就确定了。这里,均值就相当于一个限制条件,由于加了这个限制条件,估计总体方差的自由度为n-1。例如,有一个有4个数据(n=4)的样本,其平均值m等于5,即受到m=5的条件限制,在自由确定4、2、5三个数据后,第四个数据只能是9,否则m5。因而这里的自由度=n-1=4-1=3。推而广之,任何统计量的自由度=n-限制条件的个数,.,10,(四)t分布表的使用,左列表示自由度。最上一行表示不同自由度下t分布两端的概率之和,即在某t值时,t分布两端的概率之和,又称显著性水平。中间数字:某一自由度和某一显著性水平t的临界值。,.,11,不管是正态分布,还是在t分布,都存在标准误问题.标准误的含义:某种统计量在抽样分布上的标准差,符号SE表示。包括:样本平均数的标准误;样本标准差的标准误;样本相关系数的标准误;标准差与标准误的异同:都是描述数据的离中趋势,即都是离中趋势的指标标准差是一般变量值离中趋势的指标标准误是样本统计量离中趋势的指标抽样误差:从总体中抽取容量为的个样本时,样本统计量与总体参数之间总会存在一定的差距,而这种差距是由于抽样的随机性所引起的样本统计量与总体参数之间的不同,称为抽样误差。,.,12,三、2(卡方)分布,(一)2(卡方)分布的含义从一个服从正态分布的总体中,每次随机抽取随机变量X1,X2,X3XN,并分别将其平方,即可得到X12,X22,X32,XN2,这样可抽取无限多个数量为n的随机变量X,并可求得无限多个n个随机变量X的平方的和,也可计算其标准分数Z=X-/,及其平方Z2=(X-/)2。这无限多个n个随机变量平方和或标准分数的平方和的分布,即为2分布。2分布是统计分析中应用较多的一种抽样分布。,.,13,(二)2分布的特点,1、是一个正偏态分布。随每次所抽取的随机变量X个数(n的大小)不同,其分布曲线的形状不同,n或n-1越小分布越偏斜,df很大时,接近正态分布。当df时,2分布为正态分布。可见2分布是一族分布,正态分布是其中一特例。2.卡方值都是正值。3.卡方分布的和也是卡方分布。4.2分布是连续型分布,但有些离散型的分布也近似2分布。,.,14,(三)2分布表的编制与使用,2分布表是根据2分布函数计算出来的,2分布曲线下的面积都是1。但随自由度不同,同一2值以下或以上所含面积与总面积之比率不同。故一般2表,要列出自由度、及某一2值以上2分布曲线下的概率。,.,15,四、F分布,(一)F分布的含义自一个正态总体中随机抽取容量为n1及n2两个样本,它们的总体方差估计值的比值F的分布称为F分布(分子的自由度为n1-1,分母的自由度为n2-1)。知道了同一总体不同样本的总体方差估计值F的分布,即可分析任意两样本方差是否取自同一总体了。可见,F分布在统计分析中是很有用的一种样本分布。,.,16,(二)F分布的特点,1.F分布形态是一个正偏态的分布,它的分布曲线的形式随分子、分母的自由度不同而不同,它是一族分布,随df1与df2的增加而渐趋正态分布。2.因F为两个方差之比率,故F总为正值。3.F分布表是根据F分布函数计算得来。4.当分子的自由度为1,分母的自由度为任意值时,F值与分母自由度相同概率的t值(双侧概率)的平方相等。,.,17,(三)F分布表的使用,该表左一列为分母的自由度从1-30比较详细,30以后只列出间隔较大的一部分自由度。表的左二列为概率:0.05与0.01即F曲线下某F值之右侧的概率,表的最上行为分子的自由度,其值与分母自由度的值相似。表中其他各行各列的数值为0.05与0.01概率时,不同分子、分母自由度时F分布的值。,.,18,抽样分布:某一种统计量的频数分布。(一)当总体为正态分布,总体方差已知时,样本平均数的分布为正态分布。此时,样本平均数的平均数等于总体的平均数;样本平均数的标准差,等于总体标准差除以N的平方根。当总体为正态分布,总体方差未知,且样本为大样本时,样本平均数的分布为渐近正态分布。当总体为正态分布,样本为大样本时,样本方差及标准差的分布为渐近正态分布。(二)当总体为正态分布,但总体方差未知,且N30时,样本平均数的分布为t分布。此时,样本平

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论