心理与教育统计学06-抽样分布及总体平均数推断_第1页
心理与教育统计学06-抽样分布及总体平均数推断_第2页
心理与教育统计学06-抽样分布及总体平均数推断_第3页
心理与教育统计学06-抽样分布及总体平均数推断_第4页
心理与教育统计学06-抽样分布及总体平均数推断_第5页
已阅读5页,还剩38页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章抽样分布及总体平均数推断第一节抽样分布第二节总体平均数的估计第三节总体比率的区间估计第四节总体方差的区间估计第一节抽样分布一、抽样分布的概念要区分以下三种不同性质的分布:总体分布:总体内个体数值的频数分布。样本分布:样本内个体数值的频数分布。抽样分布:某一统计量的概率分布。实验性的抽样分布是为了容易了解,实际上抽样分布是一个理论的概率分布。它是统计推断的理论依据。二、平均数抽样分布的几个定理1.从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。2.容量为n的平均数在抽样分布上的标准差,等于总体标准差除以n的平方根。3.从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。4.虽然总体不呈正态分布,如果样本容量较大,反映总体平均数和标准差的样本平均数的抽样分布,也接近于正态分布。小贴士1.抽样分布是统计推断的理论依据。2.抽样误差用抽样分布上的标准差来表示。3.某种统计量在抽样分布上的标准差称为该种统计量的标准误。三、样本平均数与总体平均数离差统计量的形态1.总体分布为正态,总体方差已知时,无论样本大小,样本平均数的抽样分布为正态分布。2.总体分布为正态,总体方差未知时,只要样本容量n>30,样本平均数的分布为正态分布。3.总体分布为非正态分布,但总体方差已知,若样本容量n>30.样本平均数的抽样分布为渐进正态分布。当抽样分布为正态分布或渐进正态分布时,样本平均数与总体平均数离差的统计量用Z值来表示。

若总体呈正态分布,总体方差未知而且n<30,或总体方差未知,总体未呈正态分布,n>30,样本平均数的抽样分布为t分布。样本平均数与总体平均数的离差的统计量用t值来表示。t分布的特点:T分布是一种左右对称的分布,且分布的形状随样本容量的变化而变化。t分布t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z正态分布与t分布的比较相同点:1.取值范围相同2.平均数为0,且以平均数处为最高峰向俩侧逐渐下降3.尾部无限延伸,以横轴为渐进线4.单峰对称形不同点:1.t分布的形态随自由度的变化呈一簇分布形态,2.t分布的峰狭窄尖峭,尾长而翘的高,在基线上分布的范围广。自由度越小,分布范围越广3.当自由度增大时,t分布逐渐接近正态分布。当自由度无限大时,t分布与正态分布重合。t分布表(教材328页)t分布表是由T分布函数计算得到的,给出了不同自由度时某些概率下的t值。因为t分布曲线以纵轴为对称轴,表中只有t的正值。表的左列为不同的自由度,最上面一行是指t分布曲线两尾部的概率(面积)之和,而表第二行标明的是t分布曲线一侧的尾部概率。当t分布曲线两侧尾部概率相同时,不同的自由度下其相应t值是不同的。自由度:指总体参数估计量中变量值独立自由变化的个数。用df表示自由度与统计运算和统计推断中样本容量及限制因素的个数有关。自由度的个数等于样本容量n减去限制因子的个数。第二节总体平均数的估计

参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推断统计统计推断的过程样本总体样本统计量如:样本均值、比例、方差总体均值、比例、方差等一、总体参数估计的基本原理1.点估计用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。点估计的评价标准如下:(1)无偏性:估计量抽样分布的数学期望等于被估计的总体参数P(

)BA无偏有偏(2)有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效AB的抽样分布

的抽样分布P(

)(3)一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本容量较大的样本容量P(

)小贴士1.用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计2. 没有给出估计值接近总体参数程度的信息

2.区间估计以样本统计量的抽样分布(概率分布)为理论依据,按一定的概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。在一定的可靠程度上求出总体参数的置信区间的上下限。在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在75~85之间,置信水平是95%样本统计量

(点估计)置信区间置信下限置信上限区间估计的图示

x95%的样本

-1.96

x

+1.96

x99%的样本

-2.58

x

+2.58x90%的样本

-1.65

x

+1.65

x将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平表示为(1-为是总体参数未在区间内的比例常用的置信水平值有99%,95%,90%相应的为0.01,0.05,0.10置信水平

由样本统计量所构造的总体参数的估计区间称为置信区间统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间置信区间

置信区间与置信水平

均值的抽样分布(1-

)%区间包含了

%的区间未包含

1–aa/2a/2影响区间宽度的因素1. 总体数据的离散程度,用来测度2、样本容量,3. 置信水平(1-),影响z的大小二、

2已知条件下总体平均数区间估计 假定条件总体服从正态分布,且方差(2)未知如果不是正态分布,可由正态分布来近似(n30)使用正态分布统计量z总体均值

在1-

置信水平下的置信区间为总体均值的区间估计

(例题分析)【例】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.5

95.0108.8115.6100.0123.5102.0101.6102.2116.6

95.4

97.8108.6105.0136.8102.8101.5

98.4

93.3总体均值的区间估计

(例题分析)解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根据样本数据计算得:总体均值在1-置信水平下的置信区间为该食品平均重量的置信区间为101.44g~109.28g总体均值的区间估计

(例题分析)【例】一家保险公司收集到由36投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如下表。试建立投保人年龄90%的置信区间36个投保人年龄的数据233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计

(例题分析)解:已知n=36,1-=90%,z/2=1.645。根据样本数据计算得:,总体均值在1-置信水平下的置信区间为投保人平均年龄的置信区间为37.37岁~41.63岁三、

2未知条件下总体平均数区间估计假定条件总体服从正态分布,且方差(

2)

未知小样本(n<30)使用t

分布统计量总体均值

在1-

置信水平下的置信区间为总体均值的区间估计

(例题分析)【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命95%的置信区间16灯泡使用寿命的数据1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计

(例题分析)解:已知X~N(,2),n=16,1-=95%,t/2=2.131根据样本数据计算得:,总体均值在1-置信水平下的置信区间为该种灯泡平均使用寿命的置信区间为1476.8小时~1503.2小时总体比例的区间估计第三节总体比例的区间估计一、假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量z

总体比例

在1-

置信水平下的置信区间为总体比例的区间估计

(例题分析)【例】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间解:已知n=100,p=65%,1-=95%,z/2=1.96该城市下岗职工中女性比例的置信区间为55.65%~74.35%

总体方差的区间估计第四节总体方差的区间估计一、假定条件 估计一个总体的方差或标准差,假设总体服从正态分布。总体方差2的点估计量为S2,且

总体方差在1-

置信水平下的置信区间为总体方差的区间估计

(图示)

2

21-

2

总体方差1-

的置信区间自由度为n-1的

2总体方差的区间估计

(例题分析)【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间25袋食品的重量112.5101.0103.0102.0100.5102.6107.5

95.0108.8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论