均数的抽样误差和总体均数估计详解演示文稿_第1页
均数的抽样误差和总体均数估计详解演示文稿_第2页
均数的抽样误差和总体均数估计详解演示文稿_第3页
均数的抽样误差和总体均数估计详解演示文稿_第4页
均数的抽样误差和总体均数估计详解演示文稿_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

均数的抽样误差和总体均数估计详解演示文稿第一页,共四十二页。优选均数的抽样误差和总体均数估计第二页,共四十二页。总体样本随机抽取部分观察单位

μ?

推断inference参数估计第三页,共四十二页。一、抽样误差与标准误第四页,共四十二页。2009年某市18岁男生身高N(167.7,5.32)的抽样示意图

第五页,共四十二页。

将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制频数图从正态分布总体N(167.7,5.32)随机抽样所得样本均数分布第六页,共四十二页。①

,各样本均数未必等于总体均数;②各样本均数间存在差异;③样本均数的分布为中间多,两边少,左右基本对称。

④样本均数的变异范围较之原变量的变异范围大大缩小。可算得这100个样本均数的均数为167.69cm、标准差为1.69cm。

样本均数分布具有如下特点:第七页,共四十二页。1、抽样误差:

由个体变异产生的、抽样造成的样本统计量与总体参数的差别原因:1)抽样

2)个体差异第八页,共四十二页。表示样本统计量抽样误差大小的统计指标。标准误:说明抽样误差的大小,总体计算公式(7-27)2、标准误(standarderror,SE)实质:样本均数的标准差第九页,共四十二页。若用样本标准差s

来估计,

(7-28)当样本例数n一定时,标准误与标准差呈正比当标准差一定时,标准误与样本含量n的平方根呈反比。通过增加样本含量n来降低抽样误差。第十页,共四十二页。随机抽样调查7岁男孩120名,的身高均数为120.88,标准差为5.23,则其标准误是多少?例子:第十一页,共四十二页。指标意义应用标准差(s)衡量变量值变异程度,s越大表示变量值变异程度越大,s越小表示变量值变异程度越小描述正态分布(近似正态分布)资料的频数分布;医学参考值范围的估计标准误()样本均数的变异程度,表示抽样误差的大小。标准误越大表示抽样误差越大,样本均数的可靠性越小;标准误越小表示抽样误差越小,样本均数的可靠性越大总体均数区间估计;两个或多个总体均数间比较标准差和标准误的区别第十二页,共四十二页。二、t分布(一)t分布概念第十三页,共四十二页。随机变量XN(m,s2)标准正态分布N(0,12)z变换第十四页,共四十二页。第十五页,共四十二页。

式中为自由度(degreeoffreedom,df)

3.实际工作中,由于未知,用代替,则不再服从标准正态分布,而服从t分布。

第十六页,共四十二页。均数标准正态分布N(0,12)Studentt分布自由度:n-1第十七页,共四十二页。(二)t分布的图形与特征

分布只有一个参数,即自由度第十八页,共四十二页。

图不同自由度下的t分布图第十九页,共四十二页。1.特征:

第二十页,共四十二页。2、t界值表:详见附表2,可反映t分布曲线下的面积。单侧概率或单尾概率:用表示;双侧概率或双尾概率:用表示。

第二十一页,共四十二页。-tt0第二十二页,共四十二页。举例:

第二十三页,共四十二页。三、参数估计用样本统计量推断总体参数。总体均数估计:用样本均数(和标准差)推断总体均数。第二十四页,共四十二页。点估计(pointestimation):用相应样本统计量直接作为其总体参数的估计值。如用

估计μ、s估计

等。其方法虽简单,但未考虑抽样误差的大小。第二十五页,共四十二页。

按预先给定的概率(1)所确定的包含未知总体参数的一个范围。总体均数的区间估计:按预先给定的概率(1)所确定的包含未知总体均数的一个范围。

如给定=0.05,该范围称为参数的95%可信区间或置信区间;如给定=0.01,该范围称为参数的99%可信区间或置信区间。2.区间估计(intervalestimation):第二十六页,共四十二页。计算总体均数可信区间需考虑:(1)总体标准差是否已知,(2)样本含量n的大小通常有两类方法:(1)t分布法

(2)z分布法第二十七页,共四十二页。

(1)

未知且n比较小:按t分布第二十八页,共四十二页。第二十九页,共四十二页。第三十页,共四十二页。(2)按z分布第三十一页,共四十二页。某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间。

举例第三十二页,共四十二页。

故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47,3.81)mmolL。第三十三页,共四十二页。四、假设检验的基本概念和步骤第三十四页,共四十二页。例大规模调查表明,健康成年男子血红蛋白的均数为136.0g/L,今随机调查某单位食堂成年男性炊事员25名,测得其血红蛋白均数121g/L,标准差48.8g/L。问题:根据资料推论食堂炊事员血红蛋白均数是否与健康成年男子血红蛋白均数有无差别(一)假设检验的基本思想第三十五页,共四十二页。假设检验目的——判断差别是由哪种原因造成的。①

抽样误差造成的;②

本质差异造成的。造成的可能原因有二:案例第三十六页,共四十二页。炊事员血红蛋白总体均数

136.0g/L

121g/L炊事员血红蛋白总体均数

138.0g/L一种假设H0另一种假设H1抽样误差总体不同第三十七页,共四十二页。

假定假如炊事员均数为136.0g/L,即则,服从t分布,绝大多数t应该分布在主要区域

根据t

分布能够计算出有如此大差异的概率P,如果P值很小,即计算出的t值超出了给定的界限,则倾向于拒绝H0,认为山区血红蛋白均数不是136.0g/L

第三十八页,共四十二页。假设检验的基本思想—利用小概率反证法的思想利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。当P小于或等于预先规定的概率值α,就是小概率事件。根据小概率事件的原理:小概率事件在一次抽样中发生的可能性很小,如果他发生了,则有理由怀疑原假设H0,认为其对立面H1成立第三十九页,共四十二页。1.建立检验假设,确定检验水准(选用单侧或双侧检验)(1)无效假设,记为H0;(2)备择假设,记为H1。对于检验假设,须注意:1)检验假设是针对总体而言,而不是针对样本;2)H0和H1是相互联系,对立的假设,后面的结论是根据H0和H1作出的,因此两者不是可有可无,而是缺一不可二、假设检验的基本步骤第四十页,共四十二页。3)H1的内容直接反映了检验单双侧。若H1中只是

0

或只是

<0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。

4)单双侧检验的确定,首先根据专业知识,其次根

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论