9 参数估计2.ppt_第1页
9 参数估计2.ppt_第2页
9 参数估计2.ppt_第3页
9 参数估计2.ppt_第4页
9 参数估计2.ppt_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、参数估计,人口:被调查的事物或现象的项目单位:构成人口的每个要素的样本:从人口中提取的一些个体的样本大小:样本中包含的个体数量,统计推断的过程,统计,参数,案例:2004年7岁如果2004年该地区有10万7岁男孩,最直接的方法是进行人口普查:调查这10万名儿童,测量他们的身高,然后进行统计分析。但是工作量很大。通过随机抽样调查,我们可以知道7岁男孩的身高。例如,通过调查200名儿童并测量他们的身高,我们可以通过分析这200名儿童的身高推断出该地区10万名7岁男孩的身高。总体情况:2004年该地区10万名7岁男童的身高观察值:每个7岁男童样本:200名7岁男童的身高观察值通过随机抽样获得样本量:

2、200个抽样实验:通过样本信息了解整体情况。也就是说,通过分析200个7岁男孩的身高来估计100,000个7岁男孩的身高,也就是说,通过样本平均值来估计总体平均值。抽样误差:由于个体差异的存在,抽样过程中样本统计与总体参数的差异;或者同一人口的相同统计数据之间的差异。它属于随机误差:它没有趋势,是不可避免的。抽样实验,假设某一地点所有13岁女生的身高服从正态分布N(155.4,5.32),从全体人群中随机抽样,计算样本含量n5,10,30的均值和标准差;重复提取100次,得到100个样品;计算100个样本的均值和标准差,并制作100个样本的均值直方图。样本平均值是否等于每个样本的总平均值?样本

3、平均值相等吗?3样本均值分布的规则是什么?4与原始个体观测值相比,样本均值的变化范围是什么?5将“样本平均值的标准偏差”与n=5、10和30进行比较。已知总体标准误差:未知总体但已知样本标准误差:抽样实验摘要,均值的均值围绕总体均值上下波动。平均值的标准偏差与总体标准偏差相差一个常数倍数,即标准误差、标准误差、标准差:样本平均值的统计标准误差的标准偏差:样本平均值的标准偏差,测量样本平均值的抽样误差,即样本平均值的离差度。理论值:估计值:小于总体标准偏差影响抽样误差的主要因素是样本量。2003年,随机抽取85名20岁男性候选人,平均身高171.2厘米,标准差5.3厘米,计算当地20岁男性候选人

4、的标准误差。即本次调查的平均高度为171.2厘米,估计抽样误差为0.57厘米。标准偏差与标准误差,抽样率的标准误差在抽样调查中,抽样率与总体抽样率之间的差异称为抽样率误差。也就是说,采样率的标准偏差p被称为采样率的标准误差。人口比率的标准误差计算公式:人口比率、样本量、比率的标准误差、样本率的标准误差计算公式:样本率、样本量、样本率的标准误差、比率的标准误差的实际应用(1)表示抽样误差的大小(2)估计人口比率的置信区间(3)进行比率和样本均值分布的假设检验,1 2。同一个偏斜总体的样本均值分布,中心极限定理:当n足够大时,样本均值逐渐趋于正态分布。对于任意分布的人群,学生t分布的自由度n=n-

5、1,0,t分布:其形状与N(0,1)相似,但t分布中间较小,两边较大。0,随着n的增加,t分布接近n (0,1);当N,t分布演化为N(0,1)。p431,t分布曲线下面积,双侧t0.05/2,单侧t0.025,1.96,规则:1。同时,t值增大,p值减小;2.在相同p值下,t值增大,但t值减小;参数估计:用样本统计估计总体参数。参数估计:用样本指数(统计量)估计总体指数(参数)。总体均值的点估计总体率的点估计,即样本均值和样本率,分别是总体均值和总体率的估计。区间包含总体平均值的概率表示为1-a或100(1-a)%,常用的是99%、95%和90%。相应的分别为0.01、0.05和0.10 3

6、。(1)100%置信区间意味着区间包含总体平均值的概率是(1)100%。总体均值的估计,置信上限,点估计:点估计区间估计:区间估计,当s未知或n小时,即t分布方法为:在2002年的病例6-3中,有9名7岁男孩在某个地方发育正常,平均值为121.44厘米,标准差为5.75厘米,得到了人口平均值的95%置信区间。解决方案:2 .S是已知的,或者S是未知的,但是N足够大到33,360。病例6-4从某一地点随机抽取90名正常成年女性,计算红细胞数平均值为4.18(1012/升),标准差为0.29(1012/升)。尝试估计总体平均值的95%的置信区间。解决方案:影响区间宽度、数据离散度、用S或测量样本量

7、、置信水平(1-)、影响或大小、精度、准确度(1-A)、增加样本量的因素,当重复测试时:(1-)区间包含不包括在内的区间,95置信区间的含义:从总体中随机抽样。例如,对于100个样本,可以为每个样本计算一个置信区间,并且可以获得100个置信区间。平均而言,95个置信区间包括总体均值m(估计正确),只有5个置信区间不包括总体均值m(估计不正确)。实际上,只采集一个样本,并且只获得一个置信区间。作为未知总体平均值的可能范围的估计,理论上,95%可能是正确的,而5%可能是错误的。选择:让一个人群的身高值为XN(155.4,5.32),现在从人群中随机选择一个n=10的样本,计算出的平均值为158.3

8、6厘米,S=3.83cm厘米,m的95置信区间为(155.62,161.10),并且发现该区间不包括人群平均值m=155。如果从人群中随机选择200个n=10的样本,并且每次计算95个置信区间,有多少个A 5,b 20,c 10,d 1,e 3,n (m,S2/n),1。总体利率的置信区间。因为在采样率和总采样率之间存在采样误差,所以可以根据采样率和标准误差来估计总采样率的范围。根据样本量和样本率的不同,有两种方法来估计总体率的置信区间;正态近似和查表法。正态近似法,条件:样本量足够大(n50),样本率p和(1-p)不要太小,即np和n(1-p)5,样本率的分布近似服从正态分布。总体利率的95%置信区间为:(p1.96Sp),总体利率的99%置信区间为:(p2.58Sp)。例如,120名患有某种疾病的患者用某种药物治疗,90人治愈,治愈率为75.0%。试着估计一下95%和99%的总比率。查表法,条件:样本含量小(n50),样本率为(p1%),请参考附表6中的“百分比置信区间”。如何查表?几个重要概念(测量数据)的差异标准偏差和标准误差之间的差异,(1)100%参考范围和置信区间之

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论