参数估计基础课件_第1页
参数估计基础课件_第2页
参数估计基础课件_第3页
参数估计基础课件_第4页
参数估计基础课件_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章参数估计的基础statisticalinference总体同质、个体变异总体参数未知样本代表性、抽样误差随机抽样样本统计量已知统计推断风险图4、1从正态分布N(5.00,0.502)总体中抽样实验结果

抽样分布与抽样误差样本均数的抽样分布具有以下特点:1.各样本均数未必等于总体均数;2.样本均数之间存在差异;3.样本均数的分布很有规律,围绕着总体均数(155.4cm),中间多、两边少,左右基本对称,也服从正态分布。4.样本均数的变异较之原变量的变异大大缩小标准误(standarderror)概念:反映均数抽样误差大小的指标,是样本均数的标准差。计算:

用途:1.衡量样本均数的可靠性.均数标准误愈小,均数的抽样误差愈小,样本均数愈可靠,反之亦然.2.估计总体均数的可信区间.3.用于均数的假设检验.数值变量数据标准误的计算例6-1某研究者随机调查某地健康成年男子27人,得到血红蛋白量的均数为125g/L,标准差为15g/L。试估计该样本均数的抽样误差。

分类资料的抽样误差率的标准误:总体率的区间估计:①查表法n≤50②正态近似法np>5n(1-p)>5p±uasp

标准差与标准误区别

标准差

标准误概念不同 个体变异 抽样误差计算不同

性质不同n越大越稳定n越大越趋于0用途不同 估计参考值范围估计正态参数计算标准误 假设检验

t分布的概念从正态分布N(,2)抽得样本的均数也服从正态分布,记为N(,)。对正态变量作变换

实际工作中,当未知时,常用来代替对正态变量采用的不是z变换,而是t变换

t分布图自由度分别为1、5、∞时的t分布t分布图形

f(t)

=∞(标准正态曲线)

=5

=10.10.2-4-3-2-1012340.3t分布的特征(1)t分布是一簇单峰分布曲线,以0为中心,左右对称;(2)ν越小,则标准误越大,t值越分散,t尾部越外翘而峰部低矮;(3)当ν逼近∞时,因逼近,t分布逼近Z分布,故标准正态分布是t分布的特例(4)t分布曲线下面积是有规律的t界值表每一自由度下的t分布曲线都有其自身分布规律,这个规律可见于t界值表。表上的阴影部分,表示t,以外的尾部面积占总面积的百分数,即概率P。表中数据表示与确定时相应的t界值常记为t,。t界值表单侧:P(t<=-tα,ν)=α或P(t>=tα,ν)=α双侧:P(t<=-tα,ν)+P(t>=tα,ν)=α即:P(-tα,ν<t<tα,ν)=1-α[例]查t界值表得t值表达式

t0.05/2,16=2.120(双侧)t0.05,16=1.746(单侧)-tt0总体均数的估计区间估计:结合样本统计量和标准误可以确定一个具有较大的可信度(如95%或99%)的包含总体参数的区间,该区间称为总体参数的1

可信区间或置信区间(confidenceinterval,CI)。置信度:

值一般取0.05或0.01,故1

为0.95或0.99。通常用样本均数和均数的标准误估计总体均数的95%(或99%)置信区间,或用样本频率和率的及其标准误估计总体概率的95%(或99%)置信区间。如果没有特别说明,一般作双侧的区间估计如果资料服从t分布,若“砍去”t分布双侧尾部面积

=0.05=5%,故有95%的t值满足不等式:

t0.05/2,

<

<

t0.05/2,

t0.05/2,

<

<+t0.05/2,

:总体均数的估计95%CL:1252.056=(119.06,130.94)g/L99%CL:1252.779=(116.98,133.02)g/L该市健康成年男子血红蛋白平均含量:95%置信区间为(119.06,130.94)g/L,99%置信区间为(116.98,133.02)g/L。大样本总体均数的估计例6-3某市2000年随机测量了90名19岁健康男大学生的身高,其均数为172.2cm,标准差为4.5cm,试估计该市2000年19岁健康男大学生平均身高的95%置信区间。1.96=172.21.96=(171.3,173.1)

该市2000年19岁健康男大学生平均身高的95%置信区间为(171.3,173.1)cm。总体概率的估计例6-4某医院对39名前列腺癌患者实施开放手术治疗,术后有合并症者2人,试估计该手术合并症发生概率的95%置信区间

查概率的置信区间表(附表3),在n=39的横行,X=2的纵列交叉处的数值为1~17即该手术合并症发生概率的95%置信区间为1%~17%总体概率的估计注意:附表3中仅列出X

n/2部分;当X>n/2时,应以nX值查表,然后从100中减去查得的数值即为所求的置信区间。例6-5某医生用某药物治疗31例脑血管梗塞患者,其中25例患者治疗有效,试求该药物治疗脑血管梗塞有效概率的95%置信区间。n=31,X=25>n/2,所以用nX=6查附表3,得8~38,再用100减去所查的数值该药物治疗脑血管梗塞有效概率的95%置信区间为62%~92%。总体概率的估计正态近似法

当n足够大,且样本频率p和(1p)均不太小时,如np与n(1p)均大于5时,p的抽样分布接近正态分布,此时可按下列公式求总体概率的置信区间p

z/2Sp

公式中Sp为频率p的标准误。欲求95%置信区间,用z0.05/2=1.96,欲求99%置信区间,用z0.01/2=2.58。总体概率的估计p

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论