个样本率的抽样分布特点_第1页
个样本率的抽样分布特点_第2页
个样本率的抽样分布特点_第3页
个样本率的抽样分布特点_第4页
个样本率的抽样分布特点_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容第一节抽样分布与抽样误差第二节总体均数的估计第三节总体率的估计第四节RR值和OR值的估计第五节案例第一节抽样分布与抽样误差

samplingdistributionandsamplingerror一、样本均数(SampleMeans)二、样本率(SampleProportion)一、均数的抽样误差与标准误100份样本的均数和标准差样本含量n=10

将这100份样本的均数看成新变量值,按第四章的频数分布方法,得到这100个样本均数的直方图见图6-1。图6-1随机抽样所得100个样本均数的分布100个样本均数的抽样分布特点:①

②100个样本均数中,各样本均数间存在差异,但各样本均数在总体均数周围波动。③样本均数的分布曲线为中间高,两边低,左右对称,近似服从正态分布。

④样本均数的标准差明显变小:即样本均数的标准差,可用于衡量抽样误差的大小。因通常σ未知,计算标准误采用下式:标准误(standarderror,SE)

通过增加样本含量n来降低抽样误差。表6-1计算了100个样本的标准差S,由此可计算每一样本的抽样误差大小。3个抽样实验结果图示抽样实验小结

样本均数的均数围绕总体均数上下波动。样本均数的标准差即标准误与总体标准差相差一个常数的倍数,即

样本均数的标准误(StandardError)=样本标准差/

从正态总体N(m,s2)中抽取样本,获得均数的分布仍近似呈正态分布N(m,s2/n)

二、率的抽样误差与标准误样本含量n=10

将这10000份样本率看成新变量值,按第四章的频数分布方法,得到这10000个样本率的直方图见图。10000个样本率的抽样分布特点:①

②10000个样本率中,各样本率间存在差异,但各样本均数在总体率周围波动。③样本含量足够大时(?),样本率的分布曲线为中间高,两边低,左右对称,近似服从正态分布。

④样本率的标准误中心极限定理centrallimittheorem①从正态总体中抽取样本,无论样本含量n有多大,所得均数分布仍近似呈正态分布。②即使从非正态总体中抽取样本,只要样本含量足够大,所得均数的分布仍近似呈正态分布。③随着样本量的增大,样本均数的变异范围也逐渐变窄,。

总体均数的点估计(pointestimation)与区间估计(intervalestimation)参数的估计点估计:由样本统计量直接估计总体参数区间估计:在一定置信度(Confidencelevel)下的估计范围,同时考虑抽样误差第二节

总体均数的估计

按预先给定的概率(1

),确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间(confidenceinterval,CI)(1

)称为可信度或置信度(confidencelevel),常取95%,也取90%或99%。置信区间通常两个数值即置信限(confidencelimit,CL)构成,较小的称为置信下限(lowerlimit,L),较大的称为置信上限(upperlimit,U),置信区间的有关概念一、总体均数置信区间的计算s未知,且n较小,按t分布s已知,或s未知但n足够大,按z分布单一总体均数的置信区间两总体均数之差的置信区间二、单一总体均数的置信区间1.s未知且n较小的总体均数的100(1-a)%可信区间为:

),()(2/)(2/XXStXStXnana+-

或XStX)(2/na±

例6-3p91Z0.05/2=1.96Z0.05=1.645z0.05/2=1.96z0.05=1.645

四、置信区间的涵义

五、可信区间估计的优劣

一是可信度1

(准确度),愈接近1愈好,如99%的可信度比95%的可信度要好;二是区间的宽度(精密度),区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。

在可信度确定的情况下,增加样本含量可减小区间宽度。六、总体均数可信区间与参考值范围的区别附录方差的抽样误差与可信区间卡方界值见P431附表3第三节总体率的估计

一、点估计(p-

p)二、区间估计率的抽样误差与标准误

样本率(p)和总体率(π)的差异称为率的抽样误差(samplingerrorofrate),用率的标准误(standarderrorofrate)度量。如果总体率π未知,用样本率p估计1.查表法n

50,且p接近0或1的资料时采用。例某新药的毒理研究中,用20只小白鼠作急性毒性实验,死亡3只,估计该药急性致死率的95%可信区间。从附表7(根据二项分布原理制成)查得,在n=20与X=3纵列交叉处的数值为3~38,即该药急性致死率的95%可信区间为3%~38%。例6-7某疗法治疗某病10人,7人有效,估计该疗法有效率的95%可信区间。从附表7(根据二项分布原理制成)查得,在n=10与X=3纵列交叉处的数值为7~65,即该疗法有效率的9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论