医学统计课件人卫6版 第六章.参数估计与假设检验.ppt_第1页
医学统计课件人卫6版 第六章.参数估计与假设检验.ppt_第2页
医学统计课件人卫6版 第六章.参数估计与假设检验.ppt_第3页
医学统计课件人卫6版 第六章.参数估计与假设检验.ppt_第4页
医学统计课件人卫6版 第六章.参数估计与假设检验.ppt_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/6/11,西安医学院公共卫生系,第六章 参数估计与假设检验,2019/6/11,西安医学院公共卫生系,参数估计,在实际工作中,由于总体中各观察对象之间存在着个体变异,且随机抽取的样本又只是总体中的一部分,因此计算的样本统计量,不一定恰好等于相应的总体参数。 这种由于个体变异的存在,在抽样研究中产生的样本统计量与相应的总体参数间的差异,称为抽样误差(sampling error),2019/6/11,西安医学院公共卫生系,中心极限定理 : 设从均值为、方差为2的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布。,2019/6/11,西安医学院公共卫生系,理论上可以证明: (1)从正态总体N( ,2 )中,随机抽取例数为n的样本,样本均数也服从正态分布;即使从偏态总体抽样,当n足够大时,样本均数也近似正态分布。 (2)从均数为,标准差为的正态或偏态总体,抽取例数为n的样本,样本均数的总体均数也为,标准差为 。,2019/6/11,西安医学院公共卫生系,均数的抽样误差指由抽样造成的样本均数 与总体均数之间的差异。 称标准误,它说明均数抽样误差的大小。 n越大,标准误越小,样本均数的抽样误差亦越小 实际工作中,常未知,而是用样本标准差s来估计,则有 常用来说明均数的抽样误差的大小。,2019/6/11,西安医学院公共卫生系,率的抽样误差:样本率与样本率之间;样本率与总体率之间均存在差异,即抽样误差。 根据二项分布的原理,样本频率的总体概率为,率的标准误为 p= 实际工作中,总体率往往未知,常用样本率来近似代替总体率,则有 Sp = 反映率的抽样误差的大小。,2019/6/11,西安医学院公共卫生系,可信区间的概念,参数估计即用样本指标(称为统计量) 来估计总体指标(称为参数) 参数估计有两种方法: 1.点估计:未考虑抽样误差 2.区间估计:可信区间又称置信区间 (confidence interval,CI) 指按一定的概率估计总体参数的可能范围。 概率1-称为可信度,常取95%或99%,2019/6/11,西安医学院公共卫生系,总体均数的95%可信区间表示: 该区间包含总体均数的概率为95% 总体均数可信区间的计算* : 已知或未知但n较大时按正态分布原理计算, 未知但n较小时按t分布的原理计算。,2019/6/11,西安医学院公共卫生系,1.已知时,由Z分布可知,正态曲线下有95%的Z值在1.96之间,即: P(-1.96Z+1.96)=0.95 P(-1.96 +1.96)=0.95 移项后整理得,总体均数的95%可信区间为,2019/6/11,西安医学院公共卫生系,2.未知,但n足够大(如n100)时,可知t分布 逼近Z分布,此时t曲线下有95%的t值在1.96之间 即:P(-1.96t+1.96)=0.95 P(-1.96 +1.96)=0.95 P( )=0.95 故总体均数的95%可信区间为,2019/6/11,西安医学院公共卫生系,前面讲过,对正态变量x采用 变换,则将正态分布N(,2)变换为标准正态分布N(0,1)。 已知样本均数也服从正态分布,那么对样本均数采用Z变换,即可将其变换为标准正态分布,即Z分布。,t分布,2019/6/11,西安医学院公共卫生系,但实际工作中 需用 来估计,这样,对正态变量采用的就不是Z变换而是t变换了,即t =( -)/ 其结果即为t分布。 见t分布曲线图,2019/6/11,西安医学院公共卫生系,图5.1 自由度为1、5、的t分布,2019/6/11,西安医学院公共卫生系,t分布的特征:(与标准正态分布相比?) 以0为中心,左右对称的单峰分布; t分布是一簇曲线,形态变化与n(即自由度)大小有关。自由度越小,t分布曲线越低平;自由度越大,t分布曲线越接近标准正态分布曲线。 t分布峰部较矮,尾部翘得较高,说明远侧的t值的个数相对较多,即尾部面积(概率P)较大。自由度越小这种情况越明显,渐大时,t分布渐逼近标准正态分布;当=时,t分布就成为标准正态分布了。 附表2,t界值表,2019/6/11,西安医学院公共卫生系,3.未知且n小时,某自由度的t曲线下有95%的t值在 之间,即:,故总体均数的95%可信区间为,2019/6/11,西安医学院公共卫生系,例5.1 对某人群随机抽取20人,用某批号的结核菌素作皮试,平均浸润直径为10.9cm,标准差为3.86cm。问这批结核菌素在该人群中使用时,皮试的平均浸润直径的95%可信区间是多少?,2019/6/11,西安医学院公共卫生系,总体均数的单侧(1-)置信区间为:,总体均数的95%可信区间的含义: 该区间包含总体均数的概率为95%,2019/6/11,西安医学院公共卫生系,总体率可信区间的计算 1.查表法:n50,特别是p接近0或100%时,可查附表6百分率的置信区间表。 2.正态近似法*:当n较大且np和n(1-p)均大于5时,二项分布接近正态分布,则总体率的双侧(1-)可信区间为: P /2Sp,2019/6/11,西安医学院公共卫生系,抽样误差及其大小 t分布的特征 总体均数可信区间的计算 总体率可信区间的计算 可信区间的涵义,小结,2019/6/11,西安医学院公共卫生系,假设检验,亦称显著性检验: 是统计推断的另一个重要内容。 其目的是比较总体参数之间有无差别。,2019/6/11,西安医学院公共卫生系,2019/6/11,例:医生在某山区随机测量了30名健康成 年男子的脉搏,平均次数为74.2次分钟, 标准差为6.5次分,但是根据医学常识, 一般男子的平均脉搏次数为72次分,问 该山区男子脉搏数与一般男子是否不同?,造成两者数值不同的原因可能有两个: 1)抽样误差所致; 2)由于环境条件的影响,两均数之间有本质差异。,2019/6/11,西安医学院公共卫生系,2019/6/11,西安医学院公共卫生系,先假定该山区所有男子脉搏数数值组成一个总体, 其总体均数和标准差均为未知数,分别以 、 表示。 若假设该山区男子的脉搏数与一般地区的男子相 同,即属于同一总体, 72,所测量的30名男子的 平均脉搏数(样本均数)之所以不恰好等于72次分, 是由于抽样误差所致。,2019/6/11,西安医学院公共卫生系,2019/6/11,西安医学院公共卫生系,如果上述假设成立,则理论上讲, 样本均数应在总体均数( 72)的附近, 远离总体均数的可能性很小。 如果将样本均数变换为t值,则t值应在 0附近,远离0的可能性很小。 如果t值远离0,可认为上述假设不成立,拒绝 上述假设。则认为两均数之间存在本质差异。,2019/6/11,西安医学院公共卫生系,2019/6/11,西安医学院公共卫生系,假设检验的一般步骤,建立假设和确定检验水准 选定检验方法和计算检验统计量 确定P值和做出统计推断结论,返回,2019/6/11,西安医学院公共卫生系,2019/6/11,西安医学院公共卫生系,假设: H0(检验假设或无效假设)1=2 H1(备择假设)12或12 (H0是根据推断目的,从反证法的思想提出的 H1是与H0相联系的对立的假设),建立假设,2019/6/11,西安医学院公共卫生系,2019/6/11,西安医学院公共卫生系,检验水准又称显著性水准, 用表示 是预先规定的概率值,一般取0.05,但也并非一成不变,要根据不同的研究目的而定。 一般,可提高可靠性;,有利于发现研究总体可能存在的差异,但可靠性降低。,确定检验水准,假设检验包括单侧检验和双侧检验两种情况 当根据专业知识已知两总体的参数中甲肯定不会小于乙,或甲肯定不会大于乙时,可考虑用单侧检验,否则,宜用双侧检验。,返回,2019/6/11,西安医学院公共卫生系,2019/6/11,西安医学院公共卫生系,由计算的统计量(t值或

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论