统计学抽样误差与统计推断_第1页
统计学抽样误差与统计推断_第2页
统计学抽样误差与统计推断_第3页
统计学抽样误差与统计推断_第4页
统计学抽样误差与统计推断_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于统计学抽样误差与统计推断第1页,共30页,2022年,5月20日,19点45分,星期五统计推断的过程样本总体样本统计量如:样本均值、比例、方差总体均值、比例、方差等第2页,共30页,2022年,5月20日,19点45分,星期五教学要求掌握:总体均数的估计;假设检验基本思想、步骤和注意事项,各种t、u检验的方法与应用。熟悉:抽样误差及规律,t分布的特征和规律。了解:方差齐性检验第3页,共30页,2022年,5月20日,19点45分,星期五抽样误差(samplingerror)

19岁男大学生身高总体第4页,共30页,2022年,5月20日,19点45分,星期五抽样分布

抽样分布示意图第5页,共30页,2022年,5月20日,19点45分,星期五

中心极限定理当样本含量很大的情况下,无论原始测量变量服从什么分布,的抽样分布均近似正态。

抽样分布

抽样分布示意图第6页,共30页,2022年,5月20日,19点45分,星期五抽样分布与总体分布的关系总体正态分布非正态分布大样本小样本正态分布正态分布非正态分布第7页,共30页,2022年,5月20日,19点45分,星期五第8页,共30页,2022年,5月20日,19点45分,星期五第9页,共30页,2022年,5月20日,19点45分,星期五标准误(standarderror)

衡量样本均数的可靠性

估计总体均数的可信区间用于均数的假设检验第10页,共30页,2022年,5月20日,19点45分,星期五

例4.1在某地随机抽查成年男子140人,计算得红细胞均数4.77×1012/L,标准差0.38×1012/L,试计算均数的标准误。

第11页,共30页,2022年,5月20日,19点45分,星期五

分布

(t–distribution)1908年,英国统计学家W.S.Gosset以笔名“Student”首次提出t分布概念。第12页,共30页,2022年,5月20日,19点45分,星期五t分布的概念第13页,共30页,2022年,5月20日,19点45分,星期五t分布的概率密度函数(扩展)式中为伽玛函数

第14页,共30页,2022年,5月20日,19点45分,星期五

t分布的特征1、t分布同标准正态分布一样,是以0为中心的对称分布。2、同标准正态分布曲线不同,t分布曲线不是一条而是一簇曲线。3、t分布曲线的形态,随自由度ν的不同而不同。第15页,共30页,2022年,5月20日,19点45分,星期五-tt0第16页,共30页,2022年,5月20日,19点45分,星期五参数估计—总体均数的估计EstimationofParameter第17页,共30页,2022年,5月20日,19点45分,星期五参数估计的意义

参数估计的形式有两种:1、点(值)估计(pointestimation)2、区间估计(intervalestimation

)第18页,共30页,2022年,5月20日,19点45分,星期五

参数估计点估计:不考虑抽样误差,如区间估计:考虑抽样误差第19页,共30页,2022年,5月20日,19点45分,星期五区间估计(intervalestimation)(1-α)95%区间估计是按概率(1),确定一个包含总体参数的范围。称为参数的可信区间(confidenceinterval,CI)第20页,共30页,2022年,5月20日,19点45分,星期五区间估计的方法:总体标准差σ已知

总体标准差σ未知

总体标准差σ未知,但n足够大

第21页,共30页,2022年,5月20日,19点45分,星期五

例4.2某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32g/L,标准差为0.57g/L,试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。下限:上限:第22页,共30页,2022年,5月20日,19点45分,星期五

例4.3试计算例4.1中该地成年男子红细胞总体均数的95%可信区间。下限:上限:第23页,共30页,2022年,5月20日,19点45分,星期五总体方差的区间估计(扩展)总体方差可信区间为:221-2自由度为n-1的2第24页,共30页,2022年,5月20日,19点45分,星期五来自N(0,1)的100个样本所计算的95%可信区间示意

第25页,共30页,2022年,5月20日,19点45分,星期五可信区间估计的优劣95%第一个要素是准确性,又称可靠性,为可信度1-α的大小,显然1-α然愈接近1愈好。在实际工作中要根据研究目的和需要来定,常用的可信度为90%、95%和99%,但不以此为限。90%99%第二个要素是估计精确性,常用可信区间上下限的范围衡量,当然区间的宽度愈窄愈好。精确性与变量的变异度、样本量和1-α的取值等因素有关。个体的变异度越大范围越宽个体的变异度越小范围越窄准确性与精确性相互牵制:若要提高可信度,可取较小的α值,但此时必然使可信区间的宽度变长,导致精确性下降。从两方面评价:第26页,共30页,2022年,5月20日,19点45分,星期五归纳总结:(讨论)1、标准误与标准差的区别?2、总体均数可信区间与医学参考值范围的区别?第27页,共30页,2022年,5月20日,19点45分,星期五标准差与标准误的区别第28页,共30页,2022年,5月20日,19点45分,星期五总体均数可信区间与参考值范围的区别估计绝大多数(如95%)观察对象某项指标的分布范围估计总体均数的可信区间用途正态分布:偏态分布:σ未知:σ已知或σ未知但n较大:用或计算公式“正常人”的解剖、生理、生化指标的波动范围个体值的波动范

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论