版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三讲
正态分布抽样误差1第一、正态分布及其应用正态分布正态分布的概念正态曲线下面积的分布规律标准正态分布正态分布的应用
估计频数分布估计参考值范围质量控制理论分布的基础
2一、正态分布及其应用正态分布2正态分布的概念3正态分布的概念3正态分布的概念频数分布概念频数集中在均数周围,左右基本对称,离均数愈近数据愈多,离均数愈远数据愈少如果观察数不断增多,组距不断细分,直方图的边线将逐渐接近一条光滑曲线这条曲线数学上称为正态曲线—以均数为中心,两侧对称并逐渐下降,永远不与横轴相交的一条钟型曲线4正态分布的概念频数分布概念4正态分布的特性正态分布曲线的特点集中性对称性均匀变动性曲线的位置和形状与两个参数有关5正态分布的特性正态分布曲线的特点5正态分布的特性正态分布曲线的参数μ为位置参数:σ恒定时,μ增大,曲线沿横轴向右移动;μ减小,曲线沿横轴向左移动σ为形状参数:μ恒定时,σ越大,曲线越宽,表示数据越分散;σ越小,曲线越窄,表示数据越集中6正态分布的特性正态分布曲线的参数6正态曲线下的面积分布图7正态曲线下的面积分布图7当资料近似正正态分布时,可以作为μ的估计值,以S作为σ的估计值,估计正态曲线下面积的分布规律
8当资料近似正正态分布时,可以作为μ的估计值,以S作为标准正态分布标准正态分布:N(0,1)数据经标准化后,使μ=0,σ=1时的正态分布
转换方式任何一个正态分布,都可以通过变换,成为标准正态分布9标准正态分布标准正态分布:N(0,1)9正态分布的应用频数估计估计医学正常参考值范围质量控制统计方法的理论基础10正态分布的应用频数估计10频数估计正态分布标准正态分布11频数估计正态分布11估计医学正常参考值范围研究对象的选择估计范围确定(80%、90%、95%、99%)单双侧的确定方法的选择正态分布偏态分布12估计医学正常参考值范围研究对象的选择12正态分布的应用质量控制作为上下警戒值作为上下控制值统计方法的理论基础u检验、t分布、F分布、二项分布、χ2分布等13正态分布的应用质量控制13常用u值表正常值范围(%)单侧双侧800.8421.282901.2821.645951.6451.960982.0542.326992.3262.57614常用u值表正常值范围(%)单侧常用百分位数表正常值范围(%)单侧(低侧高侧)双侧80P20P80P10~P90
90P10P90P5~P9595P5P95P2.5~P97.598P2P98P1~P9999P1P99P0.5~P99.515常用百分位数表正常值范围(%)单侧(低侧高侧)双二、抽样误差及其应用抽样误差的概念抽样误差的应用参数估计假设检验16二、抽样误差及其应用抽样误差的概念16抽样误差的概念抽样误差由抽样研究引起的样本统计量与总体参数间的差异均数的抽样误差两种表现形式样本统计量与总体参数间的差异样本统计量间的差异抽样误差产生的原因抽样研究个体变异17抽样误差的概念抽样误差17标准误(standarderror,SE)样本统计量的标准差称为标准误,用来衡量抽样误差的大小。标准误与个体变异成正比,与样本含量n的平方根成反比。标准误理论值18标准误(standarderror,SE)样本统计量的标准标准误(standarderror,SE)实际工作中,往往是未知的,一般可用样本标准差s代替
标准误的估计值因为标准差s随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差19标准误(standarderror,SE)实际工作中,t分布的概念设某一变量Xi服从正态分布N(,),则服从标准正态分布即20t分布的概念设某一变量Xi服从正态分布N(,),则t分布的概念从正态分布N(,)的总体中随机抽样并计算多个样本均数,它们服从总体均数为,总体标准差为的正态分布,则也服从标准正态分布。
21t分布的概念从正态分布N(,)的总体中随机抽样并计算多个t分布的概念实际工作中,由于未知,则用代替,则服从t分布t分布(t-distribution)主要用于参数估计及t检验。英国统计学家W.S.Gosset于1908年在《生物统计》杂志上发表该论文时用的是笔名“Student”,故t分布又称Studentt分布。22t分布的概念实际工作中,由于未知,则用t分布的特征t分布为一簇单峰分布曲线t分布以0为中心,左右对称t分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布
23t分布的特征t分布为一簇单峰分布曲线23不同自由度下的t分布
24不同自由度下的t分布24参数估计(parameterestimation)由样本信息估计总体参数点估计(pointestimation)区间估计(intervalestimation)25参数估计(parameterestimation)由样本点估计直接用样本统计量作为总体参数的估计值
方法简单,但未考虑抽样误差的大小在实际问题中,总体参数往往是未知的,但它们是固定的值,并不是随机变量值。而样本统计量随样本的不同而不同,属随机的
26点估计直接用样本统计量作为总体参数的估计值26区间估计按一定的概率或可信度(1-)用一个区间估计总体参数所在范围,这个范围称作可信度为1-的可信区间(confidenceinterval,CI),又称置信区间。这种估计方法称为区间估计。27区间估计按一定的概率或可信度(1-)用一个区间估计总体参均数的可信区间总体均数的(1-)可信区间定义为当样本含量较大时,例如n>100,t分布近似标准正态分布,此时可用标准正态分布代替t分布,作为可信区间的近似计算。相应的100(1-)%可信区间为
28均数的可信区间总体均数的(1-)可信区间定义为28可信区间的确切涵义可信度为95%
的可信区间的确切涵义是:每100个样本所算得的100个可信区间,平均有95个包含了总体参数。29可信区间的确切涵义可信度为95%的可信区间的确切涵义是:可信区间的两个要素可靠性反映为可信度1-
的大小精确性用区间长度CU-CL衡量30可信区间的两个要素可靠性30可信区间与参考值范围的区别可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限。95%的可信区间中的95%是可信度,即所求可信区间包含总体参数的可信程度为95%95%的参考值范围中的95%是一个比例,即所求参考值范围包含了95%的正常人。31可信区间与参考值范围的区别可信区间用于估计总体参数,总体参标准差意义:描述原始数据的离散程度。衡量均数对原始数据的代表性与n的关系应用:频数分布估计(医学参考值范围估计)计算变异系数、标准误联系标准误意义:反映抽样误差大小,衡量样本均数估计总体均数的可靠性与n的关系应用:总体均数估计)假设检验标准差与标准误的区别与联系32标准差标准误标准差与标准误的区别与联系32
第三讲
正态分布抽样误差33第一、正态分布及其应用正态分布正态分布的概念正态曲线下面积的分布规律标准正态分布正态分布的应用
估计频数分布估计参考值范围质量控制理论分布的基础
34一、正态分布及其应用正态分布2正态分布的概念35正态分布的概念3正态分布的概念频数分布概念频数集中在均数周围,左右基本对称,离均数愈近数据愈多,离均数愈远数据愈少如果观察数不断增多,组距不断细分,直方图的边线将逐渐接近一条光滑曲线这条曲线数学上称为正态曲线—以均数为中心,两侧对称并逐渐下降,永远不与横轴相交的一条钟型曲线36正态分布的概念频数分布概念4正态分布的特性正态分布曲线的特点集中性对称性均匀变动性曲线的位置和形状与两个参数有关37正态分布的特性正态分布曲线的特点5正态分布的特性正态分布曲线的参数μ为位置参数:σ恒定时,μ增大,曲线沿横轴向右移动;μ减小,曲线沿横轴向左移动σ为形状参数:μ恒定时,σ越大,曲线越宽,表示数据越分散;σ越小,曲线越窄,表示数据越集中38正态分布的特性正态分布曲线的参数6正态曲线下的面积分布图39正态曲线下的面积分布图7当资料近似正正态分布时,可以作为μ的估计值,以S作为σ的估计值,估计正态曲线下面积的分布规律
40当资料近似正正态分布时,可以作为μ的估计值,以S作为标准正态分布标准正态分布:N(0,1)数据经标准化后,使μ=0,σ=1时的正态分布
转换方式任何一个正态分布,都可以通过变换,成为标准正态分布41标准正态分布标准正态分布:N(0,1)9正态分布的应用频数估计估计医学正常参考值范围质量控制统计方法的理论基础42正态分布的应用频数估计10频数估计正态分布标准正态分布43频数估计正态分布11估计医学正常参考值范围研究对象的选择估计范围确定(80%、90%、95%、99%)单双侧的确定方法的选择正态分布偏态分布44估计医学正常参考值范围研究对象的选择12正态分布的应用质量控制作为上下警戒值作为上下控制值统计方法的理论基础u检验、t分布、F分布、二项分布、χ2分布等45正态分布的应用质量控制13常用u值表正常值范围(%)单侧双侧800.8421.282901.2821.645951.6451.960982.0542.326992.3262.57646常用u值表正常值范围(%)单侧常用百分位数表正常值范围(%)单侧(低侧高侧)双侧80P20P80P10~P90
90P10P90P5~P9595P5P95P2.5~P97.598P2P98P1~P9999P1P99P0.5~P99.547常用百分位数表正常值范围(%)单侧(低侧高侧)双二、抽样误差及其应用抽样误差的概念抽样误差的应用参数估计假设检验48二、抽样误差及其应用抽样误差的概念16抽样误差的概念抽样误差由抽样研究引起的样本统计量与总体参数间的差异均数的抽样误差两种表现形式样本统计量与总体参数间的差异样本统计量间的差异抽样误差产生的原因抽样研究个体变异49抽样误差的概念抽样误差17标准误(standarderror,SE)样本统计量的标准差称为标准误,用来衡量抽样误差的大小。标准误与个体变异成正比,与样本含量n的平方根成反比。标准误理论值50标准误(standarderror,SE)样本统计量的标准标准误(standarderror,SE)实际工作中,往往是未知的,一般可用样本标准差s代替
标准误的估计值因为标准差s随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差51标准误(standarderror,SE)实际工作中,t分布的概念设某一变量Xi服从正态分布N(,),则服从标准正态分布即52t分布的概念设某一变量Xi服从正态分布N(,),则t分布的概念从正态分布N(,)的总体中随机抽样并计算多个样本均数,它们服从总体均数为,总体标准差为的正态分布,则也服从标准正态分布。
53t分布的概念从正态分布N(,)的总体中随机抽样并计算多个t分布的概念实际工作中,由于未知,则用代替,则服从t分布t分布(t-distribution)主要用于参数估计及t检验。英国统计学家W.S.Gosset于1908年在《生物统计》杂志上发表该论文时用的是笔名“Student”,故t分布又称Studentt分布。54t分布的概念实际工作中,由于未知,则用t分布的特征t分布为一簇单峰分布曲线t分布以0为中心,左右对称t分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布
55t分布的特征t分布为一簇单峰分布曲线23不同自由度下的t分布
56不同自由度下的t分布24参数估计(parameterestimation)由样本信息估计总体参数点估计(pointestimation)区间估计(intervalestimation)57参数估计(parameterestimation)由样本点估计直接用样本统计量作为总体参数的估计值
方法简单,但未考虑抽样误差的大小在实际问题中,总体参数往往是未知的,但它们是固定的值,并不是随机变量值。而样本统计量随样本的不同而不同,属随机的
58点估计直接用样本统计量作为总体参数的估计值26区间估计按一定的概率或可信度(1-)用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公共基础知识考试真题模拟题及答案
- 体育管理学试题库及答案
- 正压送风机操作和维护保养规程
- 少儿拓展22智能收费站
- 消防水流指示器操作和维护保养规程
- 公路工程质量检验计划
- 2026年浙江省绍兴市网格员招聘考试参考题库及答案解析
- 2026年辽宁省本溪市网格员招聘考试参考题库及答案解析
- 2026年广西壮族自治区柳州市网格员招聘考试备考题库及答案解析
- 2026年黑龙江省齐齐哈尔市网格员招聘考试参考题库及答案解析
- 茶叶食品追溯管理制度
- 小学50米跑教育
- 《计算机基础与应用(Office和WPS Office通-用)》中职全套教学课件
- 装修木工劳务分包协议书
- 小学英语单词大全打印
- 货车检车员:中国铁路兰州局集团有限公司编
- 工业区位因素与工业布局导学案 高中地理湘教版(2019)必修二+
- 第一单元项目一探秘鸟类研究-认识数据、信息与知识课件沪科版(2019)高中信息技术必修1
- 日本跌宕50年一个制造业强国的沉浮史
- 电生磁 电磁铁的应用浙教版 八年级科学下册【思维导图+知识提要+典例提升】
- IE改善四大原则及ECRS技法课件
评论
0/150
提交评论