版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
正态分布及抽样误差第1页,共59页,2023年,2月20日,星期五正态分布(Normaldistribution)法国概率论学者狄莫弗德国数学家Gauss最早用于物理学、天文学Gaussiandistribution2第2页,共59页,2023年,2月20日,星期五为什么如此摆放奖品?
高尔顿钉板试验
正态分布的背景-一个街头赌博游戏3第3页,共59页,2023年,2月20日,星期五Ox-8-7
-6
-5
-4
-3
-2
-1
12345678正态分布的背景-高尔顿钉板试验4第4页,共59页,2023年,2月20日,星期五12413214014815616400.100.200.300.40频率图某市120名12岁男童身高(cm)的频率分布5第5页,共59页,2023年,2月20日,星期五正态分布图示x0.1.2.3.4f(x)第6页,共59页,2023年,2月20日,星期五正态分布的概率密度函数
如果随机变量X的概率密度函数
则称X服从正态分布,记作X~N(,2),其中,为分布的均数,为分布的标准差。
(-∞<X
<+∞)
第7页,共59页,2023年,2月20日,星期五方差相等、均数不等的正态分布图示312第8页,共59页,2023年,2月20日,星期五均数相等、方差不等的正态分布图示213第9页,共59页,2023年,2月20日,星期五正态分布的特征正态分布有两个参数(parameter),即位置参数(均数)和形态参数(标准差)。高峰在均数处;均数两侧完全对称。正态曲线下的面积分布有一定的规律。第10页,共59页,2023年,2月20日,星期五正态曲线下的面积规律X轴与正态曲线所夹面积恒等于1。对称区域面积相等。S(-,-X)S(X,)=S(-,-X)第11页,共59页,2023年,2月20日,星期五正态曲线下的面积规律对称区域面积相等。S(-x1,-x2)-x1
-x2
x2
x1S(x1,x2)=S(-x2,-x1)第12页,共59页,2023年,2月20日,星期五正态曲线下的面积规律
-4-3-2-101234-3-2-++2+3
S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,)=0.5S(-,+3)=0.9987S(-,+2)=0.9772S(-,+1)=0.8413S(-,)=1第13页,共59页,2023年,2月20日,星期五正态曲线下的面积规律
-4-3-2-101234-3-2-++2+3
1-S(-3
,+3)=0.00261-S(-2
,+2)=0.04561-S(-
,+)=0.3174第14页,共59页,2023年,2月20日,星期五正态曲线下的面积规律-3-2-++2+3
S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,-0)=0.5S(-3,-2)=0.0215S(-2,-1)=0.1359S(-1,)=0.3413
-4-3-2-101234第15页,共59页,2023年,2月20日,星期五正态曲线下的面积规律-1.96+1.962.5%2.5%95%第16页,共59页,2023年,2月20日,星期五正态曲线下的面积规律-1.64+1.645%5%90%第17页,共59页,2023年,2月20日,星期五正态曲线下的面积规律-2.58+2.580.5%0.5%99%第18页,共59页,2023年,2月20日,星期五S(-1.96,+1.64)=?思考92.5%第19页,共59页,2023年,2月20日,星期五正态曲线下的面积规律正态曲线下面积总和为1;正态曲线关于均数对称;对称的区域内面积相等;对任意正态曲线,按标准差为单位,对应的面积相等;-1.64~+1.64内面积为90%;-1.96~+1.96内面积为95%;-2.58~+2.58内面积为99%。小于-3的面积为0.13%;小于-2的面积为2.28%;小于-的面积为15.87%。第20页,共59页,2023年,2月20日,星期五标准正态分布标准正态分布(standardnormaldistribution)是均数为0,标准差为1的正态分布。记为N(0,1)。标准正态分布是一条曲线。概率密度函数:
(-∞<u
<+∞)
第21页,共59页,2023年,2月20日,星期五正态分布转换为标准正态分布若
X~N(,2),作变换:
则u服从标准正态分布。u称为标准正态离差(standardnormaldeviate)第22页,共59页,2023年,2月20日,星期五标准正态分布曲线下面积(u)
u 0.00 0.02 0.04 0.06 0.08-3.0 0.0013 0.0013 0.0012 0.0011 0.0010-2.5 0.0062 0.0059 0.0055 0.0052 0.0049-2.0 0.0228 0.0217 0.0207 0.0197 0.0188-1.9 0.0287 0.0274 0.0262 0.0250 0.0239-1.6 0.0548 0.0526 0.0505 0.0485 0.0465-1.0 0.1587 0.1539 0.1492 0.1446 0.1401-0.5 0.3085 0.3015 0.2946 0.2877 0.28100 0.5000 0.4920 0.4840 0.4761 0.46810u第23页,共59页,2023年,2月20日,星期五正态分布的应用估计频数分布质量控制确定临床参考值范围第24页,共59页,2023年,2月20日,星期五估计频数分布某项目研究婴儿的出生体重服从正态分布,其均数为3150g,标准差为350g。若以2500g作为低体重儿,试估计低体重儿的比例。首先计算标准离差:查标准正态分布表:(-1.86)=0.0314结果:估计低体重儿的比例为3.14%.第25页,共59页,2023年,2月20日,星期五质量控制质量控制的意义监控日常工作、科研过程、生产过程中误差的变化,分析变化的趋势是否出现异常,从而引起警觉和注意,以便分析原因,并及时采取措施。第26页,共59页,2023年,2月20日,星期五质量控制图(qualitycontrolchart) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15测量M+3SDM+2SDMM-2SDM-3SD27第27页,共59页,2023年,2月20日,星期五参考值范围(referenceinterval)参考值范围又称正常值范围(normalrange)。什么是参考值范围:是绝大多数正常人的某观察指标所在的范围。绝大多数:90%,95%,99%等等。确定参考值范围的意义:用于判断正常与异常。“正常人”的定义:排除了影响所研究的指标的疾病和有关因素的同质的人群。第28页,共59页,2023年,2月20日,星期五参考值范围确定的原则选定同质的正常人作为研究对象控制检测误差判断是否分组(性别,年龄组)选择百分界值(90%,95%)确定可疑范围单、双侧问题第29页,共59页,2023年,2月20日,星期五单侧与双侧参考值范围根据医学专业知识确定!双侧:白细胞计数,血清总胆固醇,单侧:上限:转氨酶,尿铅,发汞……
下限:肺活量,IQ,第30页,共59页,2023年,2月20日,星期五参考值范围的估计方法方法 双侧 单侧下限 单侧上限正态分布法第31页,共59页,2023年,2月20日,星期五例20~
29岁正常成年男子尿酸浓度求双侧95%的参考值范围:下限上限第32页,共59页,2023年,2月20日,星期五总结正态分布是描述个体变异的重要分布之一,也是统计学理论中的重要分布之一;正态分布是一簇分布,由两个参数决定:均数和标准差;正态分布曲线下的面积是有规律的,且与标准正态分布曲线下的面积对应(以标准正态离差为单位)。第33页,共59页,2023年,2月20日,星期五需要掌握的内容正态分布的性质正态曲线下面积的分布规律参考值范围确定的原则和方法第34页,共59页,2023年,2月20日,星期五抽样误差及其规律性Samplingvariability
anditsattributes第35页,共59页,2023年,2月20日,星期五了解抽样误差规律的重要性总体同质个体、个体变异总体参数未知样本代表性、抽样误差随机抽样样本统计量已知统计推断风险第36页,共59页,2023年,2月20日,星期五抽样误差(samplingerror)由抽样引起的样本统计量与总体参数间的差别。原因:个体变异+抽样表现:样本统计量与总体参数间的差别不同样本统计量间的差别抽样误差是有规律的!第37页,共59页,2023年,2月20日,星期五模拟试验假设一个已知总体,从该总体中多次抽样,对每个样本计算样本统计量(均数、方差等),观察样本统计量的分布规律--抽样分布规律。考察:不同的分布不同的样本含量
对统计量的影响。第38页,共59页,2023年,2月20日,星期五均数的模拟试验从不同总体中进行抽样,观察均数的抽样分布规律。偏三角分布总体均匀分布总体指数分布总体U型分布总体考察:样本均数的均数与总体均数有何关系?样本均数的标准差与总体标准差有何关系?样本均数的分布形状如何?不同的样本含量对上述性质的影响如何?第39页,共59页,2023年,2月20日,星期五从已知总体中抽样μ
=0σ
=1样本含量n=10抽样次数m=10000
=0.0681S=0.7245
=-0.1703S=0.9248
=0.3747
S=1.2473第40页,共59页,2023年,2月20日,星期五
SamplingDistributionofsamplemeansSamplingDistributionofsamplemeans
SamplingDistributionofsamplemeansPopulationBX
XPopulationC
XPopulationDXPopulationAn=10n=4n=25n=2SamplingDistributionofsamplemeansSamplingdistributionformeans
第41页,共59页,2023年,2月20日,星期五均数的抽样误差之特点各样本均数未必等于总体均数;样本均数间存在差异;样本均数的分布很有规律,围绕总体均数,中间多两边少,左右基本对称;样本均数的变异范围较之原变量的变异范围大大缩小;随着样本含量的增加,样本均数的变异范围逐渐缩小。第42页,共59页,2023年,2月20日,星期五中心极限定理(centrallimittheorem)Case1:
从正态分布总体N(μ,σ)
中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,则样本均数也服从正态分布。样本均数的均数为μ;样本均数的标准差为。第43页,共59页,2023年,2月20日,星期五中心极限定理(centrallimittheorem)Case2:
从非正态(nonnormal)分布总体(均数为μ,方差为σ)中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,则只要样本含量足够大(n>50),样本均数也近似服从正态分布。样本均数的均数为μ;样本均数的标准差为。第44页,共59页,2023年,2月20日,星期五标准误(standarderror)样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。均数的标准误表示样本均数的变异度。当总体标准差未知时,用样本方差代替,前者称为理论标准误,后者称为样本标准误。第45页,共59页,2023年,2月20日,星期五均数标准误的计算例:某市16岁女中学生的身高均数(μ)为155.4cm,标准差(σ)为5.3cmn=10第46页,共59页,2023年,2月20日,星期五与样本含量的关系n
越大,均数的均数就越接近总体均数;n越大,变异越小,分布越窄;对称分布接近正态分布的速度,大于非对称分布。分布越偏,接近正态分布所需样本含量就越大。第47页,共59页,2023年,2月20日,星期五标准误与标准差(1)联系:都表示变异的大小;样本含量一定时,标准差越大,标准误越大。第48页,共59页,2023年,2月20日,星期五标准误与标准差(2)标准差含义:一组变量值离散程度;标准差越小,均数的代表性越好;应用:估计参考值范围;与n的关系:样本含量越大,标准差越稳定,n很大时,标准差趋向于总体标准差。第49页,共59页,2023年,2月20日,星期五标准误与标准差(3)标准误含义:样本统计量的离散程度;标准误越小,用样本均数来反映总体均数越可靠;应用:计算可信区间;与n的关系:样本含量越大,均数的标准误越小,n很大时,标准误趋向于0。第50页,共59页,2023年,2月20日,星期五正态分布的标准化变化若X~N(μ,σ),则
因,则第51页,共59页,2023年,2月20日,星期五t
分布的概念实际工作中,总体方差未知。所以,用样本方差代替总体方差此时的分布如何?第52页,共59页,2023年,2月20日,星期五从N(0,1)中1000次抽样的
t值的分布(n=4)Fractiont-8-6-4-2024680.05.1.15.2.25.3t值的均数为0.05696t的标准差为1.55827
第53页,共59页,2023年,2月20日,星期五t
分布的概念用样本方差代替总体方差,此时不服从正态分布。而服从
t分布。记为:第54页,共59页,2023年,2月20日,星期五t分布1908年Gosset以笔名Student发表。故又称Studentt
分布。t
分布是一簇分布,与自由度有关。自由度(degreeoffreedom):df、第55页,共59页,2023年,2月20日,星期五自由度分别为1、5、∞时的
t分布
f(t)
=5
=10.10.2-4-3-2-1012340.3
=∞(标准正态曲线)第
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 复合肥产品质量验收检验标准
- 低GI饮食干预执行规范
- 农药包装废弃物处置规范
- 足疗按摩服务标准操作流程
- 会员生日关怀实施方案
- 蛋鸡光照程序管理技术方案
- 临床髋关节撞击综合征标准化诊疗意见
- 风电场振动分析
- 生日关怀礼遇服务执行标准
- 水稻旱育稀植高产栽培方案
- AI在教育课堂互动中的应用:场景、策略与评估
- 药明康德研发生产制度
- 建筑国企合规管理培训
- 供应链物流环节运输成本精细化管理降本增效方案
- 光伏电力调度考试题库及答案
- 疑难病例讨论课件模板
- 【MOOC】《光信息处理》(四川大学)章节期末慕课答案
- 钢厂光伏屋顶施工方案
- 北京公墓购买合同范本
- 纪检监察办案安全题库400题及答案解析
- 2025辽宁出版集团选聘18人笔试题库及答案详解
评论
0/150
提交评论