版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学第讲抽样误差与分布第1页,课件共44页,创作于2023年2月如:总体均数总体标准差
如:样本均数样本标准差S
总体样本抽取部分观察单位
统计量参数
统计推断统计推断第2页,课件共44页,创作于2023年2月在医疗卫生实践和医学研究中,往往难以对所要研究的总体进行全部观察,通常从总体中随机抽取样本进行观察,然后由样本的信息去推断总体特征,这种研究方法叫做抽样研究方法。用样本的信息去推断总体特征,这种分析方法称为统计推断。基本手段直接推断(参数估计)间接推断(假设检验)第3页,课件共44页,创作于2023年2月总体参数的估计均数的抽样误差t分布总体均数的估计第4页,课件共44页,创作于2023年2月抽样误差的定义假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了三次。μ=119.41cmσ=4.38cm第5页,课件共44页,创作于2023年2月三次抽样得到了不同的结果!!!!原因何在????第6页,课件共44页,创作于2023年2月如果没有个体变异……NoVariation!NoSamplingError!第7页,课件共44页,创作于2023年2月NoRandomsampling!NoSamplingError!如果没有抽样研究……第8页,课件共44页,创作于2023年2月三次抽样得到了不同的结果,原因何在?个体变异随机抽样不同男童的身高不同每次抽到的人几乎不同抽样误差第9页,课件共44页,创作于2023年2月【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(samplingerror)。各种参数估计都有抽样误差,这里我们以均数为研究对象第10页,课件共44页,创作于2023年2月抽样误差产生的条件抽样研究个体变异第11页,课件共44页,创作于2023年2月抽样误差的表现样本均数和总体均数间的差别样本均数和样本均数间的差别抽样误差是不可避免的,可以通过保证总体的同质性及增大样本含量来缩小抽样误差。第12页,课件共44页,创作于2023年2月从正态分布总体N(5.00,0.502)中,每次随机抽取样本含量n=5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。按上述方法再做样本含量n=10、样本含量n=30的抽样实验;比较计算结果。抽样误差的规律性—正态分布抽样第13页,课件共44页,创作于2023年2月抽样试验(n=5)第14页,课件共44页,创作于2023年2月抽样试验(n=10)第15页,课件共44页,创作于2023年2月抽样试验(n=30)第16页,课件共44页,创作于2023年2月1000份样本抽样计算结果总体的均数总体标准差s均数的均数均数标准差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.0913第17页,课件共44页,创作于2023年2月3个抽样实验结果图示第18页,课件共44页,创作于2023年2月非正态分布抽样分别从各总体中抽取10000个样本含量为n的样本,计算每个样本的均数,并绘制频数分布图。
n分别取2、4、10、25。第19页,课件共44页,创作于2023年2月偏三角分布抽样
第20页,课件共44页,创作于2023年2月均匀分布第21页,课件共44页,创作于2023年2月指数分布第22页,课件共44页,创作于2023年2月双峰分布第23页,课件共44页,创作于2023年2月从正态总体中随机抽样,其样本均数服从正态分布;从任意总体中随机抽样,当样本含量足够大时,其样本均数的分布逐渐逼近正态分布;样本均数之均数的位置始终在总体均数的附近;随着样本含量的增加,样本均数的离散程度越来越小,表现为样本均数的分布范围越来越窄,其高峰越来越尖。第24页,课件共44页,创作于2023年2月中心极限定理从正态总体中随机抽取例数为n的样本,样本均数x也服从正态分布,即使从偏态总体中抽样,只要样本例数足够大,如n>50,样本均数x也近似正态分布。从均数为,标准差为的正态总体中随机抽取例数为n的样本,样本均数的总体均数为,标准差为x第25页,课件共44页,创作于2023年2月中心极限定理第26页,课件共44页,创作于2023年2月标准误的定义样本统计量(如均数)也服从一定的分布。与描述观测值离散趋势的指标类似,样本统计量的标准差就反映了从某个总体中随机抽样所得样本之均数分布的离散程度。用样本统计量的标准差来反映抽样误差的大小。又称标准误(standarderror)。第27页,课件共44页,创作于2023年2月x标准误x=/nsx=s/n第28页,课件共44页,创作于2023年2月标准误的意义反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。反之亦然。标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。第29页,课件共44页,创作于2023年2月用途:(1)衡量样本均值的可靠性(2)估计总体均值的可信区间(3)用于均数的假设检验第30页,课件共44页,创作于2023年2月t分布随机变量XN(m,s2)标准正态分布N(0,12)u变换标准正态分布N(0,12)均数Studentt分布自由度ν=n-1t变换第31页,课件共44页,创作于2023年2月由W.S.Gosset提出第32页,课件共44页,创作于2023年2月
t=x-s/n对于不同的n,有不同的t分布曲线。(n-1)称为t分布的自由度第33页,课件共44页,创作于2023年2月
f(t)
=∞(标准正态曲线)
=5
=10.10.2-4-3-2-1012340.3自由度分别为1、5、∞时的
t分布第34页,课件共44页,创作于2023年2月t分布的特征:①t分布为一簇单峰分布曲线。②t分布以0为中心,左右对称。③t分布与自由度ν有关,自由度越小,t分布的峰越低,而两尾越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。第35页,课件共44页,创作于2023年2月t分布曲线下面积规律t分布曲线下总面积仍为1或100%t分布曲线下面积以0为中心左右对称由于t分布是一簇曲线,故t分布曲线下面积固定面积(如95%或99%)的界值不是一个常量,而是随自由度的大小而变化第36页,课件共44页,创作于2023年2月其通式为单侧:P(t≤-t,)=或P(t≥t,)=
双侧:P(t≤-t/2,)+P(t≥t/2,)=图中非阴影部分面积的概率为,
P(-t/2,<t<t/2,)=1-第37页,课件共44页,创作于2023年2月t分布的界值t,检验水准(尾端概率)自由度在t检验中很重要第38页,课件共44页,创作于2023年2月t界值表横标目:自由度,υ纵标目:尾端概率,p,即曲线下阴影部分的面积;表中的数字:相应的|t|界值。第39页,课件共44页,创作于2023年2月附表2,t分布表的特点附表2的横标目为自由度,纵标目为概率P,表中数值为其相应的t界值,记作t,
。附表2只列出正值,若计算的t值为负值时,可用其绝对值查表。附表2右上附图的阴影部分表示t,以外尾部面积的概率。第40页,课件共44页,创作于2023年2月单侧t0.05,30=1.697,表示ν=30时,t≥1.697的概率或t≤-1.697的概率为0.05,记作P(t≤-1.697)=0.05或P(t≥1.697)=0.05;双侧t0.05,30=2.042,表示ν=30时,t≥2.042的概率和t≤-2.042的概率之和为0.05,记作P(t≤-2.042)+P(t≥2.042)=0.05第41页,课件共44页,创作于2023年2月图中非阴影部分面积的概率为:
P(-α/2,ν<t<tα/2,ν)=1-α从附表2中还可以看出,双侧概率P为单侧概率的两倍,如双侧t0.10/2,30=单侧t0.05,30=1.697第42页,课件共44页,创作于2023年2月标准误与标准差的关系区别
标准差s标准误sx意义个体变异统计量的抽样误差用途正常值范围总体均数的可信区间
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教八下英语Unit 8《Project-Reflecting》课件
- 2026年口腔执业医师聘用合同(1篇)
- 2025 高中信息技术数据结构在游戏角色属性的生成与成长的平衡性与多样性优化课件
- 2026年票据保理合同(1篇)
- 硬装施工规范培训【课件文档】
- 物流配送流程培训【课件文档】
- 新增资产价值的确定原则和计算方法
- 医院安全生产课件
- STP战略教学精要
- 社区春季健康知识课件
- DB34-T 5275-2025 全预制装配式公路梁桥设计与施工技术规程
- 2025年上海市黄浦区中考数学二模试卷
- 2025年国际汉语教师证书(CTCSOL)笔试教学理论与实践案例详解与模拟试题及答案
- 2025年全国中学生生物学联赛试题及答案(精校版)
- 2025年及未来5年中国燕窝酸行业市场深度分析及发展前景预测报告
- GB/T 46417-2025商用车对开路面直线制动车辆稳定性试验方法
- 成考专升本英语词汇必背3500词
- 2025年及未来5年中国汽车空调用微通道换热器行业发展监测及投资战略研究报告
- 橡胶隔音垫施工方案设计
- 高校图书馆标准化建设方案
- 《烹饪美学》课件-第五章 饮食器具美学
评论
0/150
提交评论