版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
研-统计3抽样误差t分布2024/3/25研统计3抽样误差t分布正态分布用N(µ,)表示,其位置与均数有关,形状与标准差有关。医学现象许多呈正态分布,或近似正态分布:如正常人的生理,生化指标变量,等研统计3抽样误差t分布从直方图到正态曲线的过渡研统计3抽样误差t分布研统计3抽样误差t分布研统计3抽样误差t分布对称分布正(右)偏分布负(左)偏分布几种常见的频数分布研统计3抽样误差t分布正态分布之所以重要,三个主要原因:1.正态分布在分析上较易处理。2.正态分布之概率密度函数(p.d.f.,probabilitydensityfunction)的图形为钟形曲线(bell-shapedcurve),对称,很适合当做不少事件之机率模式。3.正态分布可当做不少大样本的近似分布。研统计3抽样误差t分布正态分布的密度函数:式中μ为均数;σ为标准差;π为圆周率;е为自然对数的底,即2.71828。以上均为常数,仅x为变量。研统计3抽样误差t分布标准正态分布:为了应用方便,常将式进行变量变换,即:u变换.所得到的新变量u的分布即为标准正态分布。u的含义:变量到均数间的距离相当于标准差的倍数。研统计3抽样误差t分布标准正态分布的概率密度函数:研统计3抽样误差t分布u变换后,μ=0,σ=1,使原来的正态分布变换为标准正态分布(standardnormaldistribution)亦称u分布。标准正态分布N(0,1).研统计3抽样误差t分布正态分布的特征和分布规律:(1)曲线在x轴的上方,与x轴不相交,当x=μ时,曲线位于最高点。f(u=0)=0.3989(2)曲线关于直线x=μ左右对称。(3)正态分布有两个参数:均数,标准差;标准正态的参数分别为:0,1(4)正态分布的面积分布有一定规律。研统计3抽样误差t分布正态曲线下面积的分布规律正态曲线下,横轴上一定区间的面积,等于该区间的频数发生的概率(即所有随机事件发生的概率)。面积可用积分求得。F(x)为正态变量X的累积分布函数,反映正态曲线下,自-到x的面积,即左侧累积面积。研统计3抽样误差t分布统计学家已经按编成了附表,标准正态分布曲线下的面积。应用时注意:(1)当总体μ,σ已知时,先计算u值,再用u值查表,得出所求区间面积占总面积的比例。如果未知,常分别用样本均数和样本标准差来估计。(2)曲线下对称于0的区间,面积相等。如:区间(-,-2.58)与区间(2.58,)的面积相等。(3)曲线下横轴上的总面积为100%或为1。根据后两个特征,可计算右侧累积面积。研统计3抽样误差t分布正态分布标准正态分布面积(或概率)μ-1σ__μ+1σ-1__+168.27%μ–1.96σ__μ+1.96σ-1.96__+1.9695.00%μ–2.58σ__μ+2.58σ-2.58__+2.5899.00%正态分布和标准正态分布曲线下面积分布规律研统计3抽样误差t分布(-1,1),68.27%(-1.96,1.96),95%(-2.58,2.58),99%双侧概率研统计3抽样误差t分布单侧概率研统计3抽样误差t分布正态曲线下面积的分布规律的应用:一、确定医学参考值范围意义:是正常人指标测定值的波动范围,可用于划分正常,或异常。步骤:1、抽样2、控制测量误差3、取单侧或双侧4、选定合适的百分界限5、资料正态性检验6、进行参考值估计常用方法:正态分布法,对数正态分布法,百分位数法研统计3抽样误差t分布95%正常值范围的估计适用对象双侧界限单侧上界单侧下界正态分布法正态、近似正态对数正态法对数正态、近似正态百分位数法偏态研统计3抽样误差t分布正常值范围的上下限单侧下限单侧上限研统计3抽样误差t分布双侧界限研统计3抽样误差t分布例:用正态分布法求血糖值95%的参考值范围。解:1、求样本的均数4.653、标准差0.401。2、按照双侧95%范围,确定参考值范围为:3、将样本的均数、标准差数值代入计算,得出范围。研统计3抽样误差t分布对数正态分布(lognormaldistribution):很多医学资料呈偏态分布,经过对数变换(用原始数据的对数值lgx代替x)后,服从正态分布,就说x服从对数正态分布。如:环境中若干有害物质的浓度,食品中有些农药的残留量,某些临床检验结果,某些疾病的潜伏期,医院病人的住院天数,都呈偏态分布。但对数转换后,为正态分布。按照正态分布规律处理。研统计3抽样误差t分布例题某市某年调查200例正常人血铅含量(ug/100g,双硫腙分光比色法),试估计血铅值的95%上限。资料服从对数正态分布,求血铅对数值的均数,标准差。研统计3抽样误差t分布二、确定概率分布:例:某市2000年110名7岁男童身高,已知均数=119.95厘米,标准差S=4.72厘米,估计:该地7岁男童身高在110厘米以下者占该地7岁男童总数的百分数。按:求u值,查表:找到-2.1,上方找到0.01,二者相交处为0.0174,概率为0.0174=1.74%,即该地7岁男童身高在110厘米以下者,估计占1.74%,不到2%。研统计3抽样误差t分布三、质量控制:实验中,常以作为上下警戒值,以作为上下控制值。正态分布是很多统计方法的理论基础
研统计3抽样误差t分布均数的抽样误差,t分布,参数估计
Samplingerrorofmean,t-distribution,parameters’estimation研统计3抽样误差t分布一、均数的抽样误差和标准误均数的抽样误差samplingerrorofmean由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率),样本均数之间也互不相等,这种由抽样引起的差异称为均数的抽样误差的体现。即:研统计3抽样误差t分布如何估计抽样误差?标准误standarderror,SE以样本均数为例:SE越大,均数的抽样误差越大,样本均数与总体均数间的差异越大。研统计3抽样误差t分布当样本例数一定时,样本均数的标准误与原始数据的标准差成正比;当标准差一定时,标准误与样本含量n的平方根成反比。增加样本含量可以减小抽样误差。与标准差的区别:标准差:表示一般个体值的离散程度;标准误:特别说明统计量的离散程度。研统计3抽样误差t分布标准误的应用1、用来衡量抽样误差的大小:标准误越小,样本均数与总体均数越接近,样本均数的可信度越高;2、结合标准正态分布与t分布曲线下的面积规律,估计总体均数的置信区间。3、用于假设检验。研统计3抽样误差t分布假定2003年汕头市15岁女学生的身高服从均数155.4cm、标准差5.3cm的正态分布。用计算机做抽样模拟试验,从N(155.4,5.32)的总体中,每次抽出10个数字(样本含量为10),组成一个样本,求出样本均数、样本标准差S。再求得此100个样本均数的均数、样本均数的标准差。抽样分布研统计3抽样误差t分布样本均数的标准差是什么?……..标准误研统计3抽样误差t分布100个样本均数构成一个新的分布,也是正态分布。即使原分布为偏态分布,当样本含量足够大时,新分布也近似正态分布)。新分布的集中趋势用均数的均数来表示,离散趋势用标准误表示N(,)。各样本均数的均数等于总体均数。研统计3抽样误差t分布正态总体中抽样(样本量5)正态总体中抽样(样本量10)正态总体中抽样(样本量30)抽样时样本量大小决定了样本均数分布的形状,当样本量足够大时,均数分布趋向正态分布。研统计3抽样误差t分布二、t分布(t-distribution)研统计3抽样误差t分布还记得吗?研统计3抽样误差t分布u转换将正态分布转换为标准正态,N(0,1)。同理:将样本均数的分布也可以转换为标准正态分布。即:研统计3抽样误差t分布实际工作中,总体标准差往往未知,常用S代替σ计算标准误,因此:为了和u分布区别,就变为:研统计3抽样误差t分布均数的分布也是这样如果我们采用另一个正态变量:于是,均数的分布变成了标准正态分布:研统计3抽样误差t分布但是,条件发生了变化我们通常用代替
然而,
随着样本量的变化而变化,所以,我们称之为t-分布,虽然它是正态分布,但只有当样本量(自由度)无穷大的时候,它才是标准正态分布,此时,u=t研统计3抽样误差t分布t分布曲线t分布是一簇对称于0的单峰分布曲线。自由度越小(相当于标准差大),曲线的中间越低,两边越高;随自由度增大,t分布曲线逐渐逼近于标准正态分布曲线。当自由度无穷大时,t分布就是标准正态分布曲线。每一条t分布曲线,都对应于相应的自由度。t分布模拟试验研统计3抽样误差t分布t分布曲线下的面积规律与标准正态曲线下的面积规律相似:在某一个自由度下,两侧外部总面积为5%的界限的t值称为t0.05/2(υ),把两侧外部总面积为1%的界限的t值称为t0.01/2(υ)。因此,中部占95%面积的t值范围:t0.05/2(υ)--t0.05/2(υ),中部占99%面积的t值范围:-t0.01/2(υ)--t0.01/2(υ)。研统计3抽样误差t分布研统计3抽样误差t分布当自由度确定时,占一定面积的t界限值,可以查表得出。例如:查当自由度=20,两侧概率之和为0.05时,对应的t值:t0.05/2(20)=±2.086,单侧概率为0.05时,对应的t值:t0.05(20)=1.725,研统计3抽样误差t分布一般,t0.05/2(v)≥1.96,t0.01/2(v)
≥2.58自由度越小,曲线越低平,t比1.96,2.58大的多;自由度变大,t接近于1.96,2.58;自由度无穷大,t=1.96,2.58研统计3抽样误差t分布研统计3抽样误差t分布使用t值表注意:同一自由度下,P越小,t值越大;P值相同时,自由度越大,t越小;当自由度无穷大时,t值与u值相等。这也是u分布与t分布的区别。研统计3抽样误差t分布t分布的主要应用:总体均数置信区间估计;t检验;研统计3抽样误差t分布三、总体均数置信区间的估计统计推断:参数估计,假设检验参数估计:点估计(pointestimation):用样本统计量作为对总体参数的估计值(μ)。比如均数的估计。区间估计(intervalestimation):根据选定的置信度估计总体均数所在的区间(a<μ<b).a,b为置信限(可信限)。研统计3抽样误差t分布置信度(confidencelevel):在估计总体均数的置信区间时,如果可能估计错误的概率为α,那么估计正确的概率为1-α,即为置信度.常用:95%,99%.置信区间(confidenceinterval,CI)根据置信度估计得到的区间,称为置信区间。研统计3抽样误差t分布为何要进行区间估计?点估计,即用样本均数来估计总体均数,简单易行,但未考虑抽样误差,而后者又是不可避免的。故常按照一定的概率估计总体均数在哪个范围。研统计3抽样误差t分布如何进行区间估计?1、总体标准差已知参照u分布,95%置信区间:99%置信区间:研统计3抽样误差t分布2、总体标准差未知,样本例数(>50)足够大也可参考u分布进行95%置信区间:99%置信区间:研统计3抽样误差t分布3、总体标准差未知,样本例数较小按t分布原理,依据自由度,查出某个概率相应的t界值,中部占95%面积的t值范围:-t0.05/2(υ)___t0.05/2(υ),占99%面积的t值范围:-t0.01/2(υ)___t0.01/2(υ)进行估计。研统计3抽样误差t分布因为:95%的样本满足:95%置信区间:99%置信区间:研统计3抽样误
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年6月临床药物治疗学模拟练习题(含答案)
- 2025年湖南现代物流职业技术学院单招职业适应性测试测试卷附答案
- (2025年)儿童保健知识问答题及答案
- 2026黑龙江大庆市肇源县医疗卫生专项人才引进22人备考题库含答案详解(培优b卷)
- 2026黑龙江齐齐哈尔市克东县公益性岗位人员招聘60人备考题库附完整答案详解【历年真题】
- 2026江苏宿迁市卫生健康委员会所属事业单位招聘11人备考题库带答案详解(达标题)
- 2026广东中山市港口污水处理有限公司招聘合同制工作人员1人备考题库含答案详解【巩固】
- 长城电源2026届春季校园招聘备考题库及参考答案详解【考试直接用】
- 2025-2026学年大学英语四级(CET-4)听力阅读专项训练卷
- 公建用房智能化工程专项施工方案
- 国际货物买卖合同课件
- T/FCAESA 00003-2023城镇道路清扫保洁作业指导价指南
- 中小学课外辅导班商业计划书
- 2025年中小学音乐教师考试题及答案
- 安徽单招医学类校考题库及答案
- 路灯材料采购合同协议
- 高丽娅教案案
- 财政电子票据培训
- 管理学控制方法:零基预算
- 2024-2030年中国银金属含量产业未来发展趋势及投资策略分析报告
- 医疗行业法律法规解读与合规经营
评论
0/150
提交评论