已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
抽样误差与假设检验,均数的抽样误差和总体均数的估计,(一)、均数的抽样误差与标准误统计推断用样本的信息推论总体的特征。参数估计统计推断假设检验,健康女性体温,102人,均数的抽样误差-由于抽样造成的样本均数与总体均数、样本均数之间的差异。,样本1,样本2,样本k,总体均数,根据中心极限定理:,1.从正态总体中抽样,抽取样本含量为n的样本,样本均数服从正态分布。即使是从偏态总体中抽样,在样本含量足够(n50)大时,也近似正态分布。2.从均数为,标准差为的正态或偏态总体中抽样样本例数为n的样本,新样本组成的数据中,样本均数为,标准差,标准误:样本均数的标准差,反映各均数间的离散程度。,标准误的意义:描述抽样误差的大小,越小,说明抽样误差越小,样本均数越接近总体均数,用代表的可靠性越高。,标准误的计算均数的标准误,以某地14岁健康女生身高的标准差5.30cm及每个样本包含的例数10代入公式,求得,均数标准误的用途:可用来衡量样本均数的可靠性。与样本均数结合,可用于估计总体均数的可信区间;可用于进行均数的假设检验。,应用时,用样本标准差来代替总体标准差,则标准误的估计值为:?减少抽样误差的有效途径,(二)t分布u变换(将正态分布转化为标准正态分布)t变换,全国14岁女生(身高),(t分布),(u分布),t分布特征:(1)单峰分布,以0为中心左右对称。(2)t分布是一簇曲线,其形状受的影响。,t分布与标准正态分布(u分布)区别:*t分布曲线峰部较矮,尾部稍翘。*n(自由度)越大,t分布与u分布越接近;当时,t分布=u分布。,t分布的特征:,t界值表:(附录9-P261),t界值表的特征:自由度相同时越大,概率P越小;双侧概率P为单侧概率P的两倍。,自由度为,概率为(检验水准)时,t的界值记为。,t界值表的查法:=?通常取0.05或0.01,(t越大,概率P越小),2.262,3.250,1.96,2.58,当n50,为大样本(t分布=u分布),可用来代替,(三)总体均数的可信区间估计统计描述统计分析参数估计-用样本指标估统计推断计总体指标假设检验,点估计-用估计参数估计区间估计-按一定的概率估计总体均数落在某个范围,这个范围称之为:总体均数的可信区间CI,用区间()表示。如(37.02,37.10),说明总体均数在37.0237.10之间,但不包含上限(37.10)及下限(37.02)两个值。,总体均数可信区间的计算1)已知95%置信区间99%置信区间,未知时总体均数可信区间的计算2)大样本-按u分布95%置信区间99%置信区间,例7-15102名健康女大学生口腔温度总体均数为=37.06,标准差S=0.198,标准误=0.0196,试估计该地健康女大学生口腔温度总体均数95%可信区间和99%可信区间。95%可信区间为37.061.960.0196,(37.02,37.10)99%可信区间为37.062.580.0196,(37.01,37.11),某市2001年120名7岁男童的身高=123.62(cm)S=4.75(cm),计算该市7岁男童总体均数90%的可信区间。,n=120100,故可以用标准正态分布代替t分布,u0.01=1.645,=,=,总体均数可信区间的计算3)小样本或未知-按t分布95%置信区间99%置信区间,例随机抽取某地健康男子20人,测得该样本的收缩压均数为118.4mmHg,标准差S为10.8mmHg,试估计该地男子收缩压总体均数的95%置信区间。,此为小样本,应按t分布。收缩压过高过低均为异常,故取双侧。95%置信区间:代入数据()即(113.3,123.5),随机抽查某地30名40-44岁哈萨克族成年男性的骨密度,测得骨密度均数资料,,=,187.11,mg/cm2,试估计该地40-44岁哈萨克族成年男性,的骨密度总体均数的95%可信区间,N=30,则v=29,查附表2,t界值表,t0.05/2,29=2.045,可信区间的两个要素:,1.准确度:反映在的大小上。2.精确度:反映在区间的长度上。在样本含量一定的情况下二者是矛盾的。常用的95%置信区间。,均数可信区间与参考值范围的区别95%可信区间:从至范围有95%的可能性包含了总体均数。95%正常值范围:一组观察值中,有95%个体(频数)的观察值在至范围内。,六、均数的假设检验,(一)假设检验的基本思想利用反证法的思想,例某地抽样调查了25名健康成年男性的脉搏,其均数为74.2次/分,标准差为6.5次/分。已知正常成年男性脉搏的均数为72次/分。试问能否认为该地抽样调查的25名成年男性的脉搏与正常成年男性脉搏的均数不同?,0=72次/分,n=25,=74.2次/分S=6.5次/分,已知总体,未知总体,差异的原因:(1)由于抽样误差造成的.(实际上,但由于抽样误差不能很好代表)(2)该地成年男性的脉搏与正常成年男性脉搏均数不同(),假设检验的目的就是判断差异的原因:求出由抽样误差造成此差异的可能性(概率P)有多大!若P较大(P0.05),认为是由于抽样误差造成的。原因(1),实际上若P较小(P0.05),认为不是由于抽样误差造成的。原因(2),实际上,(二)假设检验的基本步骤,1、建立假设,确定检验水准H0:(无效假设),=0,H1:(备择假设)0检验水准的意义及确定,2、选定检验方法,计算检验统计量3、确定P值,作出推断结论,(推断的结论统计结论专业结论),P0.05,按检验水准,不拒绝H0,差异无统计学意义(差异无显著性),还不能认为不同或不等。P0.05,按检验水准,拒绝H0,接受H1,差异有统计学意义(差异有显著性),可以认为不同或不等。P0.01,按检验水准,拒绝H0,接受H1,差异有高度统计学意义(差异有高度显著性),可以认为不同或不等。,72次/分,单、双侧检验的选择:1、根据专业知识事先不知道会出现什么结果双侧事先知道只能出现某种结果单侧*通常用双侧(除非有充足的理由选用单侧之外,一般选用保守的双侧较稳妥),确定P值:(用求出的t值与查表查出的t值比较)查t值表:,(t越大,P越小),(1)求出t=1.833,P0.05,(2)求出t=4.18,P0.01,(3)求出t=2.96,0.01P0.05(简写为P0.05),(4)求出t=3.25,P=0.01,0.05,0.01,3.250,2.262,P0.05,P0.01,P0.05,假设检验的思路是:首先对未知或不完全知道的总体提出一个假设,然后借助一定的分布,观察实测样本情况是否属于小概率事件。一般把概率P0.05的事件称为小概率事件,小概率事件在一次观察中可以认为是不会发生的,如实测样本情况属于小概率事件,则不拒绝原来的假设;如实测样本情况不属于小概率事件,则拒绝原来的假设。当然,小概率事件在一次观察中还是可能发生的,若我们恰好碰上,则假设检验的结论就是错误的,不过因为小概率事件发生的概率小,所以犯这种错误的概率也小。,(1)建立假设、确定检验水准,H0:=0即山区成年男子平均脉搏数与一般成年男子相等H1:0即山区成年男子平均脉搏数高于一般成年男子,(2)选定检验方法,计算检验统计量,(3)确定P值,作出推断结论,T界值表,得t0.1,24=1.711,t0.1,t检验和u检验,t检验应用条件:当n0.05,按检验水准,不拒绝H0,无统计学意义。尚不能认为该法测得的均数与真值不同。,二、配对设计的均数比较,常见的配对设计主要有以下情形:自身比较:同一受试对象处理前后。同一受试对象分别接受两种不同的处理。将条件近似的观察对象两两配成对子,对子中的两个个体分别给予不同的处理。,配对t检验的基本原理:假设两种处理的效应相同,即1=2,则1-2=0,即可看成是差值的样本均数所代表的未知总体均数d与已知总体均数0=0的比较,此时,我们可套用前述t检验的公式。,例9-16应用某药治疗8例高血压患者,观察患者治疗前后舒张压变化情况,如表9-10,问该药是否对高血压患者治疗前后舒张压变化有影响?,表9-10用某药治疗高血压患者前后舒张压变化情况,H0:该药对舒张压无影响。H1:该药对舒张压有影响。,P,t,0.05,0.01,2.365,P0.01,4.02,3.499,确定P值,判断结果自由度n-18-17,查表9-9t界值表,t0.05,72.365,今4.022.365,故P0.05,故按0.05水准,拒绝H0,接受H1,认为差异有高度显著性,可以认为该药有降低舒张压的作用。,三、两个样本均数比较的t检验,大样本(n50)-u检验小样本-正态分布资料t检验偏态分布资料秩和检验,1、两个大样本均数的比较,例9-17某地随机抽取正常男性新生儿175名,测得血中甘油三酯浓度的均数为0.425mmol/L,标准差为0.254mmol/L;随机抽取正常女性新生儿167名,测得甘油三酯浓度的均数为0.438mmol/L,标准差为0.292mmol/L,问男、女新生儿的甘油三酯浓度有无差别?,建立假设,确定检验水准H0:12H1:120.05选择检验方法,计算检验统计量u值,(3)查u界值表(t界值表中自由度为的一行),u=0.4380.05,按=0.05水准,不拒绝H0,差异无统计学意义;尚不能认为正常男女新生儿血中甘油三酯浓度均数不同。,2、两个小样本均数的比较,例9-18两组雄性大鼠分别饲以高蛋白和低蛋白饲料,观察每只大鼠在实验第28天到84天之间所增加的体重,见表9-11。问用两种不同饲料喂养大鼠后,体重的增加有无差别?,表9-11用两种不同蛋白质含量饲料喂养大鼠后体重增加的克数,建立假设,确定检验水准H0:12H1:120.05选择检验方法,计算检验统计量t值,确定P值,判断结果查表9-9t界值表,t0.05,172.110,今1.8912.110,故P0.05,故按0.05水准,不拒绝H0,尚不能认为两种饲料喂养大鼠后体重的增加是不同的。,P,P=?,t=1.891,P=0.05,t,P=0.01,t=2.110,t=2.898,四、假设检
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海市市八中2026届化学高一第一学期期末质量跟踪监视试题含解析
- 2026届山东省夏津县第一中学化学高一第一学期期中经典模拟试题含解析
- 文化自主招生典型试题及参考答案解析
- 人力资源流失论文开题报告1-20250128-122315
- 甘肃省张掖市民乐县第一中学2025-2026学年高一上化学期中教学质量检测试题含解析
- 2026届江西省抚州市临川一中物理高一第一学期期末复习检测试题含解析
- 2026届湖北省随州市第二高级中学、郧阳中学高一化学第一学期期中复习检测模拟试题含解析
- 甘肃省重点中学2026届化学高一第一学期期中联考试题含解析
- 2026届贵州省台江县第二中学高一上生物期末联考模拟试题含解析
- 2026届湖北省巴东一中高一上生物期末监测试题含解析
- 全面可视化管理手册
- JJG 1205-2025直流电阻测试仪检定规程
- 事业单位物业管理制度
- 消防车乐高课件
- 供水漏控管理制度
- 2025高级生命支持(ACLS)理论考核试题及答案
- 2025欧盟REACH法规高关注物质清单
- 阴道上皮内瘤变诊治中国专家共识(2024年版)解读
- (高清版)DB34∕T 4991-2025 岩沥青+SBS复合改性沥青混合料设计与施工技术规范
- 神经外科临床诊疗指南及操作规范
- 《住院患者身体约束的护理》团体标准解读课件
评论
0/150
提交评论