




已阅读5页,还剩67页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章 假设检验,统计推断,随机抽样,参数?,统计量,( 、),(x、s、p),参数估计 假设检验,通过样本统计量推断总体参数之间是否存在差异,其推断过程称为假设检验。,教学目的与要求,掌握: 假设检验原理 单样本正态资料的假设检验 两样本正态资料的假设检验 二项分布与Poisson分布资料的Z检验 假设检验应注意的问题 了解: 置信区间与假设检验的关系,教学内容提要,重点讲解: 假设检验原理 单样本正态资料的假设检验 两样本正态资料的假设检验 Z检验 假设检验应注意的问题 介绍: 置信区间与假设检验的关系,假设检验的基本任务:事先对总体分布或总体参数作出假设,利用样本信息判断原假设是否合理,从而决定是否拒绝或接受原假设。 参数检验(parametric test):若总体分布类型已知,需要对总体的未知参数进行假设检验。 非参数检验:若总体分布类型未知,需要对未知分布函数的总体的分布类型或其中的某些未知参数进行假设检验。,假设检验(hypothesis test)的基本思想,亦称显著性检验(significance test)是先对总体的特征(如总体的参数或分布、位置)提出某种假设,如假设总体均数(或总体率)为一定值、总体均数(或总体率)相等、总体服从某种分布、两总体分布位置相同等等,然后根据随机样本提供的信息,运用“小概率原理”推断假设是否成立。,“概率很小(接近于零)的事件在一次抽样中不太可能出现,故可以认为小概率事件在一次随机抽样中是不会发生的”。,“小概率原理”,例如在2000粒中药丸中只有一粒是虫蛀过的,现从中随机取一粒,则取得“虫蛀过的药丸”的概率是1/2000,这个概率是很小的,因此也可以将这一事件看作在一次抽样中是不会发生的。若从中随机抽取一粒,恰好是虫蛀过的,这种情况发生了,我们自然可以认为“假设”有问题,即虫蛀率p不是1/2000,从而否定了假设。否定假设的依据就是小概率事件原理。由此我们得到一个推理方法:如果在某假设(记为H0)成立的条件下,事件A是一个小概率事件,现在只进行一次试验,事件A就发生了,我们就认为原来的假设(H0)是不成立的。,例如,根据大量调查,已知正常成年男性平均脉搏数为72次/分,现随机抽查了20名肝阳上亢成年男性病人,其平均脉搏为84次/分,标准差为6.4次/分。问肝阳上亢男病人的平均脉搏数是否较正常人快? 以上两个均数不等有两种可能: 第一,由于抽样误差所致; 第二,由于肝阳上亢的影响。,例 如,已知正常成年男子脉搏平均为72次/分,现随机检查20名慢性胃炎所致脾虚男病人,其脉搏均数为75次/分,标准差为6.4次/分,问此类脾虚男病人的脉搏快于健康成年男子的脉搏? 抽样误差? 脾虚?,假设检验: 1、原因 2、目的 3、原理 4、过程(步骤) 5、结果,第一节 假设检验原理,某事发生了: 是由于碰巧?还是由于必然的原因?统计学家运用显著性检验来处理这类问题。,1、假设检验的原因,由于总体不同或因个体差异的存在,在研究中进行随机抽样获得的样本均数,x1、x2、x3、x4,不同。样本均数不同有两种(而且只有两种)可能: (1)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性 (差别无统计学意义) (2)分别所代表的总体均数不同。差别有显著性(差别有统计学意义),2、假设检验的目的 判断是由于何种原因造成的不同,以做出决策。,反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。 概率论(小概率) :如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是“不会发生的”。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的。,3、假设检验的原理,4、假设检验的步骤, 建立假设(反证法),确定显著性水平( ) 计算统计量:u, t,2 确定概率P值 做出推论,【例5-1】,已知正常成年男子脉搏平均为72次/分,现随机检查20名慢性胃炎所致脾虚男病人,其脉搏均数为75次/分,标准差为6.4次/分,推断此类脾虚男病人的脉搏是否不同于健康成年男子的脉搏。,(1)建立假设,选定检验水准: 假设两种:一种是检验假设,假设差异完全由抽样误差造成,常称无效假设,用H0表示。另一种是和H0相对立的备择假设,用H1表示。假设检验是针对H0进行的。,确定双侧或单侧检验:,H0:此类脾虚病对脉搏数无影响,H0:=72次/分 H1:脾虚病人的脉搏数不同于正常人,H1:72次/分,选定检验水准: =0.05 是在统计推断时,预先设定的一个小概率值,是当H0为真时,允许错误地拒绝H0的概率。,双侧与单侧检验界值比较,(2) 选定适当的检验方法,计算检验统计量值,t 检验 Z 检验,设计类型 资料的类型和分布 统计推断的目的 n的大小 如完全随机设计实验中,已知样本均数与总体均数比较,n又不大,可用t检验,计算统计量t值。,(3) 计算P值,P值:是在H0成立时,取得大于或等于现有检验统计量值的概率。,(3)计算概率值(P) 将计算得到的Z值或 t值与查表得到Z或t,,比较,得到 P值的大小。根据u分布和t分布我们知道,如果|Z| Z或| t | t ,则 P 。,当P时,统计学结论为按所取检验水准拒绝H0,接受H1,称“差异有显著性”(“差异有统计学意义”)。 当P 时,没有理由怀疑H0的真实性,统计学结论为按所取检验水准不拒绝H0,称“差异无显著性”(“差异无统计学意义”)。,(4) 作出推断结论,与P异同,相同: 与P都是用检验统计量分布的尾部面积大小表示。 不同: 是在统计推断时,预先设定的一个小概率值,是当H0为真时,允许错误地拒绝H0的概率,是检验水准。 P值是由实际样本决定的,是指从由H0所规定的总体中随机抽样,获得大于及等于(或小于)现有样本检验统计量值的概率。,5、两类错误(I型错误 与型错误 ),统计推断可能出现的4种结果,I型错误 (),推断正确 (1),推断正确 (1),型错误 (),(假阳性错误),(假阴性错误),(检验效能、把握度),(可信度),无效假设(H0 ) 备择假设(H1),两类错误(型错误与型错误): 型错误:H0原本是正确的 拒绝H0 弃真 假阳性错误 误诊 用表示 型错误:H0原本是错误的 不拒绝H0 存伪 假阴性错误 漏诊 用表示,两均数的假设检验,样本均数与总体均数的比较 成对资料均数的 t 检验 成组资料两样本均数的比较 方差不齐时两小样本均数的比较,第二节 单样本正态资料的假设检验,不,满足,不,满足,满足,满足,已知,正态性,非参数,检验,变量替换,结论,不,满足,大样本,u,检验,t,检验,满足,z,思路,一、正态总体均数的假设检验,方 法,1、大样本 【例5-2】一般女性平均身高160.1 cm。某大学随机抽取100名女大学生,测量其身高,身高的均数是163.74cm,标准差是3.80cm。 请问某大学18岁女大学生身高是否与一般女性不同。,目的:比较样本均数所代表的未知总体均数 与已知总体均数有无差别 计算公式:z 统计量=, 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数; (3) 可得到该样本标准误; (4) 样本量不小于100。,假设检验: 建立假设,确定显著性水平( ): 检验假设:某校女大学生身高均数与一般女子身高均数相同,H0:=0; 备择假设:某校女大学生身高均数与一般女子身高均数不同,H1:0 =0.05, 做出推论: Z= 9.58 1.96, p 0.05 = , 小概率事件发生了,原H0假设不成立;拒绝H0 , 接受H1, 可认为:某校女大学生身高均数与一般女子身高均数不同;某校女大学生身高均数与一般女子身高均数差别有显著性。, 计算统计量:Z 统计量: Z=, 确定概率值: |Z|=9.58 Z = 1.96 |Z| Z p =0.05;,2、小样本 【例5-3】已知中学一般男生的心率平均为74次/分钟。为了研究常参加体育锻炼的中学生心脏功能是否与一般的中学生相同,在某地区中学生中随机抽取常年参加体育锻炼的男生16名,测量他们的心率,结果均数为65.63次/分 ,标准差为7.2次/分。,目的:比较一个小样本均数所代表的未知总 体均数与已知的总体均数有无差别。 计算公式: t 统计量:t= 自由度:=n - 1, 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本量小于100; (4) 样本来自正态或近似正态总体。,假设检验: 建立假设,确定显著性水平( ): 检验假设:常参加体育锻炼的中学男生的心率与一般中学生相等; H0:=0; 备择假设 :常参加体育锻炼的中学男生的心率与一般中学生不同; H1:0 =0.05, 计算统计量: t = =4.65 确定概率值: n= 16, 自由度 = n 1 = 15, t0.05(15) = 2.131 t t0.05(15) , p 0.05 做出推论: p 0.05 , 小概率事件发生了,原假设不成立;拒绝H0 , 接受H1, 可认为:常参加体育锻炼的中学男生的心率与一般中学生不同;常参加体育锻炼的中学男生的心率比一般中学生心率慢;常参加体育锻炼的中学男生的心率与一般中学生差别有显著性。,二、正态总体方差的假设检验,正态总体方差2的检验,如表5-3所示:,【例5-4】 某药含碳量服从正态分布,生产时允许方差在0.0482(mg2)内。现任取5件,测得含碳量(mg)为:1.32、1.55、1.36、1.40、1.44,根据0.05判断该药生产是否稳定。,H0: 0.0482,H1: 0.0482。 0.05 n5, 1.414,S0.0882,dfn14, 查统计用表6得单侧概率P0.01。以0.01水准的单侧检验拒绝H0,接受H1。检验有统计学意义,可认为该药生产不稳定。,第三节 两样本正态资料的假设检验,1. 配对样本资料(或称为相关资料)的假设检验 2. 两组独立样本(成组)资料的方差齐性检验 3. 两组独立样本比较的t检验,一、配对样本资料的t检验,什么是配对设计资料?,将可能影响指标的一些特征相同或近似的两个个体配成一对,然后按照随机化方法将每个对子内的两个个体用不同的两种方法进行处理。对处理的结果进行分析。 有哪几种形式?,配对比较主要有四种情况:,同一对象处理前后的数据 同一对象两个部位的数据 同一对象分别接受两种不同处理的数据 两个同质的对象分别接受两种处理后的数据,1目的:通过对两组配对资料的比较,判断不同的处理效果是否有差别,或某种治疗方法是否起作用。 2. 基本原理:假设两种处理方法的效果相同,12,即120。计算出两组资料各对的差值d,这时,检验两个总体均值是否相等,转化为检验差值d的总体均值是否为零,即检验假设H0:d0。 3公式: t = = 自由度: = 对子数 - 1 4. 适用条件:配对资料,对子差值满足正态性,【例5-5】 为考察一种新型透析疗法的效果,随机抽取了10名病人测量透析前后的血中尿素氮含量如下表,请根据本实验资料对此疗法进行评价。,d 13.4 13.4 9.9 9.4 6.9 10.0 25.2 10.3 12.9 11.6, H0:d = 0 H1:d 0(单侧检验) 确定显著性水平 = 0.05 计算统计量: t =7.826, 确定概率:=10 - 1=9。 查表 t 0.05(9) =1.833 t = 7.826 t 0.05(9) p 0.05 判断结果:因为p 0.05,故拒绝检验假设H0, 10名病人透析前后血中尿素氮含量差异有显著性,即透析可以降低血中尿素氮含量。,【例5-6】,为研究三棱莪术液的抑瘤效果,将20只小白鼠配成10对,将每对中的两只小白鼠随机分到实验组和对照组中,两组都接种肿瘤,实验组在接种肿瘤三天后注射30%的三棱莪术液0.5mL,对照组则注射蒸馏水0.5mL。结果见表5-4。比较两组瘤体大小是否相同。,单侧检验,二、成组资料两样本均数的比较,思路,小样本:,大样本:先进行F检验,再作Z检验,1、成组资料的方差齐性检验,成组t检验的前提条件是两总体方差齐。 两总体方差相等称为方差齐性,两总体方差不等称为方差不齐。检验两组资料的方差是否齐性,以决定采用适宜的检验统计量。 方差齐性检验假设: 查F界值表(附表8)确定P大小,作推论,【例5-9】 研究功能性子宫出血症实热组与虚寒组的免疫功能,测定淋巴细胞转化值如表5-5所示。设两组的淋巴细胞转化值都服从正态分布,判断两组的总体方差是否不等。,2、成组资料的t检验,【例5-11】 干燥芜菁叶含钙量服从正态分布,用两种方法各10次测定含钙量(g/100g),测定值均数分别为 2.2150(g/100g)、 2.2651(g/100g),标准差分别为S10.1284(g/100g)、S20.0611(g/100g)。第1种方法测定的含钙量是否低于第2种方法?,【例5-12】 某地检查正常成年人的血液红细胞数,样本容量、均数、标准差分别为:男子组156名、465.13万/mm3、54.80万/mm3,女子组74名、422.16万/mm3、49.20万/mm3。若该地正常成年男女血液红细胞数均服从正态分布,判断其红细胞平均数是否与性别有关。,第四节 二项分布与Poisson分布资料的Z检验,一、二项分布资料的Z检验,1. 单组资料的Z检验 2. 成组资料的Z检验,1单组资料的Z检验 如果二项分布的或(1)均不太小,则当n足够大时,二项分布接近正态分布,故二项分布资料的样本率与总体率比较可用z检验: Z(Xn0)/ (5-6) 式中X为阳性频数;0为已知总体率;n为样本含量。 若不用绝对数表示,改用率表示时,将上式的分子、分母同时除以n: Z(p0)/ (5-7) n不大时,用连续性校正式: Z(|p0| 0.5/n)/ (5-8),【例5-13 】根据以往经验,一般胃溃疡病患者有20%发生胃出血症状。现观察65岁以上胃溃疡病人304例,有96例发生胃出血症状。推断老年胃溃疡患者是否比较容易出血。,H0:20%,即老年患者胃出血率与一般患者相同;H1:20%。 样本出血率96/30431.58%,按公式(5-7) Z (0.31580.20)/ 5.0471 Z单侧界值Z0.012.33,P0.01。按0.01水准拒绝H0,接受H1,可认为老年胃溃疡病患者较一般患者容易发生胃出血。,2成组资料的Z检验,n1与n2均大于50时,两样本率p1X1 /n1,p2X2 /n2比较 Z=(p1p2)/ (5-11) 两样本率的合并标准误为 (5-10) 合并样本率pc的计算公式为: pc= (5-9) 若两个样本率均有p与(1p)大于1%,且np与n(1p)均大于5,则两样本率的比较亦可用Z检验。,【例5-14】用某中草药治疗慢性支气管炎患者,其中吸烟组治疗86人,显效35人,不吸烟组治疗107人,显效82人,推断吸烟与不吸烟组显效率是否相同。,H0:1=2;H1:12。=0.05 p1=X1/n1=35/86=0.4070, p2=X2/n282/107=0.7664,pc=0.6062, 0.0717 Z=(0.40700.7664)/0.0717= 5.0119 因Z |2.58,P0.01,按=0.05水准拒绝H0,接受H1。可认为用该中药治疗慢性气管炎不吸烟组的显效率高于吸烟组。,二、Poisson分布资料的Z检验,单组资料的Z检验 成组资料的Z检验,1单组资料的Z检验,当Poisson分布的均数20时,Poisson分布近似正态分布,样本阳性频数X与已知总体平均数0比较可用正态近似Z检验,检验统计量为 Z(X 0) / (5-12),【例5-15】 一般认为全国食管癌死亡率为28/10万,某省1990年死亡回顾调查10万人,食管癌死亡人数22人,该地食管癌死亡率水平是否与全国相同?,2成组资料的Z检验,当两总体均数的估计值均大于20时,可用正态近似作两样本均数比较的Z检验。根据两样本的观察单位数是否相等,分为两种情况计算: 当两样本n1n2时,Z值计算公式为 Z(X1X2)/ (5-13) 当两样本n1n2时,由样本均数计算Z值 Z = ( 1 2)/ (5-14),例 题,【例5-15 】 用艾叶苍术烟雾对室内空气进行消毒,在室内设6个地点,每点消毒前后各放置一平皿(时间及空间相同)。培养葡萄球菌个数消毒前分别为22,27,23,29,20,23;消毒后分别为12,8,15,19,10,12。比较消毒前后效果有无差别? 【例5-17】某制药车间在改革工艺前,测取3次,每升空气中分别有38、29、36颗粉尘。改进工艺后,测取2次,分别有25、18颗粉尘。推断工艺改革前后粉尘数有无差别?,1、正确理解假设检验的结论(概率性) 假设检验的结论是根据概率推断的,所以不是绝对正确的: 当 p , 不能拒绝 H0, 不能接受H1,按不能接受H1下结论,也可能犯错误;,第五节 假设检验应注意的问题,(1) 当拒绝 H0 时, 可能犯错误,可能拒绝了实际
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 环保型乳化剂项目可行性研究报告
- 2025-2026学年统编版(2024)小学语文一年级上册第一单元测试卷及参考答案
- 船舶防锈涂料项目可行性研究报告
- 防汛知识培训开场词课件
- 国内各类广告业务公司劳动协议
- 语文8威科特先生的陷阱
- 共享经济发展对就业市场的影响
- 河北省秦皇岛市实验中学2025-2026学年高二上学期开学考试英语试卷
- 四川省眉山市东坡区2025-2026学年六年级下册语文第二学月综合练习(有答案)
- 内蒙古乌海市第二中学2024-2025学年七年级上学期第一次教学质量摸底检测数学试卷(含答案)
- 4D厨房区域区间管理责任卡
- GB/T 990-1991带式输送机托辊基本参数与尺寸
- 石油化工工艺装置蒸汽管道配管的设计
- 人教版五年级道德与法治上册第7课《中华民族一家亲》优秀课件
- 肝癌的中西医治疗
- 四川省高中信息技术会考试题
- 猪动物福利及其我国对策课件
- 沟槽坍塌应急演练方案
- DBJ50∕T-352-2020 工程建设工法编制标准
- 行政审批中介服务规范治理自查自纠表
- 金融风险管理完整ppt课件(PPT 188页)
评论
0/150
提交评论