版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计量资料两组均数的比较检验第1页,共82页。(优选)计量资料两组均数的比较检验.第2页,共82页。主要内容假设检验的基本原理和步骤样本均数与总体均数的比较两相关样本均数的比较两独立样本均数的比较t检验的应用条件检验假设注意的问题案例讨论第3页,共82页。假设检验的概念与原理第4页,共82页。假设检验的思维逻辑实例:欲探讨男性成人肺炎患者的血红蛋白同男性健康成人有无区别,如果能够测量所有的男性成人肺炎患者和男性健康成人的血红蛋白数值,我们通过计算均数就可以进行大小的比较。可是,男性成人肺炎患者和男性健康成人的群体是无限大的,其血红蛋白值构成的总体也是无限的。若随机抽取两个样本,各10例:10例男性成人肺炎患者的血红蛋白(g/dl)测量值:11.9,10.9,10.1,10.2,9.8,9.9,10.3,9.3,9.8,8.9;10例男性健康成人的血红蛋白(g/dl)测量值:13.9,14.2,14.0,14.3,13.7,13.9,14.1,14.7,13.5,13.6。算得10例男性成人肺炎患者的血红蛋白均数为10.11(g/dl),
10例男性健康成人的血红蛋白均数为13.99(g/dl),差别的原因?第5页,共82页。差别的原因可能有两种:本质上的差异抽样误差只要个体之间存在差异,抽样误差就不可避免。欲想知道差别到底是本质上的差异还是纯粹的抽样误差,需进行假设检验。借助抽样误差的分布规律:均数的分布、t分布、z分布、…第6页,共82页。t变换第7页,共82页。接受无效假设拒绝H0拒绝H0tt假设检验的原理:第8页,共82页。第9页,共82页。假设检验的基本步骤
例
已知北方农村儿童前囟门闭合月龄为14.1月。某研究人员从东北某县抽取36名儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?1.选择检验方法,建立检验假设并确定检验水准根据研究目的、研究设计的类型和资料特点(变量种类、样本大小)等因素选择合适的检验方法。并且将需要推断的问题表述为一对关于总体特征的假设。原假设(nullhypothesis),又称无效假设,记为H0;对立假设(alternativehypothesis),又称备择假设,记为H1。第10页,共82页。H1的内容直接反映了检验单双侧。若H1中只是
0
或
<
0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。第11页,共82页。第12页,共82页。第13页,共82页。第14页,共82页。如果P值大于α,在
成立的假设下发生较为可能的事件,没有充足的理由对
提出怀疑。于是做出不拒绝
的决策无论做出哪一种推断结论(接受或是拒绝
),都面临着发生判断错误的风险。这就是假设检验的两类错误第15页,共82页。第一节样本均数与总体均数的比较基本思想与步骤:1.假设检验:H0:总体均数为μ0,即μ=μ0H1:μ≠μ0.其对立假设H1包括μ>μ0和μ<μ0两种可能。一般情况下均采用双侧检验第16页,共82页。2.计算统计量推断样本来自的总体均数µ与已知的某一总体均数µ0(常为理论值或标准值)有无差别3.确定P值
P值的意义是:如果总体状况和
一致,统计量获得现有数值以及更不利于
的数值的可能性(概率)有多大第17页,共82页。第18页,共82页。第19页,共82页。第二节两相关样本均数的比较配对设计主要适用于以下情况:同一受试对象处理前后的比较,或两个部位的数据,(若为某种处理前后的数据,需要经历的处理时间较长,测量结果稳定)同一样品(或受试对象)用两种处理方法(或测量等)检测的结果;根据非处理因素配对后,两个受试对象分别接受两种不同处理的数据第20页,共82页。基本思想与步骤第21页,共82页。第22页,共82页。第23页,共82页。第24页,共82页。第25页,共82页。第26页,共82页。第三节两独立样本均数的比较第27页,共82页。基本思想和步骤第28页,共82页。例
某职防所测定了某工厂不同工种的两个车间的氟作业工人的尿氟含量(μmol/L),资料如下,问两车间的氟作业工人的尿氟含量有无差别?
甲车间:126.12143.20139.41161.11123.21110.3398.06151.4486.7631.56
乙车间:86.7193.14106.5190.11121.32116.1456.9278.7861.14100.30第29页,共82页。第30页,共82页。(二)两样本所属总体方差不等(Satterthwaite近似法)第31页,共82页。例
为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的20只大鼠随机分为两组。一组用硫酸氧钒治疗(DV组),另一组作对照观察(D组),12周后测大鼠血糖含量(mmol/L)。结果为,DV组12只,样本均数为6.5mmol/L,标准差为1.34mmol/L;D组8只,样本均数为13.7mmol/L,标准差为4.21mmol/L。试问两组动物血糖含量的总体均数是否相同?第32页,共82页。第33页,共82页。第34页,共82页。第四节t检验的应用条件
(一)图示法:P-Pplot,Q-Qplot
(二)矩法偏度系数(skewness),峰度系数(kurtosis)。(三)
W检验法第35页,共82页。(一)图示法期望概率(%)期望累计概率(%)
第36页,共82页。图100个样本均数的P-P图
P-P图第37页,共82页。图100个样本均数的Q-Q图Q-Q图第38页,共82页。1.矩法是利用数学上的矩原理来检验偏度和峰度。偏度指分布不对称的程度和方向,用偏度系数(coefficientofskewness)衡量,样本偏度系数用g1表示,总体偏度系数用
1表示;理论上,总体偏度系数
1=0为对称,1>0为正偏态,1<0为负偏态;(二)统计检验法第39页,共82页。总体峰度系数2=0为正态峰,2>0为尖峭峰,2<0为平阔峰;样本峰度系数用g2表示只有同时满足对称和正态峰两个条件时,才能认为资料服从正态分布。
第40页,共82页。检验偏度的统计量第41页,共82页。检验峰度统计量第42页,共82页。
例
试用矩法对表中计算机模拟抽样所得100个样本均数进行正态性检验。(1)建立检验假设,确定检验水准H0:
1=0且2=0,即总体服从正态分布H1:1
0或/和2
0,即总体不服从正态分布
=0.10(欲不拒绝H0,宜稍大以减少II型错误)
第43页,共82页。
(2)计算检验统计量(3)确定P值,作出推断结论峰度P>0.50,偏度P>0.50。按
=0.10水准,不拒绝H0,无统计学意义。还不能认为这些样本均数的总体不服从正态分布。
第44页,共82页。(三)W检验由Shapiro和Wilk于1965年提出,简称为W法,适用于小样本资料。计算时需要采用常数表,大样本时计算很复杂。【例7.6】用小鼠研究正常肝核糖核酸(RNA)对癌细胞的生物学作用,测定水层RNA诱导肝癌细胞的果糖二磷酸酯酶(FDP)活性的结果如下,请分析FDP活性是否服从正态分布?第45页,共82页。排序后的数据一分为二第46页,共82页。(一)F检验二、方差齐性第47页,共82页。第48页,共82页。方差齐性检验,采用两个方差比值F分布图,F值从0起,这张图的F值在计算时分子分母没有分大小,大的可以是分子,也可以为分母,
就是双侧检验但是为了简便起见,实际应用时仅给了大于等于1的界限值(0.025的界限值),只能将大的方差当分子。所以看起来是单侧检验,实际上理论基础是双侧检验第49页,共82页。
例
某口腔医院选择(吉林市)40-50岁慢性牙周炎患者536例,测得吸烟组(201人)菌斑指数(PLI)均值为84.71、标准差为8.14;非吸烟组(335人)菌斑指数的均值为82.20、标准差为6.18,两样本数据是否具有方差齐性(两总体方差相等)?第50页,共82页。第51页,共82页。第52页,共82页。第53页,共82页。第54页,共82页。第55页,共82页。第56页,共82页。第57页,共82页。第58页,共82页。常用的变量变换有对数变换、平方根变换、倒数变换、平方根反正弦变换等,应根据资料性质选择适当的变量变换方法
实际资料若不满足正态性或/和方差齐性的假定,尤其当是小样本资料时,这时如用一般的t检验可能会导致偏离真实结果较远。对于明显偏离上述应用条件的资料,可通过变量变换的方法加以改善
三、当资料不满足正态性和方差齐性条件的处理方法——变量变换59第59页,共82页。1.对数变换
X’=lgX
X’=lg(X+1),当原始数据较小或有0时
X’=lg(X+K)或X’=lg(K-X)
对数变换适用于:①对数正态分布资料②各样本标准差与均数成比例或变异系数是常数或接近某一常数的资料
60第60页,共82页。2.平方根变换
X’=
X’=或,当原始数据较小或有0时平方根变换适用用于:①服从Poisson分布的资料,也即各样本方差与均数成比例者②轻度偏态分布的资料
61第61页,共82页。3.平方根反正弦变换
(1)用角度表示:X’=sin-1
(2)用弧度表示:X’=()sin-1
,其中π为圆周率平方根反正弦变换适用于率或百分比的资料。4.倒数变换
X’=1/X
倒数变换适用于数据两端波动较大的资料
62第62页,共82页。一、假设检验的两类错误第四节假设检验中需注意的问题第63页,共82页。m=m0m1m>m0m0H1:m=m1>m0第64页,共82页。ab减少(增加)I型错误,将会增加(减少)II型错误增大n
同时降低a与bα与β间的关系第65页,共82页。第66页,共82页。二、正确理解P值的意义。P值很小时“拒绝H0,接受H1”,但是不要把很小的P值误解为总体参数间差异很大。拒绝H0只是说差异不为零,P值小只是说犯第Ⅰ类错误的机会远小于α何时用单侧检验,何时用双侧检验,根据专业知识、科学推理来决定,没有任何可参考的资料,用双侧稳妥第67页,共82页。第68页,共82页。(一)置信区间具有假设检验的主要功能如果无效假设
d=0,
1-2=0不在置信区间范围内,差别有统计学意义,否则,无统计学意义
配对资料差值
d双侧95%置信区间两独立样本资料总体均数差值(1-2)的双侧(1-)置信区间:
第69页,共82页。利用前例资料,估计儿童血红蛋白在健康教育干预措施前后差值的总体均数的可信区间为:
利用前例计算两个总体均数间差值的置信区间为:第70页,共82页。2.置信区间可提供假设检验没有提供的信息
图7-1置信区间可以提供的信息第71页,共82页。3.假设检验提供,而置信区间不提供的信息在统计推断结论为拒绝H0时,假设检验可以报告确切的P值,从而较为精确地说明检验结论的概率保证。置信区间只能在预先确定的置信度100(1-α)%水平上进行推断在不能拒绝H0的场合,假设检验可以对检验的功效做出估计,从而可以评价是否在识别差异能力较强的情形下不拒绝H0的。而置信区间并不提供这方面的信息置信区间与相应的假设检验既能提供相互等价的信息,又有各自不同的功能。把置信区间与假设检验结合起来,可以提供更为全面、完整的信息第72页,共8
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 环保矿物基泥丸颗粒生产项目可行性研究报告模板申批拿地用
- 2025年中国燕丝市场调查研究报告
- 河北省邯郸市四校联考2025-2026学年高一下学期6月阶段检测历史试题
- 2026年乡村党建阵地运维管理培训题库(附答案)
- 翻煤笼司机作业工序危险预知培训
- 汉光武帝刘秀与光武中兴
- 专题01 实数的有关概念与计算(53题)(学生版)(01期)
- 银行业专业人员初级职业资格考试(银行业法律法规与综合能力)试题及答案(黑龙江省2026年)
- 第1章 走近细胞 综合测试
- 2026届七台河市勃利县三年级数学第二学期期末统考试题(含解析)
- 2024年初中生物会考知识点汇编
- T-EJCCCSE 197-2025 系统窗施工技术规范
- 2025年高职院校基建处招聘面试实战模拟题集
- 施工单位竣工验收汇报总结
- 2025年重庆高一康德期末语文试卷及答案
- 肢体离断伤的急救处理
- JG/T 406-2013土木工程用玻璃纤维增强筋
- 《三只小猪》课本剧剧本:让学生体验角色扮演的乐趣(6篇)
- 哈利波特第一部中英对照
- 醉里乾坤大壶中日月长-初中语文九年级第六单元名著导读《水浒传》整本书阅读精读研讨课 公开课一等奖创新教学设计
- 外研版八年级下英语各模块知识点
评论
0/150
提交评论