《应用统计学》第8章:两个总体的假设检验_第1页
《应用统计学》第8章:两个总体的假设检验_第2页
《应用统计学》第8章:两个总体的假设检验_第3页
《应用统计学》第8章:两个总体的假设检验_第4页
《应用统计学》第8章:两个总体的假设检验_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,本章教学目标 掌握运用 Excel 的“数据分析”及其统计函数功能求解两个总体的假设检验问题。,第8章 两个总体的假设检验,2,本章主要内容:,8.1 案例介绍 8.2 两个独立正态总体均值的检验 8.3 成对样本试验的均值检验 8.4 两个正态总体方差的检验(F检验) 8.5 两个总体比例的检验 8.6 两个总体的假设检验小结,3,【案例1】新工艺是否有效? 某厂生产的一种钢丝的平均抗拉强度为 10560 (kg/cm2)。 现采用新工艺生产了一种新钢丝,随机抽取 10 根,测得抗拉强度为: 10512, 10623, 10668, 10554, 10776 10707, 10557, 10581, 10666, 10670 求得新钢丝的平均抗拉强度为 10631.4(kg/cm2)。 是否就可以作出新钢丝的平均抗拉强度高于原钢丝,即新工艺有效的结论?,8.1 案例介绍,4,为分析甲、乙两种安眠药的效果,某医院将20个失眠病人分成两组,每组10人,两组病人分别服用甲、乙两种安眠药作对比试验。试验结果如下: 两种安眠药延长睡眠时间对比试验(小时),(1)哪种安眠药的疗效好? (2)如果将试验方法改为对同一组10个病人,每人分别服用甲、乙两种安眠药作对比试验,试验结果仍如上表,此时结论如何?,案例1哪种安眠药的疗效好?,5,设总体 X1 N ( 1, 12),,X2N ( 2, 22),,且 X1和 X2 相互独立。,和 S12, S22 分别是,它们的样本的均值和样本方差,,样本容量分别为,n1和 n2。,原假设为,H0:1 = 2,8.2 两个独立正态总体均值的检验,6,可以证明,当 H0 为真时,统计量,其中:,完全类似地,可以得到如下检验方法:, t ( n1+n2-2 ),称为合并方差。,1. 12 = 22 = 2,,但 2 未知,( t 检验 ),7,测得甲, 乙两种品牌轿车的首次故障里程数数据如下: 甲品牌 X1:1200, 1400, 1580, 1700, 1900 乙品牌 X2:1100, 1300, 1800, 1800, 2000, 2400 设 X1和 X2 的方差相同。问在水平 0.05 下, (1)两种轿车的平均首次故障里程数之间有无显著差异? (2)乙品牌轿车的平均首次故障里程是否比甲品牌有显著提高?,【案例2】轿车质量差异的检验,8,解:,双边检验问题,S12=269.62,,S22=471.92,12 = 22 = 2 未知,,n1= 5,,H0:1= 2,H1:12。,由所给数据,可求得, | t | = 0.74, t/2 (n1+n2-2),= t0.025(9),故两种轿车的平均首次故障里程间无显著差异,,即两种轿车的该项质量指标是处于同一水平的。,n2= 6,,= 2.2622,9,(2)左边检验, t = - 0.74 -t(n1+n2-2) = -t0.05(9) = -1.833 故乙品牌轿车平均首次故障里程并不显著高于甲品牌。 显然,对给定的水平 ,若单边检验不显著,则双边检验肯定不显著。 但反之却不然,即若双边检验不显著,单边检验则有可能是显著的。,H1:12,10,用 Excel 检验两总体均值,可用 Excel 的【工具】“数据分析”“ t检验:双样本等方差假设”,检验 12=22= 2,但 2未知时两个总体的均值。,在Excel 的输出结果中: “P(T=t)单尾”,t (统计量),0,f (t),“P(T=t)单尾”的值(概率),单边检验达到的临界显著性水平;,“P(T=t)双尾”,双边检验达到的临界显著性水平。,由图可知:,P(T=t)双尾 = 2P(T=t)单尾,“P(T=t)单尾”和“P(T=t)双尾”统称为“ p 值 ”。,11,“P(T=t)单尾”与“P(T=t)双尾”的使用,从而,若 “P(T0.05,则结果为不显著; “P(T0.05; “P(T0.05, 故无论单边还是双边检验结果都不显著。,t,t,“P(T=t)单尾”,由图可知:,t t,等价于,“P(T=t)单尾” ,t t/2,等价于,“P(T=t)双尾” ,12,此时,可用 Excel 的【工具】“数据分析” “ t 检验:双样本异方差假设” 检验 1222且都未知时两个正态总体的均值。,2. 1222 且未知,13,为分析甲、乙两种安眠药的效果,某医院将20个失眠病人分成两组,每组10人,两组病人分别服用甲、乙两种安眠药作对比试验。试验结果如下: 两种安眠药延长睡眠时间对比试验(小时),(1)两种安眠药的疗效有无显著差异? (2)如果将试验方法改为对同一组10个病人,每人分别服用甲、乙两种安眠药作对比试验,试验结果仍如上表,此时两种安眠药的疗效间有无差异?,【案例1】哪种安眠药的疗效好?,14,(1)设服用甲、乙两种安眠药的延长睡眠时间分别为X1, X2,,故不能拒绝H0,两种安眠药的疗效间无显著差异。 用Excel 求解本案例,S22=1.7892,S12=2.0022,,案例 1 解答,X1N( 1, 2),,X2N( 2, 2),,n1 = n2 =10。,由试验方法知 X1, X2 独立。,H0:1=2,H1:12 由表中所给数据,可求得:,15,故两种安眠药疗效间的差异是高度显著的!,= 4.0621,8.3 成对样本试验 案例 1 (2)解答,由于此时 X1, X2 为同一组病人分别服用两种安眠,药的疗效,,因此 X1, X2 不独立,,属于成对样本试验。,对于这类“成对样本试验”的均值检验,,应当化,为单个正态总体的均值检验。,方法如下:,设 X=X1-X2,(服用甲、乙两种安眠药延长睡眠时,间之差),,则 XN ( , 2 )。,H0: = 0,,H1:0,由表中所给数据,可求得,S =1.23,,n =10, t 0.005(9) = 3.2498,16,可用 Excel 的【工具】“数据分析”“ t检验:平均值的成对二样本分析” 进行成对样本试验的均值检验。,用 Excel 求解,本例中“P(T=t)双尾”= 0.0028 0.01, 故两种安眠药的疗效间存在高度显著差异。,17,1. F 分布,设 X 2(n1),,Y 2(n2),,且 X 和 Y 相互独立,,则随机变量,服从自由度为( n1, n2 )的 F 分布,,记为,F F ( n1, n2 ),n1 为第一(分子的)自由度,,n2 为第二(分母的)自由度。,8.4 两个正态总体方差的检验,18,F 分布密度函数的图形,x,f (x),0,n1=20, n2=10,n1=20, n2=25,n1=20, n2=100,19,F 分布的右侧 分位点 F ( n1, n2 ),F 分布的右侧 分位点为满足 P F F ( n1, n2 ) = 的数值 F (n1, n2)。,F( n1, n2 ),F (n1, n2)有以下性质: F1- (n1, n2)=1/F(n2, n1) 利用上式可求得 F 分布表中未给出的 值的百分位点。,如 F0.95(10, 15) = 1/F0.05(15, 10),20,可用 Excel 的统计函数 FINV 返回 F(n1,n2)。 语法规则如下: 格式:FINV( , n1, n2 ) 功能: 返回 F ( n1, n2 )的值。,用 Excel 求 F( n1, n2 ),21,2. 两总体方差的检验 ( F 检验 ),原假设为 H0:12=22。,完全类似地,可以得到如下检验方法:, F ( n1-1, n2-1 ),当 H0为真时,,统计量,22,【例2】在 0.20下,检验【案例3】中两个正态总体的方差是否存在显著差异。,解:由题意,H0:12=22,H1:1222,n1=5,n2=6 由例5的计算结果,S12=269.62,S22=471.92,= 0.326,F/2(n1-1, n2-1),= F0.1(4, 5),= 3.52,F1-/2(n1-1, n2-1),= F1-0.1(4, 5),=1/F0.1(5, 4),=1/4.05,= 0.247,F = 0.326,F1-0.1(4, 5) = 0.247, F0.1(4, 5) = 3.52,故在水平 = 0.20下,,12 与 22 间无显著差异。,可知案例4 中关于 12 = 22 的假定是合理的。 思考题:本例中为什么要将 取得较大?,23,可用 Excel 的【工具】“数据分析” “F检验: 双样本方差” 检验两个正态总体是否是同方差的。 在 Excel 的输出结果中 “P(F=f)单尾”与“P(T=t)单尾”的含义是相同的,即 p 值。,用 Excel 求解,本例中“P(F 0.20 故在在水平 0.20下,12 与 22 间无显著差异。,24,8.5 大样本两个总体比例的检验,设 P1, P2 分别是两个独立总体的总体比例,,原假设为,H0: P1 = P2,设 p1, p2 分别是它们的样本比例,,n1, n2 分别是它们的,样本容量。,则在大样本的条件下,,统计量,由此,可以得到如下检验方法:,25,【案例3】女企业家对成功的理解是否不同,对女企业家进行了一项研究来看她们对成功的理解。给她们提供了几个备选答案,如快乐/自我实现,销售/利润,成就/挑战。根据她们业务的总销售额将其分为几组。销售额在100万500万元的为一组,少于100万元的为另一组,要研究的问题是:把销售/利润作为成功定义的比率,前一组是否高于后一组? 假定我们以总销售额对女企业家进行定位。我们采访了100名总销售额低于100万元的女企业家,她们中有24个将销售/利润定义为成功。随后我们又采访了95名总销售额在100万500万元的女企业家,其中有39人把销售/利润定义为成功。问在显著性水平0.01下,两组中将销售/利润定义为成功的比率是否有显著的差异。,26,两个总体的假设检验小结,27,小样本总体比例值的参数检验问题(补充),【案例】招聘测试问题 某公司人力资源部要要招聘若干名某专业领域的工程师。出了10道选择题,每题有4个备选答案,其中只有一个是正确地。或者说,正确的比率只有0.25。问至少应当答对几道,才能考虑录取? 分析:总体是01分布,B(1,p)。应聘者答对了X取值为1;答错了,X取值为0。一个完全瞎猜的应聘者,答对的概率应当是0.25,即p=0.25。,28,29,课堂练习 1 解答,故 2 的 95% 置信区间为 (0.00016, 0.00114),30,课堂练习 2 解答,故 的 95% 置信区间为,31,课堂练习 3 解答,由所给数据,,可求得,S = 0.00554, H0: = 0.5,H1:0.5,, = 0.20,/2 = 0.10,拒绝 H0,,包装机重量设定不正确,,应重新调整。,由于对于本问题,,犯第一类错误,(包装机重量设定,正确但判定不正确),的损失很小;,而犯第二类错误,(包装机重量设定不正确但判定正确),的损失很大,,因此应控制犯第二类错误的概率,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论