统计学课后习题答案全章节_第1页
统计学课后习题答案全章节_第2页
统计学课后习题答案全章节_第3页
统计学课后习题答案全章节_第4页
统计学课后习题答案全章节_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章、练习题及解答2.为了确定灯泡的使用寿命(小时) ,在一批灯泡中随机抽取 100 只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718706 715 712 722 691 708 690 692 707 701708 729 694 681 695 685 706 661 735 665668 710 693 697 674 658 698 666 696 698706 692 691 747 699 682 698 700 710 722694 690 736 689 696 651 673 749 708 727688 689 683 685 702 741 698 713 676 702701 671 718 707 683 717 733 712 683 692693 697 664 681 721 720 677 679 695 691713 699 725 726 704 729 703 696 717 688要求: (2)以组距为 10 进行等距分组,生成频数分布表,并绘制直方图。灯泡的使用寿命频数分布表分组 频数(只) 频率(%)650-660 2 2660-670 5 5670-680 6 6680-690 14 14690-700 26 26700-710 18 18710-720 13 13720-730 10 10730-740 3 3740-750 3 3合计 100 1003.某公司下属 40 个销售点 2012 年的商品销售收入数据如下: 单位:万元152 124 129 116 100 103 92 95 127 104105 119 114 115 87 103 118 142 135 125117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。(2)制作茎叶图,并与直方图进行比较。2解:(1) 频数分布表分组 频数(个) 频率(%)85-95 3 7.595-105 6 15.0105-115 9 22.5115-125 11 27.5125-135 4 10.0135-145 5 12.5145-155 2 5.0合计 40 100(2)茎叶图树茎 树叶 数据个数891011121314157825703345578802345567789903456795678262239127421第三章、练习题及解答1. 已知下表资料:日产量(件) 工人数(人) 工人比重(%)25303540452050803614102540187合 计 200 100试根据频数和频率资料,分别计算工人平均日产量。解: 计算表日产量(件)x工人数(人)f工人比重(%) xf xf/f3f/f25 20 10 500 2.530 50 25 1500 7.535 80 40 2800 1440 36 18 1440 7.245 14 7 630 3.15合 计 200 100 6870 34.35根据频数计算工人平均日产量: (件)68034.52xf根据频率计算工人平均日产量: (件).fA结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。2.某企业集团将其所属的生产同种产品的 9 个下属单位按其生产该产品平均单位成本的分组资料如下表:单位产品成本(元/件) 单位数 产量比重(%)101212141418234204238合计 9 100试计算这 9 个企业的平均单位成本。解:单位产品成本(元/件) 单位数产量比重(%)f/f组中值(元)x Xf/f1012 2 20 11 2.21214 3 42 13 5.461418 4 38 16 6.08合计 9 100 - 13.74这 9 个企业的平均单位成本= =13.74(元)fxA3.某专业统计学考试成绩资料如下:按成绩分组(分) 学生数(人)60 以下6070708080909010048142094100 以上 5合 计 60试计算众数、中位数。解:众数的计算:根据资料知众数在 8090 这一组,故 L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9,1mo mfMLdf(分)2048083.59中位数的计算:根据 和向上累积频数信息知,中位数在 8090 这一组。6032f(分)1meefSMLd30268184.利用练习题 1 题资料计算 200 名工人日产量的标准差,并计算离散系数。 (只按照频数计算即可)解: 计算表日产量(件)x工人数(人)f2()xf25 20 1748.4530 50 946.12535 80 33.840 36 1149.2145 14 1587.915合 计200 5465.522546.27.350xf27.3.55.2310%105.23%4vx5.一家公司在招收职员时,首先要通过两项能力测试。在 A 项测试中,平均分数是 80 分,标准差是 15 分;在 B 项测试中,平均分数是 200 分,标准差是 50 分。一位应试者在 A 项测试中得了 95 分,在 B 项测试中得了 225 分。与平均分数相比,该位应试者哪一项测试更为理想?解:计算各自的标准分数: ,95801Az250.BZ因为 A 测试的标准分数高于 B 测试的标准分,所以该测试者 A 想测试更理想。第四章、练习题及解答1. 随机变量 服从标准正态分布,求以下概率:Z(1) ;(2) ;(3) 。).10(P)048.(ZP)3.1(ZP2. 由 30 辆汽车构成的一个随机样本,测得每百公里的耗油量(单位:升)数据如下:9.19 10.01 9.60 9.27 9.78 8.829.63 8.82 10.50 8.83 9.35 8.6510.10 9.43 10.12 9.39 9.54 8.519.7 10.03 9.49 9.48 9.36 9.1410.09 9.85 9.37 9.64 9.68 9.75绘制频数分布直方图,判断汽车的耗油量是否近似服从正态分布。3. 从均值为 200、标准差为 50 的总体中,抽取 的简单随机样本,用样本均值10n估计总体均值。x(1) 的期望值是多少?(2) 的标准差是多少?(3) 的概率分布是什么?xx4. 从 =0.4 的总体中,抽取一个容量为 500 的简单随机样本,样本比例为 。 p(1) 的期望值是多少?(2) 的标准差是多少?(3) 的概率分布是什么?pp5. 假设一个总体共有 6 个数值:54,55,59,63,64,68。从该总体中按重置抽样方式抽取 的简单随机样本。n(1)计算总体的均值和方差。(2)一共有多少个可能的样本?(3)抽出所有可能的样本,并计算出每个样本的均值。(4)画出样本均值的频数分布直方图,判断样本均值是否服从正态分布。(5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得到的结论是什么?第四章习题答案1.解:由于 Z 服从标准正态分布,查表得, ,0.5)(NORMSDIT0.8491.2)(NORMSDIT, ,684)( .)(9213)(6(1) 0.38495-0.8491.2)2.0( )()( NORMSDITNORSDITZP(2) .1.1-0 048 )()( )()()( ISI(3) 098)3.()3.1(3.1 RTZPZP)(2.解:对数据进行整理,30 个样本数据极差为 1.99。将数据分为 7 组,组距为 0.3,如下表所示:分组 频数8.51-8.80 28.81-9.10 39.11-9.40 79.41-9.70 99.71-10.00 310.01-10.30 510.31-10.60 1对应频数直方图为:观察上图,数据基本上拟合正态分布曲线,可以认为汽车耗油量基本服从正态分布。3.解:已知: , ,同时由于样本量很大,可以看作重10n ,22502置抽样来处理。根据公式 4.5 可以得到:(1) )(Ex(2) ,25102nx52xx(3)根据中心极限定理, 近似服从均值为 200,标准差为 5 的正态分布。4.解:已知: ,同时由于样本量很大,可以看作重置抽样来处理。 ,4.根据公式 4.7 可以得到:(1) .0)(Ep(2) , ;481n0219.p(3)根据中心极限定理,p 近似服从均值为 0.4,标准差为 0.0219 的正态分布。5.解:(1) ,5.084359461 Nxi7;9167.24)(612Nxii917.42(2)由于从总体中重置抽取的样本,考虑抽取顺序情况下共有 种可能样本。362(3)如下表所示:样本序号 样本单位 样本均值 x样本序号 样本单位 样本均值 x1 54,54 54 19 63,54 58.52 54,55 54.5 20 63,55 593 54,59 56.5 21 63,59 614 54,63 58.5 22 63,63 635 54,64 59 23 63,64 63.56 54,68 61 24 63,68 65.57 55,54 54.5 25 64,54 598 55,55 55 26 64,55 59.59 55,59 57 27 64,59 61.510 55,63 59 28 64,63 63.511 55,64 59.5 29 64,64 6412 55,68 61.5 30 64,68 6613 59,54 56.5 31 68,54 6114 59,55 57 32 68,55 61.515 59,59 59 33 68,59 63.516 59,63 61 34 68,63 65.517 59,64 61.5 35 68,64 6618 59,68 63.5 36 68,68 68(4)样本均值频数表:分组 频数54-56 456-58 458-60 960-62 762-64 764-66 366-68 2样本均值频数直方图:801234567891054-56 56-58 58-60 60-62 62-64 64-66 66-68由上图可以发现,样本均值近似服从正态分布;(5)由样本方差均值公式可以得到: 5.603217836ix;12.4836.)(6122iixx nxx 52963.可以看出,样本均值与总体均值很接近,样本标准差则比总体方差小。第五章、练习题及解答1. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期三周的时间里选取 49 名顾客组成了一个简单随机样本。(1)假定总体标准差为 15 元,求样本均值的抽样标准误差;(2)在 95%的置信水平下,求估计误差;(3)如果样本均值为 120 元,求快餐店所有顾客午餐平均花费金额的 95%的置信区间。2. 利用下面的信息,构建总体均值 的置信区间。(1)总体服从正态分布,且已知 ,置信水平为 95%。15,0,89nx(2)总体不服从正态分布,且已知 ,置信水平为 95%。3(3)总体不服从正态分布, 未知, ,置信水平为 90%。,sx(4)总体不服从正态分布, 未知, ,置信水平为 99%。509n3. 某大学为了解学生每天上网的时间,在全校学生中随机抽取 36 人,调查他们每天上网9的时间,得到下面的数据(单位:小时) ;3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.24.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.32.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.54.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5求该校大学生平均上网时间的置信区间,置信水平分别为 90%,95%和 99%。4. 某居民小区共有居民 500 户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。重置随机抽取了 50 户,其中有 32 户赞成,18 户反对。(1)求总体中赞成新措施的户数比例的置信区间,置信水平为 95%。(2)如果小区管理者预计赞成的比例能达到 80%,要求估计误差不超过 10%。应抽取多少户进行调查?5. 顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与很多因素有关,比如,银行的业务员办理业务的速度、顾客等待排队的方式,等等。为此,某银行准备采取两种排队方式进行试验。第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取 10 名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:方式 1 6.5 6.6 6,7 6.8 7.1 7.3 7.4 7.7 7.7 7.7方式 2 4.2 5.4 5.8 6.2 6.7 7.7 7.7 8.5 9.3 10.0(1)构建第一种排队方式等待时间标准差的 95%的置信区间。(2)构建第二种排队方式等待时间标准差的 95%的置信区间。(3)根据(1)和(2)的结果,你认为哪种排队方式更好?6. 两个正态总体的方差 和 未知但相等。从两个总体中分别抽取两个独立的随机样21本,它们的均值和标准差如下:来自总体 1 的样本 来自总体 2 的样本4n7n2.531x4.32x8.96s 0.1s求 的置信区间,显著性水平分别为 95%和 99%。)-(217. 一家人才测评机构对随机抽取的 10 名小企业的经理人用两种方法进行自信心测试,得到的自信心测试分数如下:人员编号 1 2 3 4 5 6 7 8 9 1010方法 1 78 63 72 89 91 49 68 76 85 55方法 2 71 44 61 84 74 51 55 60 77 39构建两种方法平均自信心得分之差 的 95%的置信区间。21-d8. 从两个总体中各抽取一个 的独立随机样本,来自总体 1 的样本比例为5021n,来自总体 2 的样本比例为 。%401p %32p构造 的置信区间,置信水平分别为 90%和 95%。)-(29. 生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对工序进行改进以减小方差。下表是两部机器生产的袋茶重量(单位:克)的数据:机器 1 机器 23.45 3.22 3.90 3.22 3.28 3.353.20 2.98 3.70 3.28 3.19 3.303.22 3.75 3.28 3.30 3.20 3.053.50 3.38 3.35 3.30 3.29 3.332.95 3.45 3.20 3.34 3.35 3.273.16 3.48 3.12 3.28 3.16 3.283.20 3.18 3.25 3.30 3.34 3.25构造两个总体方差比 的 95%的置信区间。21/10.某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120 元,现要求以 95%的置信水平估计每个顾客平均购物金额的置信区间,并要求估计误差不超过 20 元,应抽取多少个顾客作为样本?11.假定两个总体的标准差分别为: , ,若要求估计误差不超过 5,相应125的置信水平为 95%,假定 ,估计两个总体均值之差 时所需的样本量为1n)-(21多大?12.假定 ,估计误差为 0.05,相应的置信水平为 95%,估计两个总体比例之差21n时所需的样本量为多大?)-(第五章课后习题参考答案1.解:(1)已知 ,故: ;49n15,1429.75nx(2)由题目可知: ,故查表可知:0.6.025.Z估计误差 ;4.21962xZ11(3)由题目可知: ,由置信区间公式可得:120x)2.4,85(.42Zx即快餐店所有顾客午餐平均花费金额的 95%的置信区间为(115.8,124.2)元。2.解:(1)总体服从正态分布, ,则 的 95%置信区间为:96.1025.Z)9153.048,846.2(892xZ(2)总体不服从正态分布,且样本属于大样本, ,则 的 95%置信区05.2Z间为: )602.9,348.7(51.4896.802xZ(3)总体不服从正态分布, 未知,因此使用样本方差代替总体方差,则 的 90%置信区间为:645.10.2Z )0278.39,7.608(514.6.8902 nsx(4)总体不服从正态分布, 未知,因此使用样本方差代替总体方差, ,则 的 95%置信区间为:6.1025.Z )6502.9,348.7(51.4896.802 nsx3.解:整理数据可以得到 , , ,由36.nx 93.1(nxs于 属于大样本,所以使用正态分布来构建置信区间。36n当 ,该校大学生平均上网时间的 90%置信区间为:45.10.2Z小时)759.3,8.2(6.045.1367.2 nsx当 ,该校大学生平均上网时间的 95%置信区间为:9.105.2Z小时)842.3,7910.(268.09.1367.2 nsx当 ,该校大学生平均上网时间的 95%置信区间为:58.0.2Z小时)089.4,62.(8.05.23167.2 nsx124.解:(1)由题目可知: , , ,由于抽取的样50n64.032p0679.)1(npp本属于大样本,所以 ,总体中赞成新措施的户数比例的 95%置信区间为:9.12.Z ),( 0.731.5690.764.)(2 npp(2)由题目可知:估计误差 , ,1.%)1(2npZd 8.p,得到:96.1025.Z 1.0)(2npZ8-96.1)( n53.即样本个数至少为 62 户。或直接将 带入 n 确定的公式,即,.0d 624.11.0)8.(96.)1()22/ zn5.解:(1)整理数据可以得到: , , ,由于抽取的样本属于n5.71x7.021s小样本,所以由 CHIINV 函数得: , ,89)(20. 704.2)9(275.01由此可以得到第一种排队方式等待时间标准差的 95%的置信区间为: 2121)()(snsn87.03.(2)整理数据可以得到: , , ,第二种排队方式等待10n52x3.2s时间标准差的 95%的置信区间为: 212)()(sns133.25.1(3)比较两种方法的标准差置信区间,第一种方法的置信区间更小,说明第一种方法等待时间的离散程度更小,比第二种方式好。6.解:由题目可以得到: 9218.)()(21nsssw当 , 的 95%置信区间为:093.)2(975.012tnt -1)4129.,87.0(149288)()( 21975.01 nstxw当 , 的 95%置信区间为:609.)()2(95.012tnt )-(21)938.,.( 714928.860.4.3.1)25.01 nstxw7.解:由样本数据计算得到:, ,10d 53.610841)(2dniids 26.)10(2t则自信心得分之差 的 95%的置信区间为:2-)67.15,3(67.41053.6.1)9(025. nstdd8.解:由题目可以得到: , , , 21.1p.2当 , 的 90%置信区间为:64.95.02Z)-(%)98.16,02.3()(2195.021 nZp当 , 的 95%置信区间为:6.975.02Z)-(21)32.18,64.()(21975.021 nppZp9.解:由题目可以得到: , , ,21n05837.s05.2s,46.),(),(025.212FnF 4058.)2,()1,(97.12 FF14两个总体方差比 的 95%的置信区间为:21/)1,()1,( 21212212 nFsnFs 3.74.72110.解:由题目可以得到:使用过去经验数据,则可以认为 已知,即 ,在 95%120置信度下 ,估计误差 ,因此:96.1025.Z 02nZ975.0216.n97.38即样本个数至少为 139 个。11.解:由题目可以得到:总体 已知,即 , , ,在 95%置信125n21度下 ,估计误差 ,因此:96.1025.Z 212nZ521025. 96.n702.5即两个总体的样本各至少为 57 个。第六章、练习题及解答1. 一项包括了 200 个家庭的调查显示,每个家庭每天看电视的平均时间为 7.25 小时,标准差为 2.5 小时。据报道,10 年前每天每个家庭看电视的平均时间是 6.70 小时。取显著性水平 ,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加01.了”?2. 为监测空气质量,某城市环保部门每隔几周即对空气烟尘质量进行一次随机测试。已知该城市过去每立方米空气中悬浮颗粒的平均值是 82 微克。在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值(单位:微克)如下:1581.6 86.6 80.0 85.8 78.6 58.3 68.7 73.296.6 74.9 83.0 66.6 68.6 70.9 71.1 71.677.3 76.1 92.2 72.4 61.7 75.6 85.5 72.574.0 82.5 87.0 73.2 88.5 86.9 94.9 83.0根据最近的测量数据,当显著性水平 时,能否认为该城市空气中悬浮颗粒的01.平均值显著低于过去的平均值?3. 安装在一种联合收割机上的金属板的平均重量为 25 公斤。对某企业生产的 20 块金属板进行测量,得到的重量(单位:公斤)数据如下:22.6 27.0 26.2 25.8 22.226.6 25.3 30.4 23.2 28.123.1 28.6 27.4 26.9 24.223.5 24.5 24.9 26.1 23.6假设金属板的重量服从正态分布,在 显著性水平下,检验该企业生产的金属05.板是否符合要求。4. 对消费者的一项调查表明,17的人早餐饮料是牛奶。某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。为验证这一说法,生产商从该城市随机抽取 550人,调查知其中 115 人早餐饮用牛奶。在 显著性水平下,检验该生产商的说05.法是否属实。5. 某生产线是按照两种操作平均装配时间之差为 5 分钟而设计的,两种装配操作的独立样本产生如下结果:操作 A 操作 B10n 502n分钟8.4x 分钟4.1x分钟1s 分钟62s在 的显著性水平下检验平均装配时间之差是否等于 5 分钟。05.6. 某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。潜在购买力的分值为 010分,分值越高表示潜在购买力越高。原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。对 的显著性5.水平,用下列数据检验该假设,并对该广告给予评价。购买力得分 购买力得分个体看后 看前 个体 看后 看前1 6 5 5 3 52 6 4 6 9 83 7 7 7 7 54 4 3 8 6 6167. 某企业为比较两种方法对员工进行培训的效果,采用方法 1 对 15 名员工进行培训,采用方法 2 对 12 名员工进行培训。培训后的测试分数如下:方法 1 方法 256 51 45 59 57 5347 52 43 52 56 6542 53 52 53 55 5350 42 48 54 64 5747 44 44两种方法培训得分的总体方差未知且不相等。在 的显著性水平下,检验两种05.方法的培训效果是否有显著差异。8. 为研究小企业经理是否认为他们获得了成功,在随机抽取的 100 个小企业的女性经理中,认为自己成功的人数为 24 人;而在对 95 个男性经理的调查中,认为自己成功的人数为 39 人。在 的显著性水平下,检验男女经理认为自己成功的人数比例是05.否有显著差异。9. 为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者选择了面积相等、土壤等条件相同的 40 块田地,分别施用新旧两种肥料,得到的产量数据如下:旧肥料 新肥料109 101 97 98 100 105 109 110 118 10998 98 94 99 104 113 111 111 99 112103 88 108 102 106 106 117 99 107 11997 105 102 104 101 110 111 103 110 119取显著性水平 ,检验:05.(1)新肥料获得的平均产量是否显著地高于旧肥料?假定条件为:两种肥料产量的方差未知但相等,即 。21两种肥料产量的方差未知且不相等,即 。2(2)两种肥料产量的方差是否有显著差异?10.生产工序中的方差是工序质量的一个重要测度,通常较大的方差就意味着要通过寻找减小工序方差的途径来改进工序。某杂志上刊载了关于两部机器生产的袋茶重量(单位:克)的数据如下,检验这两部机器生产的袋茶重量的方差是否存在显著差异。()05.2.95 3.45 3.50 3.75 3.48 3.26 3.33 3.203.16 3.20 3.22 3.38 3.90 3.36 3.25 3.283.20 3.22 2.98 3.45 3.70 3.34 3.18 3.35机器 13.123.22 3.30 3.34 3.28 3.29 3.25 3.30 3.273.38 3.34 3.35 3.19 3.35 3.05 3.36 3.28机器 23.30 3.28 3.30 3.20 3.16 3.3317第六章课后习题参考答案1.解:由题目可以得到: , ;20n5.提出原假设与备择假设: , ;76:H7.6:1该检验属于右侧单边检验,因此得到拒绝域为: ;326.9.01zW在大样本条件下检验统计量为: ,落入拒绝域中,因32560nxz此拒绝原假设,认为如今每个家庭每天收看电视的平均时间较十年前显著增加了。(或利用 Excel 的“1-NORMSDIST(3.1113)”函数得到检验 P=0.00090.05,则不能拒绝原假设)4.解:由题目可以得到: ,计算样本数据得到 ;50n %91.2050np提出原假设与备择假设: , ;%17:H17:18该检验属于右侧单边检验,因此得到拒绝域为: ;96.1025.zW在大样本条件下检验统计量为: ,落入拒绝域中,.41.2)1(0npz因此拒绝原假设,认为生产商的说法属实,该城市的人早餐饮用牛奶的比例高于 17%。(或利用“1-NORMSDIST(2.4412)”函数得到检验 P=0.00730.05,则拒绝原假设)5.解:提出原假设与备择假设: , ;5:210H5:21在大样本条件下检验统计量为: 40.)()(21nsxz利用“2*(1-NORMSDIST(5.1450)”函数,得到双尾 值为 ,由于P71652.,拒绝原假设,认为两种装配操作的平均装配时间之差不等于 5 分钟。05.P6.解:设:“看后”平均得分为 , “看前”平均得分 , “看后”平均得分与“看前”12平均得分之差为 ;d提出原假设与备择假设: , ;0:210H0:21根据样本数据计算得到: , ;65.1ndni 3025.1)(12ndsniid在配对的小样本条件下检验统计量为: 372.80.t利用 Excel “=TDIST(1.3572, 7, 1)”得到的单尾概率 值为 0.10842,由于P,不能拒绝原假设,没有证据表明广告提高了平均潜在购买力得分。05.P7.解:设:方法一培训测试平均得分为 ,方法二培训测试平均得分为 ;12提出原假设与备择假设: , ;0:20H0:21根据样本数据计算得到:, , , , ,15n273.41x5.62x495.21s27.18s由于小样本情况下总体方差未知且不相等,t 分布自由度为:19241-)(2121ns在小样本条件下检验统计量为: 2183.5)-()-(21nsxt利用 Excel 的“=TDIST(5.2183, 24, 2)”函数,得到的双尾概率 值为 0.00002,由P于 ,拒绝原假设,认为两种培训方法的效果存在显著差异。05.P8.解: 设:男性经理认为自己成功的人数比例为 , 女性经理认为自己成功的人数比1例为 ,两个样本合并后得到的合并比例为 ;2p提出原假设与备择假设: , ;0:210H0:21根据样本数据计算得到:两个样本的比例分别为: 41, 242p两个样本合并后得到的合并比例 ;%31.21np检验统计量为: 57.12)-p)(z利用 Excel 的“=2*(1-NORMSDIST(2.5373)”函数,得到检验概率 值为 0.0112,由P于 ,所以拒绝原假设,认为男女经理认为自己成功的人数比例具有显著差异。05.P9.解:设:新肥料获得的平均产量为 ,旧肥料获得的平均产量为 ;12(1)两种肥料产量的方差未知但相等,即 时:2提出原假设和备择假设: ; 0:0: 21210 H;根据样本数据计算得:, , , , , ;201n9.1x7.2x3579.21s158.24s总体方差的合并估计量为:3685.-)()(2122nsssp20检验统计量为: 4271.51)-()-(21nsxtp利用 Excel 的“=TDIST(5.4271, 38, 1)”函数,得到单尾概率 值为 0.000002,由P于 ,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。05.P(以上也可由 Excel 中的t-检验:双样本等方差假设给出)两种肥料产量的方差未知且不相等,即 时:21提出原假设与备择假设: ;0:0: 2120 H;根据样本数据计算得到:, , , , ,201n9.1x7.2x3579.21s158.24s由于小样本情况下总体方差未知且不相等,t 分布自由度为:371-)(22121ns在小样本条件下检验统计量为: 4271.5)-()-(21nsxt利用 Excel 的“=TDIST(5.4271, 37, 1)”函数,得到单尾概率 值为 0.000002,由P于 ,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。05.P(以上也可由 Excel 中的t-检验:双样本异方差假设给出)(2)设:使用新肥料的田地为样本 1,使用旧肥料的田地为样本 1提出原假设与备择假设: ;:20H:21利用 Excel 中的“ -检验:双样本方差” ( )得到的检验结果如下表所示:F05.F-检验 双样本方差分析变量 1 变量 2平均 109.9 100.7方差 33.35789 24.11579观测值 20 20df 19 19F 1.383239 P(F=f) 单尾 0.24311 21F 单尾临界 2.526451 由于 ,不能拒绝原假设,没有证据表明两种肥料产量的方差05.4861.02P有显著差异。10.解:设:机器一为样本 1,机器二为样本 1提出原假设与备择假设: ;:210H:2利用 Excel 的“ -检验:双样本方差” ( )得到的检验结果如下表所示:F05.F-检验 双样本方差分析变量 1 变量 2平均 3.3284 3.278181818方差 0.048889 0.005901299观测值 25 22df 24 21F 8.284447623P(F=f) 单尾 3.61079E-06F 单尾临界 2.367525575 由于 ,拒绝原假设,认为两种肥料产量的方差有显著差05.07.2P异。第七章、练习题及解答1.从某市的三个小学中分别抽若干名 5 年级男生,测量其身高,数据如下,小学 身高(cm)大成小学平明小学师范附小128 135 148 152 146 135 148145 156 162 157 136145 136 139 148 164 142试检验不同小学 5 年级男生身高有无显著差别( =0.05)解:设三个小学的 5 年级男生的平均身高分别为 。321,提出假设: 0123:H不全相等 ,由 Excel 输出的方差分析表如下:差异源 SS df MS F P-value F crit组间 262.4381 2 131.219 1.388501 0.279734 3.68232组内 1417.562 15 94.50413总计 1680 17 P-value=0.279734 =0.05,(或者 F=1.388501F crit=3.68232) ,不能拒绝原假设,22没有证据表明该市 3 所小学 5 年级的男生身高有显著差异。2.某家电制造公司准备购进一批 5#电池,现有 A、 B、 C 三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取 5 只电池,经试验得其寿命(小时)数据见下表:电池生产企业试验号A B C1 50 32 452 50 28 423 43 30 384 40 34 485 39 26 40试分析三个企业生产的电池的平均寿命之间有无显著差异?如果有差异,用 LSD 方法检验哪些企业之间有差异? ( =0.05)解:A、B、C 三个企业生产的电池的平均寿命分别为 。321,提出假设: 0123:H不全相等,由 Excel 输出的方差分析表如下:方差分析差异源 SS df MS F P-value F crit组间 615.6 2 307.8 17.06839 0.00031 3.885294组内 216.4 12 18.03333总计 832 14 P-value=0.00031 =0.05(或 F=17.06839F crit=3.885294),拒绝原假设。表明电池的平均寿命之间有显著差异。为判断哪两家企业生产的电池平均寿命之间有显著差异,首先提出如下加红色:检验 1: 01212:;:H检验 2: 33检验 3: 0212:;:然后计算检验统计量: 421x863.2计算 LSD。根据方差分析表可知,MSE=18.03333.根据自由度=n-k=15-3=12.查 t 分布23表得 计算的 LSD 如下:.179205.2/t 85.)(3LSD作出决策。LSD=5.85,拒绝原假设。企业 A 与企业 B 电池的平均421x使用寿命之间有显著差异。LSD=5.85,不拒绝原假设。没有证据表明企业 A 与1631企业 C 电池的平均使用寿命之间有显著差异。LSD=5.85,拒绝原假设。企业 B 与企业 C 电池的平.02均使用寿命之间有显著差异。3.某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了 30 名工人,平均分为三组,并指定每组使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果。差异源 SS df MS F P-value F crit组间 (420) (2) 210 (1.478)0.245946 3.354131组内 3836 (27) (142.07) - - -合计 (4256) 29 - - -要求:(1)完成上面的方差分析表。(2)检验三种方法组装的产品数量之间是否有显著差异? ( =0.05)解:(1)差异源 SS df MS F P-value F crit组间 (420) (2) 210 (1.478)0.245946 3.354131组内 3836 (27) (142.07) - - -合计 (4256) 29 - - -(2)由方差分析表可知:P-value=0.245946 =0.05,(或 F=1.478F crit=3.354131,不能拒绝原假设。没有证据表明三种方法组装的产品数量之间有显著的差异。4.某农场在不同的地块试种四个品种的谷子,试验数据如下(单位:千克/亩) ,试检验地块类型和谷子品种是否对平均亩产量有影响(0.05) 。太行 2 号 冀丰 2 号 冀丰 3 号 农科 9 号 农科 12 号洼地坡地平地225156320210198351198265298152210302205236261解:设不同地块的平均亩产量分别为: 321,提出假设: 0123:H24不全相等123:,H设不同品种的平均亩产量分别为 54321,提出假设: 43210:不全相等,5由 Excel 输出的方差分析表如下:方差分析差异源 SS df MS F P-value F crit行 34498.53 2 17249.27 11.74471 0.004166 4.45897列 2329.733 4 582.4333 0.396568 0.806054 3.837853误差 11749.47 8 1468.683总计 48577.73 14 P-value=0.00140.05(或 F=11.74471 F crit=4.45897),拒绝原假设。表明不同品种的种子对亩产量的影响显著。P-value=0.8060540.05(或 F=0.396568F crit=3.837853),不拒绝原假设。没有证据表明不同地块类型对亩产量有显著差异。5.为研究食品的包装和销售地区对其销售量是否有影响,在某周的 3 个不同地区中用 3 种不同包装方法进行销售,获得的销售量数据见下表:包装方法( B )销售地区( A ) B1 B2 B3A1 45 75 30A2 50 50 40A3 35 65 50检验不同的地区和不同的包装方法对该食品的销售量是否有显著影响? ( =0.05)解:设不同地区的平均销售量分别为 321,A提出假设: 3210:AAH不全相等,设不同包装方式的平均销售量分别为 321,B提出假设: 3210:BB不全相等,由 Excel 输出的方差分析表如下:方差分析差异源 SS df MS F P-value F crit行 22.22222 2 11.11111 0.072727 0.931056 6.944272列 955.5556 2 477.7778 3.127273 0.152155 6.94427225误差 611.1111 4 152.7778总计 1588.889 8 P-value=0.931056 =0.05(或 F=0.072727 F crit=6.944272),不拒绝原假设,没有证据表明不同地区对该食品的销售量有显著影响。P-value=0.152155 =0.05(或 F=3.127273 F crit=6.944272),不拒绝原假设,没有证据表明包装方式对该食品的销售量有显著影响。第八章、练习题及解答1.从某一行业中随机抽取 12 家企业,所得产量与生产费用的数据如下:企业编号 产量(台) 生产费用(万元) 企业编号 产量(台) 生产费用(万元)12345640425055657813015015514015015478910111284100116125130140165170167180175185要求:(1) 绘制产量与生产费用的散点图,判断二者之间的关系形态。(2) 计算产量与生产费用之间的相关系数。(3) 对相关系数的显著性进行检验( =0.05),并说明二者之间的关系强度。解:(1)散点图表明产量与生产费用两变量之间为正线性相关。(2)设产量为 X,生产费用为 Y,产量与生产费用散点图10015020020 50 80 110 140 170产量生产费用2617094,35,835202 2xyyx产量与生产费用之间的相关系数:92.07835192310521085)()(2222 nr两变量为高度正相关关系。(3)相关系数的显著性检验如下:第 1 步,提出假设。原假设 ;备择假设0:H1:0H第 2 步,计算检验统计量。 94.82.2rnt第 3 步,给定显著性水平 ,查表确定临界值 2.228。0.5)2(/05.t第 4 步,做出统计决策。由于 ,则拒绝原假设,说明产量与生产费用之)1(025.t间的线性关系显著。2.设 。36,4,18SREn要求:(1)计算判定系数 ,并解释其意义。2解: =2 %90其意义为: =90%表示,在因变量 y 取值的变差中,有 90%可以由 x 和 y 之间的线性关2R系来解释。(2)计算估计标准误差 ,并解释其意义。es5.184nSEse其意义: =0.5 表示,当用 x 来预测 y 时,平均的预测误差为 0.5.e273.一家物流公司的管理人员想研究货物的运送距离和运送时间的关系,为此,抽出了公司最近 10 辆卡车运货记录的随机样本,得到运送距离(单位:公里)和运送时间(单位:天)的数据如下:运送距离 x825 215 1070 550 480 920 1350 325 670 1215运送时间 y3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0(1) 绘制运送距离和运送时间的散点图,判断二者之间的关系形态。解答:距离和运送时间的散点图:运送距离与时间大致呈正的线性相关关系。(2) 计算相关系数,说明两个变量之间的关系强度。相关系数: 22760,8.5,71043,9.6xyx222222()()1063708.546530.9.4197.nyrx 表明运输距离与运送时间之间有较强的正的线性相关关系。(3) 利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。设两变量之间的线性回归方程为: 01iiyx102637028.5 .3854618.5.0.12得到的回归方程为: 0.823.5yx回归系数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论