版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700716728719685709691684705718706715712722691708690692707701708729694681695685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。灯泡的使用寿命频数分布表分组频数(只)频率(%)650-660660-670670-680680-690690-700700-710710-720720-730730-740740-750合计2525661426181310314261813103331001003.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。(2)制作茎叶图,并与直方图进行比较。解:(1)频数分布表分组频数(个)频率(%)85-95367.515.022.527.510.012.55.095-105105-115115-125125-135135-145145-155911452合计40100(2)茎叶图树茎树叶78数据个数8239127421925710111213141503345578895678262第三章、练习题及解答1.已知下表资料:日产量(件)工人数(人)工人比重(%)25205080361420010254018730354045合计100试根据频数和频率资料,分别计算工人平均日产量。解:计算表日产量工人数工人比重(件)x(人)f(%)f/∑fxfxf/∑f2/46253035404520508036141025401875001500280014406302.57.5147.23.1534.35合计20010068706870xfx根据频数计算工人平均日产量:20034.35(件)ffxx34.35(件)根据频率计算工人平均日产量:f结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表:单位产品成本(元/件)单位数产量比重(%)10~1212~1414~18合计2349204238100试计算这9个企业的平均单位成本。解:单位产品成产量比重(%)组中值单位数X·f/∑f本(元/件)f/∑f(元)x10~1212~1414~182342042111316-2.25.466.0838合计910013.74这9个企业的平均单位成本=xx=13.74(元)ff3.某专业统计学考试成绩资料如下:按成绩分组(分)60以下60~70学生数(人)481420956070~8080~9090~100100以上合计3/46试计算众数、中位数。的计算:在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9,解:众数根据资料知众数ffmMLdffffm1m1omm1m20142014209801083.53(分)中位数的计算:f60302根据和向上累积频数信息知,中位数在80~90这一组。2fSMLem1d8030261082(分)220fme4.利用练习题1题资料计算200名工人日产量的标准差,并计算离散系数。(只按照频数计算即可)解:计算表日产量工人数(xx)2f(件)x(人)f2530354045205080361748.45946.12533.81149.21141587.915合200计5465.5xxf5465.527.327522f200227.32755.23v100%5.23100%15.23%34.35x5.一家公司在招收职员时,首先要通过两项能力测试。在A项测试标准差是15分;在B项测试中,平均分数是200分,标准差是50分。一位应试者在A项测试中得了95分,在B项测试中得了225分。与平均分数者哪一项测试更为中,平均分数是80分,相比,该位应试理想?4/4695801,Z2252000.5zA解:计算各自的标准分数:1550B因为A测试的标准分数高于B测试的标准分,所以该测试者A想测试更理想。第四章、练习题及解答1.随机变量Z服从标准正态分布,求以下概率:(1)P(0Z1.2);(2)P(0.48Z0);(3)P(Z1.33)。2.由30辆汽车构成的一个随机样本,测得每百公里的耗油量(单位:升)数据如下:9.199.6310.109.710.018.829.4310.039.859.6010.5010.129.499.278.839.399.489.649.789.359.549.369.688.828.658.519.149.7510.099.37绘制频数分布直方图,判断汽车的耗油量是否近似服从正态分布。3.从均值为200、标准差为50的总体中,抽取n100的简单随机样本,用样本均值x估计总体均值。(1)x的期望值是多少?(2)x的标准差是多少?(3)x的概率分布是什么?抽取一个容量为500的简单随机样本,p。(1)p的期望值是多少?(2)p的标准差是多少?(3)p的概率分布是什么?5.假设一个总体共有6个数值:55,59,63,64,68。从该总体中按重置抽样方式抽4.从=0.4的总体中,样本比例为54,取n2的简单随机样本。(1)计算总体的均值和方差。(2)一共有多少个可能的样本?(3)抽出所有可能的样本,并计算出每个样本的均值。(4)画出样本均值的频数分布直方图,判断样本均值是否服从正态分布。(5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得到的结论是什么?第四章习题答案正态分布,查表得1.解:由于Z服从标准NORMSDIST(0)0.5,NORMSDIST(1.2)0.8849,NORMSDIST(0.48)0.6844,NORMSDIST(1.2)0.8849,NORMSDIST(1.33)0.9082(1)P(0Z1.2)NORMSDIST(1.2)NORMSDIST(0)0.8849-0.50.3849P(0.48Z0)NORMSDIST(0)NORMSDIST(-0.48)(2)NORMSDIST(0)-1NORMSDIST(0.48)0.1844(3)P(Z1.33)1P(Z1.33)1NORMSDIST(1.33)0.09185/462.解:对数据进行整理,30个样本数据极差为1.99。将数据分为7组,组距为0.3,如下表所示:分组频数8.51-8.808.81-9.109.11-9.409.41-9.709.71-10.0010.01-10.3010.31-10.602379351对应频数直方图为:观察上图,数据基本上拟合正态分布曲线,可以认为汽车耗油量基本服从正态分布。已知:5022500,2200,n1003.解:,同时由于样本量很大,可以看作重置抽样来处理。根据公式4.5可以得到:(1)E(x)x20025001002225,25(2)nxxx(3)根据中心极限定理,x近似服从均值为200,标准差为5的正态分布。已知:0.4,n5004.解:,同时由于样本量很大,可以看作重置抽样来处理。根据公式4.7可以得到:(1)E(p)0.42(1)0.0004820.0219;,(2)nppp(3)根据中心极限定理,p近似服从均值为0.4,标准差为0.0219的正态分布。5.解:6x(1)xi1i54555963646860.5,N66(xx)22i24.9167;24.9917i1N考虑抽取顺序情况下共有6236种可能样本。(2)由于从总体中重置抽取的样本,(3)如下表所示:样本序号样本单位样本均值x样本序号样本单位样本均值x6/46154,54541963,542063,5558.559234554,5554.554,5956.554,6358.52163,592263,632363,64616354,64596163.5654,682463,6865.5755,5454.52564,542664,5559855,5555,591055,6355575959.59272864,5961.564,6363.5641155,6459.52964,6464,683168,541255,6861.51359,5456.53066611459,551559,591659,635759613268,5561.53368,5963.53468,6365.5171859,6461.559,6863.53568,643668,686668(4)样本均值频数表:分组频数54-5656-5858-6060-6262-6464-6666-684497732样本均值频数直方图:10987654321054-5656-5858-6060-6262-6464-6666-68由上图可以发现,样本均值近似服从正态分布;7/46(5)由样本方差均值公式可以得到:36x2178ixi160.5363636(xx)2472.2536i23.529636;2i112.4583336xxxn可以看出,样本均值与总体均值很接近,样本标准差则比总体方差小。第五章、练习题及解答1.某快餐店想要估计每位顾客午餐的平均花费金额,在为期三周的时间里选取49名顾客组成了一个简单随机样本。(1)假定总体标准差为15元,求样本均值的抽样标准误差;(2)在95%的置信水平下,(3)如果样本均值为120元,2.利用下面的信息,求估计误差;求快餐店所有顾客午餐平均花费金额的95%的置信区间。构建总体均值的置信区间。服从正态分布,且已知x8900,500,n15,置信水平为95%。(1)总体不服从正态分布,且已知x8900,500,n35,置信水平为95%。(2)总体(3)总体不服从正态分布,未知,(4)总体不服从正态分布,未知,x8900,s500,n35,置信水平为90%。x8900,s500,n35,置信水平为99%。3.某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网的时间,得到下面的数(据单位:小3.33.16.25.82.34.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.6求该校大学生平均置信水平分别为90%,95%和99%。时);4.15.44.53.22.5上网时间的置信区间,4.某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。重置随机抽取了50户,其中有32户赞成,18户反对。(1)求总体中赞成新措施的户数比例的置信区间,置信水平为95%。(2)如果小区管理者预计赞成的比进行调查?5.顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与很多因素有关,比例能达到80%,要求估计误差不超过10%。应抽取多少户如,银行的业务员办理业务的速度、顾客等待排队的方式,等等。为此,某银行准备采8/46取两种排队方式进行试验。第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:方式16.56.66,76.87.17.37.47.77.77.7方式24.25.45.86.26.77.77.78.59.310.0(1)构建第一种排队方式等待时间标准差的95%的置信区间。(2)构建第二种排队方式等待时间标准差的95%的置信区间。(3)根据(1)和(2)的结果,你认为哪种排队方式更好?6.两个正态总体的方差21和22未知但相等。从两个总体中分别抽取两个独立的随机样本,它们的均值和标准差如下:来自总体1的样本来自总体2的样本n141n72x53.21x43.42s296.81s102.022求(-)的置信区间,显著性水平分别为95%和99%。127.一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得到的自信心测试分数如下:人员编号12345678910方法178637289914968768555方法271446184745155607739法平均自信心得分之差的95%的置信区间。-1构建两种方d2nn250的独立随机样本,来自总体1的样本比例为8.从两个总体中各抽取一个12p40%,来自总体2的样本比例为p30%。12构造(-)的置信区间,置信水平分别为90%和95%。129.生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对工序进行改进以减小方差。下表是两部机器生产的袋茶重量(单位:克)的数据:机器1机器23.453.223.903.223.283.359/463.203.223.502.953.163.202.983.753.383.453.483.183.703.283.353.203.123.253.283.303.303.343.283.303.193.203.293.353.163.343.303.053.333.273.283.25构造两个总体方差比的95%的置信区间。22/2110.某超市想要估计每个元,现要求以95%的置信不超过20元,应抽取多少个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120水平估计每个顾客平均购物金额的置信区间,并要求估计误差顾客作为样本?11.假定两个总体的标准差分别为:12,115,若要求估计误差不超过5,相应的2(-)均值之差时所需的样本量为多12置信水平为95%,假定nn,估计两个总体12大?(-)例之差1212.假定nn,估计误差为0.05,相应的置信水平为95%,估计两个总体比12时所需的样本量为多大?第五章课后习题参考答案151.解:(1)已知15,n49,故:2.1429;7xn(2)由题目可知:0.05,故查表可知:ZZ1.960.0252估计误差Z1.962.14294.2;x2(3)由题目可知:x120,由置信区间公式可得:xZ1204.2(115.8,124.2)x2即快餐店所有顾客午餐平均花费金额的95%的置信区间为(115.8,124.2)元。2.解:服从正态分布,ZZ1.96,则的95%置信区间为:(1)总体0.025289001.96129.0994(8646.9652,9153.0348)xZx2不服从正态分布,且样本属于大样本,ZZ1.96,则的95%置信区间(2)总体0.0252为:xZ89001.9684.5154(8734.3498,9065.6502)x2不服从正态分布,未知,因此使用样本方差代替总体方差,ZZ1.645,0.05(3)总体210/46则的90%置信区间为:sxZ89001.64584.5154(8760.9722,9039.0278)n2(4)总体不服从正态分布,未知,因此使用样本方差代替总体方差,1.96,0.025ZZ2则的95%置信区间为:sxZ89001.9684.5154(8734.3498,9065.6502)n2(xx)21.6093,由于x3.3167,sn36,x3.解:整理数据可以得到n1nn36属于大样本,所以使用正态分布来构建置信区间。当ZZ1.645,该校大学生平均上网时间的90%置信区间为:0.052sxZ3.31671.6450.2682(2.8755,3.7579)小时n2当ZZ1.96,该校大学生平均上网时间的95%置信区间为:0.0252sxZ3.31671.960.2682(2.7910,3.8424)小时n2当ZZ2.58,该校大学生平均上网时间的95%置信区间为:0.0252sxZ3.31672.580.2682(2.6244,4.0089)小时n24.解:p(1p)0.0679n32(1)由题目可知:n50,p0.64,,由于抽取的样50pZZ1.96,总体本属于大样本,所以中赞成新措施的户数比例的95%置信区间为:0.0252pZp(1p)0.641.960.0679(0.5069,0.7731)n2p(1p)dZ估计误差10%0.1,ZZ1.96,p0.8,0.025(2)由题目可知:n22得到:p(1p)0.1nZ211/460.8(1-0.8)0.1n1.9661.5385n即样本个数至少为62户。或直接将d0.1带入n确定的公式,即,n(z)2(1)1.9620.8(10.8)61.5462/2d20.125.解:n10,x7.15,s20.2272,由于抽取的样本属于小据可以得到:(1)整理数样本,所以由CHIINV函数得:112(9)19.0228,(9)2.7004,由22120.9750.02522此可以得到第一种排队方式等待时间标准差的95%的置信区间为:(n1)s2(n1)s211221220.330.87n10,x7.15,s23.8183,第二种排队方式等待时(2)整理数据可以得到:22间标准差的95%的置信区间为:(n1)s2(n1)s222221221.253.33(3)比较两种方法的标准差置信区间,第一种方法的置信区间更小,说明第一种方法等待时间的离散程度更小,比第二种方式好。(n1)s2(n1)s6.解:由题目可以得到:s229.9218112nn2w122当t(nn2)t(19)2.093,(-)的95%置信区间为:120.97511211(0.1871,19.4129)147(xx)t(19)s119.82.0939.9218nn120.975w122当t(nn2)t(19)2.8609,(-)的95%置信区间为:120.99511212/4611(53.243.4)2.86099.9218nn11(xx)t(19)s147120.995w12(3.3398,22.9398)7.解:由样本数据计算得到:n(dd)2110384101id11,si1d6.53,t(101)2.26210n1d2-则自信心得分之差的95%的置信区间为:2d1112.2626.53114.67(6.33,15.67)dt(9)sd100.025nnn250,p0.4,p0.3,8.解:由题目可以得到:1212ZZ1.645,(-)的90%置信区间为:当0.95122p(1p)p(1p)(3.021%,16.98%)ppZ1122120.95nn21ZZ1.96,(-)的95%置信区间为:当0.975122p(1p)p(1p)(1.684%,18.32%)ppZ1122120.975nn21nn21,s20.058375,s20.005265,9.解:由题目可以得到:1212F(n1,n1)F(20,20)2.4645,F(n1,n1)F(20,20)0.4058120.025120.975122/两个总体方差比212的95%的置信区间为:2s21112s211s2F(n1,n1)s2F(n1,n1)2212221212217.41231227.322322120已知,即,在95%置10.解:由题目可以得到:使用过去经验数据,则可以认为误差ZZ1.96,估计Z20,因此:n信度下0.02522Z20n0.97513/461.9612020n138.2976n即样本个数至少为139个。11.解:由题目可以得到:总体15nnn,在95%置信12已知,即,,121222ZZ1.96,估计误差ZZ25,因此:度下1nn0.02522121nn22250.0251212215251.96n56.7020n即两个总体的样本各至少为57个。第六章、练习题及解答1.一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为7.25小时,标准差为2.5小时。据报道,10年前每天每个家庭看电视的平均时间是6.70小时。取显0.01著性水平,这个调查能否证明了”?2.为监测空气质量,隔几周即对空气烟尘质量进行一次随机测试。已知“如今每个家庭每天收看电视的平均时间增加某城市环保部门每该城市过去每立方米空气中悬浮颗粒的平均值是82微克。在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值(单位:微克)如下:81.686.680.085.878.658.368.773.296.674.983.066.668.670.971.171.677.376.192.272.461.788.575.686.985.594.972.583.074.082.587.073.20.01根据最近的测量数据,当显著性水平时,能否认为该城市空气中悬浮颗粒的低于过去的平均值?3.安装种联合收割机上的金属板的平均重量为25公斤。对某企业生产的20块金属板进行测量,得到的重量(单位:公斤)数据如下:平均值显著在一22.626.623.123.527.025.328.624.526.230.427.424.925.823.226.926.122.228.124.223.60.05假设金属板的重量服从正态分布,在显著性水平下,检验该企业生产的金属14/46板是否符合要求。4.对消费者的一项调查表明,17%的人早餐饮料是牛奶。某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。为验证这一说法,生产商从该城市随机抽取550人,调查知其中115人早餐饮用牛奶。在0.05显著性水平下,检验该生产商的说法是否属实。5.某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下结果:操作A操作Bn1001n502x14.8分钟1x10.4分钟2s0.8分钟1s0.6分钟2在0.05的显著性水平下检验平均装配时间之差是否等于5分钟。6.某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。对0.05的显著性水平,用下列数据检验该假设,并对该广告给予评价。购买力得分购买力得分个体个体看后看前5看后看前512346674567839764875367.某企业为比较两种方法对员工进行培训的效果,采用方法1对15名员工进行培训,采用方法2对12名员工进行培训。培训后的测试分数如下:方法151方法25756474250474543524844595253545365535752565355426444两种方法培训得分的总体方差未知且不相等。在0.05的显著性水平下,检验两种方法的培训效果是否有显著差异。8.为研究小企业经理是否认为他们获得了成功,在随机抽取的100个小企业的女性经理中,认为自己成功的人数为24人;而在对95个男性经理的调查中,认为自己成功的人数为15/4639人。在0.05的显著性水平下,检验男女经理认为自己成功的人数比例是否有显著差异。9.为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者选择了面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:旧肥料97新肥料109101981001051091101181099898949910411311111199112103881081021061061179910711997105102104101110111103110119取显著性水平0.05,检验:(1)新肥料获得的平均产量是否显著地高于旧肥料?假定条件为:①两种肥料产量的方差未知但相等,即22。12②两种肥料产量的方差未知且不相等,即2122。(2)两种肥料产量的方差是否有显著差异?10.生产工序中的方差是工序质量的一个重要测度,通常较大的方差就意味着要通过寻找减小工序方差的途径来改进工序。某杂志上刊载了关于两部机器生产的袋茶重量(单位:克)的数据如下,检验这两部机器生产的袋茶重量的方差是否存在显著差异。(0.05)2.953.453.503.753.483.263.333.203.163.203.223.383.903.363.253.28机器13.203.222.983.453.703.343.183.353.123.223.303.343.283.293.253.303.27机器23.383.343.353.193.353.053.363.283.303.283.303.203.163.33第六章课后习题参考答案1.解:由题目可以得到:n200,2.5;1H:6.7,H:6.7;提出原假设与备择假设:0该检验属于右侧单边检验,因此得到拒绝域为:W{zzz2.3263};10.99在大样本条件下检验统计量为:zx03.11132.32563,落入拒绝域中,因n此拒绝原假设,认为如今每(或利用Excel的“1-NORMSDIST(3.1113)”函数得到检验P=0.0009<0.01,则拒绝原假设)个家庭每天收看电视的平均时间较十年前显著增加了。16/462.解:由题目可以得到:n32,根据样本数据计算得到:s9.1979,x78.10625;1H:82,H:82;提出原假设与备择假设:0该检验属于左侧单边检验,因此得到拒绝域为:W{zzz2.3264};0.01xz在大样本且总体方差未知条件下检验统计量为:02.39492.325,落入sn拒绝域中,因此拒绝原假设,认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值。(或利用Excel的“NORMSDIST(-2.3949)”函数得到检验P=0.0083<0.01,则拒绝原假设)n20,计算样本数据得到s2.1933,x25.51;3.解:由题目可以得到:1H:25,H:25;提出原假设与备择假设:0W{zzz1.96};该检验属于双边检验,因此得到拒绝域为:0.0252在服从正态分布的小样本且总体方差未知条件下检验统计量为:zxs,落入接受域中,因此不能拒绝原假设,没有证据表明该企业生产1.03991.96n的金属板不符合要求。“TDIST(1.04,19,2)”函数得到检验P=0.3114>0.05,(或利用则不能拒绝原假设)n550,计算样本数据得到pn011520.91%;4.解:由题目可以得到:n550H:17%,H:17%;提出原假设与备择假设:01W{zzz1.96};该检验属于右侧单边检验,因此得到拒绝域为:0.0252(1)pz在大样本条件下检验统计量为:2.44121.96,落入拒绝域中,000n因此拒绝原假设,认为生产商的说法属实,该城市的人早餐饮用牛奶的比例高于17%。(或利用“1-NORMSDIST(2.4412)”函数得到检验P=0.0073<0.05,则拒绝原假设)12H:5,H:5;5.解:提出原假设与备择假设:01212(xx)()5.1450z在大样本条件下检验统计量为:12112ss22nn12利用“2*(1-NORMSDIST(5.1450))”函数,得到双尾P值为2.6752107,由于P0.05,拒绝原假设,认为两种装配操作的平均装配时间之差不等于5分钟。17/46“看后”平均得分为,“看前”平均得分,“看后”平均得分与“看前”平16.解:设:2均得分之差为d;1H:0,H:0;提出原假设与备择假设:01212nn(dd)d2i0.625,si1.3025;di1根据样本数据计算得到:ni1n1d0.6251.3572t在配对的小样本条件下检验统计量为:1.30258利用Excel“=TDIST(1.3572,7,1)”得到的单尾概率P值为0.10842,由于P0.05,不能拒绝原假设,没有证据表明广告提高了平均潜在购买力得分。方法一培训测试平均得分为,方法二培训测试平均得分为;17.解:设:2H:0,H:0;与备择假设:0112提出原假设21根据样本数据计算得到:n15,n12,x47.7333,x56.5,s219.4952,s218.2727121212由于小样本情况下总体方差未知且不相等,t分布自由度为:(s12s)222nn1(s1)2(s)2224222nn12n-1n-1122(x-x)-(-)5.2183t在小样本条件下检验统计量为:121ss2221nn12利用Excel的“=TDIST(5.2183,24,2)”函数,得到的双尾概率P值为0.00002,由于P0.05,拒绝原假设,认为两种培训方法的效果存在显著差异。8.解:设:男性经理认为自己成功的人数比例为,女性经理认为自己成功的人数比例1为,两个样本合并后得到的合并比例为p;2H:0,H:0;与备择假设:0112提出原假设21p41%,p24%两个样本的比例分别为:1根据样本数据计算得到:218/46npnp232.31%;p两个样本合并后得到的合并比例112nn12p-pz检验统计量为:2.53731211p(1-p)()nn12利用Excel的“=2*(1-NORMSDIST(2.5373))”函数,得到检验概率P值为0.0112,由于P0.05,所以拒绝原假设,认为男女经理认为自己成功的人数比例具有显著差异。29.解:设:新肥料获得的平均产量为,旧肥料获得的平均产量为;1方差未知但相等,即2时:2(1)两种肥料产量的211H:0;H:0;提出原假设和备择假设:01212根据样本数据计算得:n20,n20,x109.9,x100.7,s33.3579,s124.1158;2221212总体方差的合并估计量为:s2(n-1)s2(n-1)s2228.73685112nn-2p12(x-x)-(-)5.4271t检验统计量为:121211snnp12利用Excel的“=TDIST(5.4271,38,1)”函数,得到单尾概率P值为0.000002,由于P0.05,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。(以上也可由Excel中的[t-检验:双样本等方差假设]给出)方差未知且不相等,即2时:2两种肥料产量的211H:0;H:0;提出原假设与备择假设:01212根据样本数据计算得到:n20,n20,x109.9,x100.7,s33.3579,s124.11582221212由于小样本情况下总体方差未知且不相等,t分布自由度为:19/46(12s)2s22nn1372s2s1n2()2()22n12n-1n-1122(x-x)-(-)5.4271t在小样本条件下检验统计量为:121ss2221nn12利用Excel的“=TDIST(5.4271,37,1)”函数,得到单尾概率P值为0.000002,由于P0.05,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。(以上也可由Excel中的[t-检验:双样本异方差假设]给出)(2)设:使用新肥料的田地为样本1,使用旧肥料的田地为样本11H:21;H:21提出原假设与备择假设:1222201利用Excel中的“F-检验:双样本方差”(0.025)得到的检验结果如下表所示:F-检验双样本方差分析变量1变量2109.9100.7平均方差33.3578924.11579观测值df20192019F1.3832390.243112.526451P(F<=f)单尾F单尾临界由于2P0.48610.05,不能拒绝原假设,没有证据表明两种肥料产量的方差有显著差异。10.解:设:机器一为样本1,机器二为样本11H:21;H:21提出原假设与备择假设:1222201利用Excel的“F-检验:双样本方差”(0.025)得到的检验结果如下表所示:F-检验双样本方差分析变量1变量2平均方差观测值df3.32843.2781818180.0488890.0059012992524222120/46F8.2844476233.61079E-062.367525575P(F<=f)单尾F单尾临界由于2P0.0000070.05,拒绝原假设,认为两种肥料产量的方差有显著差异。第七章、练习题及解答1.从某市的三个小学中分别抽若干名5年级男生,测量其身高,数据如下,小学身高(cm)大成小学128135148152146135148145156162157136平明小学师范附小145136139148164142试检验不同小学5年级男生身高有无显著差别(=0.05)解:设三个小学的5年级男生的平均身高分别为,,。123H::提出假设0123H:,,不全相等1123由Excel输出的方差分析表如下:差异源组间SSdfMSFP-valueFcrit262.43811417.56216802131.2191.3885010.2797343.68232组内1594.5041317总计P-value=0.279734>=0.05,(或者F=1.388501<Fcrit=3.68232),证据表明该市3所小学5年级的2.某家电制造公司准备购进一批5#电池,A、B、C三个电池生产较它们生产的电池量质,从每个企业各随机抽取5只电池,经试验得其寿命(小时)数据见下表:不能拒绝原假设,没有男生身高有显著差异。现有企业愿意供货,为比电池生产企业试验号ABC12345505043403932283034264542384840试分析三个企业生产的电池的平均寿命之间有无显著差异?如果有差异,用LSD方法检?(=0.05)验哪些企业之间有差异,,解:A、B、C三个企业生产的电池的平均寿命分别为。123H::提出假设012321/463H:,,不全相等112由Excel输出的方差分析表如下:方差分析差异源SSdfMSFP-valueFcrit组间组内总计615.62307.817.068390.000313.885294216.48321218.0333314P-value=0.00031<=0.05(或F=17.06839>Fcrit=3.885294),拒绝原假设。表明电池的平均寿命之间有显著差异。为判断哪两家企业生产的电池平均寿命之间有显著差异,首先提出如下加红色:12H:;H:检验1:012113H:;H:检验2:013123H:;H:检验3:0231然后计算检验统计量:xx44.43014.412xx44.442.61.813xx3042.612.622计算LSD。根据方差分析表可知,MSE=18.03333.根据自由度=n-k=15-3=12.查t分布表得tt2.179.计算的LSD如下:/20.02511LSD2.17918.033()5.8555作出决策。xx44.43014.4>LSD=5.85,拒绝原假设。企业A与企业B电池的平均12使用寿命之间有显著差异。xx44.442.61.8<LSD=5.85,不拒绝原假设。没有证据表明企业A与企13业C电池的平均使用寿命之间有显著差异。xx3042.612.6>LSD=5.85,拒绝原假设。企业B与企业C电池的平均22使用寿命之间有显著差异。3.某企业准备用三种方法组装一种新的随机抽取了30名工人,为三组,并指定每组使用其中的一种方法。通过对每个工产品,为确定哪种方法每小时生产的产品数量最多,平均分人生产的产品数进行方差分析得到下面的结果。差异源SSdfMSFP-valueFcrit22/46组间(420)(2)210(1.40.2459463.35413178)组内3836(27)(142.07)-合计(4256)29-----要求:(1)完成上面的方差分析表。(2)检验三种方法组装的产品数量之间是否有显著差异?(=0.05)解:(1)差异源SSdfMSFP-valueFcrit组间(420)(2)210(1.40.2459463.35413178)组内3836(27)(142.07)-合计(4256)29(2)由方差分析表可知:-----P-value=0.245946>=0.05,(或F=1.478<Fcrit=3.354131=,不能拒绝原假设。没有证据表明三种方法组装的产品数量之间有显著的差异。4.某农场在不同的地块试种四个品种的谷子,试验数据如下(单位:千克类型和谷子品种是否对平均亩产量有影响(α=0.05)。太行2号冀丰2号冀丰3号农科9号农科12号/亩),试检验地块洼地225坡地156平地320210198351198265298152210302205236261,,解:设不同地块的平均亩产量分别为:123H:3提出假设:0123H:,,不全相等112设不同品种的平均亩产量分别为,,,,12345H:提出假设:012345H:,,,,,不全相等012345由Excel输出的方差分析表如下:方差分析差异源SSdfMSFP-valueFcrit行列34498.5322329.733417249.2711.744710.0041664.45897582.43330.3965680.8060543.8378531468.683误差11749.478总计48577.7314P-value=0.0014<α=0.05(或F=11.74471>Fcrit=4.45897),拒绝原假设。表明不同品种的种子对亩产量的影响显著。P-value=0.806054>α=0.05(或F=0.396568<Fcrit=3.837853),不拒绝原假设。没有证据表明不同地块类型对亩产量有显著差异。23/465.为研究食品的包装和销售地区对其销售量是否有影响,在某周的3个不同地区中用3种不同包装方法进行销售,获得的销售量数据见下表:销售地区包装方法(B)(A)B1B2755065B3304050A1A2A3455035检验不同的地区和不同的包装方法对该食品的销售量是否有显著影响?(=0.05),,解:设不同地区的平均销售量分别为A1A2A3H:提出假设:0A1A2A3H:,,不全相等0A1A2A3,,设不同包装方式的平均销售量分别为B1B2B3H:提出假设:0B1B2B3H:,,不全相等0B1B2B3由Excel输出的方差分析表如下:方差分析差异源SSdfMSFP-valueFcrit行22.22222211.111110.0727270.9310566.944272列955.55562477.77783.1272730.1521556.944272误差611.11114152.7778总计1588.8898P-value=0.931056>=0.05(或F=0.072727<Fcrit=6.944272),不拒绝原假设,没有证据表明不同地区对该食品的销售量有显著影响。P-value=0.152155>=0.05(或F=3.127273<Fcrit=6.944272),不拒绝原假设,没有证据表明包装方式对该食品的销售量有显著影响。第八章、练习题及解答1.从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:生产费用(万生产费用(产量(台)元)万企业编号产量(台)企业编号元)14042505565781307884165215015514015015410011612513014017016718017518539410111256要求:24/46(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。相关系数。(2)计算产量与生产费用之间的(3)对相关系数的显著性进行检验(=0.05),并说明二者之间的关系强度。解:(1)200生产费用150100205080110产量140170产量与生产费用散点图散点图表明产量与生产费用两变量之间为正线性相关。(2)设产量为X,生产费用为Y,x1025,y1921,x2101835,y2310505,xy170094产量与生产费用之间的相关系数:nxyxynx2(x)2ny2(y)2r12170094102519217210312101835102521231050519212783530.92两变量为高度正相关关系。(3)相关系数的显著性检验如下:第1步,提出假设。1原假设H:0;备择假设H:00第2步,计算检验统计量。n20.9212218.94tr1r210.92225/46第3步,给定显著性水平,查表确定临界值(122)2.228。0.05t0.05/2第4步,做出统计决策。由于tt(10),则拒绝原假设,说明产量与生产费用之间0.025的线性关系显著。2.设SSR36,SSE4,n18。要求:(1)计算判定系数R2,并解释其意义。SSR36解:R2=SSRSSE36490%其意义为:R2=90%表示,在因变量y取值的变差中,有90%可以由x和y之间的线性关系来解释。(2)计算估计标准误差s,并解释其意义。eSSE4sn21820.5e其意义:s=0.5表示,当用x来预测y时,平均的预测误差为0.5.e3.一家物流公司的管理人员想研究货物的运送距离和运送时间的关系,为此,抽出了公司最近10辆卡车运货记录的随机样本,得到运送距离(单位:公里)和运送时间(单位:天)的数据如下:运送距离x825215107055048092013503256701215运送时间y3.51.04.02.01.03.04.51.53.05.0(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态。解答:距离和运送时间的散点图:654时间3210050010001500距离货物运送距离与时间散点图运送距离与时间大致呈正的线性相关关系。(2)计算相关系数,说明两个变量之间的关系强度。26/46相关系数:y299.75,xy26370x7620,y28.5,x27104300,nxyxyrnx(x)ny(y)22221026370762028.5465300.9549033.54107104300762021099.7528.52表明运输距离与运送时间之间有较强的正的线性相关关系。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。ˆˆˆx1i设两变量之间的线性回归方程为:yi01026370762028.5107104300762076200.003585ˆ1128.5176200.0035850.11823ˆ10100ˆ0.118230.003585x0.003585表示运送距离每增加1公里,运送时间平均增加0.003583天。得到的回归方程为:yˆ回归系数1(4)计算判定系数,并解释其意义。SST(yy)2=nny2ny2=99.75-10×2.852=18.525iii1i1ˆˆSSRn(ˆyy)2=inynxyny2=0.11823×28.5+0.003583×26370-10×0i1iii1i1i12.852=16.681ˆˆy1SSE(yyinˆ)nnny2xy=99.75-0.11823×28.5-0.003585×i2=0iiii1i1i1i126370=1.843995SSR16.6810.90R判定系数2SST18.525判定系数等于90%表示,在因变量运送时间取值的变差中,有90%可以由运送距离和运输时间之间的线性关系来解释。(5)检验回归方程的线性关系(=0.05)。第1步:提出假设H:0,两个变量之间的线性关系不显著原假设0127/46H:0,两个变量之间的线性关系显著备择假设11第2步:计算检验统计量F。SSR/116.681/1FSSE/(n2)1.844/(102)72.3690.05,并根据分子自由度df1,分母自由度第3步:做出决策。确定显著性水平1dfn21028,查F分布表,找到相应的临界值F(1,10)5.318。由于20.05FF(1,10),拒绝H,表明运送距离与运送时间之间的线性关系是显著的。0.050(6)如果运送距离为1000公里,预测其运送时间。x1000时,ˆ0.118230.00358510003.7(天)y00(7)求运送距离为1000公里时,运送时间的95%的置信区间和预测区间。运送距离为1000公里时,运送时间的95%的置信区间为:0.48,n=10,t(n2)t(102)2.3646SSEn21.844102se0.5/20.0257620101xx762,(xx)nx(x)212978602210ni1运送时间95%的置信区间为:1(1000762)3.72.36460.4823.70.43101297860即3.27E(y)4.130天~4.13天之间。。这就是说,当运送距离为1000公里时,平均运送时间在3.27如果运送距离为1000公里,运送时间的95%的预测区间为:1(1000762)3.72.36460.48123.71.21129786010即3.49yˆ4.91。这说明,运送距离为1000公里时,运送时间95%的预测区间在3.490天~4.91天之间。Excel输出的回归结果如下表:回归统计MultipleRRSquareAdjustedRSquare0.9489430.9004920.8880540.48002310标准误差观测值28/46方差分析dfSSMSFSigF回归分析残差116.6816216.6816272.395852.79E-05
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖南省岳阳市汨罗市弼时片区2026年中考冲刺预测卷(六)化学试题含解析
- 广西钦州市钦南区达标名校2026届全国卷Ⅲ化学试题中考模拟题含解析
- 2026年浙江省杭州市经济开发区初三第六次质量检测试题化学试题含解析
- 2026年数据基础设施运营方价值共创新机制设计
- 2026年广安门医院广医岐智大模型本地化部署一体化服务案例
- 2026年碳关税对全球供应链产业链格局的重塑与影响分析
- 2026年保险公司版以房养老与银行版反向抵押贷款差异解析
- 2026年火星大气风场三维立体探测载荷设计
- 汽车销售公司试驾车辆管理方案
- 滴工程师项目经理助理招聘要点解读
- 《电工电子技术》课件-数字式万用表的使用
- 颌面部骨折围手术期的护理
- 《怡成血酮监测意义》课件
- 井字架搭拆作业架体的安装与拆除安全要求范本
- 主蒸汽管道更换施工方案
- 人工智能导论PPT完整全套教学课件
- 2023年浙江省普通高中学业水平考考纲物理
- ARJ21机型理论知识考试题库(汇总版)
- JJG 875-2019数字压力计
- 《薄膜材料与薄膜技术》教学配套课件
- 金属非金属地下矿山安全生产标准化评分办法-模板
评论
0/150
提交评论