




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学复习笔记第七章 参数估计一、 思考题1 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。根据一个具体的样本计算出来的估计量的数值称为估计值。2 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。(2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。3 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两
2、部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。4 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。5 简述样本量
3、与置信水平、总体方差、估计误差的关系。1. 估计总体均值时样本量n为其中:2. 样本量n与置信水平1-、总体方差、估计误差E之间的关系为§ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;§ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;§ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。二、 练习题1 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。1) 样本均值的抽样标准差等于多少?2) 在95%的置信水平下,估计误差是多少?解: 1)
4、 已知 = 5,n = 40, = 25 = 5 40 0.79 2) 已知 估计误差 E = 1.96×5÷40 1.552 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。1) 假定总体标准差为15元,求样本均值的抽样标准误差。2) 在95%的置信水平下,求估计误差。3) 如果样本均值为120元,求总体均值µ的95%的置信区间。解:1)已知 = 15,n = 49 = 15÷49 = 2.14 2)已知 估计误差 E = 1.96×15÷49 4.23)已知 = 120 置信区间
5、为 ±E 其置信区间 = 120±4.23 从一个总体中随机抽取n =100的随机样本,得到 =104560,假定总体标准差 = 85414,试构建总体均值µ的95%的置信区间。解: 已知n =100, =104560, = 85414,1-a95% ,由于是正态总体,且总体标准差已知。总体均值m在1-a置信水平下的置信区间为 104560 ± 1.96×85414÷100 = 104560 ±16741.144 4 从总体中抽取一个n =100的简单随机样本,得到 =81,s=12。要求:1) 构建µ的90%的置
6、信区间。2) 构建µ的95%的置信区间。3) 构建µ的99%的置信区间。解:由于是正态总体,但总体标准差未知。总体均值m在1-a置信水平下的置信区间公式为 81±×12÷100 = 81±×1.21)1-a90%,1.65 其置信区间为 81 ± 1.982)1-a95% , 其置信区间为 81 ± 2.3523) 1-a99%,2.58 其置信区间为 81 ± 3.0965 利用下面的信息,构建总体均值的置信区间。1) = 25, = 3.5,n =60,置信水平为95%2) =119,s =
7、23.89,n =75,置信水平为98%3) =3.149,s =0.974,n =32,置信水平为90%解: 1) 1-a95% , 其置信区间为:25±1.96×3.5÷60 = 25±0.885 2) 1-a98% ,则a=0.02, a/2=0.01, 1-a/2=0.99,查标准正态分布表,可知: 2.33 其置信区间为: 119±2.33×23.89÷75 = 119±6.3453) 1-a90%,1.65 其置信区间为: 3.149±1.65×0.974÷32 = 3.1
8、49±0.2846 利用下面的信息,构建总体均值µ的置信区间:1) 总体服从正态分布,且已知 = 500,n = 15, =8900,置信水平为95%。解: N=15,为小样本正态分布,但已知。则1-a95%,。其置信区间公式为 置信区间为:8900±1.96×500÷15=(8646.7 , 9153.2)2) 总体不服从正态分布,且已知 = 500,n = 35, =8900,置信水平为95%。解:为大样本总体非正态分布,但已知。则1-a95%,。其置信区间公式为 置信区间为:8900±1.96×500÷35=
9、(8733.9 9066.1)3) 总体不服从正态分布,未知,n = 35, =8900,s =500,置信水平为90%。解:为大样本总体非正态分布,且未知,1-a90%,1.65。 其置信区间为: 8900±1.65×500÷35=(8761 9039)4) 总体不服从正态分布,未知,n = 35, =8900,s =500,置信水平为99%。解:为大样本总体非正态分布,且未知,1-a99%,2.58。其置信区间为:8900±2.58×500÷35=(8681.9 9118.1)7 某大学为了解学生每天上网的时间,在全校7500名学
10、生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时)(略)。求该校大学生平均上网时间的置信区间,置信水平分别为90%解: 先求样本均值: = 3.32 再求样本标准差: 置信区间公式:8 从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值µ的95%置信区间。解:本题为一个小样本正态分布,未知。先求样本均值: = 80÷8=10再求样本标准差:= 84/7 = 3.4641于是 , 的置信水平为 的置信区间是 , 已知 ,n = 8,
11、则 ,/2=0.025,查自由度为n-1 = 7的 分布表得临界值 2.45所以,置信区间为: 10±2.45×3.4641÷79 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。解:小样本正态分布,未知。已知,n = 16,则 , /2=0.025,查自由度为n-1 = 15的 分布表得临界值 2.14样本均值=150/16=9.375再求样本标准差:= 2
12、53.75/15 4.11于是 , 的置信水平为 的置信区间是 , 9.375±2.14×4.11÷1610 从一批零件是随机抽取36个,测得其平均长度是149.5,标准差是1.93。1) 求确定该种零件平均长度的95%的置信区间。2) 在上面估计中,你使用了统计中的哪一个重要定理?请解释。解:1) 这是一个大样本分布。已知N=36, = 149.5,S =1.93,1-=0.95,。 其置信区间为:149.5±1.96×1.93÷362)中心极限定理论证:如果总体变量存在有限的平均数和
13、方差,那么,不论这个总体的分布如何,随着样本容量 的增加,样本均值的分布便趋近正态分布。在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布则是普遍存在的。样本均值也是一种随机变量和的分布,因此在样本容量 充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论基础。11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量如下:(略) 已知食品包重服从正态分布,要求:1) 确定该种食品平均重量的95%的置信区间。2) 如果规定食品重量低于100克属于不合格,
14、确定该批食品合格率的95%的置信区间。解: 1)本题为一个大样本正态分布,未知。已知N=50,µ =100,1-=0.95,。 每组组中值分别为97、99、101、103、105,即此50包样本平均值= (97+99+101+103+105)/5 = 101 样本标准差为: = (97-101)²×2(99-101)²×3(101-101)²×34(103-101)²×7(105-101)²×4÷(50-1) 1.666 其置信区间为:101±1.96×1
15、.666÷50 2) 不合格包数(100克)为2+3=5包,5/50 = 10%(不合格率),即P = 90%。 该批食品合格率的95%置信区间为: = 0.9 ±1.96×(0.9×0.1)÷50= 0.9 ±1.96×0.04212 假设总体服从正态分布,利用下面的数据构建总体均值的99%的置信区间。(略)解: 样本均值 样本标准差: 尽管总体服从正态分布,但是样本n=25是小样本,且总体标准差未知,应该用T统计量估计。1-=0.99,则=0.01, /2=0.005,查自由度为n-1 = 24的 分布表得临界值 2.8
16、 的置信水平为 的置信区间是 , 13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工,得到他们每周加班的时间数据如下(单位:小时):(略)假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。解: N = 18 30, 为小样本正态分布,未知。 样本均值= 244/18 = 13.56 样本标准差:= 1-= 90%, = 0.1,/2= 0.05,则查自由度为n-1 = 17的 分布表得临界值 1.74 的置信水平为 的置信区间是
17、60;, 14 利用下面的样本数据构建总体比例丌的置信区间:1) n =44,p = 0.51 ,置信水平为99%2) n =300,p = 0.82 ,置信水平为95%3) n =1150,p = 0.48,置信水平为90%解: 1) 1-= 99%, = 0.01,/2= 0.005,1-/2= 0.995,查标准正态分布表,则2.58 2)1-a95%, 3)1-a90%,1.65 分别代入15 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机,其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。解: 1)置信水平90%
18、,1-a90%,1.65,N = 200,P = 23%。 代入 2)置信水平95%,1-a95%,N = 200,P = 23%。代入16 一位银行的管理人员想估计每位顾客在该银行的月平均存款额。他假设所有顾客月存款额的标准差为1000元,要求的估计误差在200元以内,置信水平为99%。应选取多大的样本?解: 已知 1- = 99%,则2.58。E = 200,= 1000元。 则 N = (²×²)÷E²= (2.58²×1000²)÷200²167(得数应该是166.41,不管小数后是多少
19、,都向上进位取整,因此至少是167人)17 要估计总体比例丌,计算下列条件下所需的样本量。1) E=0.02,丌=0.40,置信水平96%2) E=0.04,丌未知,置信水平95%3) E=0.05,丌=0.55,置信水平90%解: 1)已知 1- = 96%,/2 =0.02 ,则2.06 N = ²×丌(1-丌)÷E²=2.06²×0.4×0.6÷0.02²2547 2) 已知 1- = 95%,/2 =0.025 ,则1.96 丌未知,则取使丌(1-丌)最大时的0.5。 N = ²
20、5;丌(1-丌)÷E²=1.96²×0.5×0.5÷0.04²6013)置信水平90%,1-a90%,1.65, N = ²×丌(1-丌)÷E²=1.65²×0.55×0.45÷0.05²27018 某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞同,18户反对。1) 求总体中赞成该项改革的户数比例的置信区间(=0.05)2) 如果小区管理者预计赞成的比
21、例能达到80%,估计误差不超过10%,应抽取多少户进行调查(=0.05)解:1)已知N=50,P=32/50=0.64,=0.05,/2 =0.025 ,则1.96置信区间:P±P(1-P)/N= 0.64±1.960.64×0.36/50 = 0.64±1.96×0.48/7.07=0.64±0.1332)已知丌=0.8 , E = 0.1, =0.05,/2 =0.025 ,则1.96 N= ²丌(1-丌)/E²= 1.96²×0.8×0.2÷0.1²6219
22、根据下面的样本结果,计算总体标准差的90%的置信区间:1)=21,S=2,N=502)=1.3,S=0.02,N=153)=167,S=31,N=22解:1)大样本,未知,置信水平90%,1-a90%,1.65 21±1.65×2÷50 2)小样本,未知,置信水平90%,1-a90%,则查自由度为n-1 = 14的 分布表得临界值 1.761 , = 1.3±1.761×0.02÷15 3) 大样本, 未知,置信水平90%,1-a90%,1.65 167±1.65×31÷2220
23、题目(略)1) 构建第一种排队方式等待时间标准差的95%的置信区间2) 构建第二种排队方式等待时间标准差的95%的置信区间3) 根据1)和2)的结果,你认为哪种排队方式更好?解:本题为小样本正态分布,未知,应用公式 , 置信水平95%,1-a95%,则查自由度为n-1 = 9的 分布表得临界值 2.311) = 7.15, = 2.045/90.48其置信区间为7.15±2.31×0.48÷102) = 7.15 = 0/9 = 0 其置信区间为7.15±04) 第二种排队方式更好.(19题是对总体方差的估计,应该用卡方统计量进行估计,20题是
24、对两个总体参数的估计,这二种类型老师未讲,不是本次考试的内容,不能用Z统计量像估计总体均值和比例那样去估计,具体内容见书上P188P194)第八章 假设检验一、 思考题1 假设检验和参数估计有什么相同点和不同点?解:参数估计与假设检验是统计推断的两个组成部分。相同点:它们都是利用样本对总体进行某种推断。不同点:推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数在估计前是未知的。而在假设检验中,则是先对的值提出一个假设,然后利用样本信息去检验这个假设是否成立。2 什么是假设检验中的显著性水平?统计显著是什么意思?解:显著性水平用表示,在假设检验中,它的含义是当原假设正确时却
25、被拒绝的概率或风险,即假设检验中犯弃真错误的概率。它是由人们根据检验的要求确定的。(我理解的统计学意义,统计显著是统计上专用的判定标准,指在一定的概率原则下,可以承认一种趋势或者合理性达到的程度,达到为统计上水平显著,达不到为统计上水平不显著)3 什么是假设检验中的两类错误?解:弃真错误(错误):当原假设为真时拒绝原假设,所犯的错误成为第I类错误,又称为弃真错误。犯第I类错误的概率常记作。取伪错误(错误):当原假设为假时没有拒绝原假设,所犯的错误称为第II类错误,又称取伪错误。犯第II类错误概率常记作。发生第I类错误的概率也常被用于检验结论的可靠性度量。假设检验中犯第I类错误的概率被称为显著性
26、水平,记作。4 两类错误之间存在什么样的数量关系?在样本容量n一定的情况下,假设检验不能同时做到犯和两类错误的概率都很小。若减小错误,就会增大犯错误的机会;若减小错误,也会增大犯错误的机会。要使和同时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。因此假设检验需要慎重考虑对两类错误进行控制的问题。5 解释假设检验中的P值。解:如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。也称为观察到的显著性水平。P值是反映实际观测到的数据与原假设H0之间不一致程度的一个概率值。P值越小,说明实际观测到的数据
27、与H0之间不一致程度就越大。6 显著性水平与P值有何区别?解: (显著性水平)是一个判断的标准(当原假设为真,却被拒绝的概率),而P是实际统计量对应分位点的概率值(当原假设为真时,所得到的样本观察结果或更极端结果出现的概率)。可以通过计算置信区间,然后与统计量进行比较判断,也可以通过统计量计算对应的p值,然后与值比较判断。7 假设检验依据的基本原理是什么?解: 假设检验利用的是小概率原理,小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反
28、的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。8 你认为在单侧检验中原假设和备择假设的方向应该如何确定?解: 假设问题有两种情况,一种是所考察的数值越大越好(左单侧检验或下限检验),临界值和拒绝域均在左侧;另一种是数值越小越好(右单侧检验或上限检验),临界值和拒绝域均在右侧。二、 练习题1 已知某炼铁厂的含碳量服从正态分布N(4.55,0.108²),现在测定了9炉铁水,其平均含碳量为4.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55(=0.05)?
29、解: 已知0=4.55,²=0.108²,N=9,=4.484,这里采用双侧检验,小样本,已知,使用Z统计。假定现在生产的铁水平均含碳量与以前无显著差异。则,H0 : =4.55 ; H1 : 4.55=0.05,/2 =0.025 ,查表得临界值为1.960nxZ/s-= 计算检验统计量: = (4.484-4.55)/(0.108/9) = -1.833 决策:Z值落入接受域,在a=0.05的显著性水平上接受H0。结论:有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳量为4.55。2 一种元件,要求其使用寿命不得低于700小时。现从一
30、批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,=60小时,试在显著性水平0.05下确定这批元件是否合格。解: 已知N=36,=60,=680,0 =700 这里是大样本,已知,左侧检验,采用Z统计量计算。 提出假设:假定使用寿命平均不低于700小时 H0:700 H1: < 700a = 0.05,左检验临界值为负,查得临界值: -Z0.05=-1.645计算检验统计量:0nxZ/s-= = (680-700)/(60/36) = -2 决策:Z值落入拒绝域,在a=0.05的显著性水平上拒绝H0,接受H1 结论:有证据表明这批灯泡的使用寿命低于700
31、小时,为不合格产品。3 某地区小麦的一般生产水平为亩产250公斤,其标准差是30公斤。现用一种化肥进行试验,从25个小区抽样,平均产量为270公斤。这种化肥是否使小麦明显增产(=0.05)?解:已知0 =250, = 30,N=25,=270这里是小样本分布,已知,用Z统计量。右侧检验, =0.05,则Z=1.645提出假设:假定这种化肥没使小麦明显增产。即 H0:250 H1: 250计算统计量: Z = (-0)/(/N)= (270-250)/(30/25)= 3.33结论:Z统计量落入拒绝域,在 =0.05的显著性水平上,拒绝H0,接受H1。决策:有证据表明,这种化肥可以使小麦明显增产
32、。4 糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下:(略)已知包重服从正态分布,试检验该日打包机工作是否正常。( =0.05)解:已知N=9,这里是小样本正态分布,未知,双侧检验,采用t统计量,自由度为N-1=8。 =0.05,则T/2=2.37= 99.98 1.22提出假设,假设打包机工作正常:即 H0:= 100 H1: 100计算统计量:-=nsxt0 = (99.98-100)/( 1.22/9)-0.049 结论:t值落入接受域,在a=0.05的显著性水平上接受H0 决策:有证据表明这天的打包机工
33、作正常。5 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a=0.05)?解:已知N=50,P=6/50=0.12,为大样本,右侧检验,用Z统计量计算。a=0.05,即Za=1.645H0:丌5%H1:丌5% = (0.120.05)/(0.05×0.95÷50)2.26(因为没有找到丌表示的公式,这里用P0表示丌0)结论:因为Z值落入拒绝域,所以在a=0.05的显著性水平上,拒绝H0,而接受H1。决策:有证据表明该批食品合格率不符合标准,不能出厂。6 某
34、厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下超过目前的平均水平25000公里。对一个由15个轮胎组成的随机样本做了试验,得到样本均值和标准差分别为27000公里和5000公里。假定轮胎寿命服从正态分布,问该厂家的广告是否真实(a=0.05)?解:N=15, =27000,s=5000,小样本正态分布,未知,用t统计量计算。这里是右侧检验,a=0.05,自由度N-1=14,即ta=1.77H0:0 25000H1: 250000-=nsxt = (27000-25000)/(5000÷15)1.55 结论:因为t值落入接受域,所以接受H0 ,拒绝H1。 决策:有证据表明,该厂家
35、生产的轮胎在正常行驶条件下使用寿命与目前平均水平25000公里无显著性差异,该厂家广告不真实。7 某种电子元件的寿命x(单位:小时)服从正态分布。现测得16只元件的寿命如下:(略)。问是否有理由认为元件的平均寿命显著地大于225小时(a=0.05)?解:= 241.5,= 98.726由于N=16,小样本正态分布,未知,用t统计量计算。这里是右侧分布,a=0.05,自由度N-1=15,即ta=1.753H0:0 225H1: 225-=nsxt0 = (241.5-225)/(98.726÷16)0.67 结论:因为t值落入接受域,所以接受H0 ,拒绝H1。 决策:有证据表明,元件平
36、均寿命与225小时无显著性差异,不能认为元件的平均寿命显著地大于225小时。103 一家牛奶公司有4台机器装填牛奶,每桶的容量为4L。下面是从4台机器中抽取的样本数据:机器l机器2机器3机器44.053.993.974.004.014.023.984.024.024.013.973.994.043.993.954.0l4.004.004.00取显著性水平a0.01,检验4台机器的装填量是否相同?解: 10.3 (或),拒绝原假设。1、某家电制造公司准备购进一批5#电池,现有A、B、C三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(小时)数据见表
37、1,试分析三个企业生产的电池的平均寿命之间有无显著差异?如果有差异,用LSD方法检验哪些企业之间有差异?(a=0.05)表2 电池使用寿命数据表试验号电池生产企业ABC15032452502842343303844034485392640解:(或),拒绝原假设。,拒绝原假设;,不能拒绝原假设;,拒绝原假设。107 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果; 方差分析表差异源SSdfMSFP-valueF crit组间42022101.478102190
38、.2459463.354131组内383627142.0740741总计425629 要求: (1)完成上面的方差分析表。(2)若显著性水平a=0.05,检验三种方法组装的产品数量之间是否有显著差异?解:。(1)方差分析表中所缺的数值如下表:差异源SSdfMSFP-valueF crit组间42022101.4780.2459463.354131组内383627142.07总计425629(2)题目中假设=0.05,根据第一自由度df1=k-1=3-1=2和第二自由度df2=n-k=30-3=27,查F分布表得到临界值F0.05(2,27)=3.354131,所以F=1.4781<F=3
39、.354131,所以接受原假设,即µ1=µ2=µ3成立,表明µ1、µ2、µ3之间没有显著差异,也就是说,用三种方法组装的产品数量之间没有显著差异10.9 有5种不同品种的种子和4种不同的施肥方案,在20块同样面积的土地上,分别采用5种种子和4种施肥方案搭配进行试验,取得的收获量数据如下表:品种施肥方案12341120951049721371151249631431231141114142140125120513.014013111.4检验种子的不同品种对收获量的影响是否有显著差异?不同的施肥方案对收获量的影响是否有显著差异(a=0.0
40、5)?解:这线图:_似乎交互作用不明显:(1)考虑无交互作用下的方差分析:主体间效应的检验因变量: 收获量 源III 型平方和df均方FSig.校正模型37.249(a)75.3218.0820.001截距2,930.62112,930.6214,451.0120.000Fertilization_Methods18.18236.0619.2050.002Variety19.06744.7677.2400.003误差7.901120.658总计2,975.77020校正的总计45.15019a. R 方 = .825(调整 R 方 = .723)结果表明施肥方法和品种都对收获量有显著影响。(2
41、)考虑有交互作用下的方差分析:主体间效应的检验因变量: 收获量 源III 型平方和df均方FSig.校正模型45.150(a)192.376.截距2,930.62112,930.621.Fertilization_Methods18.18236.061.Variety19.06744.767.Fertilization_Methods * Variety7.901120.658.误差0.0000.总计2,975.77020校正的总计45.15019a. R 方 = 1.000(调整 R 方 = .)由于观测数太少,得不到结果!1011 一家超市连锁店进行一项研究,确定超市所在的位置和竞争者的数
42、量对销售额是否有显著影响。下面是获得的月销售额数据(单位:万元)。超市位置竞争者数量0123个以h位于市内居民小区413859473031484045395139位于写字楼252944433135484222305053位于郊区187229242917282733252632 取显著性水平a=001,检验: (1)竞争者的数量对销售额是否有显著影响?(2)超市的位置对销售额是否有显著影响?(3)竞争者的数量和超市的位置对销售额是否有交互影响?解:画折线图:交互作用不十分明显。(1)进行无交互方差分析:主体间效应的检验因变量: 月销售额(万元) 源III 型平方和df均方FSig.校正模型281
43、4.556(a)5562.91115.2050.000截距44,802.778144,802.7781,210.1590.000Location_SuperMaket1,736.2222868.11123.4480.000Amount_competitors1,078.3333359.4449.7090.000误差1,110.6673037.022总计48,728.00036校正的总计3,925.22235a. R 方 = .717(调整 R 方 = .670)看到超市位置有显著影响,而竞争者数量没有显著影响,且影响强度仅为0.327,因此考虑是否存在交互作用。(2)有交互方差分析:看到超市位
44、置有显著影响,而竞争者数量和交互作用均无显著影响。主体间效应的检验因变量: 月销售额(万元) 源III 型平方和df均方FSig.校正模型3317.889(a)11301.62611.9190.000截距44,802.778144,802.7781,770.4720.000Location_SuperMaket1,736.2222868.11134.3050.000Amount_competitors1,078.3333359.44414.2040.000Location_SuperMaket * Amount_competitors503.333683.8893.3150.016误差607.
45、3332425.306总计48,728.00036校正的总计3,925.22235a. R 方 = .845(调整 R 方 = .774)11.5 一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下: 运送距离x 825 215 1 070 550 480 920 1 350 325 670 1 215 运送时间y 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0(1)计算线性相关系数,说明两个变量之间的关系强度。(2)利用最小二乘法求出估计的回
46、归方程,并解释回归系数的实际意义。 (1)。由说明两个变量高度线性相关。(2)于是回归方程为。回归系数表示货物运送距离每增加一公里,运送时间平均增加0.003585天。 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行了调查,所得数据如下:航空公司编号航班正点率(%)投诉次数(次)181.821276.658376.685475.768573.874672.293771.272870.8122991.4181068.5125(1)绘制散点图,说明二者之间的关系形态。 (2)用航班正点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,并解释回归系数的意义。 (3)检验回归系
47、数的显著性(=005)。 (4)如果航班正点率为80,估计顾客的投诉次数。 (5)求航班正点率为80时,顾客投诉次数95的置信区间和预测区解:(1) 散点图(略),二者之间为负的线性相关关系。(2)估计的回归方程为:。回归系数表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。(3)检验统计量(P-Value=0.001108<),拒绝原假设,回归系数显著。(4)(次)。(5)置信区间:(37.660,70.619);预测区间:(7.572,100.707)。1. 从n=20的样本中得到的有关回归结果是:SSR=60,SSE=40。要检验x与y之间的线性关系是否显著,即检验假设:。
48、(1)线性关系检验的统计量F值是多少? (2)给定显著性水平a0.05,Fa是多少? (3)是拒绝原假设还是不拒绝原假设? (4)假定x与y之间是负相关,计算相关系数r。 (5)检验x与y之间的线性关系是否显著?解:(1)SSR的自由度为k=1;SSE的自由度为n-k-1=18; 因此:F=27(2)=4.41(3)拒绝原假设,线性关系显著。(4)r=0.7746,由于是负相关,因此r=-0.7746(5)从F检验看线性关系显著。10.1 下表是1981年1999年国家财政用于农业的支出额数据 年份 支出额(亿元) 年份 支出额(亿元) 1981 110.21 1991 347.57 1982
49、 120.49 1992 376.02 1983 132.87 1993 440.45 1984 141.29 1994 532.98 1985 153.62 1995 574.93 1986 184.2 1996 700.43 1987 195.72 1997 766.39 1988 214.07 1998 1154.76 1989 265.94 1999 1085.76 1990 307.84 (1)绘制时间序列图描述其形态。(2)计算年平均增长率。(3)根据年平均增长率预测2000年的支出额。详细答案: (1)时间序列图如下: 从时间序列图可以看出,国家财政用于农业的支出额大体上呈指数上
50、升趋势。(2)年平均增长率为:。(3) 。 13.2 下表是1981年2000年我国油彩油菜籽单位面积产量数据(单位:kg / hm2)(P.399) (1)绘制时间序列图描述其形态。 (2)用5期移动平均法预测2001年的单位面积产量。 (3)采用指数平滑法,分别用平滑系数a=0.3和a=0.5预测2001年的单位面积产量,分析预测误差,说明用哪一个平滑系数预测更合适?年份 单位面积产量 年份 单位面积产量 1981 1451 1991 1215 1982 1372 1992 1281 1983 1168 1993 1309 1984 1232 1994 1296 1985 1245 199
51、5 1416 1986 1200 1996 1367 1987 1260 1997 1479 1988 1020 1998 1272 1989 1095 1999 1469 1990 1260 2000 1519 解: (1)时间序列图如下: (2)2001年的预测值为:(3)时的预测值:,误差均方291455/19=15339.737; 时的预测值:,误差均方239123/19=12585.421。更合适。 10.3 下面是一家旅馆过去18个月的营业额数据 月份 营业额(万元) 月份 营业额(万元) 1 295 10 473 2 283 11 470 3 322 12 481 4 355 13 449 5 286 14 544 6 379 15 601 7 381 16 58
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 餐饮品牌加盟商租赁及区域市场拓展合同
- 森林资源产权确认与保护合同范本
- 离婚协议范本:财产分割及子女抚养权明确协议
- 车牌租赁及车辆维修服务合同范本
- 出租车新能源充电桩运营承包协议
- 海上石油平台用成套配电箱采购与维修合同
- 证券经纪代理居间业务协议范本
- 保险市场调研及投资策略咨询服务协议
- 餐饮店装修设计及经营权转让协议书
- 城市综合体商业街铺面租赁合同范本
- 药物残留溶剂分析报告书
- SA8000:2014社会责任-中文
- 四年级如何进行有效期末复习课件
- 肿瘤医院推广方案
- 动物出血性肺炎预防与治疗
- 公路工程安全风险辨识与防控手册
- 研究生开题报告评审表
- 统编版语文二年级下册《黄帝的传说》教学课件
- 海南大学本科毕业论文正文范文
- SCA涂胶机定量机维护作业指导书
- XX跨境电商公司运营人员晋升及淘汰制度方案
评论
0/150
提交评论