统计学答案1讲解_第1页
统计学答案1讲解_第2页
统计学答案1讲解_第3页
统计学答案1讲解_第4页
统计学答案1讲解_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章 导论1.1(1)数值型变量。(2)分类变量。(3)离散型变量。(4)顺序变量。(5)分类变量。1.2( 1)总体是该市所有职工家庭的集合;样本是抽中的2000 个职工家庭的集合。(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000 个职工家庭的年人均收入。1.3( 1)总体是所有 IT 从业者的集合。(2)数值型变量。( 3)分类变量。(4)截面数据。1.4(1)总体是所有在网上购物的消费者的集合。( 2)分类变量。(3)参数是所有在网上购物者的月平均花费。(4)参数( 5)推断统计方法。第二章数据的搜集1. 什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始

2、信息已经存在, 是由别人调查和实验得来的, 并会被我们利用的 资料称为“二手资料” 。 使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、 搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免 错用、误用、滥用。在引用二手资料时,要注明数据来源。2. 比较概率抽样和非概率抽样的特点, 举例说明什么情况下适合采用概率抽样, 什么情 况下适合采用非概率抽样。概率抽样是指抽样时按一定概率以随机原则抽取样本。 每个单位被抽中的概率已知或可 以计算, 当用样本对总体目标量进行估计时, 要考虑到每个单位样本被抽中的概率, 概率抽 样的技术含量和成本都比较高。 如果调查的

3、目的在于掌握和研究总体的数量特征, 得到总体 参数的置信区间,就使用概率抽样。非概率抽样是指抽取样本时不是依据随机原则, 而是根据研究目的对数据的要求, 采用 某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、 实效快、成本低,而 且对于抽样中的专业技术要求不是很高。 它适合探索性的研究, 调查结果用于发现问题, 为 更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。3. 调查中搜集数据的方法主要有自填式、 面方式、 电话式,除此之外, 还有那些搜集数 据的方法?实验式、观察式等。4. 自填式、面方式、电话式调查个有什么利弊? 自填式优点:调查组织者管理容易,成本低,

4、可以进行较大规模调查,对被调查者可以 刻选择方便时间答卷,减少回答敏感问题的压力。缺点:返回率低,调查时间长,在数据搜 集过程中遇到问题不能及时调整。面谈式优点: 回答率高, 数据质量高, 在数据搜集过程中遇到问题可以及时调整可以充 分发挥调查员的作用。缺点:成本比较高,对调查过程的质量控制有一定难度。对于敏感问 题,被访者会有压力。电话式优点:速度快,对调查员比较安全,对访问过程的控制比较容易,缺点:实施地 区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。5. 请举出(或设计)几个实验数据的例子。不同饲料对牲畜增重有无影响,新旧技术的机器对组装同一产品所需时间的影响。6.

5、你认为应当如何控制调查中的回答误差? 对于理解误差,要注意表述中的措辞,学习一定的心里学知识。对于记忆误差,尽量缩 短所涉及问题的时间范围。 对于有意识误差, 调查人员要想法打消被调查者得思想顾虑, 调 查人员要遵守职业道德,为被调查者保密,尽量避免敏感问题。7. 怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。 对于随机误差,可以通过增加样本容量来控制。对于系统误差,做好预防,在调查前做好 各方面的准备工作, 尽量把无回答率降到最低程度。 无回答出现后, 分析武回答产生的原因, 采取补救措施。 比如要收回一百份, 就要做好一百二十份或一百三十份问卷的准备, 当被调 查者

6、不愿意回答时, 可以通过一定的方法劝服被访者, 还可以通过馈赠小礼品等的方式提高 回收率。第三章 数据的图表搜集一、思考题3.1 数据的预处理包括哪些内容? 答:审核、筛选、排序等。3.2 分类数据和顺序数据的整理和显示方法各有哪些?答:分类数据在整理时候先列出所分的类别, 计算各组的频数、 频率, 得到频数分布表, 如果是两个或两个以上变量可以制作交叉表。 对于分类数据可以绘制条形图、 帕累托图、 饼 图、环形图等。根据不同的资料或者目的选择不同的图。对于顺序数据,可以计算各种的频数、频率,以及累计频数、累计频率。可根据需要绘 制条形图、饼图、环形图等。3.3 数值型数据的分组方法有哪些?简

7、述组距分组的步骤。 答:单变量值分组和组距分组。其中组距分组:第一步,确定组数,组数多少由数据的 多少和特点等决定,一般 515 组;第二步,确定各组组距,宜取 5 或 10 的倍数;第三步, 根据分组整理出频数分布表,注意遵循“不重不漏”和“上限不在内”的原则。3.4 直方图和条形图有何区别?答: 1,条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表 示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度与宽度都有意义; 2 直方图各矩形连续排列,条形图分开排列; 3 条形图主要展示分类数据,直方图主要展示 数值型数据。3.5 绘制线图应注意问题? 答:时间在横

8、轴,观测值绘在纵轴。一般是长宽比例10:7 的长方形,纵轴下端一般从0 开始,数据与 0 距离过大的话用折断符号折断。3.6 饼图和环形图的不同? 答:饼图只能显示一个样本或总体各部分所占比例, 环形图可以同时绘制多个样本或总 体的数据系列,其图形中间有个“空洞” ,每个样本或总体的数据系类为一个环。3.7 茎叶图比直方图的优势,他们各自的应用场合?答:茎叶图既能给出数据的分布情况, 又能给出每一个原始数据, 即保留了原始数据的 信息。在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。3.8 鉴别图标优劣的准则?答: P65明确有答案,我就不写了。3.9 制作统计表应注意的问题?

9、答: 1,合理安排统计表结构; 2 表头一般包括表号,总标题和表中数据的单位等内容;3 表中的上下两条横线一般用粗线,中间的其他用细线,两端开口,数字右对齐,不要有空 白格; 4 在使用统计表时,必要时可在下方加注释,注明数据来源。第 4 章 数据的概括性度量4.1(1)众数: M 0 10 。中位数: 中位数位置 n 1 10 1 5.5, M e 10 10 10。 e2nxi平均数:i 1 i 2 4 14 15 96 x 9.6 。n 10 1010 4 710 2.5 , QL5.5 。4 L 2(2) QL 位置 nL43n 3 10Q U 位置U 4 412 127. 5 , Q

10、U12。U23)sn(xi x) 2 i1n12 2 2 2(2 9.6) 2 (4 9.6)2(14 9.6)2 (15 9.6) 210 1156.4 4.24)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。4.2(1)从表中数据可以看出, 年龄出现频数最多的是 19 和 23,所以有两个众数, 即 M 0 19和M 0 23。将原始数据排序后, 计算的中位数的位置为: 中位数位置 n 1 25 1 13,第 13 个位置 22上的数值为 23,所以中位数 M e 23。2)QL位置 n 25 6.25, QL 19 0.25 (19 19) 19。 L4 4LQU 位置 3 25

11、U418.75, QU 25 0.75 (27 - 25) 26.5。nxi3)平均数 x i 1n19 15 17 23 600 24 。2525n( xi x)2 i1n1(19 24)2 (15 24)2 (17 24) 2 (23 24)2106225 125 1( 4 )偏态系数:SK 25 xi 24 3 1.08。 (25 1)(25 2) 6.6536.65峰态系数:25(25 1) ( xi 24) 4 3 (xi 24)2 2 (25 1)K 4 0.77 。(25 1)( 25 2)( 25 3) 6.654(5)分析:从众数、中位数和平均数来看,网民年龄在2324 岁的

12、人数占多数。由于标准差较大,说明网民年龄之间有较大差异。 从偏态系数来看,年龄分布为右偏,由于偏态系数 大于 1,所以偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。4.3(1)茎茎叶图如下:叶数据个数2) x1 3 4 8 85.5 6.657.8 7.8637。9s (5.5 7)2 (6.6 7)2(7.8 7) 2 (7.8 7)2s 9 1(3)由于两种排队方式的平均数不同,所以用离散系数进行比较。1.97 0.714第一种排队方式: v10.274; v20.102 。由于 v1 v2 ,表明第一种排1 7.2 2 7 1 2 队方式的离散程度大于第二种排队方式。(4)选方法二,

13、因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方 式。4.4( 1) xn3030 115.5,230置7.543 3022.5,4n(xix)2i1中位数位置QU 位置3) s2)QL位nxii18223 274.1。272 273M e 272 273 272.5 。2, QL 258 261 259.5 。2284 291 287.5。n113002.730 121.17。4.5(1) 甲企业的平均成本 总成本总产量乙企业的平均成本总产量原因:尽管两个企业的单位成本相同, 大,因此拉低了总平均成本。 4.6(1)平均数计算过程见下表:2100 3000 15002100

14、3000 150015 20 303255 1500 1500 625518.29 .3255 1500 1500 34215 20 30 但单位成本较低的产品在乙企业的产量中所占比重较6600 19.41。340按利润额分组组中值企业数 M i fiMifi20030025019475030040035030105004005004504218900500600550189900600 以上650117150合计12051200kMifi i1n51200426.67 。120按利润额分组组中值 M i企业数 fi(M i x)2(M i x)2 fi2003002501931212.359

15、3033.5300400350305878.3176348.7400 50045042544.322860.1500 6005501815210.3273785.2600 以上6501149876.3548639.2合计120102721.51614666.7标准差计算过程见下表:k(M i x)2 fi i1n11614666.7120 1116.48 。按利润额分组组中值 M i企业数 f i(M i x)3 fi(M i x)4 fi20030025019-104771226.518509932589.230040035030-13520652.31036628411.8400 5004

16、5042533326.912442517.1500 6005501833765928.74164351991.6600 以上65011122527587.627364086138.8合计12038534964.451087441648.42)偏态系数和峰态系数的计算过程见下表:k(M i x)3 fi偏态系数:SK i 1 i 3 i38534964.43 0.203 。ns3 120 116.483k峰态系数: K(M i x)4 fi i14ns5108744164 8.4120 116.4843 0.688 。4.7(1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不

17、受样本大小的影响。(2)两位调查人员所得到的身高的标准差应该差不多相同,因为标准差的大小基本上不受 样本大小的影响。(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范 围就可能越大。4.8 ( 1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数为55v女0.1,男生体重的离散系数为 v男0.08 ,所以女生的体重差异大。女 50 男 60 (2)男生: x 60 2.2 132(磅), s 5 2.2 11(磅); 女生: x 50 2.2 110 (磅), s 5 2.2 11 (磅); (3)假定体重为对称分布,根据经验法则,在平均数加减1

18、个标准差范围内的数据个数大约为 68% 。因此,男生中大约有 68% 的人体重在 55kg 到 65kg 之间。(4)假定体重为对称分布,根据经验法则,在平均数加减2 个标准差范围内的数据个数大约为 95% 。因此,女生中大约有 95% 的人体重在 40kg 到 60kg 之间。4.9 通过计算标准分数来判断:xA x A 115 100 xB xB 425 400zAA A1; zBB B0.5 。sA 15sB50该测试者在 A 项测试中比平均分数高出 1 个标准差,而在 B 项测试中只高出平均分数 0.5 个标准差,由于 A 项测试的标准分数高于 B 项测试,所以 A 项测试比较理想。4

19、.10 通过标准分数来判断,各天的标准分数如下表:日期 周一周二周三周四周五周六周日标准分数Z 3-0.6-0.20.4-1.8-2.2 0周一和周六两天失去了控制。4.11(1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。4.2 (2)成年组身高的离散系数: vs0.024 ;s 172.12.5 幼儿组身高的离散系数: vs0.035 ;71.3 由于幼儿组身高的离散系数大于成年组身高的离散系数, 说明幼儿组身高的离散程度相 对较大。 4,11(1)应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时, 应该采用离散系数。(2)下表给出了用 Excel 计算一

20、些主要描述统计量。方法 A方法 B方法 C平均165.6平均128.73平均125.53中位数165中位数129中位数126众数164众数128众数126标准差2.13标准差1.75标准差2.77极差8极差7极差12最小值162最小值125最小值116最大值170最大值132最大值128从三种方法的集中趋势来看,方法 A 的平均产量最高,中位数和众数也都高于其他两2.13 种方法。从离散程度来看,三种方法的离散系数分别为:vA0.013 ,A 165.61.75 2.77vB0.014 , vC0.022。方法 A 的离散程度最小。因此应选择B 128.73 C 125.53方法 A 。4.1

21、2( 1)用方差或标准差来评价投资的风险。( 2)从直方图可以看出, 商业类股票收益率的离散程度较小, 说明投资风险也就较小。 (3)从投资风险角度看,应该选择风险较小的商业类股票。当然,选择哪类股票还与 投资者的主观判断有很大关系。第六章 统计量与抽样分布1、设 X1,X2, ,X n是从总体 X中抽取的容量为 n的一个样本,如果由此 样本构造一个函数 T X1,X2, ,Xn ,不依赖于任何未知参 数,则称函 数T X1,X 2, ,X n 是一个统计量。由样本构建具体的统计量, 实际上是对样本所含的总体信息按某种要求进行加工处 理,把分散在样本中的信息集中到统计量的取值上, 不同的统计推

22、断问题要求构造不同 的统计量。构造统计量的主要目的就是对总体的未知参数进行推断, 如果统计量中含有总体的 未知参数就没办法再对参数进行统计推断。2、 T1和T 2是统计量, T3和T4在 和 未知的情况下 不是统计量。3、设X 1,X 2, ,Xn是从总体X中抽取的一个样本, X(i)称为第i个次序统计量, 它是样本 X1,X2,Xn 满足如下条件的函数: 每当样本得到一组观测 值 x1,x2, , xn时,其由小到大的排序 x1 x 2 x ix n中第i个值x i就作为次序统计量 X(i)的观测值,而 X1,X 2,X n称为次序统计量。4 、假若一个统计量能把含在样本中有关总体的信息一点

23、都不损失地提取出来,这样的 统计量称充分统计量。5、统计学上的自由度指当以样本的统计量来估计总体的参数时,样本中独立或能自由 变化的资料的个数。6 、 2 分布和正态分布关系: n 时, 2分布的极限分布是正态 分布。 t分布和正态分布的关系 : t分布的密度函数曲线与 标准正态分布的密度函 数 曲线非常相似,但 t n 分布的密度函数在两侧 的尾部都要比标准正态 的两侧 尾部粗一些,方差也比 标准正态分布的方差大 。随着自由度 n的增加, t分布 的密度函数越来越接近 标准正态分布的密度函 数。F分布和正态分布关系: 若X t n ,则X2 F 1,n 。并且随着自由度 n的增加,X也越 来

24、越接近于标准正态分 布,若把 X看成近似服从标准正态 分布的一个随机变量, 则2X2 F1,n。7、在重复选取容量为 n 的样本时,由样本统计量的所有取值形成的相对频数分布为统 计量的抽样分布。8、中心极限定理:设从 均值为 ,方差为 2的任意一个总体中抽取 样本量为 n2 的样本,当 n充分大时,样本均值 X 的抽样分布近似服从均 值为 ,方差为 的 n 正态分布。中心极限定 理解决了在总体为非正 态的情况下,样本平均 数的抽样 分布问题,为总体参数 的推断提供了理论基础 。二、练习1、易知由这台机器灌装的 9 个瓶子形成的样本, 其平均灌装量服从正态分布, 均值为 ,标准差为P X 0.3

25、 P130.9 P z 0.9 0.63192、P X 0.3 0.95 ,则 P0. 30.30.3 0.95 ,即 0.31.96,nn1.96 又知1, n42.68, 故 n 43 。0.3 故 。63、易知Zi2 服从自由度为 6的卡方分布,得 b02.95(6) 12.59 (左侧分位数)i124、因为 n 12S 服从 2(n 1)分布,我们已知 n 10,1,故 9S2服从 2(9)分 布,Pb1 S2b2P 9b19S29b20.9 ,我 们 若 取P9S29b20.05, P 9S29b1 0.05, 则可 以得 到9b202.95(9) 16.92 ,9b102.05 (

26、9) 3.33 ,故 b1 0.37,b2 1.88 。(题中均为左侧分位数)第 7 章 抽样与参数估计7.1( 1)已知:5,n 40,x 25,0.05, z0.05 2 1.96。样本均值的抽样标准差55 0.79 。402)差 E z 2 1.96 5 1.55 。2 n 407.2(1)已知:15,n 49, x 120,0.05, z0.052 1.96。样本均值的抽样标准差15x2.14 。x n 492)3)差 E z 2 n 1.96 1459 4.20 。由于总体标准差已知,所以总体均值的 95%的置信区间为:120 1.96 120 4.20 ,49即( 115.8, 1

27、24.2)。7.3 已知: n 100,85414 , x 104560,0.05, z0.05 2 1.96由于总体标准差已知,所以总体均值的 95%的置信区间为:87818.85685414x z 2 104560 1.96 104560 16741.144 , 即 ( n 100121301.144)。7.4(1)已知: n 100, x 81, s 12,0.1, z0.12 1.645 。由于 n 100 为大样本,所以总体均值的 90%的置信区间为:即( 79.026, 82.974)。1281 1.645 81 1.974 ,1002)已知:0.05, z0.05 2 1.96。

28、由于 n 100 为大样本,所以总体均值的 95%的置信区间为:s12x z 2 81 1.96 81 2.352 ,即( 78.648,83.352 )。 n1003 )已知:0.01, z0.01 2 2.58 。由于 n 100 为大样本,所以总体均值的 99%的置信区间为:s1281 2.58 81 3.096 ,即( 77.940,84.096)。 n1007.5(1)已知: x 25, 3.5,n 60,0.05, z0.052 1.96。由于总体标准差已知,所以总体均值的 95%的置信区间为:25 1.96 3.5 25 0.8960即( 24.11, 25.89)。2)已知:

29、x 119.6 , s 23.89 , n 75,0.02, z0.02 2 2.33 。由于 n 75为大样本,所以总体均值的 98%的置信区间为:119.6 2.33 119.6 6.43 ,75即( 113.17, 126.03)。3)已知: x 3.419 , s 0.974 , n 32,0.1, z0.1 2 1. 645 。由于 n 32 为大样本,所以总体均值的 90%的置信区间为:0.9743.419 1.645 3.419 0.28332,即( 3.136, 3.702)。7.6( 1)已知:总体服从正态分布,500,n 15,x 8900,0.05 ,z0 .05 2 1

30、.96。由于总体服从正态分布,所以总体均值的 95%的置信区间为:8900 1.96 500 8900 253.03 ,15即( 8646.97, 9153.03)。2)已知:总体不服从正态分布,500,n 35,x 8900,0.05 ,z0 .05 2 1.96。虽然总体不服从正态分布, 但由于 n 35为大样本,所以总体均值的 95%的置信区间为:8900 1.96 500358900 165.65 ,即( 8734.35,9065.65)。3):总体不服从正态分布,未知, n 35 , x 8900 , s 500 ,z0. 1 2 1.645 。虽然总体不服从正态分布, 但由于 n

31、35为大样本,所以总体均值的 90%的置信区间为:s500x z 2 8900 1.645 8900 139.03 ,即( 8760.97, 9039.03)。 n 354)已知:总体不服从正态分布,未知, n 35, x 8900, s 500,0.01,z0. 01 2 2.58 。虽然总体不服从正态分布, 但由于 n 35为大样本, 所以总体均值 的 99%的置信区间为:即( 8681.95 ,9118.05)。x z 2 s 8900 2.58 500 8900 218.05 , n 357.7 已知: n 36,当 为 0.1、0.05、0.01 时,相应的 z0.12 1.645

32、、 z0.052 1.96 、z0. 01 2 2.58 。根据样本数据计算得: x 3.32, s 1.61。由于 n 36 为大样本,所以平均上网时间的90%的置信区间为:x z 2 n 3.32 1.645 36 3.32 0.44,即( 2.88,3.76)。 平均上网时间的 95%的置信区间为:3.32 1.96 36 3.32 0.53,即( 2.79, 3.85)。平均上网时间的 99%的置信区间为:s 3.32 2.58 1.61 3.32 0.69 ,即( 2.63,4.01)。 n 367.8已知:总体服从正态分布, 但 未知,n 8为小样本,0.05,t0.05 2 (8

33、 1) 2.365 。根据样本数据计算得: x 10 , s 3.46 。总体均值 的 95% 的置信区间为:s 10 2.365n3.4610 2.89 ,即( 7.11,12.89)。7.9 已知:总体服从正态分布, 但 未知,n 16为小样本,0.05,t0.05 2(16 1) 2.131。根据样本数据计算得: x 9.375 , s 4.113。从家里到单位平均距离的 95%的置信区间为:s4.113x t 2 9.375 2.131 9.375 2.191,即( 7.18, 11.57)。n 167.10 (1)已知: n 36, x 149.5 ,0.05, z0.05 2 1.

34、96。由于 n 36 为大样本,所以零件平均长度的95%的置信区间为:s1.93x z 2 149.5 1.96 149.5 0.63 ,即( 148.87, 150.13)。2 n36(2)在上面的估计中,使用了统计中的中心极限定理。该定理表明:从均值为、方差为2 的总体中, 抽取容量为 n 的随机样本, 当 n 充分大时 (通常要求 n 30 ),样本均值 x 的抽样分布近似服从均值为 、方差为 2 n 的正态分布。7.11(1)已知:总体服从正态分布, 但 未知, n 50为大样本,0.05,z0.05 2 1.96。根据样本数据计算得: x 101.32 , s 1.63。 该种食品平

35、均重量的 95%的置信区间为:即( 100.87, 101.77)。101.32 1.96 1.63 101.32 0.45 , 50(2)为:根据样本数据可知,样本合格率为45p 5405 0.9 。该种食品合格率的95%的置信区间p z 2 p(1 p) 0.9 1.96 0.9(1 0.9) 0.9 0.08 , n50即( 0.82, 0.98)。7.12 已 知 : 总 体 服 从 正 态 分 布 , 但 未 知 , n 25 为 小 样 本 , 0.01 ,t0.012(25 1) 2.797 。根据样本数据计算得: x 16.128 , s 0.871。 总体均值 的 99% 的

36、置信区间为:xt2 s 16.128 2.797 0.871 16.128 0.487 , n 25即( 15.64, 16.62)。7.13 已知:总体服从正态分布, 但 未知,n 18为小样本,0.1,t0.1 2 (18 1) 1.740 。根据样本数据计算得: x 13.56 , s 7.80。网络公司员工平均每周加班时间的90%的置信区间为:xt13.56 1.740 7.80 13.56 3.20 ,即( 10.36, 16.76)。187.14( 1)已知: n 44 , p 0.51 ,0.01, z0.01 2 2.58 。总体总比例 的 99%的置信区间为:p z 2 p(

37、1 p) 0.51 2.58 0.51(1 0.51) 0.51 0.19 ,即( 0.32,0.70); 2 n 44(2)已知: n 300, p 0.82,0.05, z0.05 2 1.96。总体总比例 的 95%的置信区间为:p z 2 p(1 p) 0.82 1.96 0.82(1 0.82) 0.82 0.04 ,即( 0.78, 0.86); 2 n 300(3)已知: n 1150, p 0.48,0.1, z0.12 1.645。总体总比例 的 90%的置信区间为:p z 2 p(1 p) 0.48 1.645 0.48(1 0.48) 0.48 0.02 ,即( 0.46

38、, 0.50)。2 n 11507,15 已知:n 200,p 0.23, 为 0.1和 0.05时,相应的 z0.1 2 1.645 , z0.05 2 1.96。 总体总比例 的 90% 的置信区间为:p z 2 p(1 p) 0.23 1.645 0.23(1 0.23) 0.23 0.05 ,即( 0.18,0.28)。2 n 200 总体总比例 的 95% 的置信区间为:p z 2 p(1 p) 0.23 1.96 0.23(1 0.23) 0.23 0.06 ,即( 0.17,0.29)。2 n 2007.16 已知: 1000 ,估计误差 E 200 ,0.01 , z0.01

39、2 2.58 。应抽取的样本量为:2 2 2 2( z 2 ) 2.582 10002n 167 。E220027.17( 1)已知: E0.02 ,0.40 ,0.04 , z0.04 2 2.05 。应抽取的样本量为:2( z 2 ) 2 (1 ) 2.052 0.40(1 0.40)n 2522 。E20.0222)已知: E 0.04 , 未知,0.05 , z0.05 2 1.96 。由于 未知,可用使用 0.5。22( z 2 ) (1 ) 1.962 0.50(1 0.50) 601。E20.0420.55,0.1, z0.1 2 1.645 。22( z 2 )(1 ) 1.6

40、452 0.55(1 0.55)268 。E20.05232p 0.64 ,0.05 , z0.05 2 1.96 。50总体中赞成该项改革的户数比例的95%的置信区间为:p(1 p) 0.64 1.960.64(1 0.64) 0.64 0.13 ,即( 0.51,0.77)。502 )已知: 0.80 ,0.05 , z0.05 2 1.96 。22应抽取的样本量为: n (z 2)2 2 (1 ) 1.962 0.802(1 0.80) 62。E 20.12第 8 章 假设检验二、练习题(说明: 为了便于查找书后正态分布表, 本答案中, 正态分布的分位点均采用了下侧分位点。 其他分位点也

41、可。为了便于查找书后 t 分布表方便,本答案中,正态分布的分位点均采用了 上侧分位点。 )8.1 解:根据题意,这是双侧检验问题。H 0 :4.55H1 :4.55已知:总体方差 2 0.10520 4.55, x 4.484, n 9, 显著水平 0.05x0/n4.484 4.550.108/ 91.8333当0.05 ,查表得 z1 /2 1.96 。拒绝域 W= z z1 /2 因为 z z1 /2 ,所以不能拒绝 H0,认为现在生产的铁水平均含碳量为4.55。注: z1 / 2为正态分布的 1-/2 下侧分位点 )8.2 解:根据题意,这是左单侧检验问题。H0 :700H1 :700

42、已知:总体方差 2 6020 700, x 680, n 36, 显著水平 0.05x 0 680 700 z2/ n 60/ 36当 0.05,查表得 z11.645 。拒绝域 W= zz1 因为 z 2z1 ,所以拒绝 H 0,认为该元件的使用寿命低于 700 小时。(注: z1 为正态分布的 1- 下侧分位点 )8.3 解:根据题意,这是右单侧检验问题。H0 :25 0H1 :2 50已知:总体方差 2 3020 250, x 270, n 25, 显著水平 0.05 x 0 270 250z 0 3.3333/ n 30/ 25当 0.05,查表得 z11.645 。拒绝域 W= z

43、z1 因为 z 3.3333 z1 ,所以拒绝 H0,认为这种化肥能使小麦明显增产。(注: z1 为正态分布的 1- 下侧分位点 )8.4 解:根据题意,这是双侧检验问题。H0 :100H1 : 10 0 方差 未知。已知:总体 0 4.55, 显著水平 0.05根据样本计算得: x 99.9778, s 1.2122, n 9x0s/ n99.9778 1001.2122 / 90.0549当0.05,查表得 t /2(8) 2.3060 。拒绝域 W= t t /2(8) 因为 t 0.0549 t /2 (8) ,所以不能拒绝 H 0,认为该日打包机工作正常。注:t / 2(8)为t分布

44、的/2 上侧分位点 )8.5 解:根据题意,这是右单侧检验问题。H 0 :0.05H1 :0.05已知: p 6 0.12,500 0.05,n 50,显著水平 0.05p00(1 0 )n2.27110.12 0.050.05 0.9550当0.05 ,查表得 z11.645 。拒绝域 W= z z1 因为 z 2.2711 z1 ,所以拒绝 H 0,认为不符合标准的比例超过 5%,该批食品不 能出厂。注: z1 为正态分布的 1- 下侧分位点 )8.6 解:根据题意,这是右单侧检验问题。H0 :2 5000H1 :2500 027000 250005000/ 15已知: 0 25000,

45、x 27000, s 5000, n 15, 显著水平 0.051.5492当0.05,查表得 t (14) 1.7613 。拒绝域 W= t t (14)因为 t 1.5492 t (14) ,所以不能拒绝 H0,认为该厂家的广告不真实。(注: t (14) 为 t分布的 上侧分位点 )8.7 解:根据题意,这是右单侧检验问题。H0 :22 5H1 :225241.5 22598.7259 / 15已知: 0 225,x 241.5,s 98.7259, n 16, 显著水平 0.050.6473当 0.05,查表得 t (15) 1.7531 。225 小时。拒绝域 W= t t (15)

46、因为 t 0.6473 t (14) ,所以不能拒绝 H0,认为元件的平均寿命不大于(注: t (15) 为 t 分布的 上侧分位点 )8.8 解:根据题意,这是右侧检验问题。2H 0 : 2 100H1 : 2 100已知: 0 10,s 14.6884, n 9,显著水平 0.052 (n 1)s2208 14.6882410217.2599当0.05,查表得2(8) 15.5073 。拒绝域 W= 22(8)因为 2 17.25992(8), 所以拒绝 H0,认为 H1 : 2 100成立。2注: 2(8)为 2-分布的 上侧分位点 )8.9 解:根据题意,这是双侧检验问题。H0 : A

47、B 0H1 : AB 0已知:总体方差 A 63 , B 57xA 1070,nA 81;xB 1020,nB 64, 显著水平 0.05zxAxB221070 10205.005922632 57281 64当 0.05,查表得 z1 /2 1.96 。拒绝域 W= z z1 /2 因为 z 5.0059 z1 /2 ,所以拒绝 H0,可以认为 A,B 两厂生产的材料平均抗压 强度不相同。(注: z1 / 2为正态分布的 1-/2 下侧分位点 )8.10 解:根据题意,这是双侧检验问题。H 0 : 1 2 0H1 : 1 2 022 已知:总体方差 1222 ,但未知x1 31.75, n1

48、 12;x2 28.6667, n2 12,sp 3.2030 显著水平 0.05x1 x211n1 n231.75 28.66672.3579113.203012 12当0.05,查表得 t /2(23) 2.0687 。拒绝域 W= t t / 2(23) 因为 t 2.3579 t /2 (23) ,所以拒绝 H0,认为两种方法的装配时间有显著差异。(注: t (23)为 t分布的上侧分位点 )8.11 解:根据题意,这是双侧检验问题。H0 : 1 2H1 : 1 2已知:43 13 p1 205,p2 134,n1205,n2 134,p 56 ,2 339显著水平 0.05在大样本条件下p1 p243 1311 p(1 p)( 1 1 )n1 n2205 134339(1 339)(205 134)当0.05 ,查表得 z1 /2 1.96 。拒绝域 W= z z1 /2 因为 z 2.7329 z1 /2 ,所以拒绝 H0,认为调查数据支持“吸烟者容易患慢性 气管炎”这种观点。(注: z1 / 2为正态分布的 1- /2 下侧分位点 )8.12 解:根据题意,这是右单侧检验问题。H 0 : 60( 1) 0H1 :

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论