




已阅读5页,还剩15页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
0 统计学统计学 第五版 贾俊平 课后题答案第五版 贾俊平 课后题答案 第第 4 章章 数据的概括性度量数据的概括性度量 4 1 1 众数 10 0 M 中位数 5 5 2 110 2 1 n 中位数位置 10 2 1010 e M 平均数 6 9 10 96 10 151442 1 n x x n i i 2 5 2 4 10 4 n QL位置5 5 2 74 L Q 5 7 4 103 4 3 n QU位置12 2 1212 U Q 3 2 4 9 4 156 110 6 915 6 914 6 94 6 92 1 2222 1 2 n xx s n i i 4 由于平均数小于中位数和众数 所以汽车销售量为左偏分布 4 2 1 从表中数据可以看出 年龄出现频数最多的是 19 和 23 所以有两个众数 即和 19 0 M23 0 M 将原始数据排序后 计算的中位数的位置为 第 13 2 125 2 1 n 中位数位置 1 13 个位置上的数值为 23 所以中位数 23 e M 2 25 6 4 25 4 n QL位置19 1919 25 0 19 L Q 75 18 4 253 位置 U Q56 252 7257 052 U Q 3 平均数 24 25 600 25 23171519 1 n x x n i i 65 6 125 1062 125 2423 2417 2415 2419 1 2222 1 2 n xx s n i i 4 偏态系数 08 1 65 6 225 125 2425 3 3 i x SK 峰态系数 77 0 65 6 325 225 125 125 24 3 24 125 25 4 2 24 ii xx K 5 分析 从众数 中位数和平均数来看 网民年龄在 23 24 岁的人数占多数 由于标准差较大 说明网民年龄之间有较大差异 从偏态系数来看 年龄分布为 右偏 由于偏态系数大于 1 所以偏斜程度很大 由于峰态系数为正值 所以为 尖峰分布 4 3 1 茎叶图如下 茎茎叶叶数据个数数据个数 551 66 7 83 71 3 4 8 85 2 7 9 63 9 8 78 76 65 5 x 2 714 0 8 08 4 19 78 7 78 7 76 6 75 5 2222 s 3 由于两种排队方式的平均数不同 所以用离散系数进行比较 第一种排队方式 由于 表274 0 2 7 97 1 1 v102 0 7 714 0 2 v 21 vv 明第一种排队方式的离散程度大于第二种排队方式 4 选方法二 因为第二种排队方式的平均等待时间较短 且离散程度小于第一 种排队方式 4 4 1 1 274 30 8223 1 n x x n i i 5 15 2 130 中位数位置 5 272 2 273272 e M 2 5 7 4 30 位置 L Q 5 259 2 261258 L Q 5 22 4 303 位置 U Q 5 287 2 291284 U Q 3 17 21 130 7 13002 1 1 2 n xx s n i i 4 5 1 41 19 340 6600 30 1500 20 3000 15 2100 150030002100 总产量 总成本 甲企业的平均成本 9 2 18 342 5562 30 1500 20 0051 15 2553 150000515523 总产量 总成本 乙企业的平均成本 原因 尽管两个企业的单位成本相同 但单位成本较低的产品在乙企业的产量中 所占比重较大 因此拉低了总平均成本 4 6 1 平均数计算过程见下表 3 按利润额分组按利润额分组 组中值组中值 i M 企业数企业数 i f iif M 200 300250194750 300 4003503010500 400 5004504218900 500 600550189900 600 以上650117150 合计合计 12051200 67 426 120 51200 1 n fM x k i ii 标准差计算过程见下表 按利润额分组按利润额分组 组中值组中值 i M企业数企业数 i f 2 xMi ii fxM 2 200 3002501931212 3593033 5 300 400350305878 3176348 7 400 50045042544 322860 1 500 6005501815210 3273785 2 600 以上6501149876 3548639 2 合计合计 120102721 51614666 7 48 116 1120 7 1614666 1 1 2 n fxM s k i ii 2 偏态系数和峰态系数的计算过程见下表 按利润额分组按利润额分组 组中值组中值 i M企业数企业数 i f ii fxM 3 ii fxM 4 200 30025019 104771226 52 300 40035030 13520652 3 1036628411 8 400 50045042533326 9 12442517 1 500 6005501833765928 7 4164351991 6 600 以上65011122527587 6 27364086138 8 合计合计 12038534964 4 51087441648 4 4 偏态系数 203 0 48 116120 4 38534964 33 1 3 ns fxM SK k i ii 峰态系数 688 0 3 48 116120 4 85108744164 3 44 1 4 ns fxM K k i ii 4 7 1 两位调查人员所得到的平均身高应该差不多相同 因为均值的大小基本 上不受样本大小的影响 2 两位调查人员所得到的身高的标准差应该差不多相同 因为标准差的大小基 本上不受样本大小的影响 3 具有较大样本的调查人员有更大的机会取到最高或最低者 因为样本越大 变化的范围就可能越大 4 8 1 要比较男女学生体重的离散程度应该采用离散系数 女生体重的离散系 数为 男生体重的离散系数为 所以女生的体重1 0 50 5 女 v08 0 60 5 男 v 差异大 2 男生 磅 磅 1322 260 x112 25 s 女生 磅 磅 1102 250 x112 25 s 3 假定体重为对称分布 根据经验法则 在平均数加减 1 个标准差范围内的数 据个数大约为 68 因此 男生中大约有 68 的人体重在 55kg 到 65kg 之间 4 假定体重为对称分布 根据经验法则 在平均数加减 2 个标准差范围内的数 据个数大约为 95 因此 女生中大约有 95 的人体重在 40kg 到 60kg 之间 4 9 通过计算标准分数来判断 1 15 100115 A AA A s xx z5 0 50 400425 B BB B s xx z 该测试者在 A 项测试中比平均分数高出 1 个标准差 而在 B 项测试中只高出平均 分数 0 5 个标准差 由于 A 项测试的标准分数高于 B 项测试 所以 A 项测试比较 理想 4 10 通过标准分数来判断 各天的标准分数如下表 5 日期周一周二周三周四周五周六周日 标准分数 Z3 0 6 0 20 4 1 8 2 20 周一和周六两天失去了控制 4 11 1 应该采用离散系数 因为它消除了不同组数据水平高低的影 响 2 成年组身高的离散系数 024 0 1 172 2 4 s v 幼儿组身高的离散系数 035 0 3 71 5 2 s v 由于幼儿组身高的离散系数大于成年组身高的离散系数 说明幼儿组身高的 离散程度相对较大 4 11 1 应该从平均数和标准差两个方面进行评价 在对各种方法的离散程度进 行比较时 应该采用离散系数 2 下表给出了用 Excel 计算一些主要描述统计量 方法方法 A方法方法 B方法方法 C 平均165 6平均128 73平均125 53 中位数165中位数129中位数126 众数164众数128众数126 标准差2 13标准差1 75标准差2 77 极差8极差7极差12 最小值162最小值125最小值116 最大值170最大值132最大值128 从三种方法的集中趋势来看 方法 A 的平均产量最高 中位数和众数也都高 于其他两种方法 从离散程度来看 三种方法的离散系数分别为 方法013 0 6 165 13 2 A v014 0 73 128 75 1 B v022 0 53 125 77 2 C v A 的离散程度最小 因此应选择方法 A 4 12 1 用方差或标准差来评价投资的风险 2 从直方图可以看出 商业类股票收益率的离散程度较小 说明投资风险 也就较小 6 3 从投资风险角度看 应该选择风险较小的商业类股票 当然 选择哪类 股票还与投资者的主观判断有很大关系 第第 7 章章 抽样与参数估计抽样与参数估计 7 1 1 已知 5 40 n25 x05 0 96 1 205 0 z 样本均值的抽样标准差 79 0 40 5 n x 2 估计误差 55 1 40 5 96 1 2 n zE 7 2 1 已知 15 49 n120 x05 0 96 1 205 0 z 样本均值的抽样标准差 14 2 49 15 n x 2 估计误差 20 4 49 15 96 1 2 n zE 3 由于总体标准差已知 所以总体均值的 95 的置信区间为 即 115 8 124 2 20 4 120 49 15 96 1 120 2 n zx 7 3 已知 100 n85414 104560 x05 0 96 1 205 0 z 由于总体标准差已知 所以总体均值的 95 的置信区间为 即144 16741104560 100 85414 96 1 104560 2 n zx 87818 856 121301 144 7 4 1 已知 100 n81 x12 s1 0 645 1 21 0 z 由于为大样本 所以总体均值的 90 的置信区间为 100 n 即 79 026 82 974 974 1 81 100 12 645 1 81 2 n s zx 7 2 已知 05 0 96 1 205 0 z 由于为大样本 所以总体均值的 95 的置信区间为 100 n 即 78 648 83 352 352 2 81 100 12 96 1 81 2 n s zx 3 已知 01 0 58 2 201 0 z 由于为大样本 所以总体均值的 99 的置信区间为 100 n 即 77 940 84 096 096 3 81 100 12 58 2 81 2 n s zx 7 5 1 已知 25 x5 3 60 n05 0 96 1 205 0 z 由于总体标准差已知 所以总体均值的 95 的置信区间为 即 24 11 25 89 89 0 25 60 5 3 96 125 2 n zx 2 已知 6 119 x89 23 s75 n02 0 33 2 202 0 z 由于为大样本 所以总体均值的 98 的置信区间为 75 n 即 113 17 126 03 43 6 6 119 75 89 23 33 2 6 119 2 n s zx 3 已知 419 3 x974 0 s32 n1 0 645 1 21 0 z 由于为大样本 所以总体均值的 90 的置信区间为 32 n 即 3 136 3 702 283 0 419 3 32 974 0 645 1 419 3 2 n s zx 7 6 1 已知 总体服从正态分布 500 15 n8900 x 05 0 96 1 205 0 z 由于总体服从正态分布 所以总体均值的 95 的置信区间为 即 8646 97 9153 03 03 2538900 15 500 96 1 8900 2 n zx 2 已知 总体不服从正态分布 500 35 n8900 x05 0 96 1 205 0 z 虽然总体不服从正态分布 但由于为大样本 所以总体均值的 95 的置35 n 信区间为 8 即 8734 35 9065 65 65 1658900 35 500 96 1 8900 2 n zx 3 已知 总体不服从正态分布 未知 35 n8900 x500 s 1 0 645 1 21 0 z 虽然总体不服从正态分布 但由于为大样本 所以总体均值的 90 的置35 n 信区间为 即 8760 97 9039 03 03 1398900 35 500 645 1 8900 2 n s zx 4 已知 总体不服从正态分布 未知 35 n8900 x500 s 01 0 58 2 201 0 z 虽然总体不服从正态分布 但由于为大样本 所以总体均值的 99 的置35 n 信区间为 即 8681 95 9118 05 05 2188900 35 500 58 2 8900 2 n s zx 7 7 已知 当为 0 1 0 05 0 01 时 相应的 36 n 645 1 21 0 z 96 1 205 0 z58 2 201 0 z 根据样本数据计算得 32 3 x61 1 s 由于为大样本 所以平均上网时间的 90 的置信区间为 36 n 即 2 88 3 76 44 0 32 3 36 61 1 645 1 32 3 2 n s zx 平均上网时间的 95 的置信区间为 即 2 79 3 85 53 0 32 3 36 61 1 96 1 32 3 2 n s zx 平均上网时间的 99 的置信区间为 即 2 63 4 01 69 0 32 3 36 61 1 58 2 32 3 2 n s zx 7 8 已知 总体服从正态分布 但未知 为小样本 8 n05 0 365 2 18 205 0 t 根据样本数据计算得 10 x46 3 s 9 总体均值的 95 的置信区间为 即 7 11 12 89 89 2 10 8 46 3 365 2 10 2 n s tx 7 9 已知 总体服从正态分布 但未知 为小样本 16 n05 0 131 2 116 205 0 t 根据样本数据计算得 375 9 x113 4 s 从家里到单位平均距离的 95 的置信区间为 即 7 18 11 57 191 2 375 9 16 113 4 131 2 375 9 2 n s tx 7 10 1 已知 36 n 5 149 x05 0 96 1 205 0 z 由于为大样本 所以零件平均长度的 95 的置信区间为 36 n 即 148 87 150 13 63 0 5 149 36 93 1 96 1 5 149 2 n s zx 2 在上面的估计中 使用了统计中的中心极限定理 该定理表明 从均值为 方差为的总体中 抽取容量为的随机样本 当充分大时 通常要求 2 nn 样本均值的抽样分布近似服从均值为 方差为的正态分布 30 nx n 2 7 11 1 已知 总体服从正态分布 但未知 为大样本 50 n05 0 96 1 205 0 z 根据样本数据计算得 32 101 x63 1 s 该种食品平均重量的 95 的置信区间为 即 100 87 101 77 45 0 32 101 50 63 1 96 1 32 101 2 n s zx 2 根据样本数据可知 样本合格率为 该种食品合格率的 95 9 0 50 45 p 的置信区间为 即 0 82 0 98 08 0 9 0 50 9 01 9 0 96 1 9 0 1 2 n pp zp 10 7 12 已知 总体服从正态分布 但未知 为小样本 25 n01 0 797 2 125 201 0 t 根据样本数据计算得 128 16 x871 0 s 总体均值的 99 的置信区间为 即 15 64 16 62 487 0 128 16 25 871 0 797 2 128 16 2 n s tx 7 13 已知 总体服从正态分布 但未知 为小样本 18 n1 0 740 1 118 21 0 t 根据样本数据计算得 56 13 x80 7 s 网络公司员工平均每周加班时间的 90 的置信区间为 即 10 36 16 76 20 3 56 13 18 80 7 740 1 56 13 2 n s tx 7 14 1 已知 44 n51 0 p01 0 58 2 201 0 z 总体总比例的 99 的置信区间为 即19 0 51 0 44 51 0 1 51 0 58 2 51 0 1 2 n pp zp 0 32 0 70 2 已知 300 n82 0 p05 0 96 1 205 0 z 总体总比例的 95 的置信区间为 即04 0 82 0 300 82 0 1 82 0 96 1 82 0 1 2 n pp zp 0 78 0 86 3 已知 1150 n48 0 p1 0 645 1 21 0 z 总体总比例的 90 的置信区间为 即02 0 48 0 1150 48 0 1 48 0 645 1 48 0 1 2 n pp zp 0 46 0 50 11 7 15 已知 为 0 1 和 0 05 时 相应的 200 n23 0 p 645 1 21 0 z 96 1 205 0 z 总体总比例的 90 的置信区间为 即05 0 23 0 200 23 0 1 23 0 645 1 23 0 1 2 n pp zp 0 18 0 28 总体总比例的 95 的置信区间为 即06 0 23 0 200 23 0 1 23 0 96 1 23 0 1 2 n pp zp 0 17 0 29 7 16 已知 估计误差 1000 200 E01 0 58 2 201 0 z 应抽取的样本量为 167 200 100058 2 2 22 2 22 2 E z n 7 17 1 已知 02 0 E40 0 04 0 2 05 204 0 z 应抽取的样本量为 2522 02 0 40 0 1 40 0 05 2 1 2 2 2 2 2 E z n 2 已知 未知 04 0 E 05 0 1 96 205 0 z 由于未知 可用使用 0 5 应抽取的样本量为 601 04 0 50 0 1 50 0 96 1 1 2 2 2 2 2 E z n 3 已知 05 0 E55 0 1 0 1 645 21 0 z 应抽取的样本量为 268 05 0 55 0 1 55 0 645 1 1 2 2 2 2 2 E z n 7 18 1 已知 50 n64 0 50 32 p05 0 1 96 205 0 z 总体中赞成该项改革的户数比例的 95 的置信区间为 12 即13 0 64 0 50 64 0 1 64 0 96 1 64 0 1 2 n pp zp 0 51 0 77 2 已知 80 0 05 0 1 96 205 0 z 应抽取的样本量为 62 1 0 80 0 1 80 0 96 1 1 2 2 2 2 2 E z n 第第 13 章章 时间序列分析和预测时间序列分析和预测 1 1 时间序列图如下 0 200 400 600 800 1000 1200 1400 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999 年份 财政支出 从时间序列图可以看出 国家财政用于农业的支出额大体上呈指数上升趋势 2 年平均增长率为 55 131 55 1131 21 110 76 1085 1 18 0 n n Y Y G 3 88 1232 55 131 76 1085 2000 Y 2 1 时间序列图如下 13 0 200 400 600 800 1000 1200 1400 1600 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999 年份 产量 2 2001 年的预测值为 2 1421 5 7106 5 15191469127214791367 2001 F 3 由 Excel 输出的指数平滑预测值如下表 年份年份单位面积产量单位面积产量 指数平滑预测指数平滑预测 3 0 误差平方误差平方 指数平滑预测指数平滑预测 5 0 误差平方 19811451 198213721451 06241 01451 06241 0 198311681427 367236 51411 559292 3 198412321349 513808 61289 83335 1 198512451314 34796 51260 9252 0 198612001293 58738 51252 92802 4 198712601265 429 51226 51124 3 198810201263 859441 01243 249833 6 198910951190 79151 51131 61340 8 199012601162 09611 01113 321518 4 199112151191 4558 11186 7803 5 199212811198 56812 41200 86427 7 199313091223 27357 61240 94635 8 199412961249 02213 11275 0442 8 199514161263 123387 71285 517035 9 199613671308 93369 91350 7264 4 199714791326 423297 71358 914431 3 14 199812721372 210031 01418 921589 8 199914691342 116101 51345 515260 3 200015191380 219272 11407 212491 7 合计合计 291455 2 239123 0 2001 年时的预测值为 3 0 8 1421 2 1380 3 01 15193 0 1 2001 tt FYF 时的预测值为 5 0 1 1463 1 1407 5 01 15195 0 1 2001 tt FYF 比较误差平方可知 更合适 5 0 3 1 第 19 个月的 3 期移动平均预测值为 33 630 3 1891 3 660644587 19 F 2 由 Excel 输出的指数平滑预测值如下表 月份月份营业额营业额 预测预测 0 3 误差平方误差平方 预测预测 0 4 误差平方误差平方 预测预测 0 5 误差平方误差平方 1295 2283295 0144 0295 0144 0295 0144 0 3322291 4936 4290 21011 2289 01089 0 4355300 62961 5302 92712 3305 52450 3 5286316 9955 2323 81425 2330 31958 1 6379307 65093 1308 74949 0308 15023 3 7381329 02699 4336 81954 5343 61401 6 8431344 67459 6354 55856 2362 34722 3 9424370 52857 8385 11514 4396 6748 5 10473386 67468 6400 75234 4410 33928 7 11470412 53305 6429 61632 9441 7803 1 12481429 82626 2445 81242 3455 8633 5 13449445 115 0459 9117 8468 4376 9 14544446 39547 4455 57830 2458 77274 8 15601475 615724 5490 912120 5501 49929 4 16587513 25443 2534 92709 8551 21283 3 15 17644535 411803 7555 87785 2569 15611 7 18660567 98473 4591 14752 7606 52857 5 合计合计 87514 7 62992 5 50236 时的预测值 3 0 误差均方 87514 7 5 595 9 567 3 01 6603 0 19 F 时的预测值 4 0 误差均方 62992 5 7 618 1 591 4 01 6604 0 19 F 时的预测值 5 0 误差均方 50236 3 633 5 606 5 01 6605 0 19 F 比较各误差平方可知 更合适 5 0 3 根据最小二乘法 利用 Excel 输出的回归结果如下 回归统计 Multiple R0 9673 R Square0 9356 Adjusted R Square0 9316 标准误差31 6628 观测值18 方差分析 dfSSMSFSignificance F 回归分析1232982 5232982 5232 39445 99E 11 残差1616040 491002 53 总计17249022 9 Coefficients标准误差t StatP valueLower 95 Upper 95 Intercept239 7320315 5705515 39655 16E 11206 7239272 7401 X Variable 121 9287931 43847415 244495 99E 1118 8793624 97822 tYt9288 2173 239 4 1 趋势图如下 16 0 500 1000 1500 2000 2500 3000 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999 年份 财政支出 2 从趋势图可以看出 我国财政用于文教 科技 卫生事业费指出额呈现指数 增长趋势 因此 选择指数曲线 经线性变换后 利用 Excel 输出的回归结果如 下 回归统计 Multiple R0 998423 R Square0 996849 Adjusted R Square0 996674 标准误差0 022125 观测值20 方差分析 dfSSMSFSignificance F 回归分析12 7876
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 作业程序指南
- 航海船舶防火安全制度
- 羊绒大衣秋冬搭配方案
- 可持续包装制作规定
- 基因突变机制与进化适应规划
- 服装生产流程控制方案
- 网络安全与网络言论真实化
- 2025云南丽江玉龙纳西族自治县幼儿园招聘公益性岗位教师3人笔试备考试题及答案解析
- 家电维修效率提升方法总结
- 考研英语阅读考点剖析与解题技巧
- 2022年东台市城市建设投资发展集团有限公司招聘笔试题库及答案解析
- 汉书-张骞传课件
- 民法典侵权责任编课件
- 市政道路养护工程监理工作
- 2022年初中化学新课标测试
- 练平舌音和翘舌音的绕口令
- 校企合作讲座精品PPT课件
- 医学检验师考试试题
- 煤矿电缆与电缆敷设标准
- T∕CATCM 008-2019 阿胶质量规范
- 防水堵漏施工合同
评论
0/150
提交评论