




免费预览已结束,剩余81页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第 1 章统计和统计数据 第 2 章 1 1 指出下面的变量类型 1 年龄 2 性别 3 汽车产量 4 员工对企业某项改革措施的态度 赞成 中立 反对 5 购买商品时的支付方式 现金 信用卡 支票 详细答案 1 数值变量 2 分类变量 3 数值变量 4 顺序变量 5 分类变量 1 2 一家研究机构从IT 从业者中随机抽取1000 人作为样本进行调 查 其中 60 回答他们的月收入在5000 元以上 50 的人回答他 们的消费支付方式是用信用卡 1 这一研究的总体是什么 样本是什么 样本量是多少 2 月收入 是分类变量 顺序变量还是数值变量 3 消费支付方式 是分类变量 顺序变量还是数值变量 详细答案 1 总体是 所有 IT 从业者 样本是 所抽取的 1000 名 IT 从 业者 样本量是 1000 2 数值变量 3 分类变量 1 3 一项调查表明 消费者每月在网上购物的平均花费是200 元 他们选择在网上购物的主要原因是 价格便宜 1 这一研究的总体是什么 2 消费者在网上购物的原因 是分类变量 顺序变量还是数 值变量 详细答案 1 总体是 所有的网上购物者 2 分类变量 1 4 某大学的商学院为了解毕业生的就业倾向 分别在会计专业抽取 50 人 市场营销专业抽取30 企业管理 20 人进行调查 1 这种抽样方式是分层抽样 系统抽样还是整群抽样 2 样本量是多少 详细答案 1 分层抽样 2 100 第 2 章 用图表展示数据 2 1 为评价家电行业售后服务的质量 随机抽取由100 家庭构成的一个样 本 服务质量的等级分别表示为 A 好 B 较好 C 一般 D 较差 E 差 调查结果如下 BECCADCBAE DACBCDECEE ADBCCAEDCB BACDEABDDC CBCEDBCCBC DACBCDECEB BECCADCBAE BACDEABDDC ADBCCAEDCB CBCEDBCCBC 1 用 Excel 制作一张频数分布表 2 绘制一张条形图 反映评价等级的分布 3 绘制评价等级的Pareto 图 4 绘制一张饼图 反映评价等级的构成 详细答案 1 频数分布表如下 服服务务质质量量等等级级评评价价的的频频数数分分布布 服务质量等级 家庭数 频数 频率 A1414 B2121 C3232 D1818 E1515 合计 100100 2 条形图如下 3 帕累托图如下 4 饼图如下 2 2 为确定灯泡的使用寿命 单位 小时 在一批灯泡中随机抽取100 只进行测试 所得数据如下 700716728719685709691684705718 706715712722691708690692707701 708729694681695685706661735665 668710693697674658698666696698 706692691747699682698700710722 694690736689696651673749708727 688689683685702741698713676702 701671718707683717733712683692 693697664681721720677679695691 713699725726704729703696717688 1 以组距为 10 进行分组 整理成频数分布表 2 根据分组数据绘制直方图 说明数据分布的特点 3 制作茎叶图 并与直方图作比较 详细答案 1 频数分布表如下 100 只灯泡使用寿命的频数分 按使用寿命分组 小时 灯泡个数 只 频率 650 66022 660 67055 670 68066 680 6901414 690 7002626 700 7101818 710 7201313 720 7301010 730 74033 740 75033 合计 100 100 2 直方图如下 从直方图可以看出 灯泡使用寿命的分布基本上是对称的 3 茎叶图如下 茎茎 叶叶 数数 据据 个个 数数 65 1 8 2 66 1 4568 5 67 1 34679 6 68 1 1233345558899 14 69 0 011112223344556667788889926 70 0 01122345666778889 18 71 0 022335677889 13 72 0 122567899 10 73 3 56 3 74 1 47 3 茎叶图与直方图所反映的数据分布是一致的 不同的是茎叶图中保留了原始数 据 2 3 甲乙两个班各有40 名学生 期末统计学考试成绩的分布如下 人数人数 考试成绩考试成绩 甲班甲班 乙班乙班 优 36 良 615 中 189 及格 98 不及格 42 1 根据上面的数据 画出两个班考试成绩的环形图 比较它们的构成 2 画出雷达图 比较两个班考试成绩的分布是否相似 详细答案 1 环形图如下 2 雷达图如下 从雷达图可以看出 甲班成绩为优良的人数高于乙班 说明甲班的考试成绩好 于乙班 从雷达图的形状看 两个班考试成绩的分布没有相似之处 2 4 下面是我国 10 个城市 2006 年各月份的气温数据 月份 北京 沈阳 上海 南昌 郑州 武汉 广州 海口 重庆 昆明 1 月 1 9 12 75 76 60 34 215 818 57 810 8 2 月 0 9 8 15 66 53 95 817 320 59 013 2 3 月 8 00 511 112 711 512 817 921 813 315 9 4 月 13 58 016 619 317 119 023 626 719 218 0 5 月 20 418 320 822 721 823 925 328 322 918 0 6 月 25 921 625 626 027 828 427 829 425 420 4 7 月 25 924 229 430 027 130 229 830 031 021 3 8 月 26 424 330 230 026 129 729 428 532 420 6 9 月 21 817 523 924 321 224 027 027 424 818 3 10 月 16 111 622 122 119 021 026 427 120 616 9 11 月 6 70 815 715 010 814 021 925 314 613 2 12 月 1 0 6 78 28 13 06 816 020 89 49 8 绘制各城市月气温的箱线图 并比较各城市气温分布的特点 详细答案 箱线图如下 从箱线图可以看出 10 个城市中气温变化最小的是昆明 最大的是沈 阳 从中位数来看 多数靠近上四分位数 说明多数城市的气温分布都有一定 的左偏 第 3 章 用统计量描述数据 3 1 随机抽取 25 个网络用户 得到他们的年 1915292524 2321382218 3020191916 2327223424 4120311723 龄数据如下 单位 周岁 计算网民年龄的描述统计量 并对网民年龄的分布特征进行综合分析 详细答案 网民年龄的描述统计量如下 平均 24 中位数 23 25 四分位数 19 75 四分位数 26 5 众数 19 标准差 6 65 方差 44 25 峰度 0 77 偏度 1 08 极差 26 最小值 15 最大值 41 从集中度来看 网民平均年龄为24 岁 中位数为 23 岁 从离散度 来看 标准差在为6 65 岁 极差达到 26 岁 说明离散程度较大 从分布的 形状上看 年龄呈现右偏 而且偏斜程度较大 3 2 某银行为缩短顾客到银行办理业务等待的时间 准备采用两种排队方式 进行试验 一种是所有顾客都进入一个等待队列 另一种是顾客在3 个业 务窗口处列队 3 排等待 为比较哪种排队方式使顾客等待的时间更短 两种 排队方式各随机抽取9 名顾客 得到第一种排队方式的平均等待时间为7 2 分钟 标准差为1 97 分钟 第二种排队方式的等待时间 单位 分钟 如下 5 5 6 6 6 7 6 8 7 1 7 3 7 4 7 8 7 8 1 计算第二种排队时间的平均数和标准差 2 比两种排队方式等待时间的离散程度 3 如果让你选择一种排队方式 你会选择哪一种 试说明理由 详细答案 1 岁 岁 2 第一中排队方式的离散程度大 3 选方法二 因为平均等待时间短 且离散程度小 3 3 在某地区随机抽取120 家企业 按利润额进行分组后结果如下 按利润额分组 万元 按利润额分组 万元 企业数 个 企业数 个 300 以下 19 300 40030 400 50042 500 60018 600 以上 11 合计 120 计算 120 家企业利润额的平均数和标准差 注 第一组和最后一组的组距按 相邻组计算 详细答案 426 67 万元 万元 3 4 一家公司在招收职员时 首先要通过两项能力测试 在A 项测试中 其平均分数是 100 分 标准差是 15 分 在 B 项测试中 其平均分数是 400 分 标准差是 50 分 一位应试者在A 项测试中得了 115 分 在 B 项 测试中得了 425 分 与平均分数相比 该位应试者哪一项测试更为理想 详细答案 通过计算标准化值来判断 说明在 项测试中该应试者 比平均分 数高出 1 个标准差 而在B 项测试中只高出平均分数0 5 个标 准差 由于 A 项测试的标准化值高于B 项测试 所以 A 项测试比较理想 3 5 一种产品需要人工组装 现有3 种可供选择的组装方法 为检验哪种方 法更好 随机抽取15 个工人 让他们分别用3 种方法组装 下面是15 个 工人分别用 3 种方法在相同的时间内组装的产品数量 单位 个 方法方法 A方法方法 B方法方法 C 164129125 167130126 168129126 165130127 170131126 165130128 164129127 168127126 164128127 162128127 163127125 166128126 167128116 166125126 165132125 1 你准备用哪些统计量来评价组装方法的优劣 2 如果让你选择一种方法 你会做出怎样的选择 试说明理由 详细答案 3 种方法的主要描述统计量如下 方法方法 A 方法方法 B方法方法 C 平均 165 6平均 128 73平均 125 53 中位数 165中位数 129中位数 126 众数 164众数 128众数 126 标准差 2 13标准差 1 75标准差 2 77 峰度 0 13峰度 0 45峰度 11 66 偏度 0 35偏度 0 17偏度 3 24 极差 8极差 7极差 12 离散系数 0 013离散系数 0 014离散系数 0 022 最小值 162最小值 125最小值 116 最大值 170最大值 132最大值 128 1 从集中度 离散度和分布的形状三个角度的统计量来评价 从集 中度看 方法 A 的平均水平最高 方法C 最低 从离散度看 方法A 的 离散系数最小 方法C 最大 从分布的形状看 方法A 和方法 B 的偏斜 程度都不大 方法C 则较大 2 综合来看 应该选择方法A 因为平均水平较高且离散程度较 小 第 4 章 概率分布 4 1 消费者协会经过调查发现 某品牌空调器有重要缺陷的产品数出现的概 率分布如下 X012345678910 P0 0410 1300 2090 2230 1780 1140 0610 0280 0110 0040 001 根据这些数值 分别计算 1 有 2 到 5 个 包括 2 个与 5 个在内 空调器出现重要缺陷的概率 2 只有不到 2 个空调器出现重要缺陷的概率 3 有超过 5 个空调器出现重要缺陷的概率 详细答案 1 0 724 2 0 171 3 0 105 4 2 设 是参数为 和 的二项随机变量 求以下概率 1 2 详细答案 1 0 375 2 0 6875 4 3 求标准正态分布的概率 1 2 3 详细答案 1 0 3849 2 0 1844 3 0 0918 4 4 由 30 辆汽车构成的一个随机样本 测得每百公里的耗油量数据如下 单 位 公升 9 1910 019 609 279 788 82 9 638 8210 508 839 358 65 10 109 4310 129 399 548 51 9 7010 039 499 489 369 14 10 099 859 379 649 689 75 绘制正态概率图 判断该种汽车的耗油量是否近似服从正态分布 详细答案 正态概率图如下 由正态概率图可以看出 汽车耗油量基本服从正态分布 4 5 从均值为 200 标准差为 50 的总体中 抽取 的简单随机样本 用样本均值 估计总体均值 1 的期望值是多少 2 的标准差是多少 3 的概率分布是什么 详细答案 1 200 2 5 3 近似正态分布 4 6 从 的总体中 抽取一个容量为500 的简单随机样本 1 的期望值是多少 2 的标准差是多少 3 的分布是什么 详细答案 1 0 4 2 0 0219 3 近似正态分布 4 7 假设一个总体共有8 个数值 54 55 59 63 64 68 69 70 从 该总体中按重复抽样方式抽取的随机样本 1 计算出总体的均值和方差 2 一共有多少个可能的样本 3 抽出所有可能的样本 并计算出每个样本的均值 4 画出样本均值的正态概率图 判断样本均值是否服从正态分布 5 计算所有样本均值的平均数和标准差 并与总体的均值和标准差进行比较 得到的结论是什么 详细答案 1 2 共有 64 个样本 3 所有样本的样本均值如下 54 0 54 556 558 559 061 061 562 0 54 555 057 059 059 561 562 062 5 56 557 059 061 061 563 564 064 5 58 559 061 063 063 565 566 066 5 59 059 561 563 564 066 066 567 0 61 061 563 565 566 068 068 069 0 61 562 064 066 066 568 569 069 5 62 062 564 566 567 069 069 570 0 4 样本均值的正态概率图如下 从正态概率图可以看出 样本均值近似服从正态分布 5 样本均值的 平均数等于总体平均数 样本均值的标准差等于总体标准差的 第 5 章 参数估计 5 1 某快餐店想要估计每位顾客午餐的平均花费金额 在为期3 周的 时间里选取 49 名顾客组成了一个简单随机样本 1 假定总体标准差为15 元 求样本均值的标准误差 2 在 95 的置信水平下 求估计误差 3 如果样本均值为120 元 求总体均值 的 95 的置信区间 详细答案 1 2 E 4 2 3 115 8 124 2 5 2 利用下面的信息 构建总体均值 的置信区间 1 总体服从正态分布 且已知 置信水平 为 95 2 总体不服从正态分布 且已知 置信水 平为 95 3 总体不服从正态分布 未知 置信水平为 90 4 总体不服从正态分布 未知 置信水平为 99 详细答案 1 8647 9153 2 8734 9066 3 8761 9039 4 8682 9118 5 3 某大学为了解学生每天上网的时间 在全校学生中随机抽取36 人 调查他们每天上网的时间 得到下面的数据 单位 小时 如下 3 33 16 25 82 34 15 44 53 2 4 42 05 42 66 41 83 55 72 3 2 11 91 25 14 34 23 60 81 5 4 71 41 22 93 52 40 53 62 5 求该校大学生平均上网时间的置信区间 置信水平分别为90 95 和 99 详细答案 1 2 88 3 76 2 2 80 3 84 3 2 63 4 01 5 4 某居民小区共有居民500 户 小区管理者准备采取一项新的供水设 施 想了解居民是否赞成 采取重复抽样方法随机抽取了50 户 其中 有 32 户赞成 18 户反对 1 求总体中赞成新措施的户数比例的置信区间 置信水平为95 2 如果小区管理者预计赞成的比例能达到80 要求估计误差不超过 10 应抽取多少户进行调查 详细答案 1 51 37 76 63 2 62 5 5 顾客到银行办理业务时往往需要等待一些时间 而等待时间的长短与 许多因素有关 比如 银行的业务员办理业务的速度 顾客等待排队的方 式等等 为此 某银行准备采取两种排队方式进行试验 第一种排队方式 是 所有顾客都进入一个等待队列 第二种排队方式是 顾客在三个业务 窗口处列队三排等待 为比较哪种排队方式使顾客等待的时间更短 银行 各随机抽取的 10 名顾客 他们在办理业务时所等待的时间 单位 分钟 如下 方式 16 56 66 76 87 17 37 47 77 77 7 方式 24 25 45 86 26 77 77 78 59 310 0 1 构建第一种排队方式等待时间标准差的95 的置信区间 2 构建第二种排队方式等待时间标准差的95 的置信区间 3 根据 1 和 2 的结果 你认为哪种排队方式更好 详细答案 1 0 33 0 87 2 1 25 3 33 3 第一种排队方式更好 5 6 两个正态总体的方差 和 未知但相等 从两个总体中分别抽取 两个独立的随机样本 它们的均值和标准差如下 来自总体来自总体 1 的样本的样本 来自总体来自总体 2 的样本的样本 1 求 的 95 的置信区间 2 求 的 99 的置信区间 详细答案 1 1 86 17 74 2 0 19 19 41 3 3 34 22 94 5 7 一家人才测评机构对随机抽取的10 名小企业的经理人用两种方法进 行自信心测试 得到的自信心测试分数如下 人员编号人员编号 方法方法 1方法方法 2 17871 26344 37261 48984 59174 64951 76855 87660 98577 105539 构建两种方法平均自信心得分之差的95 的置信区间 详细答案 6 33 15 67 5 8 从两个总体中各抽取一个 的独立随机样本 来自总体1 的样本比例为 来自总体 2 的样本比例为 1 构造 的 90 的置信区间 2 构造 的 95 的置信区间 详细答案 1 3 02 16 98 2 1 68 18 32 5 9 生产工序的方差是工序质量的一个重要度量 当方差较大时 需要对 工序进行改进以减小方差 下面是两部机器生产的袋茶重量 单位 克 的数据 机器机器 1机器机器 2 3 453 223 903 223 283 35 3 202 983 703 383 193 30 3 223 753 283 303 203 05 3 503 383 353 303 293 33 2 953 453 203 343 353 27 3 163 483 123 283 163 28 3 203 183 253 303 343 25 构造两个总体方差比 的 95 的置信区间 详细答案 4 06 24 35 5 10 某超市想要估计每个顾客平均每次购物花费的金额 根据过去的经 验 标准差大约为120 元 现要求以 95 的置信水平估计每个顾客平均 购物金额的置信区间 并要求估计误差不超过20 元 应抽取多少个顾 客作为样本 详细答案 139 5 11 假定两个总体的标准差分别为 若要求估计误 差不超过 5 相应的置信水平为95 假定 估计两个总体均值 之差 时所需的样本量为多大 详细答案 57 5 12 假定 估计误差 相应的置信水平为95 估计 两个总体比例之差 时所需的样本量为多大 详细答案 769 第 6 章 假设检验 6 1 一项包括了 200 个家庭的调查显示 每个家庭每天看电视的平均时间为 7 25 小时 标准差为2 5 小时 据报道 10 年前每天每个家庭看电视的平 均时间是 6 70 小时 取显著性水平 这个调查能否证明 如今每 个家庭每天收看电视的平均时间增加了 详细答案 3 11 拒绝 如今每个家庭每天收看 电视的平均时间显著地增加了 6 2 为监测空气质量 某城市环保部门每隔几周对空气烟尘质量进行一次随 机测试 已知该城市过去每立方米空气中悬浮颗粒的平均值是82 微克 在最近一段时间的检测中 每立方米空气中悬浮颗粒的数值如下 单位 微 克 81 686 680 085 878 658 368 773 2 96 674 983 066 668 670 971 771 6 77 376 192 272 461 775 685 572 5 74 082 587 073 288 586 994 983 0 根据最近的测量数据 当显著性水平 时 能否认为该城市空 气中悬浮颗粒的平均值显著低于过去的平均值 详细答案 2 39 拒绝 该城市空气中 悬浮颗粒的平均值显著低于过去的平均值 6 3 安装在一种联合收割机的金属板的平均重量为25 公斤 对某企业生产 的 20 块金属板进行测量 得到的重量数据如下 22 626 623 123 5 27 025 328 624 5 26 230 427 424 9 25 823 226 926 1 22 228 124 223 6 假设金属板的重量服从正态分布 在显著性水平下 检验该企业生产的 金属板是否符合要求 详细答案 不拒绝 没有证据表明 该企业生产的金属板不符合要求 6 4 在对消费者的一项调查表明 17 的人早餐饮料是牛奶 某城市的牛奶 生产商认为 该城市的人早餐饮用牛奶的比例更高 为验证这一说法 生产 商随机抽取 550 人的一个随机样本 其中115 人早餐饮用牛奶 在 显著性水平下 检验该生产商的说法是否属实 详细答案 拒绝 该生产商的说法 属实 6 5 某生产线是按照两种操作平均装配时间之差为5 分钟而设计的 两种 装配操作的独立样本产生如下结果 操作操作 A操作操作 B 100 50 14 8 10 4 0 8 0 6 对 0 02 检验平均装配时间之差是否等于5 分钟 详细答案 5 145 拒绝 两种装配操作的平均装配时间之差不等于5 分钟 6 6 某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分 样本中每个人都分别在看过该产品的新的电视广告之前与之后打分 潜在购 买力的分值为 0 10 分 分值越高表示潜在购买力越高 原假设认为 看 后 平均得分小于或等于 看前 平均得分 拒绝该假设就表明广告提高了平 均潜在购买力得分 对 0 05 的显著性水平 用下列数据检验该假设 并对该广告给予评价 购买力得分购买力得分 购买力得分购买力得分 个体个体 看后看后 看前看前 个体个体 看后看后 看前看前 165535 264698 377775 443866 详细答案 设 1 36 不拒绝 广告提高了平均潜在购买力得分 6 7 某企业为比较两种方法对员工进行培训的效果 采用方法1 对 15 名 员工进行培训 采用方法2 对 12 名员工进行培训 培训后的测试分数如下 方法 1方法 2 565145595753 475243525665 425352535553 504248546457 474444 两种方法培训得分的总体方差未知且不相等 在 显著性水平下 检验两种方法的培训效果是否有显著差异 详细答案 拒绝 两种方法的培训效果是有显著差异 6 8 为研究小企业经理们是否认为他们获得了成功 在随机抽取 100 个 小企业的女性经理中 认为自己成功的人数为24 人 而在对 95 个男性经 理的调查中 认为自己成功的人数为39 人 在 的显著性水平下 检验男女经理认为自己成功的人数比例是否有显著差异 详细答案 设 拒绝 男女经理认为自己成功的人数比例有显著差异 6 9 为比较新旧两种肥料对产量的影响 以便决定是否采用新肥料 研究者 选择了面积相等 土壤等条件相同的40 块田地 分别施用新旧两种肥料 得到的产量数据如下 旧肥料旧肥料 新肥料新肥料 1091019798100105109110118109 9898949910411311111199112 1038810810210610611799107119 97105102104101110111103110119 取显著性水平 检验 1 新肥料获得的平均产量是否显著地高于旧肥料 假定条件为 两种肥料产量的方差未但相等 即 两种肥料产量的方差未且不相等 即 2 两种肥料产量的方差是否有显著差异 详细答案 1 设 拒绝 新肥料获得的平均产量显著地高于 旧肥料 2 拒绝 新肥料获得的平均产量显著地高于旧肥料 3 两种肥料产量 的方差有显著差异 6 10 生产工序中的方差是工序质量的一个重要测度 通常较大的方差就意味 着要通过寻找减小工序方差的途径来改进工序 某杂志上刊载了关于两部机 器生产的袋茶重量的数据 单位 克 如下 检验这两部机器生产的袋茶重 量的方差是否存在显著差异 0 05 机器机器 12 953 453 503 753 483 263 333 20 3 163 203 223 383 903 363 253 28 3 203 222 983 453 703 343 183 35 3 12 机器机器 23 223 303 343 283 293 253 303 27 3 383 343 353 193 353 053 363 28 3 303 283 303 203 163 33 详细答案 8 28 拒绝 两部机 器生产的袋茶重量的方差存在显著差异 第 7 章 方差分析与实验设计 教材习题答案教材习题答案 7 1 一家牛奶公司有4 台机器装填牛奶 每桶的容量为4 升 下面是从 4 台机器中抽取的装填量样本数据 机器机器 1机器机器 2机器机器 3机器机器 4 4 053 993 974 00 4 014 023 984 02 4 024 013 973 99 4 043 993 954 01 4 004 00 4 00 取显著性水平 检验 4 台机器的装填量是否相同 详细答案 7 2 一家管理咨询公司为不同的客户进行人力资源管理讲座 每次讲座的 内容基本上一样的 但讲座的听课者有时是高级管理者 有时是中级管理 者 有时是低级管理者 该咨询公司认为 不同层次的管理者对讲座的满 意度是不同的 对听完讲座后随机抽取的不同层次管理者的满意度评分如 下 评分标准是从1 10 10 代表非常满意 高级管理者高级管理者 中级管理者中级管理者 低级管理者低级管理者 785 796 885 7107 994 108 8 取显著性水平 检验管理者的水平不同是否会导致评分的显著性 差异 详细答案 7 3 某家电制造公司准备购进一批5 电池 现有 A B C 三个电池生 产企业愿意供货 为比较它们生产的电池质量 从每个企业各随机抽取5 只电池 经实验得其寿命 单位 小时 数据如下 电池生产企业电池生产企业 实验号实验号 ABC 1 2 3 4 5 50 50 43 40 39 32 28 30 34 26 45 42 38 48 40 试分析 3 个企业生产的电池的平均寿命之间有无显著差异 如果有差异 用LSD 方法检验哪些企业之间有差异 详细答案 7 4 某企业准备用 3 种方法组装一种新的产品 为确定哪种方法每小时生 产的产品数量最多 随机抽取了30 名工人 并指定每个人使用其中的一 种方法 通过对每个工人生产的产品数进行方差分析得到下面的结果 方差分析表 差异源 SSdfMSFP valueF crit 组间 210 0 2459463 354131 组内 3836 总计 29 1 完成上面的方差分析表 2 若显著性水平 检验 3 种方法组装的产品数量之间是否有 显著差异 详细答案 7 5 有 5 种不同品种的种子和4 种不同的施肥方案 在20 块同样面积 的土地上 分别采用5 种种子和 4 种施肥方案搭配进行实验 取得的收 获量数据如下表 施肥方案施肥方案 品种品种 1234 1 2 3 4 5 12 0 13 7 14 3 14 2 13 0 9 5 11 5 12 3 14 0 14 0 10 4 12 4 11 4 12 5 13 1 9 7 9 6 11 1 12 0 11 4 检验种子的不同品种对收获量的影响是否显著 不同的施肥方案对收获量 的影响是否显著 详细答案 7 6 城市道路交通管理部门为研究不同的路段和不同的时间段对行车时间 的影响 让一名交通警察分别在3 个路段和高峰期与非高峰期亲自驾车 进行实验 通过实验取得共获得30 个行车时间 单位 分钟 的数据 试分析路段 时段以及路段和时段的交互作用对行车时间的影响 路段 路段 1路段 2路段 3 36 528 132 4 34 129 933 0 37 232 236 2 35 631 535 5 高峰期 38 0 30 135 1 30 627 631 8 27 924 328 0 32 422 0 26 7 31 825 429 3 时段 非高峰期 27 321 725 6 详细答案 7 7 为检验广告媒体和广告方案对产品销售量的影响 一家营销公司做了 一项实验 考察三种广告方案和两种广告媒体 获得的销售量数据如下 广告媒体广告媒体 报纸报纸 电视电视 812 A 128 2226 广告方案 B 1430 1018 C 1814 检验广告方案 广告媒体或其交互作用对销售量的影响是否显著 详细答案 第 8 章 一元线性回归 8 1 从某一行业中随机抽取12 家企业 所得产量与生产费用的数据如下 企业编号企业编号 产量 台 产量 台 生产费用 万元 生产费用 万元 企业编号企业编号 产量 台 产量 台 生产费用 万元 生产费用 万元 140130784165 2421508100170 3501559116167 45514010125180 56515011130175 67815412140185 1 绘制产量与生产费用的散点图 判断二者之间的关系形态 2 计算产量与生产费用之间的线性相关系数 并对相关系数的显著性进 行检验 并说明二者之间的关系强度 详细答案 1 散点图如下 产量与生产费用之间为正的线性相关关系 2 检验统计量 拒绝原假设 相关系数显著 8 2 下面是 7 个地区 2000 年的人均国内生产总值 GDP 和人均消费 水平的统计数据 地区地区 人均人均 GDP 元 元 人均消费水平 元 人均消费水平 元 北京 224607326 辽宁 112264490 上海 3454711546 江西 48512396 河南 54442208 贵州 26621608 陕西 45492035 1 绘制散点图 并计算相关系数 说明二者之间的关系 2 人均 GDP 作自变量 人均消费水平作因变量 利用最小二乘法求出 估计的回归方程 并解释回归系数的实际意义 3 计算判定系数和估计标准误差 并解释其意义 4 检验回归方程线性关系的显著性 5 如果某地区的人均GDP 为 5000 元 预测其人均消费水平 6 求人均 GDP 为 5000 元时 人均消费水平95 的置信区间和预测 区间 详细答案 1 散点图如下 二者之间为高度的正线性相关关系 二者之间为高度的 正线性相关关系 2 估计的回归方程为 回归系数 表示人均 GDP 每变动 1 元 人均消费水平平均变动0 3087 元 3 判定系数 表明在人均消费水平的变差中 有 99 63 是由人均 GDP 与消费水平之间的关系决定的 估计标准误差 表示用人均 GDP 预测人均消费水平的平均误差为247 3 元 4 检验统计量 拒绝原假设 线性关系显著 5 元 6 置信区间 1990 749 2565 464 预测区间 1580 463 2975 750 8 3 随机抽取 10 家航空公司 对其最近一年的航班正点率和顾客投诉次 数进行调查 所得数据如下 航空公司编号航空公司编号 航班正点率 航班正点率 投诉次数 次 投诉次数 次 181 821 276 658 376 685 475 768 573 874 672 293 771 272 870 8122 991 418 1068 5125 1 用航班正点率作自变量 顾客投诉次数作因变量 求出估计的回归方 程 并解释回归系数的意义 2 检验回归系数的显著性 3 如果航班正点率为80 估计顾客的投诉次数 详细答案 1 估计的回归方程为 回归系数 表示 航班正点率每变动1 顾客投诉次数平均反向变动4 7 次 3 检验回归系数的P 0 001108a 0 05 表明 y 与和之间 的线性关系不显著 用于回归系数检验的P 值均大于 a 0 05 两个回归系 数均不显著 当 200 7 时 y 的预测值为 9 2 根据下面 Excel 输出的回归结果 说明模型中涉及多少个自变量 多少 个观察值 写出回归方程 并根据F 及调整的 的值对模型进 行讨论 SUMMARY OUTPUT 回归统计 Multiple R0 842407 R Square 0 709650 Adjusted R Square0 630463 标准误差 109 429596 观测值 15 方差分析 dfSSMSFSignificance F 回归 3321946 8018107315 60068 961759 0 002724 残差 11131723 198211974 84 总计 14453670 Coefficients标准误差 t StatP value Intercept657 0534167 4595393 923655 0 002378 X Variable 15 7103111 7918363 186849 0 008655 X Variable 2 0 4169170 322193 1 293998 0 222174 X Variable 3 3 4714811 442935 2 405847 0 034870 详细答案 模型中涉及 2 个自变量 15 对观察值 估计的回归方程为 从判定系数 和调整的判定系数 可以看出 回 归方程的拟合程度一般 估计标准误差 预测误差比较大 从方差分析表可知 Significance F 0 002724a 0 05 不显著 的 P Value 0 0013 的 P Value 0 0571 a 0 05 不显著 9 7 根据 9 4 题中的数据 回答下面的问题 1 a 0 01 的水平下 检验二元回归模型线性关系的显著性 2 a 0 05 在的水平下 检验回归系数的显著性 你认为应该从模 型中剔除吗 3 a 0 05 在的水平下 检验回归系数的显著性 你认为应该从模 型中剔除吗 详细答案 1 由于 Significance F 0 001865 2 的 P Value 0 0007 3 的 P Value 0 0098 9 8 根据下面的数据回答下面的问题 y 123 722 396 6 126 625 789 4 120 038 744 0 119 331 066 4 110 633 949 1 130 328 385 2 131 330 280 4 114 421 490 5 128 630 477 1 108 432 651 1 112 033 950 5 115 623 585 1 108 327 665 9 126 339 049 0 124 631 669 6 1 计算 y 与之间的相关系数 有无证据表明二者之间存在线性关系 a 0 05 2 计算 y 与之间的相关系数 有无证据表明二者之间存在线性关系 a 0 05 3 根据上面的结论 你认为 对预测 y 是否有用 4 用 Excel 进行回归 并对模型进行检验 所得的结论与 3 是否相 同 a 0 05 5 计算与之间的相关系数 所得结果意味着什么 详细答案 1 由 excel 的 CORREL 函数计算的系数r 0 0025 检验的统计量为 取 a 0 05 由于检验统计量 拒绝原假设 无证据表明二者之间存在线性关系 2 由 excel 的 CORREL 函数计算的系数r 0 4341 检验的统计量为 取 a 0 05 由于检验统计量 拒绝原假设 无证据表明二者之间存在线性关系 3 由于 与 y 没有相关关系 所以用 对预测 y 没有用 4 由 Excel 输出的回归结果如下 回归统计 Multiple R0 999924 R Square 0 999847 Adjusted R Square0 999822 标准误差 0 107155 观测值 15 方差分析 dfSSMSFSignificance F 回归分析 2900 7222450 361139222 341 28E 23 残差 120 1377870 011482 总计 14900 86 Coefficients标准误差 t StatP valueLower 95 Upper 95 Intercept 45 15410 611418 73 85152 53E 17 46 4863 43 822 X Variable 13 0970080 012274252 31371 01E 233 0702643 123752 X Variable 21 0318590 003684280 07892 89E 241 0238321 039886 由于 Significance F 1 28E 23 5 由 excel 的 CORREL 函数计算的系数r 0 8998 两个自变量之间高 度负相关 这意味着模型中存在多重共线性 9 9 下面是随机抽取的15 家大型商场销售的同类产品的有关数据 单位 元 企业编号企业编号 销售价格销售价格 y 购进价格购进价格销售费用销售费用 11238966223 21266894257 31200440387 41193664310 51106791339 61303852283 71313804302 81144905214 91286771304 101084511326 111120505339 121156851235 131083659276 141263490390 151246696316 1 计算 y 与 y 与之间的相关系数 是否有证据表明销售价格与购 进价格 销售价格与销售费用之间存在线性关系 2 根据上述结果 你认为用购进价格和销售费用来预测销售价格是否有用 3 用 Excel 进行回归 并检验模型的线性关系是否显著 a 0 05 4 解释判定系数 所得结论与问题 2 中是否一致 5 计算 与 之间的相关系数 所得结果意味着什么 6 模型中是否存在多重共线性 你对模型有何建议 详细答案 1 由 excel 的 CORREL 函数计算的系数 检验的统计量分别为 取 a 0 05 由于检验统计量 因此没有证据表明销售价格与购进价格 销售价 格与销售费用之间存在线性关系 2 没有用 3 由 Excel 输出的回归结果如下 回归统计 Multiple R0 593684 R Square 0 35246 Adjusted R Square0 244537 标准误差 69 75121 观测值 15 方差分析 dfSSMSFSignificance F 回归分析 231778 1515889 083 2658420 073722 残差 1258382 784865 232 总计 1490160 93 Coefficients标准误差 t StatP valueLower 95 Upper 95 Intercept375 6018339 41061 106630 290145 363 911115 114 X Variable 10 5378410 2104472 5557110 02520 0793170 996365 X Variable 21 4571940 6677072 1823860 0496810 0023862 912001 回归方程为 由于 Significance F 0 073722 a 0 05 线性关系不显著 4 所得结论与问题 2 一致 5 由 excel 的 CORREL 函数计算的系数 两个自变量高 度负相关 6 由于两个自变量高度负相关 可能存在多重共线性 建议将一个自变量 从模型中剔除 9 10 设因变量为 y 一个数值型自变量 和一个具有两个水平 水平1 和水平 2 的分类型自变量 1 写出因变量 y 关于自变量和分类自变量的多元回归方程 2 对应于分类自变量水平1 的 y 的期望值是多少 3 对应于分类自变量水平2 的 y 的期望值是多少 详细答案 1 式中 2 3 4 是当 保持不变时 由于 变化一 个单位引起 变化的数量 9 11 一家货物运输公司想研究运输费用与货物类型的关系 并建立运输费用 与货物类型的回归模型 以此对运输费用作出预测 该运输公司所运输的货 物分为两种类型 易碎品和非易碎品 下表给出了15 个路程大致相同 而货物类型不同的运输费用数据 每件产品的运输费用每件产品的运输费用 y 元 元 货物类型货物类型 17 2易碎品 1 11 1易碎品 1 12 0易碎品 1 10 9易碎品 1 13 8易碎品 1 6 5易碎品 1 10 0易碎品 1 11 5易碎品 1 7 0非易碎品 0 8 5非易碎品 0 2 1非易碎品 0 1 3非易碎品 0 3 4非易碎品 0 7 5非易碎品 0 2 0非易碎品 0 1 写出运输费用与货物类型之间的线性方程 2 对模型中的回归系数进行解释 3 检验模型的线性关系是否显著 a 0 05 详细答案 1 由 Excel 输出的回归结果如下 回归统计 Multiple R0 780195 R Square 0 608704 Adjusted R Square0 578604 标准误差 3 042926 观测值 15 方差分析 dfSSMSFSignificance F 回归分析 1187 2519187 251920 22290 000601 残差 13120 37219 259396 总计 14307 624 Coefficients标准误差 t StatP valueLower 95 Upper 95 Intercept4 5428571 1501183 9499060 0016622 0581797 027535 X Variable 17 0821431 5748644 4969880 0006013 67985710 48443 运输费用与货物类型之间的线性方程为 2 表示 易碎品 的预期运输费用比非易碎品的预期运输费 用多 7 0821 元 3 由于 Significance F 0 000601 9 12 为分析某行业中的薪水有无性别歧视 从该行业中随机抽取15 名员 工 有关的数据如下 月薪月薪 y 元 元 工龄工龄 性别 性别 1 男 男 0 女 女 15483 21 16293 81 10112 70 12293 40 17463 61 15284 11 10183 80 11903 40 15513 31 9853 20 16103 51 143
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广东清远市英德市建筑工程检测站有限公司招聘员工1人模拟试卷及答案详解(名师系列)
- 2025内蒙古工业大学事业编制工作人员招聘10人考前自测高频考点模拟试题及答案详解(全优)
- 2025年洮南市面向社会公开招聘化工园区特勤站政府专职消防员聘用人员考前自测高频考点模拟试题附答案详解(黄金题型)
- 2025年吉林松辽水利水电咨询有限责任公司公开招聘模拟试卷及1套完整答案详解
- 2025春季四川叙永县委组织部叙永县人力资源和社会保障局叙永县事业单位人才岗位需求70人模拟试卷及答案详解(必刷)
- 2025贵州黔东南州第十三届贵州人才博览会黔东南州事业单位人才引进19人模拟试卷及完整答案详解一套
- 2025年安徽白帝集团有限公司及所属子公司春季招聘8人模拟试卷带答案详解
- 2025贵州黔西市招募青年就业见习人员81人考前自测高频考点模拟试题参考答案详解
- 2025届春季中国广核集团校园招聘考前自测高频考点模拟试题及1套参考答案详解
- 2025年哈尔滨延寿县公安局公开招聘第二批警务辅助人员32人考前自测高频考点模拟试题及答案详解(夺冠)
- 2025海康威视视频安全门禁系统使用手册
- 安检流程课件
- 2025-2026学年沪教牛津版(深圳用)小学英语五年级上册教学计划及进度表
- 带状疱疹后神经痛护理查房
- 保密文印管理办法
- 肝癌的中医护理
- 高血糖健康宣教
- 【城市道路监理大纲】市政一级主干道路工程监理大纲
- 二年级上册道德与法治期末测试卷含完整答案(有一套)
- 《房产测绘数据库存储管理规范》
- 南通市第一初中2023~2024初一上学期第一次月考数学试卷及答案
评论
0/150
提交评论