已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
11 统计学复习笔记统计学复习笔记 第七章第七章 参数估计参数估计 一 一 思考题思考题 1 解释估计量和估计值解释估计量和估计值 在参数估计中 用来估计总体参数的统计量称为估计量估计量 估计量也是随机 变量 如样本均值 样本比例 样本方差等 根据一个具体的样本计算出来的估计量的数值称为估计值估计值 2 简述评价估计量好坏的标准简述评价估计量好坏的标准 1 无偏性 是指估计量抽样分布的期望值等于被估计的总体参数 2 有效性 是指估计量的方差尽可能小 对同一总体参数的两个无偏 估计量 有更小方差的估计量更有效 3 一致性 是指随着样本量的增大 点估计量的值越来越接近被估总 体的参数 3 怎样理解置信区间怎样理解置信区间 在区间估计中 由样本统计量所构造的总体参数的估计区间称为置信区间 置信区间的论述是由区间和置信度两部分组成 有些新闻媒体报道一些调查结 果只给出百分比和误差 即置信区间 并不说明置信度 也不给出被调查的人 数 这是不负责的表现 因为降低置信度可以使置信区间变窄 显得 精确 有误导读者之嫌 在公布调查结果时给出被调查人数是负责任的表现 这样则 可以由此推算出置信度 由后面给出的公式 反之亦然 4 解释解释 95 的置信区间的含义是什么的置信区间的含义是什么 置信区间 95 仅仅描述用来构造该区间上下界的统计量 是随机的 覆盖总 体参数的概率 也就是说 无穷次重复抽样所得到的所有区间中有 95 的区 间 包含参数 不要认为由某一样本数据得到总体参数的某一个 95 置信区间 就以为该 区间以 0 95 的概率覆盖总体参数 5 简述样本量与置信水平 总体方差 估计误差的关系 简述样本量与置信水平 总体方差 估计误差的关系 1 估计总体均值时样本量n为 其中 2 22 2 E z n n zE 2 2 样本量n与置信水平 1 总体方差 估计误差E之间的关系为 22 与置信水平成正比 在其他条件不变的情况下 置信水平越大 所需要的样本量越大 与总体方差成正比 总体的差异越大 所要求的样本量也越大 与与总体方差成正比 样本量与估计误差的平方成反比 即可以 接受的估计误差的平方越大 所需的样本量越小 二 二 练习题练习题 1 从一个标准差为从一个标准差为 5 的总体中采用重复抽样方法抽出一个样本量的总体中采用重复抽样方法抽出一个样本量 为为 40 的样本 样本均值为的样本 样本均值为 25 1 样本均值的抽样标准差样本均值的抽样标准差 x 等于多少 等于多少 2 在在 95 的置信水平下 估计误差是多少 的置信水平下 估计误差是多少 2 某快餐店想要估计每位顾客午餐的平均花费金额 在为期某快餐店想要估计每位顾客午餐的平均花费金额 在为期 3 周周 的时间里选取的时间里选取 49 名顾客组成了一个简单随机样本 名顾客组成了一个简单随机样本 1 假定总体标准差为假定总体标准差为 15 元 求样本均值的抽样标准误差 元 求样本均值的抽样标准误差 2 在在 95 的置信水平下 求估计误差 的置信水平下 求估计误差 3 如果样本均值为如果样本均值为 120 元 求总体均值元 求总体均值 的的 95 的置信区间的置信区间 33 3 从一个总体中随机抽取从一个总体中随机抽取 n 100 的随机样本 得到的随机样本 得到 104560 假定总体标准差假定总体标准差 85414 试构建总体均值 试构建总体均值 的的 95 的置信区间 的置信区间 4 从总体中抽取一个从总体中抽取一个 n 100 的简单随机样本 得到的简单随机样本 得到 81 s 12 要求 要求 1 构建构建 的的 90 的置信区间 的置信区间 2 构建构建 的的 95 的置信区间 的置信区间 3 构建构建 的的 99 的置信区间 的置信区间 5 利用下面的信息 构建总体均值的置信区间 利用下面的信息 构建总体均值的置信区间 1 25 3 5 n 60 置信水平为 置信水平为 95 2 119 s s 23 89 n 75 置信水平为 置信水平为 98 3 3 149 s s 0 974 n 32 置信水平为 置信水平为 90 x x x x x 44 6 利用下面的信息 构建总体均值利用下面的信息 构建总体均值 的置信区间 的置信区间 1 总体服从正态分布 且已知总体服从正态分布 且已知 500 n 15 8900 置信 置信 水平为水平为 95 2 总体不服从正态分布 且已知总体不服从正态分布 且已知 500 n 35 8900 置 置 信水平为信水平为 95 3 总体不服从正态分布 总体不服从正态分布 未知 未知 n 35 8900 s s 500 置 置 信水平为信水平为 90 4 总体不服从正态分布 总体不服从正态分布 未知 未知 n 35 8900 s s 500 置 置 信水平为信水平为 99 x x x x 55 7 某大学为了解学生每天上网的时间 在全校某大学为了解学生每天上网的时间 在全校 7500 名学生中采名学生中采 取重复抽样方法随机抽取取重复抽样方法随机抽取 36 人 调查他们每天上网的时间 得到下人 调查他们每天上网的时间 得到下 面的数据 单位 小时 面的数据 单位 小时 3 33 16 25 82 34 15 44 53 2 4 42 05 42 66 41 83 55 72 3 2 11 91 25 14 34 23 60 81 5 4 71 41 22 93 52 40 53 62 5 求该校大学生平均上网时间的置信区间 置信水平分别为求该校大学生平均上网时间的置信区间 置信水平分别为 90 8 从一个正态总体中随机抽取样本量为从一个正态总体中随机抽取样本量为 8 的样本 各样本值分别的样本 各样本值分别 为 为 10 8 12 15 6 13 5 11 求总体均值 求总体均值 的的 95 置信区置信区 间 间 9 某居民小区为研究职工上班从家里到单位的距离 抽取了由某居民小区为研究职工上班从家里到单位的距离 抽取了由 16 个人组成的一个随机样本 他们到单位的距离分别是 个人组成的一个随机样本 他们到单位的距离分别是 10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2 假 假 设总体服从正态分布 求职工上班从家里到单位平均距离的设总体服从正态分布 求职工上班从家里到单位平均距离的 95 的的 置信区间 置信区间 66 10 从一批零件是随机抽取从一批零件是随机抽取 36 个 测得其平均长度是个 测得其平均长度是 149 5 标准 标准 差是差是 1 93 1 求确定该种零件平均长度的求确定该种零件平均长度的 95 的置信区间 的置信区间 2 在上面估计中 你使用了统计中的哪一个重要定理 请解释 在上面估计中 你使用了统计中的哪一个重要定理 请解释 1111 某企业生产的袋装食品采用自动打包机包装 每袋标准重量某企业生产的袋装食品采用自动打包机包装 每袋标准重量 为为 100100 克 现从某天生产的一批产品中按重复抽样随机抽取克 现从某天生产的一批产品中按重复抽样随机抽取 5050 包进包进 行检查 测得每包重量如下 行检查 测得每包重量如下 已知食品包重服从正态分布 要求 已知食品包重服从正态分布 要求 1 1 确定该种食品平均重量的确定该种食品平均重量的 95 95 的置信区间 的置信区间 77 2 2 如果规定食品重量低于如果规定食品重量低于 100100 克属于不合格 确定该批食克属于不合格 确定该批食 品合格率的品合格率的 95 95 的置信区间 的置信区间 12 假设总体服从正态分布 利用下面的数据构建总体均值假设总体服从正态分布 利用下面的数据构建总体均值 的的 99 的置信区间 的置信区间 略 略 13 一家研究机构想估计在网络公司工作的员工每周加班的平均一家研究机构想估计在网络公司工作的员工每周加班的平均 时间 为此随机抽取了时间 为此随机抽取了 18 个员工 得到他们每周加班的时间数据如个员工 得到他们每周加班的时间数据如 下 单位 小时 下 单位 小时 6 3 21 8 17 12 20 11 7 9 0 21 8 25 16 15 29 16 假定员工每周加班的时间服从正态分布 估计网络公司员工平均假定员工每周加班的时间服从正态分布 估计网络公司员工平均 88 1414 利用下面的样本数据构建总体比例丌的置信区间 利用下面的样本数据构建总体比例丌的置信区间 1 1 n n 44 44 p p 0 510 51 置信水平为 置信水平为 99 99 2 2 n n 300 300 p p 0 820 82 置信水平为 置信水平为 95 95 3 3 n n 1150 1150 p p 0 480 48 置信水平为 置信水平为 90 90 1515 在一项家电市场调查中 随机抽取了在一项家电市场调查中 随机抽取了 200200 个居民户 调查他个居民户 调查他 们是否拥有某一品牌的电视机 其中拥有该品牌电视机的家庭占们是否拥有某一品牌的电视机 其中拥有该品牌电视机的家庭占 23 23 求总体比例的置信区间 置信水平分别为求总体比例的置信区间 置信水平分别为 90 90 和和 95 95 1616 一位银行的管理人员想估计每位顾客在该银行的月平均存款一位银行的管理人员想估计每位顾客在该银行的月平均存款 额 他假设所有顾客月存款额的标准差为额 他假设所有顾客月存款额的标准差为 10001000 元 要求的估计误差元 要求的估计误差 在在 200200 元以内 置信水平为元以内 置信水平为 99 99 应选取多大的样本 应选取多大的样本 99 1717 要估计总体比例丌 计算下列条件下所需的样本量 要估计总体比例丌 计算下列条件下所需的样本量 1 1 E 0 02E 0 02 丌 丌 0 40 0 40 置信水平 置信水平 96 96 2 2 E 0 04E 0 04 丌未知丌未知 置信水平置信水平 95 95 3 3 E 0 05E 0 05 丌 丌 0 55 0 55 置信水平 置信水平 90 90 18 某居民小区共有居民某居民小区共有居民 500 户 小区管理者准备采用一项新的户 小区管理者准备采用一项新的 供水设施 想了解居民是否赞成 采取重复抽样方法随机抽取了供水设施 想了解居民是否赞成 采取重复抽样方法随机抽取了 50 户 其中有户 其中有 32 户赞同 户赞同 18 户反对 户反对 1 求总体中赞成该项改革的户数比例的置信区间求总体中赞成该项改革的户数比例的置信区间 0 05 2 如果小区管理者预计赞成的比例能达到如果小区管理者预计赞成的比例能达到 80 估计误 估计误 差不超过差不超过 10 应抽取多少户进行调查 应抽取多少户进行调查 0 05 19 根据下面的样本结果 计算总体标准差根据下面的样本结果 计算总体标准差 的的 90 的置信区间 的置信区间 1 21 21 S 2S 2 N 50N 50 1010 2 2 1 3 1 3 S 0 02S 0 02 N 15N 15 3 3 167 167 S 31S 31 N 22N 22 20 顾客到银行办理业务时往往需要等待一段时间 而等待时间的长短与许多因素有关 比 如 银行业务员办理业务的速度 顾客等待排队的方式等 为此 某银行准备采取两 种排队方式进行试验 第一种排队方式是 所有顾客都进入一个等待队列 第二种排 队方式是 顾客在三个业务窗口处列队三排等待 为比较哪种排队方式使顾客等待的 时间更短 银行各随机抽取 10 名顾客 他们在办理业务时所等待的时间 单位 分钟 如下 方式 16 56 66 76 87 17 37 47 77 77 7 方式 24 25 45 86 26 77 77 78 59 310 要求 1 构建第一种排队方式等待时间标准差的 95 的置信区间 2 构建第二种排队方式等待时间标准差的 95 的置信区间 第八章第八章 假设检验假设检验 一 一 思考题思考题 1 假设检验和参数估计有什么相同点和不同点 假设检验和参数估计有什么相同点和不同点 解 参数估计与假设检验是统计推断的两个组成部分 相同点 它们都是利用样本对总体进行某种推断 1111 不同点 推断的角度不同 参数估计参数估计讨论的是用样本统计量估 计总体参数的方法 总体参数 在估计前是未知的 而在假设检验假设检验 中 则是先对 的值提出一个假设 然后利用样本信息去检验这个 假设是否成立 2 什么是假设检验中的显著性水平 统计显著是什么意思 什么是假设检验中的显著性水平 统计显著是什么意思 解 显著性水平用 表示 在假设检验中 它的含义是当原假设正 确时却被拒绝的概率或风险 即假设检验中犯弃真错误的概率 它 是由人们根据检验的要求确定的 我理解的统计学意义 统计显著是统计上专用的判定标准 指在一定的概率原则下 可以承认一种趋势或者合理性达到的程度 达到为统计上水平显著 达不到为统计上水平不显著 3 什么是假设检验中的两类错误 什么是假设检验中的两类错误 解 弃真错误 错误 当原假设为真时拒绝原假设 所犯的错 误成为第 I 类错误 又称为弃真错误 犯第 I 类错误的概率常记作 取伪错误 错误 当原假设为假时没有拒绝原假设 所犯 的错误称为第 II 类错误 又称取伪错误 犯第 II 类错误概率常记作 发生第 I 类错误的概率也常被用于检验结论的可靠性度量 假 设检验中犯第 I 类错误的概率被称为显著性水平 记作 1212 4 两类错误之间存在什么样的数量关系 两类错误之间存在什么样的数量关系 在样本容量 n 一定的情况下 假设检验不能同时做到犯 和 两类错误的概率都很小 若减小 错误 就会增大犯 错误的 机会 若减小 错误 也会增大犯 错误的机会 要使 和 同时变小只有增大样本容量 但样本容量增加要受人力 经费 时 间等很多因素的限制 无限制增加样本容量就会使抽样调查失去意 义 因此假设检验需要慎重考虑对两类错误进行控制的问题 5 解释假设检验中的解释假设检验中的 P 值 值 解 如果原假设为真 所得到的样本结果会像实际观测结果那么极 端或更极端的概率 称为 P 值 也称为观察到的显著性水平 P 值是反映实际观测到的数据与原假设 H0之间不一致程度的一 个概率值 P 值越小 说明实际观测到的数据与 H0之间不一致程度 就越大 6 显著性水平与显著性水平与 P 值有何区别 值有何区别 解 显著性水平 是一个判断的标准 当原假设为真 却被拒 绝的概率 而 P 是实际统计量对应分位点的概率值 当原假设为真 时 所得到的样本观察结果或更极端结果出现的概率 可以通过 计算置信区间 然后与统计量进行比较判断 也可 以通过统计量计算对应的 p 值 然后与 值比较判断 1313 7 假设检验依据的基本原理是什么 假设检验依据的基本原理是什么 解 假设检验利用的是小概率原理 小概率原理是指发生概率很小 的随机事件在一次试验中是几乎不可能发生的 根据这一原理 可 以先假设总体参数的某项取值为真 也就是假设其发生的可能性很 大 然后抽取一个样本进行观察 如果样本信息显示出现了与事先 假设相反的结果且与原假设差别很大 则说明原来假定的小概率事 件在一次实验中发生了 这是一个违背小概率原理的不合理现象 因此有理由怀疑和拒绝原假设 否则不能拒绝原假设 8 你认为在单侧检验中原假设和备择假设的方向应该如何确定 你认为在单侧检验中原假设和备择假设的方向应该如何确定 解 假设问题有两种情况 一种是所考察的数值越大越好 左单侧 检验或下限检验 临界值和拒绝域均在左侧 另一种是数值越小越 好 右单侧检验或上限检验 临界值和拒绝域均在右侧 二 二 练习题练习题 1 已知某炼铁厂的含碳量服从正态分布已知某炼铁厂的含碳量服从正态分布 N 4 55 0 108 现在 现在 测定了测定了 9 炉铁水 其平均含碳量为炉铁水 其平均含碳量为 4 484 如果估计方差没有变化 如果估计方差没有变化 可否认为现在生产的铁水平均含碳量为可否认为现在生产的铁水平均含碳量为 4 55 0 05 1414 2 一种元件 要求其使用寿命不得低于一种元件 要求其使用寿命不得低于 700 小时 现从一批这种小时 现从一批这种 元件中随机抽取元件中随机抽取 36 件 测得其平均寿命为件 测得其平均寿命为 680 小时 已知该元件寿小时 已知该元件寿 命服从正态分布 命服从正态分布 60 60 小时 试在显著性水平小时 试在显著性水平 0 050 05 下确定这批元下确定这批元 件是否合格 件是否合格 3 某地区小麦的一般生产水平为亩产某地区小麦的一般生产水平为亩产 250 公斤 其标准差是公斤 其标准差是 30 公公 斤 现用一种化肥进行试验 从斤 现用一种化肥进行试验 从 25 个小区抽样 平均产量为个小区抽样 平均产量为 2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 营销策划执行合同范本
- 2025年河北张家口市党校系统硕博人才引进60名参考题库含答案详解(综合卷)
- 2025广西南宁市信访局招聘外聘人员1人参考题库含答案详解(黄金题型)
- 2025广东中共清远市纪委市监委纪律审查管理中心招聘17人参考题库附答案详解ab卷
- 2025年甘肃省地矿局所属事业单位定向招聘残疾工作人员参考题库附答案详解(达标题)
- 2025年大学《劳动与社会保障-社会救助与社会福利》考试模拟试题及答案解析
- 2025年大学《导航工程-卫星导航原理》考试模拟试题及答案解析
- 2025年劳动仲裁申请流程试题及答案
- 2025年大学《环保设备工程-环保设备拆装与调试实训》考试备考试题及答案解析
- 2025年7月全国自考劳动法试题及答案解析
- 医院感染管理科十五五发展规划
- DL-T 1476-2023 电力安全工器具预防性试验规程
- 20S805-1 雨水调蓄设施-钢筋混凝土雨水调蓄池
- 2024年江苏江南水务股份有限公司招聘笔试参考题库附带答案详解
- 传染病案例分析(一)
- 江苏省房屋面积测算技术规程
- MSL湿敏物料管控作业指导书
- 常见降压药的分类
- 中医药膳学课件
- 脊柱弯曲异常筛查结果记录表
- 有机光化学之光催化剂参与的反应课件
评论
0/150
提交评论