




已阅读5页,还剩91页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5章抽样与参数估计 第5章抽样与参数估计 5 1抽样及其分布5 2抽样方法5 3参数估计5 4样本容量的确定5 5Excel的应用 学习目标 1 了解抽样和抽样分布的基本概念2 了解点估计的概念和估计量的优良标准3 掌握总体均值 总体比例和总体方差的区间估计掌握样本容量的确定掌握Excel的应用 5 1抽样及其分布 1 统计推断2 几个基本概念 总体个体 样本 统计量3 抽样分布 统计推断 参数估计在统计方法中的地位 统计推断 1 统计学描述统计学 研究如何全面收集被研究客观事物的数据资料并进行简缩处理 描述其群体特征和数量规律性 推断统计学 研究如何有效地收集和使用被研究客观事物的不完整并且带有随机干扰的数据资料 以对其群体特征和数量规律性给出尽可能精确 可靠的推断性结论 2 推断统计参数估计 由对部分进行观测取得的数据对研究对象整体的数量特征取值给出估计方法 假设检验 由对部分进行观测取得的数据对研究对象的数量规律性是否具有某种指定特征进行检验 统计推断的过程 几个基本概念 总体和个体 概念要点 1 具体含义总体 Population 调查研究的事物或现象的全体个体 Itemunit 组成总体的每个元素2 抽象含义总体 Population 调查研究中所关心的作为随机变量的统计指标个体 Itemunit 统计指标所取得每个可能值 样本 Sample 1 样本 Sample 从总体中所抽取的部分个体2 样本容量 Samplesize 样本中所含个体的数量3 样本选取的基本原则 代表性 样本的每个分量都与总体有相同的分布独立性 样本的每个分量都是相互独立的4 简单随机样本 满足代表性和独立性的样本5 简单随机抽样 获得简单随机样本的方法 统计量 统计量 不含任何未知参数的样本的函数例 设是总体容量为n的样本 则 样本均值 Samplemean 样本方差 Samplevariance 阶原点矩 Momentoforder 都是统计量 抽样分布 抽样分布 samplingdistribution 样本统计量的概率分布 是一种理论分布在重复选取容量为的样本时 由该统计量的所有可能取值形成的相对频数分布样本统计量是随机变量样本均值 样本比例 样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息 是进行推断的理论基础 也是抽样推断科学性的重要依据 抽样分布的形成过程 samplingdistribution 样本均值的抽样分布 样本均值的抽样分布 在重复选取容量为n的样本时 由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值 的理论基础 样本均值的抽样分布 例题分析 例 设一个总体 含有4个元素 个体 即总体单位数N 4 4个个体分别为x1 1 x2 2 x3 3 x4 4 总体的均值 方差及分布如下 均值和方差 样本均值的抽样分布 例题分析 现从总体中抽取n 2的简单随机样本 在重复抽样条件下 共有42 16个样本 所有样本的结果为 样本均值的抽样分布 例题分析 计算出各样本的均值 如下表 并给出样本均值的抽样分布 样本均值的分布与总体分布的比较 例题分析 2 5 2 1 25 总体分布 样本均值的抽样分布与中心极限定理 当总体服从正态分布N 2 时 来自该总体的所有容量为n的样本的均值 x也服从正态分布 x的数学期望为 方差为 2 n 即 x N 2 n 中心极限定理 centrallimittheorem 中心极限定理 设从均值为 方差为 2的一个任意总体中抽取容量为n的样本 当n充分大时 样本均值的抽样分布近似服从均值为 方差为 2 n的正态分布 中心极限定理 centrallimittheorem x的分布趋于正态分布的过程 抽样分布与总体分布的关系 样本均值的数学期望样本均值的方差重复抽样不重复抽样 样本均值的抽样分布 数学期望与方差 样本均值的抽样分布 数学期望与方差 比较及结论 1 样本均值的均值 数学期望 等于总体均值2 样本均值的方差等于总体方差的1 n 样本比例的抽样分布 总体 或样本 中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品 或不合格品 与全部产品总数之比总体比例可表示为样本比例可表示为 比例 proportion 在重复选取容量为的样本时 由样本比例的所有可能取值形成的相对频数分布一种理论概率分布当样本容量很大时 样本比例的抽样分布可用正态分布近似推断总体比例 的理论基础 样本比例的抽样分布 样本比例的数学期望样本比例的方差重复抽样不重复抽样 样本比例的抽样分布 数学期望与方差 5 2抽样方法 抽样调查抽样单元与抽样框抽样方法分类抽样调查设计 抽样调查 抽样调查 抽样调查 通过对有限总体实施抽样 利用样本调查数据对总体参数进行估计 概率抽样 根据一个已知的概率来抽取样本单位 也称随机抽样 概率抽样的特点 能够确切地区分不同的样本 对每个可能的样本都赋予一个被抽到的概率 按照事先赋予的概率通过某种随机形式抽取样本 利用样本调查数据估计目标量时仍需与抽样概率相联系 抽样单元与抽样框 抽样单元与抽样框 抽样单元 Samplingunit 将总体划分成互不重迭且又穷尽的若干部分 每个部分称为一个抽样单元每个抽样单元都是由若干个体组成的集合只由一个个体组成就称为最小抽样单元抽样单元可以是自然形成的 也可以是人为划定的抽样框 Samplingframe 关于抽样单元的名册或清单上一级别的某个抽样单元被抽中 必须在下一级别抽样框中连续抽样有效的抽样框所包含的抽样单元应既无遗漏又无重复 抽样方法 抽样方法 简单随机抽样 simplerandomsampling 从总体N个单位中随机地抽取n个单位作为样本 使得每一个容量为样本都有相同的机会 概率 被抽中抽取元素的具体方法有重复抽样和不重复抽样特点简单 直观 在抽样框完整时 可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时 不易构造抽样框抽出的单位很分散 给实施调查增加了困难没有利用其他辅助信息以提高估计的效率 分层抽样 stratifiedsampling 将抽样单位按某种特征或某种规则划分为不同的层 然后从不同的层中独立 随机地抽取样本优点保证样本的结构与总体的结构比较相近 从而提高估计的精度组织实施调查方便既可以对总体参数进行估计 也可以对各层的目标量进行估计 二阶抽样与多阶段抽样 two multi stagesampling 先抽取群 但并不是调查群内的所有单位 而是再进行一步抽样 从选中的群中抽取出若干个单位进行调查群是初级抽样单位 第二阶段抽取的是最终抽样单位 将该方法推广 使抽样的段数增多 就称为多阶段抽样不需要对每个高级别的抽样单元建立关于低级别抽样单元的抽样框 节约调查费用需要包含所有低阶段抽样单位的抽样框 同时由于实行了再抽样 使调查单位在更广泛的范围内展开在大规模的抽样调查中 经常被采用的方法 整群抽样 clustersampling 将总体中若干个单位合并为组 群 抽样时直接抽取群 然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框 可简化工作量调查的地点相对集中 节省调查费用 方便调查的实施缺点是估计的精度较差 系统抽样 systematicsampling 将总体中的所有单位 抽样单位 按一定顺序排列 在规定的范围内随机地抽取一个单位作为初始单位 然后按事先规定好的规则确定其他样本单位先从数字1到k之间随机抽取一个数字r作为初始单位 以后依次取r k r 2k 等单位优点 操作简便 可提高估计的精度缺点 对估计量方差的估计比较困难 抽样调查设计 抽样调查设计 抽样方案设计抽样方法的选择和组合样本容量的确定调查方法确定例 问卷调查 座谈会调查 电话调查等估计量的构造建立由所得数据能够给出目标量估计值的估计方法估计量具有较好的概率性质 例如无偏性 方差小构造估计量方差的估计量采用自加权估计量 5 3参数估计 参数估计概述参数估计的基本方法总体均值的区间估计总体比例的区间估计总体方差的区间估计 参数估计概述 参数估计概述 统计估计 研究由样本估计总体的未知分布或分布中的未知参数2 非参数估计 直接对总体未知分布的估计3 参数估计 总体分布类型已知 仅需对分布的未知参数进行的估计 参数估计的基本方法 估计量 用于估计总体参数的随机变量如样本均值 样本比例 样本方差等例如 样本均值就是总体均值 的一个估计量参数用 表示 估计量用表示估计值 估计参数时计算出来的统计量的具体值如果样本均值 x 80 则80就是 的估计值 估计量与估计值 estimator estimatedvalue 参数估计的方法 点估计 pointestimate 1 点估计量 设总体的分布类型已知 但包含未知参数 从总体中抽取一个简单随机样本 构造一个适当的统计量作为 的估计 称为未知参数 的点估计量2 用样本的估计量直接作为总体参数的估计值例如 用样本均值直接作为总体均值的估例如 用两个样本均值之差直接作为总体均值之差的估计3 没有给出估计值接近总体未知参数程度的信息 区间估计 intervalestimate 在点估计的基础上 给出总体参数估计的一个区间范围 该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如 某班级平均分数在75 85之间 置信水平是95 区间估计的图示 将构造置信区间的步骤重复很多次 置信区间包含总体参数真值的次数所占的比例称为置信水平表示为 1 为是总体参数未在区间内的比例 常用的置信水平值有99 95 90 相应的 为0 01 0 05 0 10 置信水平 置信区间 confidenceinterval 设 是未知参数 是来自总体的样本 构造两个统计量 对于给定的 0 1 若 满足 则称随机区间 是参数 置信水平为 1 的置信区间 1 称为 的置信系数 称为置信限 2 区间长度为随机变量 置信区间为随机区间置信水平描述了估计的可靠度 区间长度描述了估计的精度4 用一个具体的样本所构造的区间是一个特定的区间 我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个 但它也可能是少数几个不包含参数真值的区间中的一个 置信区间 confidenceinterval 置信区间与置信水平 影响区间宽度的因素 1 总体数据的离散程度 用 来测度样本容量 3 置信水平 1 影响z的大小 评价估计量的标准 无偏性 unbiasedness 设 是未知参数 的一个点估计量 若 满足 则称 是 的无偏估计量 否则称为有偏估计量 有效性 efficiency 有效性 对同一总体参数的两个无偏点估计量 有更小标准差的估计量更有效 一致性 consistency 一致性 随着样本容量的增大 估计量的值越来越接近被估计的总体参数 均方误差准则 Meansquareerror 是参数 的两个估计量 若对 的一切可能值 设 且严格不等式至少对参数 的某个可能值成立 则称在均方误 优于 差意义下 注 均方误差准则计量取值 集中 于参数真值得的程度 一个总体参数的区间估计 总体均值的区间估计 总体均值的区间估计 正态总体且 已知或非正态总体 未知 大样本 1 假定条件总体服从正态分布 且方差 已知如果不是正态分布 可由正态分布来近似 n 30 使用正态分布统计量z 总体均值 在1 置信水平下的置信区间为 总体均值的区间估计 例题分析 例5 3 1 保险公司从投保人中随机抽取36人 计算得36人的平均年龄岁 已知投保人平均年龄近似服从正态分布 标准差为7 2岁 试求全体投保人平均年龄的置信水平为99 的置信区间 解 已知n 36 1 99 z 2 2 575 根据样本数据计算得 总体均值 在1 置信水平下的置信区间为 故全体投保人平均年龄的置信水平为99 的置信区间为 36 41 52 59 总体均值的区间估计 例题分析 例5 3 2 一家食品公司 每天大约生产袋装食品若干 按规定每袋的重量应为100g 为对产品质量进行检测 该企业质检部门采用抽样技术 每天抽取一定数量的食品 以分析每袋重量是否符合质量要求 现从某一天生产的一批食品8000袋中随机抽取了25袋 不重复抽样 测得它们的重量如下表所示 已知产品重量服从正态分布 且总体方差为100g 试估计该批产品平均重量的置信区间 置信水平为95 总体均值的区间估计 例题分析 解 已知 N 102 n 25 1 95 z 2 1 96 根据样本数据计算得 总体均值 在1 置信水平下的置信区间为 该食品平均重量的置信区间为101 4459g 109 2741g 注 在不重复抽样条件下 置信区间取 总体均值的区间估计 例题分析 例5 3 3 一家保险公司收集到由36投保个人组成的随机样本 得到每个投保人的年龄 周岁 数据如下表 试建立投保人年龄90 的置信区间 总体均值的区间估计 例题分析 解 已知n 36 1 90 z 2 1 645 根据样本数据计算得 总体均值 在1 置信水平下的置信区间为 投保人平均年龄的置信区间为37 37岁 41 63岁 总体均值的区间估计 正态总体 方差未知 小样本 1 假定条件总体服从正态分布 且方差 未知小样本 n 30 使用t分布统计量 总体均值 在1 置信水平下的置信区间为 t分布 t分布是类似正态分布的一种对称分布 它通常要比正态分布平坦和分散 一个特定的分布依赖于称之为自由度的参数 随着自由度的增大 分布也逐渐趋于正态分布 总体均值的区间估计 例题分析 例5 3 4 已知某种灯泡的寿命服从正态分布 现从一批灯泡中随机抽取16只 测得其使用寿命 小时 如下 建立该批灯泡平均使用寿命95 的置信区间 总体均值的区间估计 例题分析 解 已知 N 2 n 16 1 95 t 2 2 131根据样本数据计算得 总体均值 在1 置信水平下的置信区间为 该种灯泡平均使用寿命的置信区间为1476 8小时 1503 2小时 总体比例的区间估计 总体比例的区间估计 假定条件 大样本条件下 样本比例的抽样分布可以由正态分布来近似使用正态分布统计量z 3 总体比例 在1 置信水平下的置信区间为 总体比例的区间估计 例题分析 例5 3 5 某城市想要估计下岗职工中女性所占的比例 随机地抽取了100名下岗职工 其中65人为女性职工 试以95 的置信水平估计该城市下岗职工中女性比例的置信区间 解 已知n 100 p 65 1 95 z 2 1 96 该城市下岗职工中女性比例的置信区间为55 65 74 35 总体比例的区间估计 例题分析 例5 3 6 某企业共有职工1000人 企业准备实行一项改革 在职工中征求意见 采用不重复抽样方法 随机抽取200人作为样本 调查结果显示 由150人表示赞成这项改革 有50人表示反对 试以95 的置信水平确定赞成改革的人数比例的置信区间 解 已知n 200 z 2 1 96 p 75 根据样本数据计算得总体均值 在1 置信水平下的置信区间为 95 的置信水平下估计赞成改革的人数比例的置信区间为69 63 80 37 总体方差的区间估计 总体方差的区间估计 1 估计一个总体的方差或标准差2 假设总体服从正态分布总体方差 2的点估计量为S2 且 4 总体方差在1 置信水平下的置信区间为 总体方差的区间估计 图示 总体方差的区间估计 例题分析 例5 3 7 食品厂从生产的罐头中随机抽取15个称量其重量 得样本方差s2 1 652 克2 设罐头重量服从正态分布 试求其方差的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025新疆天筑建工集团有限公司招聘计划备考练习题库及答案解析
- 小学消防安全主题班会课件讲课文档
- 2025四川广元市朝天区医疗卫生辅助岗位招募10人备考练习试题及答案解析
- 2025杭州市临平区公开招聘幼儿园劳动合同制教师70人考试参考试题及答案解析
- 2025湖南省地质院直属事业单位高层次人才招聘59人备考练习题库及答案解析
- 病历管理制度与病历书写规范考试题及答案
- 加油站安全考试试卷试题及答案
- 2025年甘肃省定西市岷县维新镇卫生院招聘乡村医生备考练习题库及答案解析
- 2025西安市渭北中学招聘考试参考试题及答案解析
- 育婴员理论知识考核试题题库及答案
- 小学科学教科版三年级下册全册思维导图(共24课)
- (三级)智能云服务交付工程师理论考试题库大全-中(多选题)
- 《色彩的对比》教学设计-1色彩的对比-五年级上册美术
- 浙江省中小学心理健康教育课程标准
- 4.4车体主要伤损形式及检修课件讲解
- 甲状腺术后出院健康宣教
- 《柔性棚洞防护结构技术规程》
- 2024年美国专利诉讼报告
- 施工现场临电方案
- MOOC 高等数学先修课-西南财经大学 中国大学慕课答案
- 装备资产的动态管理
评论
0/150
提交评论