第6章抽样推断_第1页
第6章抽样推断_第2页
第6章抽样推断_第3页
第6章抽样推断_第4页
第6章抽样推断_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章抽样推断 教学目的与要求 抽样推断是抽样调查的继续 它提供了一套利用抽样资料来估计总体数量特征的方法 通过本章的学习 要理解和掌握抽样估计的概念 特点 抽样误差的含义 计算方法 抽样估计的置信度 推断总体参数的方法 能结合实际资料进行抽样估计 抽样推断的意义和作用抽样误差抽样估计的方法抽样的组织设计 本章学习以下主要内容 一 抽样推断的概念和特点 概念 抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察 并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断 特点 按随机原则抽选调查单位 从数量上推断总体 抽样推断运用概率估计的方法 抽样推断的误差可以事先计算并加以控制 第一节抽样推断的意义和作用 二 抽样推断的作用 三 有关抽样的基本概念 一 总体和样本 总体 也称全及总体 指所要认识的研究对象全体 总体单位总数用 N 表示 样本 又称子样 是从全及总体中随机抽取出来 作为代表这一总体的那部分单位组成的集合体 样本单位总数用 n 表示 1 有些客观现象需要了解全面情况 2 可以补充 核对全面调查的结果 3 用于工业生产过程的质量控制 4 对总体的某种假设进行检验 二 总体指标与样本指标 总体指标 研究总体中的数量标志 总体平均数 总体方差 研究总体中的品质标志 总体成数 成数方差 样本指标 研究数量标志 样本平均数 样本标准差 研究品质标质 成数标准差 样本成数 三 样本容量和样本个数 样本容量 一个样本包含的单位数 用 n 表示 一般要求n 30 样本个数 从一个全及总体中可能抽取的样本数目 四 重复抽样和不重复抽样 重复抽样 又称回置抽样 可能组成的样本数目 可能组成的样本数目 不考虑顺序 考虑顺序 标号为A B C D的四个圆球从中随机抽取两个 考虑顺序 AA AB AC ADBA BB BC BDCA CB CC CDDA DB DC DD 可能样本个数 不考虑顺序 AA AC BA BB BDCB CC DA DC DD 考虑顺序 重复 不重复 AB AC ADBA BC BDCA CB CDDA DB DC 不考虑顺序 AB AC ADBD CB DC 第二节抽样误差 一 抽样误差的含义 由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构 而引起抽样指标和全及指标之间的绝对离差 二 影响抽样误差大小的因素 1 总体各单位标志值的差异程度 2 样本的单位数 3 抽样方法 4 抽样调查的组织形式 三 抽样平均误差 1 概念 抽样平均误差是抽样平均数或抽样成数的标准差 反映了抽样平均数与总体平均数抽样成数与总体成数的平均误差程度 2 计算方法 抽样平均数的平均误差 抽样成数平均误差 实例分析 设有四个工人工资分别为40 50 70 80元 现在随机从其中抽取2人 并求平均工资 用以代表4人总体的平均工资水平 如果采用重复抽样 则所有可能样本以及平均工资如下表 四个工人工资分别为40 50 70 80元 所以 设总体变量有N个 样本容量有n个 则 则 由于都是取自总体中 它与总体同分布 所以 所以 抽样平均数的平均误差 所以 抽样平均数平均误差的计算公式 采用重复抽样 此公式说明 抽样平均误差与总体标准差成正比 与样本容量成反比 当总体标准差未知时 可用样本标准差代替 通过例题可说明以下几点 样本平均数的平均数等于总体平均数 抽样平均数的标准差仅为总体标准差的 可通过调整样本单位数来控制抽样平均误差 例题 假定抽样单位数增加2倍 0 5倍时 抽样平均误差怎样变化 解 抽样单位数增加2倍 即为原来的3倍 则 抽样单位数增加0 5倍 即为原来的1 5倍 则 即 当样本单位数增加2倍时 抽样平均误差为原来的0 577 即 当样本单位数增加0 5倍时 抽样平均误差为原来的0 8165 数理统计证明采用不重复抽样误差公式 公式表明 抽样平均误差不仅与总体变异程度 样本容量有关 而且与总体单位数的多少有关 例题一 随机抽选某校学生100人 调查他们的体重 得到他们的平均体重为58公斤 标准差为10公斤 问抽样推断的平均误差是多少 例题二 某厂生产一种新型灯泡共2000只 随机抽出400只作耐用时间试验 测试结果平均使用寿命为4800小时 样本标准差为300小时 求抽样推断的平均误差 下面求的无偏估计的方差 对称性论证 或 其中 0 例题一解 即 当根据样本学生的平均体重估计全部学生的平均体重时 抽样平均误差为1公斤 例题二解 计算结果表明 根据部分产品推断全部产品的平均使用寿命时 采用不重复抽样比重复抽样的平均误差要小 已知 则 已知 则 抽样成数平均误差的计算公式 采用重复抽样 采用不重复抽样 例题三 某校随机抽选400名学生 发现戴眼镜的学生有80人 根据样本资料推断全部学生中戴眼镜的学生所占比重时 抽样误差为多大 例题四 一批食品罐头共60000桶 随机抽查300桶 发现有6桶不合格 求合格品率的抽样平均误差 例题三解 已知 则 样本成数 即 根据样本资料推断全部学生中戴眼镜的学生所占的比重时 推断的平均误差为2 例题 已知 则 样本合格率 计算结果表明 不重复抽样的平均误差小于重复抽样 但是 N 的数值越大 则两种方法计算的抽样平均误差就越接近 四 抽样极限误差 含义 抽样极限误差指在进行抽样估计时 根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围 计算方法 它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值 抽样平均数极限误差 抽样成数极限误差 五 抽样误差的概率度 含义 抽样误差的概率度是测量抽样估计可靠程度的一个参数 用符号 t 表示 公式表示 t是极限误差与抽样平均误差的比值 极限误差是t倍的抽样平均误差 上式可变形为 例题一 要估计某批优良水稻品种种子的平均千粒重 现在随机从该批种子抽取1市斤 计数共12500粒 折合平均每千粒重 如果确定极限误差范围为8克 这就要求该批种子的平均每千粒重落在 即在32克到48克之间 例题二 要估计某农作物幼苗的成活率 从播种这一品种的秧苗地快中随机抽取秧苗1000株 其中死苗80株 则秧苗成活率 如果确定极限误差范围为5 这就要求该农作物成活率p落在即落在87 至97 之间 假设上例一中的抽样平均误差为 假设上例二中的抽样平均误差为 六 抽样误差的可靠程度 抽样极限误差的估计总是要和一定的概率保证程度联系在一起的 因为既然抽样误差是一个随机变量 就不能期望抽样平均数 成数 落在一定区间内是一个必然事件 而只是给予一定的概率保证而已所以我们在进行抽样估计时 不但要考虑抽样误差的可能范围有多大而且还必须考虑落到这一范围的概率有多少 前者是估计的精确度问题 后者是估计的可靠性问题 两者密不可分 为了说明这个关系 我们举一个实例来说明 设有五位射击选手 他们的得分各为2 4 6 8 10分 很显然总平均成绩为 现在随机选两名选手的平均成绩来估计总平均成绩水平 假如采用不重复取样 不考虑顺序 样本分布为 各样本平均数的分布频率 根据上列概率分布 可以求出各区间抽样平均数的概率 上式说明抽样极限误差的概率 例如极限误差为1 即总体平均数落在之间的概率为0 6 极限误差为2的概率为0 8等等 这说明抽样极限误差一定是与概率的可靠程度联系在一起的 要确定抽样平均数 成数 落在一定区间的概率 必须研究抽样平均数 成数 的分布规律 由于N 5n 2 极限误差用抽样平均误差来表示 由不重复抽样的基本公式得 由正态分布理论 介绍两个重要定理 定理一 可以看出前面的值越大 可靠程度 即概率越高 当总体为正态分布N 则从这个总体抽取容量为n的的全部样本平均数也服从于正态分布 其平均数 其标准差为 定理二 如果变量X的分布具有有限的平均数和标准差 则从这个总体抽取容量为n的全部样本 其平均数的分布随着n的增大而趋近于平均数为 标准差为的正态分布 定理2并不要求总体分布是正态的 甚至可以是不知道的 只要样本的容量增大 抽样平均数就趋于正态分布 这和定理1限制总体分布为正态 而样本容量n不作限制的情况是不同的 由以上两个定理可以得到以下几个基本事实 一 由于抽样平均数的平均数等于总体平均数 所以抽样平均数的分布 实际上就是围绕着以总体平均数为对称中心的分布 各样本平均数和中心点的离差概率恰好表明抽样极限误差的概率 因此 这两个区间的概率是相等的 二 根据正态分布的理论 极限误差的概率 应该是指抽样平均数落在区间的概率 但是实际上总体平均数是未知的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论