版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、5-1,第六章,抽样推断,5-2,(一)总体与样本:,(二)重复抽样与不重复抽样,重复抽样,不重复抽样,一、抽样推断的基本概念,特点,同一总体单位有可能被重复抽中,而且每次抽取都是独立进行,特点,同一单位不会被重复抽中,在连续抽取时,每次抽取都不是独立进行,抽样推断的基本概念,5-3,指标值是确定、唯一的,数值随样本不同而变化。,全及指标,样本指标,变量总体:,属性总体:,全及指标与抽样指标,5-4,抽样误差,由于随机抽样的偶然因素使样本不足以完全代表总体结构,引起样本指标与全及指标之间的差异。,二、抽样误差,对于任何一个样本,其实际抽样误差都不可能测量出来,抽样误差,5-5,反映所有可能样本
2、抽样误差的平均水平的指标,通常用样本平均数(成数)的标准差作为衡量尺度。,抽样平均误差,5-6,重复抽样:,计算公式:,不重复抽样:,计算公式,5-7,例:估计某乡粮食亩产量,从5000亩中随机抽取100亩,计算得出样本平均亩产量为450公斤,方差780公斤,则粮食平均亩产量的平均抽样误差是多少?,重复抽样,不重复抽样,例估计对某项措施的支持率,对职工进行5的随机抽样,调查60名员工,有45人表示支持,则支持率的平均抽样误差是多少?,重复抽样:,不重复抽样:,5-8,影响抽样误差的因素:,总体样志值的变异程度,样本容量,抽样方法,抽样组织方式,三、抽样估计,点估计,区间估计,在一定的概率保证下
3、,由样本指标推断出总体指标的可能区间,并称此区间为置信区间。,根据中心极限定理,得知当n足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率F(t)的保证下:抽样极限误差=t,(t为概率度),可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。,抽样极限误差:样本指标与总体指标之间的可能误差范围,又叫允许误差和可能误差,5-11,区间估计,区间估计的三要素,合适统计量的估计值,合理的允许误差,可接受的置信度水平,概率度,估计区间覆盖总体参数真值的概率F(t),5-12,F(t),5-13,
4、t与相应的概率保证程度存在一一对应关系,常用t值及相应的概率保证程度为:,t值概率保证程度1.000.68271.650.90001.960.95002.000.95452.580.99003.000.9973,(大样本条件下),抽样极限误差的计算公式,68.27%,95.45%,99.73%,抽样极限误差(精度)与概率保证程度(可靠程度),5-15,某公司出口一种茶叶,规定每包规格不低于150克,用不重复抽样方法抽取检验,结果如下:,要求:1)以99.73%的概率估计这批茶叶平均每包的重量,确定平均重量是否达到要求;,2)以同样的置信度估计这批茶叶的合格率范围。,3)若平均重量最大允许误差不
5、超过0.15克,则估计可靠性有多大?,5-16,解:1)2),估计区间(150.04,150.56),估计区间:(56.32,83.68),3),5-17,区间估计的步骤:,1)根据可靠程度计算极限误差:,2)根据极限误差计算可靠程度:,已知,已知,某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。则:,某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度
6、推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率:,5-20,保证随机原则的实现,(二)抽样组织形式:,(一)原则:,关于样本量和结构,关于抽样组织形式,重视调查费用,四、抽样设计,5-21,简单随机抽样示意图,简单随机抽样,5-22,重复抽样:,不重复抽样:,确定样本容量,5-23,【例A】某食品厂要检验本月生产的10000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?解:,重复抽样条件下:,不重复抽样条件下:,5-24,【例B】某企业对一批总数为5000件的产品进行质量检查,过
7、去几次同类调查所得的产品合格率为93、95、96,为了使合格率的允许误差不超过3,在99.73的概率保证程度下,应抽查多少件产品?,解,重复抽样条件下:,不重复抽样条件下:,5-25,影响样本容量的因素:,总体方差的大小;允许误差范围的大小;概率保证程度;抽样方法;抽样的组织方式。,5-26,类型抽样(分层抽样),N1,Nk,N2,N3,N4,N5,N,n1,nk,n2,n3,n4,n5,n,5-27,类型抽样示意图,能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标,5-28,统计量:,比例抽样,5-29,抽样平均误差:,组内方差平均值,缩小组内差异扩大组间差
8、异,5-30,例:某乡粮食生产抽样资料如下:计算样本平均亩产量及抽样平均误差。,1、样本平均亩产:,2、抽样平均误差:,5-31,重复抽样:,不重复抽样:,5-32,等距抽样(系统抽样),对称等距抽样,1)抽样距离,2)按无关标志排队:,3)按有关标志排队:,抽样起点在第一抽样距离内随机选择,抽样起点在第一抽样距离的中点,等距抽样示意图,5-33,整群抽样,样本指标的计算:(假定各群单位数相同),5-34,整群抽样示意图,简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差,5-35,抽样平均误差,群间方差,缩小群间差异扩大群内差异,5-36,例某化工厂日夜连续生产,每分钟产量为1
9、00袋,现在采用整群抽样来检验一昼夜生产的化肥平均每袋重量和包装的一等品率,每次抽出1分钟的产量,每144分钟为一个间隔,结果平均每袋重量为49.5公斤,其群间方差为2.65公斤,一等品包装的比重为85,其群间方差为0.5,以95的置信度估计:)该厂24小时生产的化肥每袋平均重量的区间;2)包装一等品率的区间。,平均重量区间:49.5-1,49.5+1,一等品率区间:85-4.3,85+4.3,5-37,思考与练习,5-38,2、在抽样调查中()A、全及总体是唯一确定的B、全及指标值只有一个C、样本是唯一确定的D、样本指标值只能有一个,1、抽样误差()A、包括登记误差B、是随机误差C、包括系统性误差D、是代表性误差E、不是系统性误差F、不能消除,5-39,3、根据重复抽样资料
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年安徽省池州市高职单招职业适应性测试考试题库有答案详细解析
- 2026年云南林业职业技术学院单招职业适应性测试题库含答案详细解析
- 2025年 PVC板制作合同
- 2025年文件封套设计服务合同
- 2025年完片担保服务合同
- 2026年混合云托管服务合同
- 2016年全国初中化学竞赛资源28-甘肃-现场课教学设计-7.1燃烧与灭火-张艳明
- 第四课 恰当表达情绪教学设计初中心理健康八年级鄂科版
- 保安和员工做饭合同
- 包榛子山合同协议
- 2026年青海省海南藏族自治州单招职业适应性测试题库附参考答案详解(模拟题)
- 2026春牛津译林版英语八年级下册Unit+8+Reading+(同步课件)
- 第一单元(单元测试 基础夯实)-高二语文人教统编版选择性必修下册
- 2025山西中煤一局集团有限公司应届高校毕业生招聘20人笔试历年典型考点题库附带答案详解2套试卷
- 2026年安克创新行测笔试题库
- 违反无菌技术操作
- AI养鱼:智慧渔业新模式
- 2025年《三级公共营养师》考试练习题库及答案
- 华东师范大学 PPT 37
- 深圳市新能源汽车充电设施“一线三排”工作指引
- GB/T 7233.1-2023铸钢件超声检测第1部分:一般用途铸钢件
评论
0/150
提交评论