下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、7/26/2020,浙江财经学院,1,本 章 要 求,1、基本概念 2、抽样指标计算 3、抽样平均误差的影响因素及计算 4、全及指标推断:抽样极限误差计算、置信区间计算 5、简单随机抽样重复抽样的必要抽样单位数计算,掌握,7/26/2020,浙江财经学院,2,1、抽样调查分类 2、抽样调查特点 3、全及总体分类及全及指标 4、抽样方式分类 5、抽样误差概念及分类 6、抽样平均误差影响因素 7、可信程度、概率度 8、抽样方案设计基本原则 9、主要的抽样组织方式种类,理解,7/26/2020,浙江财经学院,3,1、抽样调查的意义 2、抽样调查的适用范围 3、不同抽样方式的可能样本数目 4、抽样调查
2、的理论依据 5、抽样平均误差的意义 6、各种抽样组织方式介绍 7、不重复抽样的必要抽样单位数计算,了 解,7/26/2020,浙江财经学院,4,第一节 概述,第二节 基本概念及理论依据,第三节 抽样平均误差,第四节 全及指标推断,第五节 抽样方案设计,练 习 题,人均教育支出抽样调查案例,第一节 概 述,7/26/2020,浙江财经学院,6,1、抽样调查概念,广义:抽取部分单位观察,并根据观察结果推断全体。,随机抽样:,保证总体中各单位具有同等机会被抽中,客观地抽取样本,并推断总体。,狭义:按照随机原则抽取部分单位观察,并运用数理统计方法,由部分对总体做出数量上的推断分析。,7/26/2020
3、,浙江财经学院,7,2、特 点,1)只抽取部分单位;,2)用部分推断总体;,3)抽样遵循随机原则;,4)会产生抽样误差,但误差可以计算和控制。,3、统计误差,统计数字与各种实际数量之间的差别。,登记误差:,代表性误差:,调查误差或工作误差,指在登记、汇总计算过程中产生的误差。(可以避免的),用部分去推断总体产生的误差。(一般不可避免),返回目录,第二节 基本概念及理论依据,7/26/2020,浙江财经学院,9,一、基 本 概 念,1、全及总体:所要认识对象的全体。,变量总体:,属性总体:,总体中总体单位的标志为品质标志,2、抽样总体:从全及总体随机抽取得部分单位的集合体。,一个全及总体中,可以
4、抽取多个抽样总体,即抽样总体不是唯一的。一般认为,样本容量大于30的称为大样本,小于30个单位数的称为小样本。,总体中总体单位的标志为数量标志,(一)全及总体和抽样总体,7/26/2020,浙江财经学院,10,1、全及指标:根据全及总体中的各单位标志值或标志特征 计算的、反映总体某种属性的综合指标。,变量总体:,属性总体:,N1 具有某种属性的单位数 , N0 不具有某种属性的单位数,(二)全及指标和抽样指标,7/26/2020,浙江财经学院,11,属性总体成数方差公式推导:,则属性总体的平均数,7/26/2020,浙江财经学院,12,2、抽样指标:根据抽样总体中的各单位标志值或标志特征 计算
5、的综合指标。,变量总体:,属性总体:,n1 具有某种属性的单位数 , n0 不具有某种属性的单位数,7/26/2020,浙江财经学院,13,(三)抽样方法和样本可能数目,1、抽样方法:从全及总体随机抽取得部分单位的集合体。,样本数目与样本容量有关,也与抽样方法有关,样本容量既定,则样本数目取决于抽样的方法。,抽样方式不同,重复抽样,不重复抽样,样本要求不同,考虑顺序抽样,不考虑顺序抽样,以上结合为四种抽样方法:考虑顺序的重复抽样、考虑顺序的不重复抽样、不考虑顺序的重复抽样和不考虑顺序的不重复抽样。,7/26/2020,浙江财经学院,14,2、不同抽样方法的样本可能数目,2)考虑顺序的不重复抽样
6、,3)不考虑顺序的不重复抽样,1)考虑顺序的重复抽样,4)不考虑顺序的重复抽样,7/26/2020,浙江财经学院,15,例如:一个盒子里有三个球,标号分别为1、2、3,现从中随机抽取两个。即N=3,n=2:,1)考虑顺序的重复抽样,2)考虑顺序的不重复抽样,3)不考虑顺序的重复抽样,4)不考虑顺序的不重复抽样,7/26/2020,浙江财经学院,16,二、抽样调查的理论依据,1、大数定律: 该定律表明,当样本单位数n足够大时,抽样平均数 趋近于总体平均数,抽样成数p趋近于总体成数P。这为抽样推断提供了重要依据。,2、中心极限定律: 该定律证明,不论总体服从何种分布,只要它的数学期望和方差存在,从
7、中抽取容量为n的样本,当n足够大,则这个样本的平均数趋于正态分布。这为抽样误差的概率估计提供了依据。,返回目录,第三节 抽样平均误差,7/26/2020,浙江财经学院,18,一、抽样误差的概念和理解,1、抽样误差:来源于登记性误差和代表性误差。,调查误差或工作误差,指在调查、编辑、编码、汇总过程中由于观察、测量、登记、计算上的差错或被调查者提供虚假资料而引起的误差。,这种误差的直接表现就是没有真实客观地搜集或记录被调查单位的标志值或标志特征,从而使所计算的统计量偏离其真实值。 登记性误差存在于所有的统计调查中,而且调查的范围越大、调查单位越多,产生误差的可能性越大。 登记性误差与测量工具的精度
8、、测量技术、调查人员的责任心、被调查者的合作态度等密切相关。,登记性误差:,7/26/2020,浙江财经学院,19,代表性误差:,抽样过程中产生的以及用部分去推断总体过程中产生的误差。(一般不可避免),代表性误差又分为两种:,偏差:系统性误差,由非随机因素(违背随机原则)造成样本代表性不足而产生的误差。表现为样本统计量的值系统性偏高或偏低。这种误差也属于工作态度、水平、技术等的问题。应尽量避免。,随机误差:偶然性误差,遵循了随机原则的原则,由偶然因素引起样本结构不能完全代表总体结构而产生的误差。偶然误差不可避免,即使没有登记误差和系统性误差,仍会存在误差。 虽然不可避免,但可以估计和控制。偶然
9、误差总和等于0。 全面调查不存在偶然误差。,7/26/2020,浙江财经学院,20,抽样中的 总误差,登记性误差,代表性误差,系统性误差,随机误差:偶然误差,偏差:,实际误差,抽样平均误差,随机误差又可以分为实际误差和抽样平均误差。,实际误差:样本指标与总体指标之间的实际差别,无法直接计算。,抽样平均误差:所有可能抽取的样本的指标的标准差,代表了所有样本平均数(成数)与总体平均数(成数)的差距的平均,可以计算,我们讨论的就是这种误差。,7/26/2020,浙江财经学院,21,二、抽样平均误差的计算,1、理论公式,实际上,全及指标是未知的,而且实践中只会抽样一个样本。所以这个公式实践中不采用。,
10、7/26/2020,浙江财经学院,22,2、实际使用公式,公式说明了,抽样平均误差仅为全及总体标准差的 。,为总体标准差,(1)重复抽样:,P为总体成数,7/26/2020,浙江财经学院,23,(2)不重复抽样:,当抽样比大大小于1时,不重复抽样的抽样平均误差与重复抽样的很接近。,7/26/2020,浙江财经学院,24,前面公式中用的是总体标准差和总体成数,而总体标准差和总体成数是未知的,实际运用中,常采用以下方法估计:,1、用过去的取得的资料; 2、用样本方差和成数代替总体方差和成数; 3、用小规模的调查资料; 4、用预估的资料。,一般采用第二种方法,即用样本方差和成数代替总体方差和成数。,
11、7/26/2020,浙江财经学院,25,1、抽样平均误差计算总结,变量总体,重复抽样,不重复抽样,属性总体,重复抽样,不重复抽样,现实中,总体标准差往往是未知的,此时采用样本标准差和样本成数作为总体标准差和总体成数的估计值。当总体单位总数未知时,则默认采用重复抽样的计算公式。,例,7/26/2020,浙江财经学院,26,2、抽样平均误差的影响因素:,1)全及总体标志变动程度。总体标志变动越大,抽样平均误差越大,反之则越小。,2)抽样单位数的多少。其他条件不变,抽取的单位数越多,抽样平均误差越小,反之越大。,3)抽样方法。重复抽样的平均误差大,不重复抽样的平均误差小。,返回目录,4)抽样的组织方
12、式。,第四节 全及指标的推断,7/26/2020,浙江财经学院,28,一、概述,抽样调查的目的是为了用样本指标推断总体指标。对总体指标的估计方法有两种,一种是点估计,一种是区间估计。 点估计不能说明误差大小,意义不大。 区间估计,可以将误差控制在一定的范围内(即说明总体指标在某一范围内的可能性大小) 。,7/26/2020,浙江财经学院,29,二、抽样极限误差,由于存在误差,而且抽样指标会随着样本的不同而 变动。这样,可以在统计意义上,推断总体指标在一定范围内。样本指标与总体指标的离差绝对值就是抽样极限误差 。由于离差可正可负,整个变动的范围区间称为置信区间。,变量总体,属性总体,7/26/2
13、020,浙江财经学院,30,置信区间:,对上式去掉绝对值符号,并且移项可得到:,置信区间是统计意义上的,即一定概率下,总体指标所落在的区间。,7/26/2020,浙江财经学院,31,抽样平均误差说明估计的准确 程度,因此可以将抽样平均误差作为误差单位(当然在不同的条件下,这个单位的具体值是不同的),抽样极限误差可以表示为多少个误差单位(即抽样平均误差的多少倍),表示为:,抽样极限误差为t个抽样平均误差,或者是抽样平均误差的t倍。这个t就称为概率度或置信度。 显然,概率度与抽样极限误差成正比。,7/26/2020,浙江财经学院,32,(概率),7/26/2020,浙江财经学院,33,四、全及平均
14、指标的区间估计计算步骤,根据上面的讨论,全及平均指标推断的最终结果表现为一定概率保证程度下的置信区间。,2、根据概率保证要求,查表得出 值,然后计算 出抽样极限误差 。,3、得出置信区间,显然:当置信区间已知时,可以根据已知条件倒推,计算抽样平均误差、样本容量、概率度等。,1、根据调查资料计算出抽样平均误差,例,7/26/2020,浙江财经学院,34,重复抽样:,不重复抽样:,五、简单随机抽样的必要样本容量的确定,(一)计算公式:,例,7/26/2020,浙江财经学院,35,(二)确定抽样单位数的依据,1、推断可靠程度和精确度要求;高则抽样单位多,反之少。 2、总体变异程度,大则多,小则少。
15、3、采用何种抽样组织方法。简单随机抽样所需要的抽样单位数一般大与其他抽样方法,不重复抽样学要的单位数少于重复抽样。 4、根据成本效益原则。,返回目录,第五节 抽样方案设计,7/26/2020,浙江财经学院,37,一、抽样方案设计的原则,1)保证实现抽样随机性的原则;,2)保证实现最大抽样效果原则。,二、抽样组织形式,(一)简单随机抽样 1)直接抽选法; 2)抽签法 3)随机数码表法,7/26/2020,浙江财经学院,38,(二)类型抽样(分类抽样、分层抽样),类型抽样是先对总体各单位按一定标志加以分类,然后再从各类中按随机原则抽取样本,由各类中的样本组成一个总的样本。 确定各类型组的抽样单位数
16、: (1)标志差异大的组多抽一些,标志差异小的组少抽一些; (2)按各组的单位数占总体单位数的比例来确定各组的抽样单位数,称为类型比例抽样,这是通常采用的方法。 适用于各组组间单位标志差异较大,而组内差异较小的情况。,7/26/2020,浙江财经学院,39,(三)机械抽样(等距抽样、系统抽样),机械抽样是对研究的总体按一定的顺序排列,每隔一定的间隔抽取一个或若干个单位,将这些抽取的单位组成样本。 方法有: (1)随机起点等距抽样 (2)半距起点等距抽样 (3)对称等距抽样 机械抽样是一种简单易行的,在大规模抽样调查中常用的方法。,7/26/2020,浙江财经学院,40,(四)整群抽样,整群抽样
17、是将总体划分为由总体单位所组成的若干群,然后以群为抽样单位,从总体中抽取若干个群体作为样本,对选中群内的所有单位进行全面调查的抽样方式。 当群间差异较小,而群内差异较大时适合采用。或者说,在分群时应使群内方差尽可能大,而使群间方差尽可能小。,7/26/2020,浙江财经学院,41,多阶段抽样是先从总体中抽取部分群,再从抽中的群内抽取部分群或单位进行调查。比如对某省农户进行调查,先从全省抽取部分县作为第一阶段抽取的样本,再从抽中的县内,抽取部分乡或村作为第二阶段抽取的样本,再从抽中的乡或村内,抽取部分农户进行调查。 多阶段抽样在组织技术上是整群抽样和类型抽样的综合。,(五)多阶段抽样,返回总目录
18、,返回目录,例 题,7/26/2020,浙江财经学院,43,例1、某地对1万亩粮食耕地进行粮食产量调查,根据去年的资料,去年亩产1000公斤,方差为500,此次抽取100亩耕地调查,平均亩产1050公斤,请问在重复和不重复抽样条件下,调查平均亩产的抽样平均误差分别为多少?,重复抽样:,不重复抽样:,7/26/2020,浙江财经学院,44,例2,某公司进口一批电子器件5000件,为了检测其寿命, 抽取了500件进行检验,结果如下:,分别计算重复抽样和不重复抽样方式下电子器件的抽样 平均误差。,4740,45245,309.8,7/26/2020,浙江财经学院,45,重复抽样下:,不重复抽样下:,
19、7/26/2020,浙江财经学院,46,例3:,如果寿命低于9000小时的产品是不合格品,计算 不合格率的抽样平均误差。,不合格率:,重复抽样下:,不重复抽样下:,返回,7/26/2020,浙江财经学院,47,例4,某公司对一批新产品的使用寿命进行测试。随机收取了400个产品,测得其平均寿命为2800小时,标准差100小时,不合格产品数为80个。 要求(1)以95.45的可靠程度估计这批新产品的平均使用寿命 (2)以95%的可靠程度估计这批新产品的不合格率;,(3)若要将这批产品的使用寿命范围控制在27882812小时之间,其他条件不变,则应该抽取多少个零件进行测试? (4)若要将这批产品的不合格率控制在15%25%之间,并保证有95的置信度,则至少应该抽取多少个产品进行测试?,答案1,答案2,7/26/2020,浙江财经学院,48,则这批新产品在95.45%的可靠程度上的置信区间为(2790,2810)小时。,(1),7/26/2020,浙江财经学院,49,(2),在95%的可靠程度下这批新产品的不合格率为 (16.08,23.92),返回,7/26/2020,浙江财经学院,50,(3),在95.45%的可靠程度,至少需要抽取278个产品,才能满足可靠性和准确度要求。,7/26/2020,浙江财经学院,51,在95
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海立信会计金融学院《教育管理学》2025-2026学年期末试卷
- 沈阳药科大学《危重病学》2025-2026学年期末试卷
- 上海出版印刷高等专科学校《口腔科学》2025-2026学年期末试卷
- 兴安职业技术大学《商务谈判》2025-2026学年期末试卷
- 沈阳医学院《音乐学导论》2025-2026学年期末试卷
- 上海现代化工职业学院《旅游学》2025-2026学年期末试卷
- 沈阳师范大学《工作分析与组织设计》2025-2026学年期末试卷
- 上海闵行职业技术学院《学前特殊儿童教育》2025-2026学年期末试卷
- 沈阳建筑大学《广播电视新闻学》2025-2026学年期末试卷
- 上海体育大学《市场调查》2025-2026学年期末试卷
- 药厂称量工作流程
- 中兴通讯网络设备调试与优化手册
- 2025年内蒙古行政执法人员执法证考试题库及答案
- 军事识图用图课件
- 2025中数联物流科技(上海)有限公司招聘考试参考试题及答案解析
- 手扶梯应急安全培训意义课件
- 病房持续改进PDCA案例课件
- 年产20000吨2-甲基呋喃及2-甲基四氢呋喃联合装置项目环境影响报告书
- 施工合同人工费支付协议
- 舰艇维修监督管理办法
- 社机构志愿者培训手册
评论
0/150
提交评论