版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章抽样调查第一节抽样调查的概念和作用第二节抽样调查的几个基本概念第三节抽样误差和抽样估计第四节抽样调查的组织形式第五节必要样本容量的确定和总指标的计算第一节抽样调查的概念和作用1。抽样调查1的概念和特征。抽样调查是一种非全面调查,根据随机原则2从整个调查对象中选择一些单位。抽样调查的特点1)按照随机原则对调查单位进行抽样随机原则是指通过消除人们主观意愿的干扰,整体上每个单位都有相同的机会被选中。2)用某些单位(样本)的指标值推断和估计总体指标值抽样调查的核心问题是如何根据已知的(样本)数据推断未知的总体情况。3)抽样调查不可避免地会产生抽样误差,但这种误差是可以预先计算和控制的,抽样误差范
2、围可以通过各种组织措施来控制,以保证抽样推断的结果满足预定的可靠性要求。2.抽样调查的作用。1.对某些现象进行全面调查是不可能的。为了计算综合数据,必须采用抽样调查。2.对于一些不必要或难以进行全面调查的现象,应采用抽样调查。3.综合测量数据的检查和校正。4.可用于工业生产过程中的质量控制。3.抽样估计的一般原理。1.大数定律2。中心极限定理。1大数定律在对客观事物及其现象的观察和实验中,随着观察或实验次数的增加,事件的频率和平均值逐渐趋于某一常数。(1)伯努利定理伯努利定理表明事件的频率在概率上收敛于事件的概率。因此,频率的稳定性特征以严格的数学形式表示,即当n较大时,事件的频率和概率之间不
3、太可能有大的偏差。因此,当n足够大时,事件的概率可以用事件的频率来代替。切比雪夫定理(2)随机变量相互独立,具有相同的有限数学期望和方差。对于任何正整数,序列收敛概率等于总体均值。也就是说,当n足够大时,几乎所有的切比雪夫不等式都有效;当n趋于无穷大时,n个随机变量的平均值趋于总平均值。中心极限定理,2。中心极限定理:让我们假设容量为N的样本是从均值和方差为2的任意总体中提取的。当N足够大时,样本均值的抽样分布近似服从均值和方差为2/N的正态分布。总体、人口和抽样人口1。总体和人口意味着统计研究。2.抽样群体抽样群体是根据随机原理从整个群体中抽取的一些单位组成的小群体。抽样总体也称为样本总体,
4、即样本和子样本。1.总指数,也称总体指数,是根据整体和总体单位的分值计算出来的综合指数。1)总平均数不分组:2)总数;3)总数的标准差和方差不分组:4)总交替的标准差和方差根据抽样总体计算。与总体和总体一样,有四个常用的抽样指标:抽样平均值、抽样数、表示标准差和方差的样本数以及表示标准差和方差的样本交替。,1)采样平均值,当采样总体未分组时:2)采样数,3)采样数标记标准差和方差当采样总体未分组时:当采样总体被分组时:4)采样交替标记标准差和方差,3。重复采样和非重复采样,1。重复抽样也就是从整体和整体中随机选取一个样本单元,在对相关标志进行调查和登记后,将其放回原来的整体,然后从整体中抽取第
5、二个样本单元,记录其相关标志的表现,并放回整体,以此类推,直至抽取出足够的样本单元。非重复采样,也称为非重置采样,是根据随机原理从整体和整体中抽取一个样本单元,观察并记录其相关标记,然后不将其放回整体中参与下一次采样,而是从剩余的一个单元中抽取第二个样本单元。如果你这样做一次,你可以得到样本人口的能力。参数估计的优秀标准无偏性是指一个优秀的估计量,其数学期望应等于估计的总体参数的真实值。(二)有效性意味着作为一个优秀的估计者,其方差应该相对较小。只有这样,我们才能确保估计器的值能够集中在估计的总体参数附近。(3)一致性意味着,随着样本量n的增加,一个好的估计量将越来越接近概率意义上的待估计总体
6、参数的真实值。第三节抽样误差和抽样估计2。采样误差1。抽样误差的概念抽样误差是指由于随机抽样造成的样本结构与总体结构的差异而导致的样本估计值与总体参数之间的偏差。即抽样平均数和总体平均数之间的绝对离差以及抽样数和总体数之间的绝对离差。2。抽样误差、统计误差、配准误差、代表性误差、系统误差、随机误差的原因。影响取样误差的因素,1)总体可变性。抽样误差与总体标准偏差成正比()。2)样本大小。采样误差与样本大小(n)的算术平方根成反比。非重复采样引起的误差小于重复采样引起的误差。4)抽样机构。一般来说,抽样误差由小到大的顺序是:类型(分层)抽样、机械(等距)抽样、纯随机(简单随机)抽样和整群抽样。采
7、样平均误差1。抽样平均误差的概念是指所有可能样本的估计值与待估计参数之间的平均偏差。通常用or表示。1)样本平均值的抽样平均误差在重复抽样的条件下,某地区有2500头奶牛,随机抽取400头进行调查。每头奶牛的年平均产奶量为3000公斤,标准差为280公斤。重复抽样公式如下:(1)公斤,(2)平均抽样误差。一家工厂生产了一批10,000台电视机,没有重复取样。现在,有300台电视机被选中进行质量检测,合格率为94%。试着找出平均采样误差。采样极限误差,采样极限误差,也称为采样允许误差。样本指标与总体指标之间的最大可能抽样误差范围,表示为样本指标与总体指标允许变化的上限或下限之差的绝对值。采样误差
8、的概率度和采样极限误差与采样平均误差之比称为误差概率度,用、或、或、5表示。抽样估计,1。点估计,也称为固定值估计,直接用实际样本指标值代替总体指标值。例如,在中国随机抽取6000名大学生,调查他们每月平均生活费在500元左右。据说中国大学生的月平均生活费在500元左右。区间估计是一种估计方法,它根据一定的概率保证程度,将样本指数和抽样误差结合起来,从而推断出总体指数的可能范围。1)总体均值的区间估计、区间估计图、多次重复构造置信区间的步骤,置信区间包含总体参数真值的次数比例称为置信水平,表示为(1-对于总体参数不在区间内的比例,常用的置信水平值分别为99%、95%、90%和0.01、0.05
9、。由样本统计量构造的总体参数的估计区间称为置信区间。统计学家认为这个区间在一定程度上会包含真实的人口参数,所以他们称之为置信区间,置信区间,人口均值的区间估计(正态人口,已知或非正态人口,大样本),人口均值的区间估计,假设条件人口服从正态分布。方差()是已知的。如果不是正态分布,可以用正态分布(n 30)来近似。1-置信水平下总体均值的置信区间为:重复抽样,不重复抽样,总体均值的区间估计(实例分析),实例某一部分的长度服从正态分布。通过重复抽样的方法,从某一天生产的一批零件中随机选取9个零件,测量其平均长度为21.4厘米,已知总体标准偏差为=0.15厘米,试估计该批零件平均长度的置信区间,置信
10、水平为95%。解决方案:众所周知,具有n(,0.152),n=9,1-=95%和t=1.96的总体平均值的置信区间是1-置信水平,这批零件的平均长度的置信区间在21.302厘米和21.498厘米之间,总体平均值的区间估计(示例分析),在某一天产生示例 500。众所周知,袋装食品的重量服从正态分布,标准差为20克。试估计这类食物平均重量的置信区间,置信水平为95%。解决方法:众所周知,n(,202),n=25,1-=95%,t=1.96的置信区间为1-置信水平,此类食品平均重量的置信区间为988.35克至1003.65克。一家进出口公司出口一种名茶。为了检查每包茶叶的质量,通过重复抽样抽取了10
11、00个样品。表10-3某公司茶叶质量抽样表。根据规定,这批茶叶的每包重量不得低于150克。试以99.73%的概率推断这批茶叶每包平均重量的区间范围,并判断每包茶叶的质量是否符合要求。表10-4某公司茶叶质量抽样误差计算表、150.039、150.561,人口比例区间估计(重复抽样),1。假设人口服从二项分布的条件可以由1来确定。假设条件总体服从二项分布,它可以用正态分布来近似;2.1置信水平的人口比例的置信区间为、例10.8。仍然使用前面例子的数据,每包重量超过150克的茶的比例范围可以以95.45%的概率推断出来。=24.58%=9.16%,70% 9.16%,70% 9.16%,60.84
12、%,79.16%,总体比例的区间估计(示例分析),示例一个城市想要估计女性在下岗工人中的比例,请尝试用95%的置信水平来估计该城市下岗工人中女性比例的置信区间。众所周知,n=100,p65%,t=1.96,本市下岗职工中女性比例的置信区间为55.65t.35%,总体比例的区间估计(例分析),例一个企业有1000名职工。企业将进行改革,征求员工的意见,用非重复抽样的方法随机抽取200人作为样本。调查结果显示,150人赞成改革,50人反对改革。尝试确定赞成改革的人数的置信区间,概率为95%。解决方法是:n=100,p75%,t=1.96,企业员工中赞成改革的人数的置信区间在69.63-37%之间。
13、第四部分是必要样本量的确定和总指标的计算。1.必要样本容量的确定1。影响必要样本容量的因素1)标志总体中各单元的变异程度2)容许误差范围,即极限误差3)抽样估计的概率保证程度4)抽样方法5)抽样调查的组织形式2。由采样平均误差和采样极限误差之间的关系转化而来的必要样本容量计算公式,又分为重复采样和非重复采样两种计算方法。简单随机抽样的必要样本量的计算公式:1)重复抽样的必要样本量:几个必要样本量:2)非重复抽样的必要样本量,平均必要样本量:几个必要样本量:估计总体平均值时样本量的确定(例析),例析大学本科毕业生年薪的标准差约为, 在估计总体均值时样本容量的确定(示例分析),解:已知为=2000,=400,1-=95%,并且t=1.96的置信区间为95%,即在估计总体比例时应取97人作为样本来确定样本容量(示例分析),示例根据以前的生产统计,某种解:显示p=90%,1-=95%,t=1.96,=5%,以及样本大小2.总量指标的估计。1.直接推算法是一种通过将样本指数值或总指数的区间估计值乘以单位总数来计算总量指数的方法。在点估计的情况下,样本指标值可以直接乘以总单位数,即推断或;在区间估计的情况下,区间估计值可以乘以单位的总数,即或。校正系数法1)比例校正比例校正是指用同一抽样群体中所有相关标记的比例来校正所有总体指标的方法。示
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年阳光学院单招综合素质考试题库附参考答案详解(a卷)
- 2026年阜新高等专科学校单招职业技能测试题库及答案详解(网校专用)
- 2026年陕西警官职业学院单招职业技能考试题库含答案详解(预热题)
- 国家事业单位招聘2024农业经济与发展研究所学术型调剂硕士研究生拟录取笔试历年参考题库典型考点附带答案详解
- 2026年青岛黄海学院单招综合素质考试题库附参考答案详解(预热题)
- 2026年阳江职业技术学院单招职业适应性考试题库带答案详解(能力提升)
- 国家事业单位招聘2023中央财经大学创新发展学院行政岗招聘1人(非事业编制)笔试历年参考题库典型考点附带答案详解
- 四川省2024年四川长江航道局事业编制人员招聘(140人)笔试历年参考题库典型考点附带答案详解
- 2026年阜新高等专科学校单招职业适应性测试题库含答案详解(研优卷)
- 2026福建漳龙集团有限公司招聘1人笔试历年参考题库附带答案详解
- 2026年中学新团员入团测试题及答案
- (一模)东北三省三校2026年高三第一次联合模拟考试语文试卷(含答案详解)
- 2026河南郑州建设集团所属公司社会招聘工作人员44名笔试备考题库及答案解析
- 2026辽宁大连理工大学后勤处自聘管理岗位招聘2人笔试备考题库及答案解析
- 2026年吉安职业技术学院单招综合素质考试题库含答案详解
- 2026年春五年级下册数学教学计划(附教学进度表)
- 薄抹灰施工方案
- 2026年餐饮服务标准操作流程培训
- 2026年南京交通职业技术学院单招职业技能考试题库及答案详解(基础+提升)
- 2025年青岛农商银行春招笔试及答案
- 绍兴2025年浙江绍兴市政务服务办公室招聘政务服务专员6人笔试历年参考题库附带答案详解
评论
0/150
提交评论