第七章 抽样调查.ppt_第1页
第七章 抽样调查.ppt_第2页
第七章 抽样调查.ppt_第3页
第七章 抽样调查.ppt_第4页
第七章 抽样调查.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本章主要内容包括抽样调查常见问题、抽样误差、抽样估计方法、抽样组织设计、第7章抽样调查、第1节抽样调查概述、第1、抽样调查概念:非全面调查是从所有研究对象中以随机原则抽取部分单位进行观察一种部分估计整体的识别方法。 的双曲馀弦值。 使用概率估计的方法。 那个误差可以事先计算并控制。 二、特征、三、关系的基本概念,(一)全体和样本,全体:也称全体和全体。 指应该认识的整个研究对象。 整体单元总数用“n”表示。 样本:或子样本。 是从全体和全体中随机抽出,作为代表全体的部分单位构成的集合体。 采样单位的总数用“n”表示。 (二)全及指标和样品指标,全及指标:反映全体数量特征的指标数值。全及指标、研究全体数量指标、全体平均、全体方差、研究全体质量指标、多方差、全体数量、抽样指标:根据抽样数据计算的综合指标。 研究数量标记、样品平均值、样品标准偏差、研究质量标记、样品数量、数量标准偏差、样品指标、数量是什么? 全体所包含的全体单位在某个标识中被分为两大部分,具有某个特征的单位数在全体单位数中所占的比例是整数。 数量也是这个整体的平均值。产品质量、良品、不良品、数量(件)、合计、N1、N0、n、平均、x、1、0、f、(数)、(3)样品容量和样品个数、样品容量:1样品中包含的单位数。 用“n”表示。 一般而言,n30个样本:能够从整个样本和总体样本中提取的样本的数目。 (4)重复采样,不重复采样,重复采样:此外,返回采样。 不重复采样:也称为不返回采样。 例如,有两个单元构成一个样本,每个样本包括四个单元: a、b、c、d,其中a、a、AC、AD、b、a、BB、BC、BD、AB、c、a、CB、CC、CD、d、a、DB、DC、DD,其中,不重复采样即调查中不包含由观察、测量、登记、计算上的错误引起的误差的另一个系统误差,是通过违反抽样调查的随机原则,有意抽出好的单位或坏的单位进行调查,由于样本的代表性不足而产生的误差。 二、影响采样误差幅度的因素,一、整体各单位指标值的差异程度,二、采样单位数、三、采样方法、四、采样调查的组织形式,三、采样平均误差、采样平均误差是采样平均或采样数的标准偏差,反映采样指标与整体指标的平均误差程度的双曲馀弦值。 总体上假定包含1、2、3、4、5、5的数字。 然后,总体平均值为x,1,2,3,5,=,3。目前,使用重复采样提取两个样本以构成一个样本。 可配置样本数: 25个。 例如,、1、3、2、=2、1、4、2、=2.5、2、2、=3、3、5、2、=4、采样平均误差的计算理论式、采样平均误差、采样数平均误差、(上述两个式子实际上是第4章所述的标准偏差。 然而,反映了样本指标和整体指标的平均方差程度,实际上,无法通过使用上述两种公式来计算样本平均误差。 想一想,为什么大量采样指标和整体指标有误差,误差大,小,正,负,采样平均误差综合所有误差,求平均,因此采样平均误差是反映采样误差一般水平的指标。此外,计算采样平均误差的实际方法是重复采样:该公式显示采样平均误差与总体标准偏差成比例,这与采样容量成反比。 (母集团的标准偏差未知时,可以用标准偏差替换) (教材p79例题)从例题中,可以说明以下几点标准平均值等于母集团平均值。 样本平均值的标准偏差仅为整体标准偏差,通过调整样本单位数,可以控制样本平均误差。 例题:假设样本单位数增加了2倍、0.5倍,样本平均误差会如何变化? 解:样本单元数为2倍,即原来的3倍时,样本单元数为0.5倍,即原来的1.5倍时,样本单元数为2倍时,样本平均误差为原来的0.577倍。 也就是说,当样本的单位数目增加到0.5倍时,样本的平均误差为原始0.8165倍。 不重复取样:采用公式表明,取样的平均误差不仅与整体变异程度、取样容量有关,还与整体单位数的多少有关。 此外,与重复取样相比,重复取样的平均误差率总是小于重复取样的平均误差率1,因为重复取样的平均误差率总是小于重复取样的平均误差率。 例题1 :例题2 :某厂生产新型灯泡2000支,随机抽取400支进行耐久时间试验,测试结果平均寿命为4800小时,样品标准偏差为300小时,求样品估算的平均误差? 随机抽取某学校100名学生,调查体重。 平均体重为58公斤,标准偏差为10公斤。 当根据样本学生的平均体重估计所有学生的平均体重时,示例性问题解: (即: ),样本平均误差为1公斤。 例题二解:计算的结果表明,当根据某些产品来估计所有产品的平均寿命时,采用不重叠样本小于重叠样本的平均误差。已知:已知:已知:则:n=100、=10、x=58、N=2000、n=400、=300、x=4800、练习题:五个工人的日产量分别为(单位:条件):6、8、10、12、14,以重复采样的方式,从其中随机地选择两个工人取样的平均误差是多少? 如果切换到不重复采样的方法,采样的平均误差是多少? 解:根据问题意见,在不重复采样的条件下的采样平均误差,在重复采样的条件下的采样平均误差的实际计算方法为:重复采样:不重复采样:例题3 :在某学校随机抽取400名学生,戴眼镜的学生从样品资料中估算所有学生中戴眼镜的学生所占的比例,取样误差为多少例题4 :食品罐头总计60000桶,随机抽取300桶,发现6桶不合格,求出合格率的样品平均误差? 例题三解:已知:样本数,即根据样本数据推定所有学生中戴眼镜的学生所占的比例时,推定的平均误差为2%。 例题四解:已知:中,样本合格率,在计算结果中,不重复样本的平均误差小于重复样本,但是“n”的数值越大,用两种方法计算的样本的平均误差越接近。 采样极限误差是样本与总体指标之间误差的可能范围。 整体指标是确定性的数量,但由于采样指标以整体指标为中心上下变动,与整体指标之间存在正方差和负方差,采样指标变动的上限或下限与整体指标之差的绝对值可以表示采样误差的可能范围,我们以这种绝对值形式表示采样误差的可能性四、采样极限误差,含义:采样极限误差是指在进行采样估计时,根据研究对象的变异程度和分析任务的要求而决定的采样指标与整体指标之间可接受的最大误差范围。计算方法:|x-X|x,|p-P|p假设x和p分别表示采样平均数和采样数采样界限误差,|x-X|x,|p-P|p上述不等式为:采样平均界限误差:采样数界限误差:x -xxXP -pppp、5、采样误差的信号用符号 t 表示。 此外,公式为、(t为极限误差与采样平均误差之比)、(极限误差为t倍的采样平均误差),上述公式参照、P284-286例题,按照第四节采样组织设计、一、简单随机采样、1、含义:随机原则从整体的n个单位中直接提取n个单位作为采样2、样本单位数的计算方法:根据样本极限误差公式计算所需的样本单位数。 重复取样:不重复取样:取样的平均数目,取样的数目,2,类型的取样,3,等间隔的取样,4,整个组的取样首先按主要标志将整个组的每个单位分组,然后按随机原则从每个组中进行采样用某个标志排列整体各单位,按一定的顺序和间隔抽取样本单位的组织形式。 抽样组织形式,将整体的各单位分成多个组,从中随机抽取部分组,对从中选出的组的所有单位进行全面调查。第5节取样单位数的决定、取样单位数的计算方法:根据取样极限误差式来计算所需的取样单位数。 重复取样:不重复取样:取样平均数、取样数、第5节取样单位数的决定、教材P302-306、第6节的整体指标的推定、一、整体的点推定、点推定的特征: p07、整体参数的优良推定的基准、无偏差、一致性、有效性整体区间推定、区间推定三要素、推定值、采样误差范围、采样推定的可靠度、区间推定的方法步骤: p07、教材p71、采样推定的可靠度是什么? 样本估计的可靠性指示了样本指示符与总体指示符之间的误差不会超出一定范围的概率保证程度(教材p84 ),其中,对于较大样本,符号指示符号:P(x-X)=F(t )、x、(教材p86例题)、理论上可以表明样本平均分布接近正态分布,而分布的特征在于: 证明样本平均值以整体平均值为中心,两侧完全对称分布,即样本平均值的正误差与负误差的可能性完全相等。 取样平均值越接近整体平均值,出现的可能性越高,概率越高,相反,取样平均值越远离整体平均值,出现的可能性越小,概率越小,出现的可能性越为0。 根据正态概率分布图、x、x 1、x-1、68.27%、x 2、x-2、95.45%、可知,误差范围越大,采样估计的可靠性越高,但采样估计的精度越低,相反,误差范围越小,采样估计的可靠性越高由于扩大或缩小后的平均误差为临界误差:=t,所以采样平均误差的系数为概率精度t。 数理统计证明了采样误差的概率是概率度的函数,两者对应的函数关系被编入“正态分布概率表”。 基于给定概率F(t ),和(1),估计采样极限误差的可能范围。 2、根据给定的F(t )表求概率度t。 3、根据概率度和取样平均误差计算极限误差。 4、计算估计出的值的上下限,对整体的参数进行区间估计。 三、整体参数区间估算方法在某农场进行小麦产量抽样调查,采用小麦播种总面积1万亩、不重复的简单随机抽样,其中抽样100亩进行实测,测定样品平均亩产量为400斤,方差为144斤(以95.45%的可靠性估计,该农场的小麦平均亩产可能为多少公斤,例题1 :t=2,样本指标,有时需要计算,例题1的解题过程:已知:问题1解:1,计算样本平均误差2,计算样本极限误差3, 计算整体平均置信区间,以上限:下限:即95.45%置信度估计该农场的小麦亩产量在397.62公斤到402.38公斤之间,不重复采样,如果x-xxx x,(2)概率保证的程度不变,则采样容许误差不能超过1公斤问题二解:已知:样本单元数:即,至少544.6亩必须提取为样本。 例题2 :某纺织厂在某时期生产10万单位纱线,采用随机抽样方式抽取2000单位的检测,检测结果合格率为95%,不合格率为5%,以95%的把握程度,尝试推定全纱合格率的区间范围和合格率的区间范围。 已知:区间下限:区间上限:例题3 :为了调查农民的生活状况,在某地区的5000户农民中,采用不重复的简单随机抽样法抽出400户进行了调查,结果发现这400户中有彩色电视机的农民有87户。 求计算:1.在显着性水平=0.05的条件下,本地区所有农户中拥有彩色电视机的农户估计占多少比例? 2 .样品允许误差不超过0.02时,其他条件不变,作为样品应该提取多少家庭? 例题3的问题解答: N=5000,n=400,1,样本数的计算: 2,样本平均误差的计算: 3,样本极限误差的计算: 4,总体p的置信区间的计算:下限:上限:即95%的把握度,该地区的农户中有彩色电视机的农户在17.87%到25.63%之间、例题3的问题二解:其他条件不变时:(二)根据给定的采样误差范围求出概率保证度,步骤:1、提取采样,计算采样指标。 2、根据给定的极限误差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论