《抽样调查概述》PPT课件_第1页
《抽样调查概述》PPT课件_第2页
《抽样调查概述》PPT课件_第3页
《抽样调查概述》PPT课件_第4页
《抽样调查概述》PPT课件_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章是抽样调查概述(重点章节和难点章节),第一节是抽样调查的概念,第二节是抽样误差,第三节是参数估计,第四节是EXCEL的应用,以及“抽样调查和社会经济现象的推断”的任务书(5)一、任务标题:选择某个社会经济现象,对该现象进行抽样调查,并对调查结果进行分析和推断。第二,主要内容:了解抽样调查的意义和特点;学会掌握抽样误差、参数估计等指标的意义和计算方法;选择某一社会经济现象进行抽样调查,并对调查结果进行分析和推断。三。基本要求:1。所选择的社会经济现象可以是工商企业的生产经营资料,也可以是学校的人员分布和财产结构。2.抽样调查收集的数据采用实地调查的方法;3.每个人使用EXCEL制作一个调查

2、数据表;利用统计函数计算抽样误差和参数估计,并分析这一现象的特点和趋势。4.将分析保存在一个文件夹中,并将其复制到您自己的u盘中以供将来参考。4.成绩评价:1。评分标准。基本点:数据分析方法和结果正确。8分;额外加分:按时提交作业并独立完成。两点。2.这个年级占这个学期总成绩的10%。任务发布日期:2012年月日任务完成日期:2012年月日教师签名:任务书,学习内容和要求,学习内容:了解抽样调查的意义和作用;熟悉抽样误差的计算方法及其影响因素;掌握各种抽样组织形式下总体均值和分量区间估计的技巧和方法;掌握确定样本量的计算方法及其影响因素。带着问题学习:1。抽样调查的概念、特征和功能是什么?2.

3、取样误差可以避免吗?根据平均样本数计算平均抽样误差的方法、过程和结果是什么?3.影响抽样误差的因素有哪些?4.区间估计的计算方法和过程是什么?5.影响样本数量的因素有哪些?本章在统计原理、抽样调查和推理中的地位是理论教学和实际工作中最常用和最重要的统计方法之一。根据概率论揭示的随机变量的一般规律,利用抽样调查获得的样本信息估计人口的一些数量特征。本章也是假设检验和相关回归分析的重要基础。第一部分是抽样调查的概念(依据和要点),重点:抽样调查的基本概念和作用,存在的问题:1。抽样调查的概念和特点是什么?2.抽样调查的作用是什么?第一节是抽样调查的概念(基础、重点),第一节是抽样调查的含义。抽样调

4、查是一种统计方法,它根据随机原理从人口中抽取一些单位,根据抽样观察结果,以一定的可信度估计和推断人口的未知数量特征,从而了解人口。(完整和总体)、(样本总体)、样本指数、(总体参数)2。抽样调查的特点:(三)3 .抽样调查的作用:(四)要学习抽样推断,首先必须弄清总体分布、样本分布和抽样分布之间的关系。总体分布:可以是正态分布、偏态分布等。未知。唯一的一个。样本分布:可以是正态(偏斜)分布等。取样后就知道了;有几个不同形状的样品。抽样分布:广泛多样;越靠近中心点,分布越密集。75,一般分布:未知;只是,抽样分布:有几个终点(低概率)和许多中心(高概率)。补充:概率和分布的相关知识1。总体分布及

5、其特征总体分布是由人口中所有个体对某一变量(符号)的值形成的分布。变量分布有多种形式,如J型分布、U型分布有两个常用的总体参数:一个是总体均值(包括不变量的均值);第二,总体方差或标准差(包括不变量的方差或标准差)。2.样本分布及其特征样本分布是样本中所有个体关于某一变量(标记)的值所形成的分布。因为样本来自整体,它包含了一些关于整体的信息。当样本量大(或逐渐增加)时,样本分布将接近总体分布。如果样本量很小,样本分布可能与总体分布有很大不同,抽样估计的结果会很差。反映样本点特征的指标称为样本统计量,通常用。还有两种常见的样本统计:样本均值和样本方差,即:3。抽样分布及其特征抽样分布的概念和影响

6、因素一般来说,抽样分布是样本统计量的概率分布,它由样本统计量的所有可能值及其相应的概率组成。实际抽样分布的形成取决于以下五个因素:总体分布。总体分布越分散,样本量越分散。样本量越小,抽样分布越分散。在正常情况下,重复采样比非重复采样分布更广。简单抽样率和分层抽样下抽样分布的分散估计量的构造。不同估计量的抽样分布形式不同。在抽样估计中,最基本的抽样分布是样本均值的抽样分布和样本分数的抽样分布,从而得到抽样分布的形式。抽样分布特征任何抽样分布都有它自己的特点,即抽样统计的数学期望和方差。其中,样本统计量的数学期望是所有样本统计量的平均值,样本统计量的方差是所有样本统计量关于数学期望的方差。当估计量

7、为样本统计量时,数学期望和方差分别表示为和。抽样分布及其特征。抽样分布的概念及其影响因素一般来说,抽样分布是样本统计量的概率分布,它由样本统计量的所有可能值及其相应的概率组成。如果样本分布是关于样本观测值的分布,那么样本分布是关于样本统计值的分布,它是从样本观测值计算出来的。实际抽样分布的形成取决于以下五个因素:总体分布。总体分布越分散,样本量越分散。样本量越小,抽样分布越分散。在正常情况下,重复采样比非重复采样分布更广。简单抽样率和分层抽样下抽样分布的分散估计量的构造。不同的估计量有不同的结构和不同的抽样分布。补充:为了说明抽样分布和概率,有4名工人(N=4),他们的日产量为22、24、26

8、和28件(用A、B、C和D表示),总平均数为25件。从其中随机抽取两个试验(n=2),用重复抽样法产生16个可能的样本,即“AA、AB、AC、AD、BA、BB、DA、AB、DC、DD”。所有可能的样本平均值的平均值=总体平均值,即E(x)=X样本平均值的抽样分布如下表所示:示例:4名工人日产量的抽样分布(考虑订单)(重复抽样,2个中的4个),示例:4名工人日产量的抽样分布(考虑订单)(不重复抽样,2个中的4个)!嘿!样本均值中心极限定理的抽样分布定理对于任何具有均值和方差的有限总体,当样本容量足够大(例如或)时,样本均值的分布趋于服从正态分布,这就是所谓的中心极限定理。分布定理当正态总体的方差

9、未知且n很小时,或者任一方的方差为总体但n很小时,样本均值的分布服从自由度为n-1的T分布。分布曲线类似于正态分布,其中数学期望是补充:常用的抽样分布定理,一般分布(未知),样本分布1 (n小,误差大),样本分布3 (n变大,误差变小),样本分布2 (n变大,误差变小),4。抽样调查中的几个抽样总数。(可以有多个样本,样本容量可以大也可以小,n50是大样本,n30是小样本)(2)常用的一般参数和样本统计量(样本指标):一般平均值、数量、方差等。(客观存在,唯一但未知,需要计算);样本平均值、百分比、方差等。(它是根据样本数据计算的实际数字,以推断总体指数)。取样方法和样品数量1。重复采样,也称

10、为重置采样,是指从整个种群的每一个单位中取一个容量为N的样本,一次取出一个单位,然后放回整个种群中参与下一次采样,这样就可以连续取N次样本。同一整体单位可以重复绘制;每次都从总单位中提取。(每个单元被提取的概率没有改变。)2。非重复采样,也称为非重置采样,意味着所选单位不再放回总数中,下一个采样单位只能从剩余的总单位中提取。相同的整体单位不会重复绘制;每次提取都在不同数量的整体单元中进行。(每个单元被绘制的概率变化),x1,x2,x3,xn、重复采样:每个单元被绘制的概率相同,1/20,1/20,一个特定的单位可以在不重复取样的情况下被画几次:每个单位被画的概率是不同的,1/20,1/19,1

11、/18,每个单元只能画一次。x1,x2,x3,xn,有五种基本的抽样组织方式:纯随机抽样(简单随机抽样),等距抽样(机械抽样),类型抽样(分层抽样),整群抽样(群体抽样),阶段抽样,第2节能提前计算和调整吗?2.根据样本平均值计算样本平均误差的方法、过程和结果是什么?3.根据样本数计算平均抽样误差的方法、过程和结果是什么?4.用(非)重复抽样法计算抽样误差有什么区别?5.影响抽样误差的因素有哪些?第二节抽样误差,返回,第一,抽样单位的方式和抽样误差非抽样误差(系统偏差)。例如,采样帧不准确;一些观测单元数据无法获得;获取的数据不真实等原因。抽样误差(代表性误差):由抽样的不全面性和随机性引起的

12、偶然误差。也就是说,不同样本的抽样估计值的误差。其特征是:样本量增加并趋于零(样本平均值与总平均值之差为零)。抽样调查中的抽样误差一般指随机误差。(例如,在产品质量抽查中,使用50种电子产品的平均耐用时间和合格率来推断生产的所有1000种产品的耐用时间和合格率。),error -45,error 15,(1)采样误差类型,1)采样实际误差的采样估计值和总体参数值之间的偏差。请注意。(每次采样的实际误差未知,因为总体参数未知)。2、抽样平均值误差抽样平均值或抽样标准差。它是衡量抽样误差的核心指标。(平均采样误差越小,采样分布越集中。相反,越离散。(3)估计采样极限误差(也称为允许误差范围)所允许

13、的最大(最小)值与总体参数值之间的绝对偏差通常用,即表示。取样极限误差取决于两个因素:1 .抽样标准误差。采样标准误差越大,采样极限误差越大;2.抽样估计概率保证度。概率保证程度越高,抽样极限误差越大。优秀估计量的评价标准估计量用于估计总体参数的数量,总体参数通常指样本统计量。优秀评估者的标准:1。样本总体的无偏估计,所有可能的估计量和总体参数之间的平均偏差为零。样本均值、分量和方差是总体均值、分量和方差的无偏估计。2.一致性通过样本来估计总体。当样本量足够大时,样本指数接近总体参数。样本均值、分量和方差是总体均值、分量和方差的一致估计。3.有效性通过样本来估计总体,这要求好的估计量的方差小于

14、其他估计量的方差。样本均值、分量和方差是总体均值、分量和方差的有效估计量。4.充分性通过样本来估计总体,并且要求构造优秀的估计器应该最小化有用信息的损失。样本均值、分量和方差是总体均值、分量和方差的充分估计量。(2)抽样平均误差的计算,影响抽样标准误差的因素:(1)总体标准偏差。在其他条件不变的情况下,整个单元的离散度大,采样标准误差大。(2)样本量。在其他条件不变的情况下,样本量大,采样标准误差小。(3)抽样方法。在相同条件下,重复采样的采样标准误差大于非重复采样。(4)取样机构。由于不同的抽样机构有不同的抽样误差,在相同的抽样误差要求下,不同抽样机构所需的样本数是不同的。补充:样本量与抽样

15、误差之间的定量变化关系(在其他条件不变的情况下)。1.当样本大小n扩大(或缩小)到k倍于原始值时,抽样平均误差减小(或扩大)到k倍倒数的平方根。证明1:让:=2,n=4是:证明2:让:=2,n=4是:2。当采样平均误差增大(或减小)k倍时,样本大小n减小(或扩大)k倍的倒数的平方。证明3:假设:=2,n=4是:证明4:假设:=2,n=4是:第3节参数估计(关键部分),重点:带问题的总体参数的区间估计:1。参数估计的理论基础是什么?2.如何计算抽样极限误差?3.区间估计的计算方法和过程是什么?4.影响样本数量的因素有哪些?第三部分是参数估计(关键部分)。首先,参数估计的理论基础:基于大数定律和中心极限定理的抽样估计。根据随机原则,从人群中选取一些单位(样本)进行调查,利用调查结果(样本指标)对总体参数进行估计和推断,具有一定的可靠性,从而了解人群。示例:从1000个灯中随机选择50个灯用于抽样估计和推断。(总数)1000 50(样本)总平均样本平均数总样本数总方差样本方差,特征: 1。根据随机原则取样。2.用样本指数值估计总体指数值。3.基于概率论和数理统计,推断结果具有一定的可靠性,抽样误差可以预先计算和控制。推断、提取、抽样极限误差、样本均值:样本数:*注:由于总体均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论