抽样调查课件_第1页
抽样调查课件_第2页
抽样调查课件_第3页
抽样调查课件_第4页
抽样调查课件_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样调查课件1第1页,课件共51页,创作于2023年2月本章主要内容2.1概述2.2简单估计量及其性质2.3比率估计量及其性质2.4回归估计量及其性质2.5简单随机抽样的实施第2页,课件共51页,创作于2023年2月2.1概述2.1.1随机抽样的几点约定2.1.2简单随机抽样的意义和原则2.1.3简单随机抽样的定义2.1.4简单随机抽样的符号2.1.5对总体特征估计的思路和方法2.1.6简单估计的主要参数和统计量第3页,课件共51页,创作于2023年2月2.1.1随机抽样的几点约定随机抽样具体分为4种情形:放回有序放回无序不放回有序不放回无序本书的内容是围绕不放回简单随机抽样展开的。所有可能样本数最多,但理论结果最简单。所有可能样本数最少,实际操作最简单。除非特别说明,简单随机抽样是指不放回简单随机抽样(Simplerandomsamplingwithoutreplacement记为SRSWOR)。第4页,课件共51页,创作于2023年2月放回简单随机抽样(SRSwithreplacement)放回简单随机抽样在每次抽取样本单元时,都将前一次抽取的样本单元放回总体,因此,总体的结构不变,抽样是相互独立进行的,这一点是它与不放回简单随机抽样的主要不同之处。放回简单随机抽样的样本量不受总体大小的限制,可以是任意的。第5页,课件共51页,创作于2023年2月【例2.1】设总体有5个单元(1、2、3、4、5),按放回简单随机抽样的方式抽取2个单元,则所有可能的样本为25个(考虑样本单元的顺序):1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5第6页,课件共51页,创作于2023年2月不放回简单随机抽样(SRSwithoutreplacement)当从总体N个抽样单元中依次抽取n个抽样单元时,每个被抽中的单元不再放回总体,而是从总体剩下的单元中进行抽样。不放回简单随机抽样的样本量要受总体大小的限制。在实际工作中,更多的采用不放回简单随机抽样。第7页,课件共51页,创作于2023年2月

【例2.2】设总体有5个单元(1、2、3、4、5),按不放回(无序)简单随机抽样的方式抽取2个单元,则所有可能的样本为10个:1,22,33,44,51,32,43,5

1,42,5

1,5

第8页,课件共51页,创作于2023年2月除非特别说明,本书此后所讨论的总体是:(1)具体总体;(2)有限总体;(3)与抽样框存在一一对应的实查总体,或被称为抽样总体的抽样框本身。本书所讨论的单元总是指构成抽样总体的抽样单元(或称样品、样本点),抽样单元并不总是等同于个体,有时抽样单元甚至可能包含几个或很多个个体,这意味着个体是最小的不可再分的单元。在简单随机抽样中,每个抽样单元就是个体。第9页,课件共51页,创作于2023年2月设抽样总体由N个抽样单元组成,N是一个已知的正整数,表示总体规模;设n是样本容量,它是一个不大于N、不小于1的正整数(1≤n≤N,但通常情况下是1<n<N),表示样本中所包含的单元数,简称样本量或样品数,表示样本规模。从N个单元里抽取n个单元进行调查,并根据调查结果得到的统计量去估计总体的数量特征,就是抽样调查。样本容量相对于总体规模的比例记为f;通常情况下,0<f<1。称为抽样比,第10页,课件共51页,创作于2023年2月2.1.2简单随机抽样的意义和原则简单随机抽样的意义:简单随机抽样是直接用样本均值估计总体均值,待估参数与用于估计的统计量两者“同形同构”,通常视为简单估计。简单随机抽样也称为纯随机抽样,是直接从总体中(而不是层之类的子总体)抽取个体(而不是群之类的大单元),是最基本的抽样方法,从理论上讲最符合随机原则,是其他各种抽样方法的基础和核心内容。简单随机抽样操作简单,应用广泛。第11页,课件共51页,创作于2023年2月简单随机抽样的缺点:N很大时难以获得抽样框样本分散不易实施,调查费用高总体内部个体之间变量值差异悬殊时误差会增大简单随机抽样的适用场合:N不很大的均匀总体很少单独使用,一般结合其他方法使用没有其他信息时使用多变量复杂数据分析第12页,课件共51页,创作于2023年2月简单随机抽样的抽取原则:(1)按随机原则取样,排除任何主观因素的影响,防止出现系统误差;(2)每个抽样单元被抽中的概率都是已知的或事先确定的;(3)每个抽样单元被抽中的概率都是相等的,即简单随机抽样属于等概率抽样。每个单元被抽中的概率相同所有可能样本每个样本被抽中的概率相同第13页,课件共51页,创作于2023年2月定义2.1从总体的N个单元中,一次整批抽取n个单元,使得任何一个单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概率也都相等,这种抽样称为简单随机抽样。定义2.2从总体的N个单元中,逐个不放回地抽取单元,每次抽取到尚未入样的任何一个单元的概率都相等,直到抽足n个单元为止,这样所得的n个单元组成一个简单随机样本,这种抽样方法就是简单随机抽样。2.1.3简单随机抽样的定义第14页,课件共51页,创作于2023年2月定义2.3从总体的N

个单元中抽取n个单元的所有可能不同的组合构造所有可能的个样本,从有限事实上,当N和n都较大时,依照定义2.3进行抽样是很不方便的,因为此时个样本随机抽取1个样本,使每个样本被抽中的概率都等于,这种抽样称为简单随机抽样。很大,要列出全部可能的样本是不现实的。(例如,N=10000,n=400的抽样只能算是中等规模的抽样,但所有可能的样本有3.29×101438多个,已属天文数字。)实际中,简单随机抽样是按照定义2.1和2.2设计的。第15页,课件共51页,创作于2023年2月2.1.4简单随机抽样中的符号大写符号表示总体的有关变量用小写符号表示样本的有关变量

第16页,课件共51页,创作于2023年2月总体样本

第17页,课件共51页,创作于2023年2月总体指标值上面带符号“^”的表示由样本得到的总体指标的估计。估计量的方差用大写的V表示,对的样本估计,不用而用表示。第18页,课件共51页,创作于2023年2月2.1.5对总体特征估计的思路和方法两种思路和方法:直接估计:不借助任何辅助变量,仅仅通过变量的样本观察值对其总体特征进行直接估计,即样本特征的线性组合表示总体特征,故统称线性估计。间接估计:借助相关辅助变量,对我们所感兴趣的变量的总体特征进行间接估计,用样本特征的非线性组合表示总体特征,故统称为非线性估计。对简单随机抽样进行直接估计,称为简单线性估计,简称简单估计。第19页,课件共51页,创作于2023年2月2.1.6简单估计的主要参数和统计量(1)均值估计:(2)总值估计:(3)比例估计:(4)比率估计:第20页,课件共51页,创作于2023年2月2.2简单估计量及其性质2.2.1对总体均值的简单估计2.2.3对总体总量的简单估计2.2.2对总体比例的简单估计第21页,课件共51页,创作于2023年2月2.2.1对总体均值的估计一、简单估计及其无偏性在没有其它信息的条件下,对总体均值的简单估计为:抽样理论证明样本平均数是总体均值的有效、无偏估计量。可以证明:教科书p32-34。第22页,课件共51页,创作于2023年2月二、简单估计量的方差数理统计中定义有限总体的方差为:抽样理论中所使用的方差为:第23页,课件共51页,创作于2023年2月简单随机抽样中的方差所有的统计量都是随机变量,可能的样本有很多个,样本不同,统计量就不同,但总体参数是唯一的确定的。由于样本出现的偶然性,样本均值与总体均值之间必然有误差,的方差即是所有可能的样本均值与总体均值的误差的方差。是一个表达抽样误差的确定型变量,是抽样精度的理论表达。第24页,课件共51页,创作于2023年2月说明:在不考虑1-f的情况下,估计量的方差与样本容量n成反比;当其他条件不变时,估计量的方差与总体未入样率(1-f)成正比。

样本均值的方差与总体方差成正比。第25页,课件共51页,创作于2023年2月三、估计量的方差估计用s2代替S2第26页,课件共51页,创作于2023年2月

四、总体均值估计的置信区间1-a称为置信水平或置信度,在1-a的置信度下,总体均值,落在近似置信区间:置信度与置信区间共同反映抽样调查的信度,其含义是总体均值落在上述置信区间的概率不低于1-a。第27页,课件共51页,创作于2023年2月置信度1-a

与概率度,两者是一一对应的正比例关系。两者常用的数值主要有(可查正态分布概率表):令

1-a

=68.27%t=11-a

=95%t=1.961-a

=95.45%t=21-a

=99.73%t=3第28页,课件共51页,创作于2023年2月1)计算样本均值2)计算样本方差3)计算样本均值的方差4)给定置信度1-a

五、总体均值估计的步骤5)计算置信区间第29页,课件共51页,创作于2023年2月【例2.3】某学院有100名学生,我们从中随机抽出10名学生调查他们每天学习英语的时间(小时),调查资料如下表,根据对这10名学生的调查结果,在95%的置信度下估计全学院学生每天学习英语的平均时间。序号1234567891045204661508第30页,课件共51页,创作于2023年2月解:第31页,课件共51页,创作于2023年2月

因此,可以以95%的概率保证程度估计全学院100名学生平均每天学习英语的时间:即:以95%的概率保证程度,估计全学院100名学生平均每天学习英语的时间在2.43~7.57小时之间。当置信度为95%时,对应的概率度第32页,课件共51页,创作于2023年2月思考题为调查某地区1960个村新棉收购情况,以简单不重复抽样方式随机抽取49个村进行调查,求得样本均值为7000公斤,样本方差为180公斤。试以99.73%的可靠程度估计该地区平均每村收购棉花多少公斤?第33页,课件共51页,创作于2023年2月已知:解:当置信度为99.73%时,对应的概率度以99.73%的可靠程度估计该地区平均每村收购棉花在6994.33~7005.67公斤之间。第34页,课件共51页,创作于2023年2月2.2.2对总体比例的估计一、对总体的描述总体按所研究标志不同变量总体(研究数量标志)属性总体(研究品质标志)在属性总体中,当所研究的标志,其表现只有两种属性,即“是”或“非”时,将该属性总体称为是非标志总体。例如:产品按质量分组合格品不合格品(是)(非)学生按成绩分组及格不及格(非)(是)注意:“是”与“非”是根据研究目的确定的,研究的标志是“是”。第35页,课件共51页,创作于2023年2月1、成数

在是非标志总体中,设总体有N个单位,其中,有A个单位具有某种性质或属性(“是”的属性),有B个单位不具有某种性质或属性(“非”的属性),而A+B=N

则有:即总体中具有研究标志的单位数在总体中所占的比重即总体中不具有研究标志的单位数在总体中所占的比重第36页,课件共51页,创作于2023年2月2、总体比例(是非标志的均值)由于是非标志的表现不能用数值表示,为了研究问题方便,我们可以将是非标志数量化。即用1表示单位标志为“是”的标志值(即具有研究标志的单位的标志值);用0表示单位标志为“非”的标志值(即不具有研究标志的单位的标志值)。产品标志值

Yi

单位数

Ni合格(是)不合格(非)10

AB

合计

N第37页,课件共51页,创作于2023年2月

所以,总体比例为:总体比例的方差:第38页,课件共51页,创作于2023年2月二、估计量及其性质估计量p的方差:(所有可能的样本比例与总体比例的误差的方差)样本比例:样本比例的方差:第39页,课件共51页,创作于2023年2月

三、总体比例估计的置信区间在1-a的置信度下,总体比例P落在近似置信区间:第40页,课件共51页,创作于2023年2月1)计算样本比例

2)计算样本均值的方差3)给定置信度1-a

四、总体比例估计的步骤4)计算置信区间第41页,课件共51页,创作于2023年2月

例,某高校有10000名在校生,现随机从中抽取400名,结果有320名学生近视,在置信水平95.45%的条件下,试估计该高校全体在校生近视率的置信区间。解:第42页,课件共51页,创作于2023年2月置信水平95.45%时,概率度第43页,课件共51页,创作于2023年2月即:以95.45%的概率保证程度估计该校在校学生近视率在76.08%~83.92%之间。该高校全体在校生近视率的置信区间为:P{76.08%≤P≤83.92%}=95.45%第44页,课件共51页,创作于2023年2月

【例2.5】

某超市新开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度,该超市与附近几个小区的居委会取得联系,在总体中按简单

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论