版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2章简单随机抽样(SRS)2.1定义及其抽选方法2.2简单估计量及其性质2.3样本量的确定2.4设计效应2.5逆抽样2.1定义与符符号简单随机机抽样也也称为纯纯随机抽抽样。从含有N个单元的的总体中中抽取n个单元组组成样本本,如果果抽样是是不放回回的,则则所有可可能的样样本有个个,若每每个样本本被抽中中的概率率相同,,都为,,这种抽抽样方法法就是简简单随机机抽样。。具体抽样样时,通通常是逐逐个抽取取样本单单元,直直到抽满满n个单元为为止。有限放回简单单随机抽抽样不不放回简简单随机机抽样放回简单单随机抽抽样(SRSwithreplacement)当从总体体N个抽样单单元中抽抽取n个抽样单单元时,,如果依依次抽取取单元时时,不管管以前是是否被抽抽中过,,每次都都从N个抽样单单元中随随机抽取取,这时时,所有有可能的的样本为为??个个(考虑虑样本单单元的顺顺序),,每个样本本被抽中中的概率率为?放回简单单随机抽抽样在每每次抽取取样本单单元时,,都将前前一次抽抽取的样样本单元元放回总总体,因因此,总总体的结结构不变变,抽样样是相互独立立进行的,,这一点点是它与与不放回回简单随随机抽样样的主要要不同之之处。放回简单单随机抽抽样的样样本量不不受总体体大小的的限制,,可以是是任意的的。简单随机机抽样的的抽取原原则:(1)按随机机原则取取样;(2)每个抽抽样单元元被抽中中的概率率都是已已知的或或事先确确定的;;(3)每个抽抽样单元元被抽中中的概率率都是相相等的。。所有可能能样本每每个样本本被抽中中的概率率相同所有可能能样本每每个样本本被抽中中的概率率相同【例2.1】设总体有有5个单单元(1、2、、3、4、5)),按放放回简单单随机抽抽样的方方式抽取取2个单单元,则则所有可可能的样样本为25个((考虑样样本单元元的顺序序):1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5(2)不不放回简简单随机机抽样((SRSwithoutreplacement)当从总体体N个抽样单单元中依依次抽取取n个抽样单单元时,,每个被被抽中的的单元不不再放回回总体,,而是从从总体剩剩下的单单元中进进行抽样样。不放回简简单随机机抽样的的样本量量要受总总体大小小的限制制。在实际工工作中,,更多的的采用不不放回简简单随机机抽样。【例2.2】设总体有有5个单单元(1、2、、3、4、5)),按不不放回简简单随机机抽样的的方式抽抽取2个个单元,,则所有有可能的的样本为为个:1,22,33,44,51,32,43,5
1,42,5
1,5
符号
大写符号号表示总总体的标标志值,,用小写符符号表示示样本的的标志值值总体样本
总体指标标值上面面带符号号“^””的表示示由样本本得到的的总体指指标的估估计。称为为抽样比比,记为为f。估计量的的方差用用大写的的V表示,对的的样样本估计计,不用用而而用表表示。。二、抽选选方法1.抽签签法2.随机机数法———随机机数表、、随机数数骰子、、摇奖机机、计算算机产生生的伪随随机数随机数表表法:N=327n==5讨论:(1)总体编号号为1~~35,,在00~99中产生生随机数数,若==00或或>35,则抛抛弃重抽抽。(2)总总体编编号为1~35,在00~99中产产生随机机数,以以除以35,余余数作为为被抽中中的数,,如果余余数为0,则被被抽中的的数为35。三、地位位与作用用优点简单直观观理论基础础缺点N很大时难难以获得得抽样框样本分散散不易实实施,调调查费用用高很少单独独使用,,一般结结合其他他方法使使用没有其他他信息时时使用多变量复复杂数据据分析2.2简单估计计量及其其性质判断下面面要估计计的总体体目标量量分别属属于什么么类型??调查城市市居民家家庭平均均用电量量。估计湖中中鱼的数数量。测试日光光灯的寿寿命。估计居民民家庭用用于做饭饭菜及饮饮用的用用水量占占家庭总总用水量量的比重重。估计婴儿儿出生性性别比。。检测食盐盐中碘含含量。一、对总总体均值值的估计计以样本均均值作为为总体均均值的估估计性质1::对于简单单随机抽抽样,是的无偏估估计。例设总体体为{0,1,,3,5,6}},计算算总体均均值==3、总体体方差==5.2和==6..5;给给出全部部的的样样本,并并验证及及。。
1010.5-2.50.52031.5-1.54.53052.5-0.512.540630185132-126153087163.50.512.58354129364.51.54.510平均565.52.50.5
306.5
方差1.95
样本编号号单元1单元2样本均值值-样本方差差证明性质1对于固定定的有限限总体,,估计量量的期望望是对所所有可能能样本求求平均得得到的,,因此总体中每每个特定定的单元元在不同的的样本中中出现的的次数。。证明性质1(对称性性论证法法)由于每个个单元出出现在总总体所有有可能样样本中的的次数相相同,因因此一定是的倍数,,且这个个倍数就就是,,性质2::对于有限限总体的的方差定定义:性质2::对于简单单随机抽抽样,的的方方差式中:为为抽抽样比,,为有限总总体校正正系数。。证明性质2((对称论证证法)::中的求和和是对项项的,,中的求和和是对项项的每个特定定单位被被选入样样本的概概率:=P(i)=故其定义义为:*不放回抽抽样*每个样本本被抽中中的概率率为*每个单位位被选入入样本的的概率利用无限限总体理理论Mean=随机变量量证明性质2简单随机机抽样下下,简单单估计量量估计精度度影响因因素:估计量的的方差是是衡衡量估计计量精度度的度量量。影响响估计量量方差的的因素主要是样样本量n,总体大小小N和总体方方差。通常N很大,当当f<0..05时,可将将近近似似取为1。总体方差差是我们们无法改改变的;因此,在在简单随随机抽样样的条件件下,只只有通过过加大样样本量来来提高估估计量的的精度。。性质3::的样本无无偏估计计为:证明:大样本下下,抽样样调查估估计量渐渐进正态态【例2.3】我们从某某个=100的的总体中中抽出一一个大小小为=10的简简单随机机样本,,要估计计总体平平均水平平并给出出置信度度为95%的区区间估计计。序号1234567891045204661508由置信度度95%%对应的的,,因此,,可以以以95%%的把握握说总体体平均水水平大约约在之间,即即2.4295和7..5705之间间。有放回简简单随机机抽样二、对总总体总量量的估计计【例2.4】续例2.3。。估计总总体总量量,并给给出在置置信度95%的的条件下下,估计计的极限限相对误误差。在置信度度95%%下,的的极限相相对误差差为:三、对总总体比例例的估计计某一类特特征的单单元占总总体单元元数中的的比例P.将总体单单元按是是否具有有这种特特征划分分为两类类,设总总体中有有个单元元具有A这个特征征,如果果对每个个单元都都定义指指标值总体方差差:估计量
性质5::对于简单单随机抽抽样,是是P的无偏估估计。的的方方差为::证明【例2.5】某超市新新开张一一段时间间之后,,为改进进销售服服务环境境,欲调调查附近近几个小小区居民民到该超超市购物物的满意意度,该该超市与与附近几几个小区区的居委委会取得得联系,,在总体体中按简简单随机机抽样抽抽取了一一个大小小为=200人人的样本本,调查查发现对对该超市市购物环环境表示示满意或或基本满满意的居居民有130位位,要估估计对该该超市购购物环境境持肯定定态度居居民的比比例,并并在置信信度95%下,,给出估估计的近近似置信信区间、、极限绝绝对误差差。假定定这时的的抽样比比可以忽忽略。95%近近似置信信区间为为〔58.37%,,71..63%%〕2.3样样本本量的确确定费用总费用固固定定费用可可变变费用设计费分析费办公费管理费场租费等访问员费费交通费礼品费电话费等STEPS所需要的的精度找出样本本量与精精度之间间的关系系估计所需需的数值值,求解解n如超出预预算,调调整精度度值重新新计算精度marginoferror对精度的的要求通通常以允允许最大大绝对误误差(绝绝对误差差限)或或允许最最大相对对误差((相相对误差差限)来来表示。。样本量足足够大时时,可用用正态分分布近似似变异系数数SampleSizen0为重复抽抽样条件件下的样样本量当N很大时,,0,nn0,wr与wor几乎没有有区别。。总体参数数为P的情形f<0..05总体方差差的估计计根据预调调查数据据或以前前文献资资料根据数据据的分布布粗略估估算S,例如全距距/4,全距/6对于比例例估计,,如果P在0.5附近(00.2--0.88),可根据据PQ在P=0..5时达到极极大值来来对样本本量进行行计算.如果时间间允许,,且总体体在时间间上变化化不快,,调查可可以分为为两步,,首先确确定一个个可以承承受的样样本量,,调查后后对估计计精度进进行计算算,如果果精度达达到要求求,则不不再进行行下一步步,否则则,计算算为达到到精度要要求所需需的样本本量,再再调查补补充样本本通过定性性分析,最好是对对总体变变异系数数进行分分析并估估计,因因为变异异系数通通常变化化不大..样本量设设计中的的误区1.估计精度度越高越越好吗??简单随机机抽样估估计比例例P的样本量量与误差差(当P=0..5时)样本量误误差差d500..141000..105000..04510000..032100000.0098对精度要要求的判判断十分分重要。。为得到到最小误误差而选选择最大样本量量不是好好的选择择。2.样本量与与总体规规模N有关吗??按照总总体比例例确定样样本量合合适吗??例:简单单随机抽抽样估计计P,置信度度95%,允许误误差5%,在P=0..5条件下总体规模模(N)所所需样样本量((n)5044100805002221000286500037010000385100000398100000040010000000400
抽样调查查中的样样本量由此可知知,在精精度要求求相同条条件下,,在北京市进行行一项调调查和在在全国进进行一项项调查,,样本量的差差别并不不大。总体规模模越大,,进行抽抽样调查查的效率率越高。。若分类、、分区、、分层分分别进行行估计,,如何处处理?对于多项项目,如如何处理理?其他影响响因素1.所研究问问题目标标量的个个数2.调查表的的回收率率例如回收收率估计计为80%,则应接接触的样样本量为为计算出出所需样样本量的的1.25倍;3.非抽样误误差4.资源限制制5.有效样本本etc定义:简简单随机机抽样的的样本估估计量的的方差与与复杂抽抽样的样样本估计量的的方差的的比率。。
DeffVar())为为复杂样样本估计计量的方方差。2.4设计效果果(Designeffect,Deff)设计效应应基什(L.Kish)提出比较不同同抽样方方法的效效率.
不放回简简单随机机抽样简简单估计计量的方方差某个抽样样设计在在同样样样本量条条件下估估计量的的方差。。Deff的作用::(1)评价抽抽样设计计的一个个依据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023年鹤壁辅警招聘考试真题及一套答案详解
- 2023年鄂州辅警协警招聘考试备考题库及答案详解(夺冠系列)
- 2023年黑河辅警招聘考试题库附答案详解(预热题)
- 2024年东莞辅警协警招聘考试真题含答案详解(模拟题)
- 2023年陇南辅警协警招聘考试真题及一套答案详解
- 2023年甘孜藏族自治州辅警招聘考试题库及答案详解(夺冠)
- 2024年屏东县辅警招聘考试真题及答案详解(必刷)
- 2023年黑河辅警协警招聘考试真题含答案详解(突破训练)
- 2023年芜湖辅警协警招聘考试备考题库含答案详解(巩固)
- 2024年南宁辅警协警招聘考试真题含答案详解(精练)
- 2024普通高中物理课程标准解读
- 铁路桥隧工高级理论知识模拟题库与答案
- 污水处理厂安全生产培训课件
- 医院反恐风险评估报告
- 阿基米德三角形的性质
- 小学生预防流感
- 数字化时代的酒店员工培训:技能升级
- 自适应智能控制
- 三年级上册语文阅读《稻草人》-(燕子)
- 22第五章2墨刀原型工具-基本操作流程
- 初三满分作文600字
评论
0/150
提交评论