抽样样本量的确定ppt课件_第1页
抽样样本量的确定ppt课件_第2页
抽样样本量的确定ppt课件_第3页
抽样样本量的确定ppt课件_第4页
抽样样本量的确定ppt课件_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、样本量的确定、1、本文的主要内容是如何校正简单随机抽样的样本量、如何在分层采样中实现每层的样本单位的分配、2、样本容量的确定、样本量=费用精度(函数)、样本容量的确定,以及处理预期的精度和现有费用必须考虑资源和时间等制约条件,3、分层分配样本的标准、总样本容量预先决定估计值求出的精度,4、调查影响样本容量的因素、求出估计值的精度,调查估计值可允许的误差。 估计量的采样方差越小、估计量准确的估计值的精度越高,需要的样本容量越大,影响精度的要素也同样影响样本容量大小的研究指标整体的变异程度的大小的采样设定校正和使用的估计量无回答率,在6,1某个精度水平上的样本容量的确定, 样本容量的大小与调查估计

2、所要求的精度密切相关,数据不是由人口普查而是由采样收集并产生抽样误差。 精度是根据取样方差测定的。 随着样本容量的增加,调查推定值的精度也在提高。7、标准误差误差极限离散系数、采样方差的若干校正预测方法,以及抽样调查中的样本容量确定,通常也使用此类校正预测方法中的一个或多个描述精度。8、非抽样误差、非抽样误差对调查估计的精度有显着影响,但抽样误差大小与采样容量大小无大关系,无需将这些个误差作为影响因素来考虑,为了确保调查结果的精准性,对于具有至少应最小化的正态概率分布的估计量, 95%的置信区间指的是,在以相同条件进行了100次重复采样的100个样本中,由95个样本的估计量决定的区间包含整体真

3、实值,该区间以样本估计量为中心,半径是1.96倍的标准误差。置信区间、10、2误差极限、误差极限或标准误差的乘法标准误差或估计量取样方差的平方根乘法因子取决于调查估计中要达到的置信水平(或信任度),11、对于估计t,如果给出其标准误差t,则置信区间的公式可以是(t-ztzz ) 可以表示为z是与某信任等级对应的标准正态分布的分位点值这个z值可以从标准正态分布表中查询,并且这种统一校正表附加到许多数学校正教材中,12、常用的z值是90%的信任度,对应的z值是95%的信任度,对应的z值是1.常用的95%可靠性,5%的误差极限,是否我们的调查目标要求更高(或更低)的精确度,如果调查结果用于做出有重要

4、意义的或具有更大风险的决策,那么估计可能要求更高的精确度。 只要想得到正在研究的总体的某个特征的感性认识,就可以以稍低的精度满足要求,14,接受多少采样分散,需要估计调查的子总体(或称为结构域),调查结果中需要包含细分化的数据这些个中的数据称为子总体估计(或结构域估计)。在数据满足调查要求时,与调查估计相关联的适当精度的样本方差是多少? 15、对精度的要求可能因子整体而异。 例如,在全国性的抽样调查中,对于国家级的数据,调查组织者可能需要3%的误差界限。 然而,对于省级估计,在10%的误差极限内,在5%的误差极限可满足要求的省级以下的估计值一盏茶。16、在这种情况下,通常按每个研究结构域进行阶

5、层化,分别修正各层的样本容量,使各研究结构域的所有层的样本容量相脚丫子,调查需要的总样本容量,17、关于调查推定值的样本方差,为了达到调查结果的要求精度,假定我们进行了比例推定。 这里,一部分指标的比例可以为P=50%以上,但其他的指标的比例也可以低。 例如,对于P=5%或P=10%,p可以是从P=0到P=1.0的任意值。 在确定调查估计所需的精度时,应当考虑在某个预定精度达到时获得的最小估计。 在最小估计是P=5%时,误差极限应小于5%。 例如,某公司在公司所在地区中,如果至少有P=4%的人对某产品有需求,则该公司决定生产该产品。 因此,该公司的市场调查部为了估算这种产品的消费需要,计划调查

6、当地居民。 P=4%5%左右的调查估计并不太合适,应当规定更小的误差界限,例如0.01以下、0.02以下等,此时置信区间应当是(0.05 0.01 )或者(0.05.02 )。 19、Table 1样本容量和P=0.5时使用简单随机抽样来估计p值的误差极限,20、最佳解决方案是,不应该选择最大可能的样本来追求最小误差极限,而是可以接受大的误差极限,并在有效地利用现有资源的基础上, 修改其他因素(例如,拒绝访问者的减少、实施小规模导频调查、训练造访者等)会影响调查结果的准确性,而不是降低调查结果的准确性,从而获得相对高的估计结果,可能会更为高效,在整个21,4项调查中, 我们研究的项目和指标,虽

7、然不能控制由个人、住户、企业得到的估计结果这样的偏差,但是其大小会影响某个精度水平上的研究项目工程所需的样本容量。 22、假设有第一次调查,以估计对某企业提供的服务感到满意的顾客的比例。 对于“顾客满意”指标,设置两个可能的值:满脚丫子或不满。 23、表2显示了满脚丫子和不满顾客可能所占比例的组合,24、难以准确测定整体中具有或不太出现的特征。 为这些变量提供准确的估计需要大样本容量。 当研究的特点具有最大的变异度时,调查所需的样本容量也最大。 对于仅具有两个值的特征,当两个这些个值以5050的百分比整体出现时,特征变化最大。、整体变异程度、25,如果讨论的特征的真实变异程度大于在确定样本容量

8、时我们估计的变异程度,则估计值的调查精度低于期望的精度。 相反,如果研究的特征的真实变异程度比我们估计的变异程度小,则在抽样调查获得的估计比调查目标要求的估计更精确。 26、确保达到调查要求的精度,通过保守估计某个特征的整体变异程度的调查,如果不知道测量特征变异程度的数据,则假设研究特征具有最大的变异程度,对于只能取两个的变量,则整体将其变异程度设定为取两个的值5050等分、必要的样本容量、27、修正多个测量指标、抽样调查时,测量指标(或项目、特征)通常有多个,有时每个数量大的指标,其变异程度不同,对于某些指标来说,是一盏茶较大的样本, 对于变异程度较大的指标来说,为了确保样本容量,一盏茶可能

9、较小,28,5 .整体的大小,整体所发挥的作用因其规模而异,小规模整体的大小对中规模整体起着重要的作用,其作用中重要的整体规模对样本容量的确定不起作用。 在确定样本容量的过程中,29、表3:表示在不同规模的整体为P=0.5时,容易使用,且误差界限为0.05,信任度为95%的基准,估计p所需的样本容量30,对于小规模整体,通常需要调查大比例的样本,得到所希望的精度。 因此,在实际的操作中,对小规模整体多采用调查而不是抽样调查。 31、在纠正样本容量时,通常假定采用的抽样方案是简单随机抽样(SRS )。 因此,假定样本容量的修正公式为简单随机抽样。 另外,由六个样本的设置校正和估计量、分层采样获得

10、的估计通常比相同规模的简单随机抽样更准确,或者至少同样准确。 整个组采样获得的估计通常假定简单随机抽样的估计精度、32、设置校正效果因子、和通常样本容量的校正公式是简单随机抽样SRS,但是在使用更复杂的抽样方案的情况下,其乘以实现预定精度所需的样本容量。 设定修正效果=对于相同规模的样本容量,规定的样本设定修正下的估计量的采样分散相对于简单随机抽样估计量的采样分散的比率。 对于简单的随机抽样设定修正,设定修正效果=1层次采样设定修正,对于设定修正效果1组全体的采样设定修正,设定修正效果1、33、7回答率,所有的调查由于某种原因,得不到提取的样本单位的信息时完全无回答(或者单位无回答) 以通过问

11、题单获得的有效问题单的预期样本容量的百分比来表示的完全无损回答,其减少有效样本数、增加抽样误差并降低估计准确性,例如,如果在34个初始样本容量为400的情况下,则被称为“否”的对 对于上面的方法估计的回答效率为75%的情况,所选样本容量通常应该根据期望的回答效率来调整样本容量35,使用不对最简单示例作出回答的简单随机样本大小的校正公式、简单随机抽样来确定所需样本容量。 36、不返回简单随机抽样时总体平均估计量的标准误差公式。 这里,设s是总体的标准离差,37,误差极限为e,则:n,得到:其中z是与某一置信水平的标准正态分布对应的分位点的值。38、其中,整体方差S2最不容易得到,通常需要根据过去

12、对类似整体进行的研究进行近似修正。 为了确定n,需要知道与期望的误差界限e可靠水平对应的标准正态分布的分位点值z整体规模n整体分散S2,39,求出比例样本容量的确定,并使用一例说明推定比例问题时的样本容量的确定过程。 在本例中,所需的精度根据误差极限来确定,并且所讨论的指标取p和1p两个值。 这是因为,对于大的总体,当估计量服从正态概率分布时,p的总体方差为: 40,总体的真值是已知的,通过将其直接代入上式得到样本容量,总体的真值是未知的,如果也不能利用以往的信息,则P=0.5时能够利用。 关于补正比例推定样本容量的详细顺序,首先补正初始样本容量,然后根据整体的大小、设定补正效果和回答率分别进

13、行调整,最后求出最终的样本容量。 42、步骤1 :算出初始样本容量,式(1)留心使用有限综合校正因数n/N修正综合规模。 忽略该因子,初始样本容量n-1可以由以下公式校正: e和p不按比例表示,当用百分比表示时,n-1的校正公式也同样成立。 步骤43,步骤2 :用下面的公式调整整体尺寸,步骤44,步骤3 :用设定修正效果调整样本容量,如果样本设定修正不是简单的随机抽样,可以用下面的公式调整样本容量,45,没有回答再次进行调整,决定最终的样本容量n。 其中r=估计回答率。 步骤#4:以无回答调整样本容量、46、样本容量决定的例子、样本容量的订正计算过程为例进行说明。 例1 .一家杂志出版社要求对

14、该杂志的读者综合充满度进行估价。 邮寄调查允许出版商联系所有500名用户。 但是,由于时间的限制,出版社决定使用简单的随机抽样进行电话调查。 我应该拜访多少读者? 47、如果实际总比率在总比率样本估计值的0.10范围内,出版社将满意脚丫子。 换句话说,误差极限e是0.10。 出版社希望调查估计的信任度为95%,这意味着在20个样本中只有一次,而由所获得的样本估计确定的置信区间中不包含整体的真值p,Z=1.96。 使用简单的随机抽样SRS。 回答率估计为65%,即r=0.65。 由于没有与顾客满意速度的真实比例p有关的可用信息,所以假设方差最大,即P=0.5。 假设,48,样本容量校正和第一步:

15、校正初始样本容量n-1,由于P(1-P )的值随着p趋向0.50而达到最大值,如果选择P=0.5,则留心得到最保守的n-1估计。49、步骤2 :调整初始样本容量,也考虑影响整体大小这一样本容量决定的因素。 (另外,虽然该步骤仅能够应用于整个小规模及整个中规模)、步骤50、步骤#3:根据采样设计的效果调整样本容量,但是在该例子中,假设简单的随机抽样设计,因此B=1。第51、第4步骤:根据无回答状况进行调整,确定最终的样本容量n、52、例2。 现在计划实施民意调查,决定赞成建设公园的居民比例。 全体由两个城市和住在一个农村地区的18岁以上的居民组成。 每个城市和农村提取一个简单的随机样本,可以得到分层的随机样本。询问各层需要的样本容量吗? 53、整体单位数657,500整体在各层的分布情况如下:必要的样本容量取决于调查对象数据的具体要求,可以考虑以下两个方案。 54、方案1、各层的推定值的精度,如果整个地区的推定值达到95%的信任度,5%的误差界限,则认为推定值是一盏茶可靠的。 因为没有全部地区

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论