统计抽样培训课件_第1页
统计抽样培训课件_第2页
统计抽样培训课件_第3页
统计抽样培训课件_第4页
统计抽样培训课件_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计抽样主要研究什么内容,解决什么问题?抽样方法主要有哪几种方法?如何确定样本容量?1/52统计抽样主要研究什么内容,解决什么问题?1/527.1统计抽样基本概念总体由研究对象的全体所组成。样本是总体中的部分元素所组成的集合。目标总体是我们要推断的总体抽样总体是实际抽取样本的总体27.1统计抽样基本概念2 在抽样之前,应将总体划分为抽样单位。抽样单位既可以是一个简单的个体,也可以是一组个体。 对某一个特殊研究,抽样单位的名册称为抽样框。7.1统计抽样基本概念3 在抽样之前,应将总体划分为抽样单位。抽样单位既可以是一个调查方法邮寄调查电话调查个人采访调查7.2抽样调查种类和抽样方法4调邮寄调查电话调查个人采访调查7.2抽样调查种类和抽样方调查误差非抽样误差抽样误差由于没有对总体的所有单位进行调查而产生的误差进行一次抽样调查可能出现的如测量误差、采访者误差及数据处理误差等。

7.3调查误差5调非抽样误差抽样误差由于没有对总体的所有单位进行调查而产 从一个容量为N的有限总体中抽取得到一个容量为n的简单随机样本,使每一个容量为n的可能样本,都有相同的概率被抽中。建立抽样框根据随机数表进行抽样抽样总体中所有个体的名册使用随机数表,可以保证抽样总体中的每个个体都有相同的概率被抽中

7.4简单随机抽样6 从一个容量为N的有限总体中抽取得到一个容量为n的简单随机总体均值总体比率样本容量的确定7.4简单随机抽样7总体均值7.4简单随机抽样7

如果选择大样本(n≥30),则中心极限定理可以保证的抽样分布近似服从正态概率分布,μ的区间估计为

式中,为均值的标准差。1-α称为置信度,为与之对应的临界值。例如,若置信度为95%,则。7.4.1总体均值8 7.4.1总体均值8 当从一个容量为N的有限总体中,抽取一个容量为n的简单随机样本时,均值的标准差的估计值为

此时总体均值的区间估计为 在抽样调查中,当构造置信区间时,通常取μ=2。因此,在使用简单随机样本时,总体均值的近似95%的置信区间的表达式为:7.4.1总体均值9 当从一个容量为N的有限总体中,抽取一个容量为n的简单随机[例7.1]《摄影》是一本推介摄影作品、报道摄影发展状况、介绍摄影器材的杂志,它目前拥有8000个订户。根据一个484个订户的简单随机样本,得出订户的年平均收入为30500元,标准差为7040元。因此,所有订户的年平均收入的无偏估计为元。 因此,这本杂志订户的年平均收入的近似95%的置信区间为 即(29880,31120)。7.4.1总体均值10[例7.1]《摄影》是一本推介摄影作品、报道摄影发展状况、介 上述过程也可用于对诸如总体总量或总体比率等其他总体参数的区间估计。对点估计的抽样分布近似服从正态概率分布的所有情形,其近似95%的置信区间为 例如,在《摄影》的抽样调查中,点估计量的标准误差的估计值为,允许误差为2×310元=620元。7.4.1总体均值117.4.1总体均值11

总体比率p是总体中具有某些感兴趣特征的个体的比重。[例7.2]在市场调查研究中,人们想了解喜欢某一品牌的消费者比重。样本比率是总体比率的无偏点估计。总体比率的标准差的估计值为 因此, 总体比率的近似95%的置信区间的表达式如下:

7.4.2总体比率12 总体比率p是总体中具有某些感兴趣特征的个体的比重。7.4. 例如,在大宇国际咨询公司的抽样调查中,大宇国际咨询公司也想估计在它服务范围内的500所学校中,使用天然气作为取暖燃料的学校比率。如果在抽出的50所学校中,有35所学校使用天然气作为取暖燃料,则总体500所学校中使用天然气比率的点估计值。比率的标准差的估计值为 因此, 总体比率的近似95%置信区间为 即(0.5758,0.8242)。7.4.2总体比率13 例如,在大宇国际咨询公司的抽样调查中,大宇国际咨询公司也想回忆前面提到的允许误差为“点估计的标准差估计值的2倍”,因此:均值的标准差的估计值:7.4.3样本容量的确定14回忆前面提到的允许误差为“点估计的标准差估计值两步抽样用试点调查或事先检验的结果估计s2

估计s2的方法根据以往的资料估计s2

由第一步抽取的部分单位,得到的s2的估计值,将此值代入上式,确定出全部样本容量n;然后对第一步确定的全部样本容量,再抽取第二步所需要的其余单位数。

7.4.3样本容量的确定15两步抽样用试点调查或事先估计s2的方法根据以往的资料估计s2[例7.3]某大学有5000名毕业生,我们想构造宽度在1000元之内的近似95%的置信区间。 对这样规定的置信区间,B=500。在确定n之前,需要估计。 假设根据去年所做的同样研究,得知s=3000元。我们可以用这个值来估计。根据B=500、s=3000及N=5000,则样本容量为7.4.3样本容量的确定16[例7.3]某大学有5000名毕业生,我们想构造宽度在100

在估计总体比率时,选择样本容量的公式,与估计总体均值的公式类似。我们只需要将估计总体均值的公式中替换为,即

使用上式时,我们必须规定允许误差B和给出的一个估计值。如果没有合适的估计值,我们可以使用代替,这样将保证近似置信区间的允许误差比希望的要小的多。7.4.3样本容量的确定17 在估计总体比率时,选择样本容量的公式,与估计总体均值的公将总体划分H组从第h层中抽取一个容量为nh的简单随机样本由这H个简单随机样本的联合资料,可得出诸如总体均值、总体总量及总体比率等各种总体参数的估计。

分层简单随机抽样的步骤:也称为层7.5分层简单随机抽样18将总体划分H组从第h层中抽取一个容量由这H个简单随机样本的联

如果各层内的差异比层间的差异小,则分层简单随机样本可得到更大的精度(总体参数的区间估计将更窄)。 各层的划分应依据样本设计者的判断。 总体可按部门、地区、年龄、产品类型、销售水平等分层。7.5分层简单随机抽样19 如果各层内的差异比层间的差异小,则分层简单随机样本可得到[例7.4]某大学管理学院想对今年的毕业生进行一次调查,以便了解他们开始工作时的年薪。7.5分层简单随机抽样20[例7.4]某大学管理学院想对今年的毕业生进行一次调查,以便 在分层抽样中,总体均值的无偏估计是各层样本均值的加权平均数,所用权数为总体在各层的比重。用

表示总体均值的点估计,其定义如下: 式中:H--层数;--第h层的样本均值; Nh--第h层的单位数;N--总体单位数; 对分层简单随机样本,计算平均值的标准差的估计公式为7.5.1总体均值21 在分层抽样中,总体均值的无偏估计是各层样本均值的加权平均某大学管理学院的180名毕业生的样本调查结果

7.5.1总体均值227.5.1总体均值22 各专业(层)的样本均值分别为:

因此,总体均值的点估计为7.5.1总体均值237.5.1总体均值23抽样调查中估计均值的标准差所需要的部分计算结果7.5.1总体均值247.5.1总体均值24 上表中 因此,总体的近似95%的置信区间为 即(29074,29626)。

7.5.1总体均值257.5.1总体均值25 对分层简单随机抽样,总体比率p的无偏估计是各层比率的加权平均数,所用权数为总体在各层的比重。总体比率的点估计定义如下: 式中:H--层数;--第h层的样本比率;Nh―第h层的单位数;N―总体单位数;7.5.2总体比率26 对分层简单随机抽样,总体比率p的无偏估计是各层比率的加权 的标准差的估计值为 总体比率的近似95%的置信区间的表达式为7.5.2总体比率277.5.2总体比率27

[例7.5]在某大学的调查中,大学想了解毕业生开始工作时的年薪不低于36000元的比率。180名毕业生的抽样调查结果显示,有20名毕业生开始工作时的年薪不低于36000元,其中会计专业4名,金融专业2名,信息系统专业7名,市场营销专业1名,经营管理专业6名。

7.5.2总体比率28 7.5.2总体比率28 根据总体比率的近似95%的置信区间的公式,开始工作时的年薪不低于36000元的比率的点估计为:

故毕业生开始时的年薪不低于36000元的比率近似95%置信区间为(0.0575,0.1387)7.5.2总体比率29 根据总体比率的近似95%的置信区间的公式,开始工作时的年

对分层简单随机抽样,我们可用两阶段过程来选择样本容量。

既然人们想估计各层的均值、总量及比率,这两种组合方法都经常使用。确定总样本容量n决定各层应分配的样本单位数决定每层应选择的样本单位数加总得到总样本容量

或者7.5.3样本容量的确定30 对分层简单随机抽样,我们可用两阶段过程来选择样本容量。

确定总样本容量n及其分配,可对所有要研究的总体参数提供必要的精度。

分配工作就是决定总样本被分配到各层的部分,这些部分将确定各层的简单随机样本的容量。

各层的单位数各层内的方差考虑的因素各层选择单位的费用

7.5.3样本容量的确定31 确定总样本容量n及其分配,可对所有要研究的总体参数提供必 一般地,单位数较多的层和方差较大的层应分配较多的样本数目。 相反地,对于给定的费用,为了获得更多的信息,则抽样单位成本较大的层应分配较少的样本数目。7.5.3样本容量的确定327.5.3样本容量的确定32整群抽样需要将总体各个个体分为N组(也称作群),使总体中每个个体只属于一群。总体组1组2个体4个体5个体1个体6个体2个体37.6整群抽样33整群抽样需要将总体各个个体分为N组(也称作群),使总体中例如,我们想调查某省的登记选民。则有两种方法:调查某省的登记选民。有两种方法:第一种方法是建立包含该省所有登记选民的抽样框,然后根据抽样框,选择选民的一个简单随机样本。第二种方法是整群抽样,我们选择用该省各县的清单作抽样框。在这个方法中,每个县(或群)包含一组登记选民,而该省的每个登记选民只属于一群。7.6整群抽样34例如,我们想调查某省的登记选民。则有两种方法:调查某省的分层抽样和整群抽样都将总体划分为组,因此这两种抽样过程感觉上是相似的。选择整群抽样与分层抽样的原因是不同的。当群内的个体存在差异时,整群抽样可提供较好的结果。理想情形是每一群是整个总体的一个缩影,这时,抽取很少的群就可以提供关于整个总体特征的信息。整群抽样与分层抽样的比较7.6整群抽样35分层抽样和整群抽样都将总体划分为组,因此这两种抽样过程感觉上整群抽样的优缺点

整群抽样的优点是实施方便、节省经费;整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。整群抽样与分层抽样的匹别

整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大36整群抽样的优缺点36[例7.6]某省拥有12000名执业注册会计师的注册会计师协会进行了一项调查。作为调查的一部分,注册会计师协会收集与收入、性别和与注册会计师生活方式有关的因素的信息。因为用个人采访法去搜集所需要的信息,因此注册会计师协会采用整群抽样,以使总的差旅费和采访费用达到最小。抽样框中包含所有在该省登记注册的执业会计师事务所。7.6整群抽样37[例7.6]7.6整群抽样37假设有1000群,即在该省登记注册的从事会计活动的会计师事务所有1000个,选择10个会计师事务所为一个简单随机样本。[例7.6](续)7.6整群抽样38假设有1000群,即在该省登记注册的从事会计活动的会计师为了介绍在整群抽样中,构造总体均值、总体总量和总体比率的近似95%置信区间需要的公式,我们使用如下的记号:N—总体的群数;n—样本中选出的群数;Mi—i群的单位数;M—总体单位数;M=M1+M2+…十MN;—每一群的平均单位数。Xi——第i群所有观察值的总量;ai——第i群具有某特征的观察值的数量;7.6整群抽样39为了介绍在整群抽样中,构造总体均值、总体总量和总体比对注册会计师协会的抽样调查,我们有如下资料:N=1000n=10M=12000

下表7-4为每个中选群的Mi和xi的值,以及中选事务所中女注册会计师的数量(ai)的资料。[例7.6](续)7.6整群抽样40对注册会计师协会的抽样调查,我们有如下资料:N=10007.6整群抽样417.6整群抽样41由整群抽样得到的总体均值的点估计的公式如下:(7-25)7.6.1总体均值42由整群抽样得到的总体均值的点估计的公式如下:(7-该点估计量的标准差的估计为:(7-26)总体均值的近似95%的置信区间为:7.6.1总体均值43该点估计量的标准差的估计为:(7-26)总体均值的根据表7-4的资料,我们可以得到执业注册会计师平均年薪的点估计为[例7.6](续)7.6.1总体均值44根据表7-4的资料,我们可以得到执业注册会计师平均年由于表7-4中的年薪资料是以千元计量的,因此,执业注册会计师的平均年薪的估计值为42531元。而:因此:[例7.6](续)7.6.1总体均值45由于表7-4中的年薪资料是以千元计量的,因此,执业注因此标准差为1.730。我们得到平均年薪的近似95%置信区间:即(39.071,45.991)。[例7.6](续)7.6.1总体均值46因此标准差为1.730。我们得到平均年薪的近似95%整群抽样的总体比率的点估计如下:(7-30)式中ai——第i群中具有某种感兴趣特征的个体的数量。7.6.2总体比率47整群抽样的总体比率的点估计如下:(7-30)式中ai该点估计量的标准误差的估计为:(7-31)总体比率的近似95%的置信区间(7-32)7.6.2总体比率48该点估计量的标准误差的估计为:(7-31)总体比率的近似9对注册会计师抽样调查,可以得到女性执业注册会计师的比率的估计为:[例7.6](续)7.6.2总体比率49对注册会计师抽样调查,可以得到女性执业注册会计师的比并且:因此:[例7.6](续)7.6.2总体比率50并且:因此:[例7.6](续)7.6.2总体比率50因此,女性执业注册会计师比率的近似95%置信区间为即(0.2052,0.3416)。[例7.6](续)7.6.2总体比率51因此,女性执业注册会计师比率的近似95%置信区间为先通过选择β(即允许误差)的值,规定可接受的精度水平建立满足所需要的精度的n值的计算公式每群平均个体的数量和群间方差是决定样本中包含群数多少的关键因素。如果各群相似,则群间方差小,因此中选群数就比较少。如果每群平均个体数量较大,则中选群数也会比较少。整群抽样的过程同其他抽样方法整体上是类似的7.6.3样本容量的确定52先通过选择β(即允许误差)的值,规定可接受的精度水平建立满足7.7系统抽样系统抽样法:又叫做等距抽样法或机械抽样法,即依据一定的抽样距离,从母体中抽取样本。

定义:要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法。

由于系统抽样法操作简便,实施起来不易出错,因而在生产现场人们乐于使用它。如在某道工序上定时去抽一件产品进行检验,就可以看做是系统抽样法的一个例子.

537.7系统抽样53系统抽样步骤:

①编号:先将总体的N个个体编号,有时可直接利用自身个体所带的号码,如学号、门牌号等。

②分段:确定分段间隔k,对编号进行分段,当N/n(n是样本容量)是整数时,取k=N/n。

③确定第一个个体编号:在第一段用简单随机抽样确定第一个个体编号l(l≤k)。

④成样:按照一定的规则抽取样本,通常是将l加上间隔k得到第二个个体编号(l+k),再加上k得到第三个个体编号(l+2k),依次进行下去,直到获取整个样本。54系统抽样步骤:54例如,需要从容量为5000的总体中抽取一个容量为50的样本,我们可以从总体中随机选择一个,然后在其后面的抽样框中,每隔100个个体选择一个,可得到样本中其余的个体。7.7系统抽样因为第一个个体的选择是随机的,因此系统样本常常假定具有简单随机样本的性质。当抽样框是由总体中的个体随机排列而形成时,这种假定通常是合适的。55例如,需要从容量为5000的总体中抽取一个容量为50分层抽样与系统抽样的区别:分层抽样是按比例抽样,系统抽样属于分组抽样(比较常见的等距抽样)(1)分层抽样是要先把所有元素按某种特征或标志(比如年龄、性别、职业或地域等)划分成几个类型或层次,在在其中采用前两种方法抽取一个子样本,所有子样本构成了总的样本。(2)系统抽样就是把总体的元素编号排序后,再计算出某种间隔,然后按一固定抽取元素来组成样本的方法。适合用于总体及样本规模都较大的情况。它与简单随机抽样一样都要有完整的抽样框。56分层抽样与系统抽样的区别:56演讲完毕,谢谢观看!演讲完毕,谢谢观看!统计抽样主要研究什么内容,解决什么问题?抽样方法主要有哪几种方法?如何确定样本容量?58/52统计抽样主要研究什么内容,解决什么问题?1/527.1统计抽样基本概念总体由研究对象的全体所组成。样本是总体中的部分元素所组成的集合。目标总体是我们要推断的总体抽样总体是实际抽取样本的总体597.1统计抽样基本概念2 在抽样之前,应将总体划分为抽样单位。抽样单位既可以是一个简单的个体,也可以是一组个体。 对某一个特殊研究,抽样单位的名册称为抽样框。7.1统计抽样基本概念60 在抽样之前,应将总体划分为抽样单位。抽样单位既可以是一个调查方法邮寄调查电话调查个人采访调查7.2抽样调查种类和抽样方法61调邮寄调查电话调查个人采访调查7.2抽样调查种类和抽样方调查误差非抽样误差抽样误差由于没有对总体的所有单位进行调查而产生的误差进行一次抽样调查可能出现的如测量误差、采访者误差及数据处理误差等。

7.3调查误差62调非抽样误差抽样误差由于没有对总体的所有单位进行调查而产 从一个容量为N的有限总体中抽取得到一个容量为n的简单随机样本,使每一个容量为n的可能样本,都有相同的概率被抽中。建立抽样框根据随机数表进行抽样抽样总体中所有个体的名册使用随机数表,可以保证抽样总体中的每个个体都有相同的概率被抽中

7.4简单随机抽样63 从一个容量为N的有限总体中抽取得到一个容量为n的简单随机总体均值总体比率样本容量的确定7.4简单随机抽样64总体均值7.4简单随机抽样7

如果选择大样本(n≥30),则中心极限定理可以保证的抽样分布近似服从正态概率分布,μ的区间估计为

式中,为均值的标准差。1-α称为置信度,为与之对应的临界值。例如,若置信度为95%,则。7.4.1总体均值65 7.4.1总体均值8 当从一个容量为N的有限总体中,抽取一个容量为n的简单随机样本时,均值的标准差的估计值为

此时总体均值的区间估计为 在抽样调查中,当构造置信区间时,通常取μ=2。因此,在使用简单随机样本时,总体均值的近似95%的置信区间的表达式为:7.4.1总体均值66 当从一个容量为N的有限总体中,抽取一个容量为n的简单随机[例7.1]《摄影》是一本推介摄影作品、报道摄影发展状况、介绍摄影器材的杂志,它目前拥有8000个订户。根据一个484个订户的简单随机样本,得出订户的年平均收入为30500元,标准差为7040元。因此,所有订户的年平均收入的无偏估计为元。 因此,这本杂志订户的年平均收入的近似95%的置信区间为 即(29880,31120)。7.4.1总体均值67[例7.1]《摄影》是一本推介摄影作品、报道摄影发展状况、介 上述过程也可用于对诸如总体总量或总体比率等其他总体参数的区间估计。对点估计的抽样分布近似服从正态概率分布的所有情形,其近似95%的置信区间为 例如,在《摄影》的抽样调查中,点估计量的标准误差的估计值为,允许误差为2×310元=620元。7.4.1总体均值687.4.1总体均值11

总体比率p是总体中具有某些感兴趣特征的个体的比重。[例7.2]在市场调查研究中,人们想了解喜欢某一品牌的消费者比重。样本比率是总体比率的无偏点估计。总体比率的标准差的估计值为 因此, 总体比率的近似95%的置信区间的表达式如下:

7.4.2总体比率69 总体比率p是总体中具有某些感兴趣特征的个体的比重。7.4. 例如,在大宇国际咨询公司的抽样调查中,大宇国际咨询公司也想估计在它服务范围内的500所学校中,使用天然气作为取暖燃料的学校比率。如果在抽出的50所学校中,有35所学校使用天然气作为取暖燃料,则总体500所学校中使用天然气比率的点估计值。比率的标准差的估计值为 因此, 总体比率的近似95%置信区间为 即(0.5758,0.8242)。7.4.2总体比率70 例如,在大宇国际咨询公司的抽样调查中,大宇国际咨询公司也想回忆前面提到的允许误差为“点估计的标准差估计值的2倍”,因此:均值的标准差的估计值:7.4.3样本容量的确定71回忆前面提到的允许误差为“点估计的标准差估计值两步抽样用试点调查或事先检验的结果估计s2

估计s2的方法根据以往的资料估计s2

由第一步抽取的部分单位,得到的s2的估计值,将此值代入上式,确定出全部样本容量n;然后对第一步确定的全部样本容量,再抽取第二步所需要的其余单位数。

7.4.3样本容量的确定72两步抽样用试点调查或事先估计s2的方法根据以往的资料估计s2[例7.3]某大学有5000名毕业生,我们想构造宽度在1000元之内的近似95%的置信区间。 对这样规定的置信区间,B=500。在确定n之前,需要估计。 假设根据去年所做的同样研究,得知s=3000元。我们可以用这个值来估计。根据B=500、s=3000及N=5000,则样本容量为7.4.3样本容量的确定73[例7.3]某大学有5000名毕业生,我们想构造宽度在100

在估计总体比率时,选择样本容量的公式,与估计总体均值的公式类似。我们只需要将估计总体均值的公式中替换为,即

使用上式时,我们必须规定允许误差B和给出的一个估计值。如果没有合适的估计值,我们可以使用代替,这样将保证近似置信区间的允许误差比希望的要小的多。7.4.3样本容量的确定74 在估计总体比率时,选择样本容量的公式,与估计总体均值的公将总体划分H组从第h层中抽取一个容量为nh的简单随机样本由这H个简单随机样本的联合资料,可得出诸如总体均值、总体总量及总体比率等各种总体参数的估计。

分层简单随机抽样的步骤:也称为层7.5分层简单随机抽样75将总体划分H组从第h层中抽取一个容量由这H个简单随机样本的联

如果各层内的差异比层间的差异小,则分层简单随机样本可得到更大的精度(总体参数的区间估计将更窄)。 各层的划分应依据样本设计者的判断。 总体可按部门、地区、年龄、产品类型、销售水平等分层。7.5分层简单随机抽样76 如果各层内的差异比层间的差异小,则分层简单随机样本可得到[例7.4]某大学管理学院想对今年的毕业生进行一次调查,以便了解他们开始工作时的年薪。7.5分层简单随机抽样77[例7.4]某大学管理学院想对今年的毕业生进行一次调查,以便 在分层抽样中,总体均值的无偏估计是各层样本均值的加权平均数,所用权数为总体在各层的比重。用

表示总体均值的点估计,其定义如下: 式中:H--层数;--第h层的样本均值; Nh--第h层的单位数;N--总体单位数; 对分层简单随机样本,计算平均值的标准差的估计公式为7.5.1总体均值78 在分层抽样中,总体均值的无偏估计是各层样本均值的加权平均某大学管理学院的180名毕业生的样本调查结果

7.5.1总体均值797.5.1总体均值22 各专业(层)的样本均值分别为:

因此,总体均值的点估计为7.5.1总体均值807.5.1总体均值23抽样调查中估计均值的标准差所需要的部分计算结果7.5.1总体均值817.5.1总体均值24 上表中 因此,总体的近似95%的置信区间为 即(29074,29626)。

7.5.1总体均值827.5.1总体均值25 对分层简单随机抽样,总体比率p的无偏估计是各层比率的加权平均数,所用权数为总体在各层的比重。总体比率的点估计定义如下: 式中:H--层数;--第h层的样本比率;Nh―第h层的单位数;N―总体单位数;7.5.2总体比率83 对分层简单随机抽样,总体比率p的无偏估计是各层比率的加权 的标准差的估计值为 总体比率的近似95%的置信区间的表达式为7.5.2总体比率847.5.2总体比率27

[例7.5]在某大学的调查中,大学想了解毕业生开始工作时的年薪不低于36000元的比率。180名毕业生的抽样调查结果显示,有20名毕业生开始工作时的年薪不低于36000元,其中会计专业4名,金融专业2名,信息系统专业7名,市场营销专业1名,经营管理专业6名。

7.5.2总体比率85 7.5.2总体比率28 根据总体比率的近似95%的置信区间的公式,开始工作时的年薪不低于36000元的比率的点估计为:

故毕业生开始时的年薪不低于36000元的比率近似95%置信区间为(0.0575,0.1387)7.5.2总体比率86 根据总体比率的近似95%的置信区间的公式,开始工作时的年

对分层简单随机抽样,我们可用两阶段过程来选择样本容量。

既然人们想估计各层的均值、总量及比率,这两种组合方法都经常使用。确定总样本容量n决定各层应分配的样本单位数决定每层应选择的样本单位数加总得到总样本容量

或者7.5.3样本容量的确定87 对分层简单随机抽样,我们可用两阶段过程来选择样本容量。

确定总样本容量n及其分配,可对所有要研究的总体参数提供必要的精度。

分配工作就是决定总样本被分配到各层的部分,这些部分将确定各层的简单随机样本的容量。

各层的单位数各层内的方差考虑的因素各层选择单位的费用

7.5.3样本容量的确定88 确定总样本容量n及其分配,可对所有要研究的总体参数提供必 一般地,单位数较多的层和方差较大的层应分配较多的样本数目。 相反地,对于给定的费用,为了获得更多的信息,则抽样单位成本较大的层应分配较少的样本数目。7.5.3样本容量的确定897.5.3样本容量的确定32整群抽样需要将总体各个个体分为N组(也称作群),使总体中每个个体只属于一群。总体组1组2个体4个体5个体1个体6个体2个体37.6整群抽样90整群抽样需要将总体各个个体分为N组(也称作群),使总体中例如,我们想调查某省的登记选民。则有两种方法:调查某省的登记选民。有两种方法:第一种方法是建立包含该省所有登记选民的抽样框,然后根据抽样框,选择选民的一个简单随机样本。第二种方法是整群抽样,我们选择用该省各县的清单作抽样框。在这个方法中,每个县(或群)包含一组登记选民,而该省的每个登记选民只属于一群。7.6整群抽样91例如,我们想调查某省的登记选民。则有两种方法:调查某省的分层抽样和整群抽样都将总体划分为组,因此这两种抽样过程感觉上是相似的。选择整群抽样与分层抽样的原因是不同的。当群内的个体存在差异时,整群抽样可提供较好的结果。理想情形是每一群是整个总体的一个缩影,这时,抽取很少的群就可以提供关于整个总体特征的信息。整群抽样与分层抽样的比较7.6整群抽样92分层抽样和整群抽样都将总体划分为组,因此这两种抽样过程感觉上整群抽样的优缺点

整群抽样的优点是实施方便、节省经费;整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。整群抽样与分层抽样的匹别

整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大93整群抽样的优缺点36[例7.6]某省拥有12000名执业注册会计师的注册会计师协会进行了一项调查。作为调查的一部分,注册会计师协会收集与收入、性别和与注册会计师生活方式有关的因素的信息。因为用个人采访法去搜集所需要的信息,因此注册会计师协会采用整群抽样,以使总的差旅费和采访费用达到最小。抽样框中包含所有在该省登记注册的执业会计师事务所。7.6整群抽样94[例7.6]7.6整群抽样37假设有1000群,即在该省登记注册的从事会计活动的会计师事务所有1000个,选择10个会计师事务所为一个简单随机样本。[例7.6](续)7.6整群抽样95假设有1000群,即在该省登记注册的从事会计活动的会计师为了介绍在整群抽样中,构造总体均值、总体总量和总体比率的近似95%置信区间需要的公式,我们使用如下的记号:N—总体的群数;n—样本中选出的群数;Mi—i群的单位数;M—总体单位数;M=M1+M2+…十MN;—每一群的平均单位数。Xi——第i群所有观察值的总量;ai——第i群具有某特征的观察值的数量;7.6整群抽样96为了介绍在整群抽样中,构造总体均值、总体总量和总体比对注册会计师协会的抽样调查,我们有如下资料:N=1000n=10M=12000

下表7-4为每个中选群的Mi和xi的值,以及中选事务所中女注册会计师的数量(ai)的资料。[例7.6](续)7.6整群抽样97对注册会计师协会的抽样调查,我们有如下资料:N=10007.6整群抽样987.6整群抽样41由整群抽样得到的总体均值的点估计的公式如下:(7-25)7.6.1总体均值99由整群抽样得到的总体均值的点估计的公式如下:(7-该点估计量的标准差的估计为:(7-26)总体均值的近似95%的置信区间为:7.6.1总体均值100该点估计量的标准差的估计为:(7-26)总体均值的根据表7-4的资料,我们可以得到执业注册会计师平均年薪的点估计为[例7.6](续)7.6.1总体均值101根据表7-4的资料,我们可以得到执业注册会计师平均年由于表7-4中的年薪资料是以千元计量的,因此,执业注册会计师的平均年薪的估计值为42531元。而:因此:[例7.6](续)7.6.1总体均值102由于表7-4中的年薪资料是以千元计量的,因此,执业注因此标准差为1.730。我们得到平均年薪的近似95%置信区间:即(39.071,45.991)。[例7.6](续)7.6.1总体均值103因此标准差为1.730。我们得到平均年薪的近似95%整群抽样的总体比率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论