抽样调查-2简单随机抽样ppt课件_第1页
抽样调查-2简单随机抽样ppt课件_第2页
抽样调查-2简单随机抽样ppt课件_第3页
抽样调查-2简单随机抽样ppt课件_第4页
抽样调查-2简单随机抽样ppt课件_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Chap 2 简单随机抽样2.2 简单估计法SE 2.1 定义与符号抽样调查 2.5 样本量确实定 2.6 其它相关问题 2.3 比率估计量 2.4 回归估计量.2.1 定义与符号一、定义与符号 一定义上述抽样就称为不放回简单随机抽样 定义2.1:设有限总体共有N个单元,一次整批抽取 n个单元 使得每个单元被抽中的概率都相等,任何 n个不同单元的组合样本都有一样的概率被抽中,这种抽样方法称为简单随机抽样法,所抽到的样本为简单随机样本。 . 定义2.2:在详细实施过程中,从总体中逐个等概率抽取单元每次抽取到尚未入样的任何一个单元的概率都相等,直到抽满 n个为止。假设每次抽中一个单元,然后放回总体

2、,重新抽取。这样一个单元有能够被反复抽中,故又称反复抽样。. 定义2.3 按照从总体的N个单元中抽取n个单元的一切能够不同的组合构造一切能够的 CNn 个样本,从CNn 个样本随机抽取一个样本,使每个样本被抽中的概率都等于 1/CNn.上述三中定义其实是完全等价的,而定义2.2在实践中容易实施 。.例2.1 设总体有5个单元1,2,3,4,5,按有放回简单随机抽样的方式抽取容量为2的样本,那么一切能够样本为个,如表2.1。 表2.1 放回简单随机抽样一切能够样本1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25

3、,35,45,5.例2.2 上述总体按不放回简单随机抽样方式抽取容量为2的样本,那么一切能够样本为个,如表2.2。1,21,31,41,52,32,42,53,43,54,5表2.2 不放回简单随机抽样一切能够样本.二样本分布与符号从总体抽样单元。假设顺序被抽中的样本单元的号码为入样号码,那么样本为,称为抽样比Sampling fraction。中逐个不放回抽取n个作为随机变量样本有什么分布呢?.1 y1,yn同分布但不相互独立,其共同分布列为 2 ( yi, yj)的结合分布列均同(y1, y2 ).表2.3符号总体参数样本统计量.二、抽样方法一抽签法 制造N个外形一样的签,将它们充分混合,

4、然后一次抽取n个签,或一次抽取一个但不放回,抽取n次得到n个签。那么这n个签上所对应号码表示入样的单元号。例如:某中学为了解学生身体素质的根本情况,从全校N1200人中抽取一个简单样本n100人进展检查。.1 随机数表二随机数法如上例,N1200,那么在表中随机延续取四列,顺序往下,选出前面100个不同不放回抽样的00011200之间的数字。假设不够100个,可随机再取四列,同样操作,直至抽取100个止。 .Simple random sampling.Table of random numbers.2 随机数骰子 随机数骰子是由均匀材质制成的正20面体,每个面上刻有一个09的数字,且每个数字

5、只出如今两个面上。要产生一个m位数的随机数如m4,N1200,那么将mm=4个颜色不同的骰子盒中,并规定每个颜色代表的位数,盖上盖子,充分摇动盒子后,翻开读出各色骰子的数字,即可得一个随机数。反复上述过程,直至产生了n个满足条件的随机数。.3 利用统计软件直接抽取法 大部分统计软件都有产生随机数的功能,快捷方便。不过产生的是伪随机数,有一定循环周期的。简单引见一下利用EXCEL产生随机数的方法. .2.2 简单估计法SE一、总体均值的估计一简单估计定义 .(2.6) 二简单估计量的性质 引理2.1 从大小为N的总体中抽取一个样本容量为n的简单随机样本,那么总体中每个特定的单元入样的概率为n/N

6、,两个特定单元入样的概率为nn1/NN-1。 . 引理2.2从大小为N的总体中抽取一个样本容量为n的简单随机样本。假设令: 那么:.二简单估计量的性质 定理2.1上述简单估计是无偏的,即 定理2.2 上述简单估计的方差均方误差为:.(2.12/2.18) .证明P35证法1对称证法: 为0留意样本分布.推论2.7的无偏估计为.(2.25) 证明:只须阐明样本方差是总体方差的无偏估计即可。 留意. 例2.3 从某个N100的总体重抽取一个容量n=10的简单随机样本,要估计总体平均程度,并给出置信度为95的置信区间估计。如表2.4序号1 2 3 4 5 6 7 8 9 104 5 2 0 4 6

7、6 15 0 8表2.4 简单随机样本目的 .三有放回简单随机抽样的简单估计量由于故有放回抽样的精度低于不放回抽样的精度。.阐明:1 抽样调查中的估计量与传统数理统计中估计量的区别见表2.5表2.5 抽样实际与传统数理统计关于样本均值性质异同比较抽样理论数理统计理论假设样本之间不独立,所以可能样本最多 个,欲估计总体特征为 ,当nN时可以求出样本之间独立,所有可能样本最多为无限多个;欲估计总体特征为总体(一般是随机变量X)期望,一般不能通过样本求出 符号、定义期望方差.2 总体方差普通也是未知的,故计算估计量方差估计值时总是用样本方差直接去估计它,由于该估计无偏,故这样做相对是合理的。 3 对

8、于无限总体的简单随机抽样或有限总体有放回简单抽样估计中由于N普通很大, 即从有限总体抽样得到简单随机样本均值得方差是从无限总体抽样得的独立样本均值的方差的1f 倍,要小些,这意味着对同等样本量,不放回简单随机抽样的精度高于有放回的。 由于样本点不会反复,样本量一样时所包含的有效样本点更多,因此信息更多,效果当然好些。 1f又被称为有限总体校正系数。. 4样本容量n越大,估计量方差越小。当样本容量一定时,总体方差越大,估计量方差越大。由于总体方差是固定的,因此在简单随机抽样的条件下,要提高估计量精度就只需添加样本容量了。但添加样本容量也会带来计算量骤增和本钱添加,所以是矛盾的一对,需求找到适宜的

9、平衡点。.二、总体总量的估计一简单估计量.(2.7) 二估计量性质 推论2.1 2.4 2.8 .(2.13) .(2.19) .(2.26) .例2.4续例2.3估计总体总量,并给出置信度为95条件下的估计相对误差 。三、总体比例的估计 将总体分为两类,一类具有该特征的单元A个,另一类不具有该特征的单元NA个 。调查的目的是估计或A 假设令那么.一估计量的定义 二估计量性质 推论2.2 2.5 2.9 对于简单随机抽样,p是P无偏估计。 p的方差为 方差的无偏估计 (2.27) 2.20.例2.5某超市开张一段时间后,为改良销售效力环境,欲调查附近几个小区居民到该超市购物的称心度。该超市与附

10、近一个小区的居委会获得联络,在总体中按简单随机抽样抽取了一个大小为n=200人的样本。调查发现对购物表示称心或根本称心的居民有130人,估计对该超市购物环境持一定态度的居民的比例,并在置信度95%条件下,给出估计的绝对误差和置信区间,假设抽样比可以忽略。.2样本协方差是总体协方差的无偏估计. 2.22,2.23 2.29 思索二维总体.证明:仍采用对称法P40证法11留意样本分布留意为0. 1证法2: 构造性展开.2留意由1.一、概念与作用 一概念 比率Ratio与比例Proportion区别 二作用2.3 比率估计量及其性质一种场所是待估的总体参数R是两个变量比值。如人口密度,恩格尔系数等。

11、 分子分母均为r.v.分子为r.v.另一种运用场所,虽然待估的参数是某个研讨变量的均值或总体总量,它本来可以经过样本均值加以估计,但是为了提高估计的效率,它经过引进一个辅助变量xi ,来计算比率,即 再经过这一比率乘以总体知的辅助变量均值或总量来到达估计的目的。 .二、运用条件 1辅助变量auxiliary variable资料易得或知 2辅助变量与目的变量之间存在高度相关性且相关 性稳定。 3样本量普通要求比较大三、简单随机抽样下的比率估计.一定义 比率估计量ratio estimator又称比估计。 2.30 2.31 .二比率估计的性质引理2.3定理2.6推论2.11.引理2.4证:当n

12、充分大时 .定理2.7推论2.12.因此方差估计有两种思绪(2.39)(2.40).例2.6i123456均值XiYi011331151882910464.518表4.1 假设的总体数据.解:i样本简单估计比率估计123456789101112131415均值1,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.518181817.116.87521.1515.7515.751620.045516.312516.363619.730816.26921

13、9.218.7517.68644.解.例2.7P51例2.4 在二十世纪90年代初的一项工资研讨中,人们发现IT行业中,从业者的现薪与起薪之间相关系数高达0.88,知某IT企业474名员工的评鉴起薪为17 016.00元/年,现根据对100个按简单随机抽样方式选出的员工现薪的调查结果,估计该企业员工的现薪平均程度。数据如下:, , .解:简单估计 95的置信区间 比率估计 95的置信区间 .例2.8某县在对船舶月完成的货运量进展调查,对运管部门登记的船舶台帐进展整理后获得注册船舶2 860艘,载重吨位154 626 吨。从2 860艘船舶中抽取一个n10的简单随机样本。调查得到样本船舶月完成的

14、货运量及其载重吨位如表4.2单位:吨要估计该县船舶月完成货运量 1234578015001005376600100505010206789102170182314501581370120150802050表4.2样本船舶货运量及载重吨位数据 . 解. 三消除比率估计偏倚的方法. 哈特利-罗斯Hartley-Ross,1954提出的估计量 (2.51) 于是可以令.现实上: .例2.9 .四、比率估计的效率1/2.2.4 回归估计量及其性质比率估计成为最优线性估计的条件:1样本点yi,xi构成过原点的直线2yi对直线的偏向与xi成比例.一、回归估计的定义二、是知常数时记为0 定理2.8 .Q:“

15、0取何值时,回归估计量的精度最高,即最 小?定理2.9:三、由样本回归系数计算得到 2.56 Y对X回归系数 定理2.10 这时的均值估计量是渐近无偏估计 留意b并不是B的无偏估计.定理2.11 它的一个近似估计为: .例2.10 续例2.8.四、精度比较1回归估计总优于简单估计,除非=0 2比率估计优于简单估计的条件 3回归估计优于比率估计的条件是 五、多变量回归估计略 .2.5 样本量确实定一、总体均值情形1 给定规范误差上限,求满足条件的最小n . 2 给定绝对误差上限及信度,求满足条件的最小n有放回,不放回 3 给定相对误差上限及信度,求满足条件的最小n有放回不放回 .给定相对规范误差

16、上限 ,求满足条件 的最小n.放回不放回例2.6 在例2.3中,假设要求以95%的把握保证相对误差不超越10%,样本量应该取多少? .二、总体总量情形 作业 思索各种情行的公式例 欲估计一个乡村的每月平均副业收入,知该村共有1000户农户,月副业收入的规范差不超越300元。1现要求置信度为95%,估计每户月副业收入的误 差不超越50元,应抽取多少户作为样本?2假设每户调查费用为15元,调查管理费用为800元, 该项调查估计费用是多少?.例 假设上例目的是要估计全村1000户一月的副业总收入,允许总量的误差为40000,置信度为95%,应抽取多少样本? 三、总体参数P的情形四、总体参数的预先估计

17、.1根据以往的阅历数据 例如对同类问题获得过一个样本量n0为的简单随机样本,并且知在一定置信度下比如95%,该调查对总体均值或总量估计的相对误差上限为r0,那么在一样的置信度下,假设希望本次调查的相对误差上限为r,那么在抽样比可以忽略的情况下,可以近似地计算出本次调查所需的样本量: 作业 证明上述结论.2在正式调查前进展试点调查,根据试点调查的 结果作出估计,或者采用两步抽样 3没有同类调查阅历,又不能进展预调查, 那么只能经过有阅历的专家作一些定性分析, 对总体变异系数C比较稳定作出估计。 4留意:针对总体参数为 时情形 当估计P0.5,那么选取较小的P,如假设估计P为0.6,0.8那么选取P为0.6 假设对P一无所知那么取P=0.5。.例2.7 某销售公司希望了解全部3000家客户对公司的称心度,决议用调查一个简单随机样本。这时销售公司希望以95的把握保证客户称心度比例P在样本比例p10,p+10范围内,但对总体比例P无法给出一个大致范围。这时调查多少个客户,才干保证满足要求?.2.6 其它相关问题一、逆抽样比例P是稀有事件的比例,普通P0.2 事先给定一个正整数m,然后逐个随机抽取样本,n个单元。 直到抽到m个所思索特征的单元为止,设共取了. 现实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论