




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
精选,1,3.4百分数的估计及其误差,简单随机抽样中,估计量的性质,(1),(2),(3),精选,2,抽样推断既然必须处理收集来的数据,因此数学知识是必不可少的。下面仅就抽样调查中一些最基本的常用数学知识和概念以直观简洁的方式做一些介绍。,盒子模型,一般抽样调查面临的总体只有有限多个初级单元。从总体中抽样,就相当于从一个盒子里摸取若干张票,盒子里的票数相当于有限总体的单元个数,票上记载着反映该单元特征的指标的值。设总体有N个单元,各指标值为则盒子如图3-4-1所示:,精选,3,如果我们只关心总体中具有某些特定类型的集合占整个总体的比例,那么只需稍加处理,引入01指标,总体比例的问题立刻转化为总体平均数的一个特例。,只要将盒子中的票子分为两类,我们感兴趣的一类全标上1,其余的都标上0。于是盒子可用图3-4-2表示:,则盒子中票子指标的平均数为:,待估参数,精选,4,此时,盒子的方差化为:,常采用的方差表示为:,正好是我们关心的那类个体占总体的比例。因此,凡对总体平均数有的结果,总体比例也有相应的结果。,精选,5,由于该参数恰为01盒子的平均数,在简单随机抽样理论中自然地采用这个无偏估计。为与参数记号相配,记:,对进行估计才有可能获得P的置信区间。,容易计算得:,精选,6,这样可得的无偏估计为:,(3.26),其实当N比较大时,样本中1的个数服从二项分布,因此当n不是很大时,近似置信区间(3.26)会发生一定差错,应当考虑必要的修正。p的修正置信区间为:,(3.27),精选,7,例3.4某地区有30587人,为调查其中吸烟者所占比例而从中随机无放回抽取2000人进行访问,得知其中烟民785人。试估计该地区吸烟者比例,并给出吸烟比例的置信水平为90的近似置信区间。,解:,N30587,n2000,置信水平为90,则,查表得,又,故置近似信区间为,(37.52,40.98),精选,8,3.5样本容量n的确定,抽样调查理论中,样本容量n的确定具有实实在在的意义。n过大,违背抽样调查的宗旨,n过小,则抽样误差偏大,无法作出精确的估计。,一般情况,总费用是固定的,在固定的费用下尽量提高精度或在必需的精度下使费用尽可能减少,是我们确定n的基本原则。下面主要研究简单随机抽样下如何确定n。,设选取n个样本,访问每个单元所需的平均费用为,另外除了样本调查所需的费用以外,还需要一笔基本费用,例如办公费、设计问卷的费用等,用表示。这样总费用为,我们主要考虑n与精度的关系:,精选,9,精度要求主要涉及到估计的方差(或相应的标准差),或估计量与参数的绝对误差或相对误差。若记为基于简单随机样本的关于参数的估计量。是一个随机变量,要使此绝对误差控制在一定数之内,只能以概率加以描述,假设置信水平为,那么:,同样,若以相对误差r作为标准,则有,假设n相当大时,可以利用正态近似,我们有,精选,10,再利用正态近似的手段,得:,这里我们定义:,我们称之为统计量的变异系数,它在抽样调查中也是一个比较重要的量,尤其是在评价统计量的精度时常常用到。,将(3.31)式中的取为为例,如果调查时有一定要求,那么由(3.31)式以及额定的,只要已知,我们完全可以求得n的值。,精选,11,如果是未知的,我们可以先作少量抽样以估计,然后再确定n,当然这个确定的n比少量抽样的容量通常要大。,*(了解)如果问题是估计总体的具有某种特征的子总体所占的百分数P,那么,代入(3.31)式,并解得:,(3.35),由于P未知,仍然必须事先利用少量抽样加以估计。但在实际操作中,当时,PQ很接近P=0.5时的最大值,,精选,12,以P=0.5代入,此时,得到n约为,如果调查对有一定要求,自然也能得到n的大约数值。,(3.36),以(3.36)式确定n,建立在P不大不小的基础之上。这种信息有时在抽样之前事先感觉得到。有时事先也可能感觉P相当小(或Q相当小)。例如,要估计流水线上生产一批精密元件的废品率,此时废品率往往很小,P0.1是最起码的。对此废品率的抽样调查所需的n就不能用(3.36)式了。,精选,13,这种场合下如何确定n呢?一个可供选择的方法就是逆抽样。思路很简单,我们事先估计P很小,此时确定的n次抽样中必须含有废品,否则很难估计P。于是逆抽样方法建议我们事先确定一个大于1的整数m,从总体中随机逐次抽取样本,直到出现第m个“废品”(或具有某种特征的单元)为止。此时,我们实际抽取的样本容量n是一个随机变量,我们使用:,来估计P。逆抽样的特点是n为随机变量,与P及m有相当的关系,的精度就与m有密切的关系。我们的问题是根据调查的需要去确定事先指定的“废品”数m。,(3.37),一般地,由于欲估计的P相当小,因此可以认为Q几乎为1。运用概率论知识可求得的变异系数的一个上界:,精选,14,如果对有一定要求(这实际上就是精度要求),那么可以求得m的大致值。,例如,那么,,那么,理论上是P的无偏估计,因此当P很小时,由(3.37)可知,n应相当大。,精选,15,作业,1.一批电视机10000台在出厂前需进行质量检查,现随机无放回地从中选取425台进行测试,发现有4台不合格,问这批电视机的合格率估计为多少?能否给出该合格率的95%置信区间.,2.欲调
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专培基地管理制度
- 专职人员管理制度
- 专色油墨管理制度
- 丙肝院内管理制度
- 业主财务管理制度
- 业务上班管理制度
- 业务台账管理制度
- 业务承揽管理制度
- 业务量化管理制度
- 东丽公司管理制度
- GB/T 3505-2009产品几何技术规范(GPS)表面结构轮廓法术语、定义及表面结构参数
- GB/T 21446-2008用标准孔板流量计测量天然气流量
- 无领导小组面试评分表
- 大学语文-第四讲魏晋风度和魏晋文学-课件
- 我们毕业啦毕业季通用模板课件
- 小升初数学复习八(平面图形)讲义课件
- (完整版)基建建设工程流程图
- 公司金融课件(完整版)
- 墙体开槽技术交底及记录
- 国家开放大学《调剂学(本)》形考任务1-4参考答案
- 公务员工资套改和运行案例
评论
0/150
提交评论