




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,学习目标理解抽样推断的概念和特点、掌握抽样推断中涉及的几个基本概念;知道如何采用重复抽样和不重复抽样方法选取样本,能结合实际有关资料进行点估计和区间估计,并能确定必要样本容量;熟练应用Excel进行抽样推断。,第7章抽样推断分析,关键术语抽样推断抽样平均误差抽样极限误差点估计区间估计,.,章首引例,国家旅游局自1993年起,每年委托国家统计局城市社会经济调查总队(现为国家统计局城市社会经济调查司),对我国大陆地区城镇居民国内旅游情况进行抽样调查(2006年以前未将西藏纳入调查范围)。同时,在连续三年(19971999年)与国家统计局城市社会经济调查总队合作开展农村居民国内旅游调查取得经验的基础上,从2000年开始,委托国家统计局农村社会经济调查总队(现为国家统计局农村社会经济调查司)在我国除西藏以外的大陆地区开展了农村居民国内旅游抽样调查。根据2007年这两项调查的结果,对全国国内旅游人数、出游率、出游花费等主要指标进行测算,从而分别得出2007年城镇居民旅游总体情况、农村居民旅游总体情况及全国国内居民旅游总体情况。,.,由国家旅游局与国家统计局城市社会经济调查司、农村社会经济调查司合作,在我国大陆地区开展的国内旅游抽样调查结果表明,2007年我国国内旅游人数继续平稳增长,国内旅游收入突破7000亿元;国内旅游总人数为16.10亿人次,比上年增长15.5;国内旅游总收入为7770.62亿元,比上年增长24.7;国内游客人均花费482.6元人次,比上年增长8。,章首引例,上述案例中,为什么采取抽样调查这种非全面调查方式同样可以取得反映全国国内旅游情况的资料?案例中的数据是采用何种方法估计推断的?,.,1.抽样推断的概念及特点(1)抽样推断的概念抽样推断就是按照随机抽样的原则,从总体中抽出一部分单位作为样本,并利用样本的实际资料计算样本指标值,然后根据样本指标对总体指标(数量特征)做出具有一定可靠程度的估计和判断的一种统计分析方法。,7.1抽样推断的基本概念,.,1.抽样推断的概念及特点,(2)抽样推断的特点,抽样误差可以事先计算和控制,由部分资料推算总体的数量特征,遵循随机取样的原则,.,(1)全及总体和样本总体全及总体指所要认识的研究对象的全体。是所要认识的、具有某种共同性质的许多单位的集合体。总体单位总数用“N”表示。在抽样推断中,全及总体是客观存在、唯一确定的。样本总体指从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。样本总体的单位数通常用“n”来表示。在抽样推断中,样本不是唯一确定的,而是随机的。,2.抽样推断中的几个基本概念,.,(2)样本容量和样本个数样本容量样本所容纳的单位个数称为样本容量。样本容量是一个样本所包含的单位数。样本容量30为大样本,30为小样本。样本个数(样本可能数目)样本个数指有多少个样本。是从一个全及总体中可能抽取的样本数目。,2.抽样推断中的几个基本概念,.,(3)全及指标和抽样指标1)全及指标(参数)指根据全及总体各个单位的标志值或标志属性计算的,反映总体某种特征或属性的统计指标。全及指标是总体变量的函数,其数值是由总体各单位的标志值或标志属性决定的。由于一个全及指标的指标值是确定的、唯一的,所以称为参数。常用的全及指标包括总体平均数和总体标准差、总体成数和总体成数标准差。,2.抽样推断中的几个基本概念,.,总体平均数和总体标准差总体平均数总体各单位某一数量标志标志值的算术平均数。,1)全及指标(参数),总体标准差测定总体各单位标志值差异程度的指标。,或,或,.,总体成数和总体成数标准差总体成数P指总体中具有某一标志表现的单位数占总体全部单位数的比重。设总体N个单位中,有N1个单位具有某种属性,N0个单位不具有某种属性。,1)全及指标(参数),.,1)全及指标(参数),如果品质标志表现只有是、非两种,把“是”的标志表示为1,而“非”的标志表示为。那么成数就可以视为(,)分布的平均数。,总体成数标准差,.,全及指标虽然是客观存在的,为什么在抽样推断中是不可能直接计算的,只能推断得出?,分组讨论:,.,(3)全及指标和抽样指标,2)样本指标(统计量)样本指标根据样本各单位标志值或标志属性计算的综合指标。它是样本变量的函数,用来估计总体参数的,又称为统计量,它和总体参数相对应。统计量有样本平均数、样本成数、样本标准差(或样本方差)。,.,2)样本指标(统计量),样本平均数和样本标准差样本平均数反映样本各单位某一数量标志标志值的算术平均数。,样本标准差用来测定样本各单位标志值变异程度的指标。,或,或,.,样本成数和样本成数标准差样本成数p样本中具有某一标志表现的单位数占全部样本单位数的比重。设样本n个单位中,有n1个单位具有某种属性,n0个单位不具有某种属性,则,2)样本指标(统计量),.,样本成数标准差,2)样本指标(统计量),提示全及总体是唯一确定的,反映全及总体数量特征的全及指标也是个定值。从一个总体中可抽取多个样本,样本总体不是唯一的,样本指标是随机变量。,.,3.抽样方法,(1)重复抽样从总体N个单位中随机抽取一个容量为n的样本,每次从总体中抽取一个单位,并把它看作是一次试验,把结果登记下来,又重新放回,参加下一次抽选,连续进行n次试验构成一个样本的方法。从总体N个单位中,用重复抽样的方法,随机抽取n个单位构成一个样本,则共可抽取个个样本。,总体有A、B、C、D四个单位,用重复抽样的方法抽取2个单位构成样本。全部可能抽取的样本数目为42=16个,它们是:AAABACADBABBBCBDCACBCCCDDADBDCDD,.,3.抽样方法,(2)不重复抽样从总体N个单位中抽取一个容量为n的样本,每次从总体中抽取一个单位,但每次抽出一个单位后就不再放回参加下一次的抽选,连续进行n次抽取构成一个样本的方法。从总体N个单位中,用不重复抽样的方法,抽取n个单位构成一个样本,全部可能抽取的样本数目为,个,总体有A、B、C、D四个单位,用重复抽样的方法抽取2个单位构成样本。全部可能抽取的样本数目为4312个,它们是:ABACADBABCBDCACBCDDADBDC,.,(1)简单随机抽样简单随机抽样又称为纯随机抽样。它是对总体各单位不作任何加工整理,直接从总体中随机抽取调查单位的抽样调查方式,是最基本也是最简单的一种。(2)类型抽样类型抽样又称为分层抽样或分类抽样。它是先对总体各单位按某一标志加以分组,然后再从各组中按随机原则抽取一定单位构成样本的抽样组织方式。,4.抽样组织方式,.,4.抽样组织方式,(3)等距抽样等距抽样又称为机械抽样或系统抽样。它是先将总体各单位按某一标志排序,然后按照固定的顺序和相同的间隔来抽选样本单位的抽样组织形式。(4)整群抽样整群抽样也称为分群抽样或集团抽样。它是将总体划分为若干群,然后以群为单位从中随机抽取部分群,对中选群中的所有单位进行全面调查的抽样组织方式。,.,抽样误差是指按照随机原则抽取的样本计算的样本指标,在代表总体指标时产生的离差,即样本平均数与总体平均数的离差,样本成数与总体成数的离差。这种误差是抽样推断所特有的,用部分单位资料估计总体数量特征不可避免的误差。由于总体指标是未知的,而样本指标又是随机变量,不是唯一的,所以,抽样误差也是一个随机变量,即有多少种可能的样本就有多少种可能的实际抽样误差。,7.2抽样误差,.,(1)抽样平均误差的概念抽样平均误差是反映抽样误差一般水平的指标。表示抽样平均数的抽样平均误差,表示抽样成数的抽样平均误差,表示全部可能的样本数目。,1.抽样平均误差,1)样本平均数的抽样平均误差,2)样本成数的抽样平均误差,提示上述公式只能表示抽样平均误差的意义。实际工作中不能用其来计算。在抽样推断中总体指标是不知道的,需要推断才能得到。另外还需知道所有可能的样本平均数和成数,这实际上也是很难办到的。,.,1.抽样平均误差,(2)抽样平均误差的计算公式,1)在重复抽样的条件下,抽样平均数的抽样平均误差,成数的抽样平均误差,某电视台想了解观众对某个电视专题栏目的喜欢程度,假定总体变异程度不变,如样本容量减少1/2或增加1倍,抽样平均误差将会如何变化?,检查点,.,(2)抽样平均误差的计算公式,2)在不重复抽样的条件下,抽样平均数的抽样平均误差,成数的抽样平均误差,应用上述公式计算抽样平均误差时,一般总体方差是未知的,通常使用样本方差来代替,有时也可用小规模的试验性调查资料来代替。,提示,抽样平均误差的计算,【例7-1】某高等职业技术学院2009年9月从1000名新生中随机抽取100名进行英语口语测试,测得平均成绩为76分,标准差为11.2分,其中60分以上的学生有94名。根据上述资料,计算该校新生英语口语平均成绩和及格率的抽样平均误差。,已知,及格率,由于总体方差不知道,需用,代替,代替,重复抽样条件下:,平均成绩的抽样平均误差,及格率的抽样平均误差,不重复抽样条件下:,.,提示平均数的抽样平均误差的计量单位与平均数的计量单位相同,成数的抽样平均误差一般用百分数来表示。,.,(3)影响抽样误差大小的因素,1.抽样平均误差,总体各单位标志值的差异程度,样本的单位数,抽样方法,抽样调查的组织形式,抽样误差,正比,抽样误差,反比,不重复抽样,重复抽样,抽样误差大,抽样误差小,在样本容量相同的情况下采用等距抽样或类型抽样抽样误差就比简单随机抽样或整群抽样小。,.,2.抽样极限误差,(1)抽样极限误差的含义抽样极限误差是指联系一定可靠程度的抽样误差的可能范围,是进行抽样推断时可以允许的误差范围,故又称为允许误差,用表示。根据可靠程度的要求,抽样极限误差与抽样平均误差之间的关系式为:,抽样平均数的抽样极限误差,抽样成数的抽样极限误差,.,2.抽样极限误差,(2)抽样极限误差的计算,1)重复条件下,成数的抽样极限误差,平均数的抽样极限误差,2)不重复条件下,平均数的抽样极限误差,成数的抽样极限误差,【例7-2】用前例,某高等职业技术学院抽测2009级新生英语口试的资料。以95.45%的概率保证程度计算抽样极限误差。根据资料,概率为95.45%,查正态分布概率表得t=2重复抽样条件下:平均成绩的抽样极限误差为:,及格率的抽样极限误差为:,不重复抽样条件下:,及格率的抽样极限误差为:,平均成绩的抽样极限误差为:,抽样极限误差的计算,.,提示抽样极限误差是一个可能的误差范围,而不是一个必然的误差范围。因为样本是随机的,抽样误差也是随机的,因而,不能保证每一次的抽样误差一定不会超出这个范围,只能说有多大的可能,即有多大的保证程度不会超出这个误差范围。,.,7.3抽样估计方法,1.点估计点估计也叫定值估计,是用样本指标直接代替总体指标的估计方法。,在点估计中,总体指标和样本指标之间的关系为:,【例7-3】以例7-1的资料为例,抽测100名新生英语口试的平均成绩为76分,及格率为94%。用点估计则可得出:全院1000名新生英语口语测试的平均成绩和及格率分别为:,分,.,2.区间估计,(1)区间估计的概念区间估计是根据点估计值,联系一定的极限误差,设置一个区间,指出被估计的总体参数落在这个区间内的可能性有多大的一种估计方法。,点估计值,抽样误差范围,概率保证程度,区间估计三个要素,结合估计的置信度,表明总体参数,和P落在区间的(,),内的概率为,.,(1)区间估计的概念,【例7-4】仍以某高等职业学院抽测新生英语口试的资料为例,试以95.45%的可靠程度,按重复抽样的要求,对全校1000名新生英语口试水平和及格率作出区间估计.,在重复抽样条件下=2.24,=4.74%,已知,得,将有关数据代入下列关系式:,计算结果表明,在95.45%的可靠程度下,该学院新生英语口试平均成绩会落在区间(73.76分,78.24分),及格率落在区间(89.26%,98.74%),.,2.区间估计,(2)总体平均数和总体成数的区间估计,抽取样本,计算样本指标和抽样平均误差,根据给定的概率保证程度,查正态分布概率表得概率度t,根据t值和抽样平均误差计算抽样极限误差,并作出区间估计,区间估计步骤,.,(2)总体平均数和总体成数的区间估计,【例7-5】某厂对生产的5000只灯泡进行质量检验,随机抽取100只,对其使用寿命进行测试,所得资料如第4章例4-27所示。要求以95.45%的概率保证程度估计该批灯泡的平均使用寿命。,样本指标灯泡平均使用寿命,样本标准差,样本平均使用寿命的抽样平均误差,.,(2)总体平均数和总体成数的区间估计,样本平均使用寿命的抽样极限误差,5000只灯泡平均使用寿命所在的置信区间为,以95.45%的概率保证程度,估计出该批灯泡的平均使用寿命在3193.83486.2小时之间。,分组讨论,在【例7-5】中,假定概率保证程度提高到99.73%,则该批灯泡的平均使用寿命的区间如何变动?,(2)总体平均数和总体成数的区间估计,【例7-6】对某批4000件成品按不重复抽样方法抽选200件检查,其中合格品192件,要求以95的把握程度估计该批成品的合格率范围。,样本合格率,样本合格率的抽样平均误差为:,样本合格率的抽样极限误差为:,则该批产品合格率的置信区间为:,.,以95%的把握程度估计出该批成品合格率的所在区间为(93.35%,98.65%),即在93.35%98.65%之间。,(2)总体平均数和总体成数的区间估计,在【例7-6】中,如果按重复抽样方式选取样本,试推断该批成品的合格率范围。,检查点,.,7.4样本容量的确定,1.影响必要样本容量的因素,(1)总体各单位标志变异程度,即总体方差或标准差,(2)允许的抽样极限误差的大小,(3)抽样推断的概率保证程度,(4)抽样方法和抽样组织方式,.,2.样本容量的确定方法,(1)重复抽样条件下1)平均数的样本容量,2)成数的样本容量,(2)不重复抽样条件下,1)平均数的样本容量,2)成数的样本容量,检查点,在重复抽样条件下,若允许误差减少一半,样本容量如何变动?若允许误差扩大一倍,样本容量又如何变动?,2.样本容量的确定方法,【例7-7】推算零售商平均每次进货额,根据历史资料进货额的标准差为1500元,假定到批发站进货的零售商为2000人,若要求概率保证程度为99.73%,允许误差不超过250元,至少要抽取多少零售商?,由概率保证程度为95.45.%得t=2,在重复抽样条件下,必要样本容量为,在不重复抽样条件下,必要样本容量为,提示计算样本容量n时,计算结果必须只能进,而不能舍取整。,.,3.计算必要样本容量应注意的几个问题,必要样本容量是一个最低限度的数目。,为同时满足推断总
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 陕西省汉中市宁强县2024-2025学年八年级下学期7月期末考试数学试卷(含答案)
- 湖北省武汉市东湖高新区2024-2025学年八年级下学期期末考试英语试卷(含答案无听力原文及音频)
- 恶劣天气安全的应急预案范文
- 绿色旅游的市场需求与前景分析
- DB64-T 1919-2023 无线电固定监测站机房及配套设施建设规范
- 2025年城镇公寓购房合同范本
- 永年燃气安全知识培训课件
- 机电设备管道安装方案
- 装配式建筑施工现场电气安全管理方案
- 生殖系统济源医学护理系43课件
- 6G多维度切片QoS保障-洞察及研究
- 2025-2026学年外研版(三起)(2024)小学英语四年级上册教学计划及进度表
- 2025年安徽国控集团所属企业招聘7人笔试备考题库及答案解析
- 2025年海南省警务辅助人员招聘考试(公共基础知识)历年参考题库含答案详解(5套)
- 城市道路清扫保洁协议
- 2025年医学检验在编考试题库
- 特色食品卖场建设方案(3篇)
- 高考3500词汇表(完整版)
- 思想道德与法治课件:专题五在实现中国梦的实践中放飞青春梦想
- 新人教A必修一《集合》课件
- 复用器械处理流程
评论
0/150
提交评论