版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学授课题目第6章抽样推断课次第8-9次授课方式讲授课时安排第8教学周-第9教学周,共4课时教学目的:通过本章的学习,要求掌握利用样本统计资料来推断总体数量特征的原理及方法;深刻理解抽样推断的概念及特点;了解抽样误差产生的原因,并对抽样误差、抽样平均误差、抽样极限误差加 以区别,掌握抽样平均误差、抽样极限误差的计算;掌握点估计和区间估计的方法;掌握必要样本 单位数的确定方法。教学重点及难点提小:重点:区间估计难点:抽样平均误差的计算案例导入:大学生消费调查:一个月你花多少第T 抽样推断概述一、抽样推断的概念及特点(一)概念按随机原则从总体中抽取部分单位,根据这部分单位的信息对总体的数量特征进
2、行 科学倩计与推断的方法。包括抽样调查和统计推断抽样调查:一种非全面调查,按随机原则从总体中抽取部分单位进行调查以获得相关资料,以推断总体统计推断:根据抽样调查所获得的信息,对总体的数量特征作出具有一定程度的估教法提示:多媒体教学案例教学列举法计和推断。(二)特点.按随机原则(等可能性原则)抽取调查单位.随机抽样的目的是为了排除人的主观影响,使每个样本都有系统的可能性被抽中,使样本对总体具有充分的代表性。随机性原则是保证抽样推断正确性的一个重要前提条件。随机抽样不是随便抽样。.根据部分推断总体的数量特征.抽样推断的结果具有一定的可靠性和准确性,抽样误差可以事先计算和控制其他特点有经济性、时效性
3、、准确性、灵活性等(三)抽样推断的应用不可能进行全面调查时不必要进行全面调查时检查生产过程正常与否对全面调查资料进行补充修正时二、抽样的几个基本概念.样本容量与样本个数30(1)样本容量:样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本 容量,一般用n表示,它表明一个样本中所包含的单位数。一般地,样本单位数大于 个的样本称为大样本,不超过 30个的样本称为小样本。(2)样本个数:又称样本可能数目,它是指从一个总体中可能抽取多少个样本。样 本个数的多少与抽样方法有关。.总体参数与样本统计量(1)总体参数:总体分布的数量特征就是总体参数,也是抽样统计推断的对象。常见的总体参数有:总体的平
4、均数指标,总体成数(比重)指标,总体分布的方差、标准差等等。(2)样本统计量:与总体参数对应的是样本统计量。设(Xi,X2L ,Xn)是总体X容量为n的样本,若样本函数T T (Xi,X2L ,Xn)中不含任何未知参数,则称 T为一个统计量。例如就是一个统计量,称为样本均值(Sample mean),S2(Xi X)也是统计量,称为样本方差(Sample variance3.重复抽样与不重复抽样(1)重复抽样:是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总 体中继续参加下一次样本单位的抽取。(2)不重复抽样:即每次从总体中抽取一个单位,登记后不放回原总体,不参加下 一次抽样。第二节
5、抽样推断的方法、点估计(一)点估计的概念及特点参数估计:以样本统计量对总体参数进行估计,有点估计和区间估计两种。点估计:直接以样本统计量作为相应的总体参数的估计量。优点:直接给出了总体参数的具体数值缺点:未能反映误差的大小参数点估计有:? x(1)样本均值估计总体均值? p TOC o 1-5 h z (2)样本成数估计总体成数L?2S2(3)样本方差估计总体方差(二)估计的评价标准:(1)无偏性:设? t (XjX2,!. ,Xn)是未知参数 的一个点估计量,若?满足E?即估计量的数学期望等于被估计参数则称?是的无偏估计量,否则称为有偏估计量。需要注意的是,由于估计量 ?是样本(Xl,X2,
6、L,Xn)的函数,样本量是n维随机变 量,所以对 ?求平均是按样本(Xl,X2,L ,Xn)的概率分布求平均。无偏性是我们衡量点估计量好坏的一个评价标准,这个评价标准的直观意义如下:由于样本的出现带有随机性,所以基于一次具体抽样所得的参数估计值未必等于参数真值,这是由样本的随机性造成的。我们希望当大量使用这个估计量对参数进行倩计时,一系列估计值的平均值应该与待估参数真值相等。这就从平均效果上对估计量的优劣给 出一个评价标准。(2)功效性:?T /V VIV ?丁 /V VIV 设1Ti (X1,X2,L,Xn)2丁2 (Xi,X2,L,Xn)均为未知参数的无偏估计?量,如果对参数日勺一切口能取
7、值有2(?)2( ?2),则称无偏估计量 1比2有效一个无偏估计量并不意味着他就非常接近被借计的参数,他还必须与总体参数的离散程度比较小。对同一总体参数的两个无偏点估计量,方差小者更有效。(3) 一B 性:指随着样本单位数 n的增大,样本估计量将在概率意义下越来越接近于总体真实值若对于任意 0,有lim P ?1n二、区间估计法在参数倩计中,虽然点估计可以给出未知参数的一个情计,但不能给出倩计的精度。为此人们希望利用样本给出一个范围,要求它以足够大的概率包含待估参数真值。这就 是导致区间估计问题。所谓区间估计,就是倩计总体参数的区间范围,并要求给出区间估计成立的概率值。设 是未知参数,(X1,
8、X2,L ,Xn)是来自总体的样本,构造两个统计量 ? T1 (X1,X2,L ,Xn), 2 T2(X1,X2,L ,Xn),对于给定的(0 1),若?、2满足则称随机区间2 是参数的置信水平为1的置信区间,1称为21的置信度,5称为置信限。这里有几点需要说明:(1)区间马的端点?,及长度?都是样本的函数,从而都是随机变量,因此是一个随机区间。的概率包含未知参数真值,区间长度2- 1描述估计的精度,置信水平1描述了估计的可靠度。(3)因为未知参数是非随机变量,所以不能说落入区间1,而应是随机区间2:包含的概率是11 是说随机区间通俗地说,在点估计的基础上,给出总体参数的一个范围称为区间估计。
9、(二)总体均值的区间估计.正态总体且方差已知;或非正态总体、方差未知、大样本情况下在这种情况下,样本均值的抽样分布呈正态分布,其数学期望为总体均值2为。则X z 尸称为总体均值在1置信水平下的置信区间。n2 n区间估计步骤:1.计算样本统计量x, pxp2,计算抽样平均误差3,计算极限误差X,x Xp p, p p4,确定置信区间NXNP5,估计总量指标注意抽样方法的不同例保险公司从投保人中随机抽取36人,计算得36人的平均年龄 X39,5 岁,已知投保人平均年龄近似服从正态分布,标准差为岁,试求全体投保人平均年龄的置信水平为99%勺置信区间。解:10,99,0,01,查 N (0,1)表得
10、Z22.57539,5 2,5757,236,41 :3639,5 2,5757,2-一 42,59 .36故全体投保人平均年龄的置信水平为99%勺置信区间为,若总体方差 2未知,可用样本方差 S2代替即土 =,投保人平均年龄在 90%的置信水平下的置信区间为岁岁。.正态总体、方差未知、小样本情况下如果总体服从正态分布,无论样本容量大小,样本均值的抽样分布都服从正态分布。 只要总体方差已知,即使在小样本情况下,也可以计算总体均值的置信区间。如果总体 方差2未知,需用样本方差 S2代替,在小样本情况下,应用 t分布来建立总体均值的置 信区间。t分布是类似正态分布的一种对称分布,他通常要比正态分布
11、平坦和分散。随着自由度的增大,t分布逐渐趋于正态分布。正态总体、方差未知、小样本情况下,总体均值在1置信水平下的置信区间为:sX t -j=(重复抽样条件下)X t 阜JN(不重复抽样条件下)2 n . N 1其中t (n 1)为t分布临界值,可以查t分布临界值表得到(三)成数的区间估计在大样本(一般经验规则:np 5和n(1 p) 5)条件下,样本比例的抽样分布可用正态分布近似。在这种情况下,数理统计已经证明如下结论:置信水平为1的置信区间为:(重复抽样)p Z Zp(1 P)(N_n)(不重复抽样)2 n N 1例某城市想要估计下岗职工中女性所占的比例,采取重复抽样方法随机抽取了 100名
12、下岗职工,其中65人为女性。试以95%的置信水平估计该城市下岗职工中女性所 占比例的置信区间。一 .65解:已知 n 100, z. 1.96, p 65%2100根据公式得:p Z ,函询 65% 1.96 . 65% (1 65%) HYPERLINK l bookmark40 o Current Document 2 . n.100即65% 土 =%), 95%的置信水平下估计该城市下岗职工中女性所占比例的置信区 间为唳%例某企业共有职工1000人,企业准备实行一项改革,在职工中征求意见,采用不重复抽样方法,随机抽取200人作为样本,调查结果显示,由150人表示赞成这项改革,有50人表示
13、反对。试以95 %的置信水平确定赞成改革的人数比例的置信区间。一一,150解:已知 n 200, z 1.96, p 75% 2200根据公式得:pZ,p(1np)(N;)75% 1.96 .175%(1.75%)(1000-200) 丫 2001000 1即75% 土 =% %), 95 %的置信水平下估计赞成改革的人数比例的置信区间为三、样本容量的确定(一)影响样本容量的意义在抽取样本时样本容量应多大是一个很实际的问题。样本容量取得比较大,收集的信息就比较多,从而估计精度比较高,但进行观测所投入的费用、人力及时间就比较多;样本容量取得比较小,则投入的费用、人力及时间就比较少,但收集的信息也
14、比较少,从而估计精度比较低。这说明精度和费用对样本量的影响是矛盾的,不存在既使精度最高又使费用最省的样本量。一个常用的准则是在使精度得到保证的前提下寻求使费用最省的样本量。由于费用通常是样本量的正向线性函数,故使费用最省的样本量也就是使 精度得到保证的最小样本量。(二)倩计总体均值时样本容量的确定22z 重复抽样条件下:n 上在简单随机/、重复抽样条件下,M 22Nz n N 2 z2 22b或S通常未知。一般按以下方法确定其估计值:过去的经验数据;试验调查样本的So例 在某企业中采用简单随机抽样调查职工月平均奖金额,设职工月奖金额服从标准差为10元的正态分布,要求倩计的绝对误差为3元,可靠度
15、为95%试问应抽多少职工解:已知10310.95z_ 1.96则2二 222z21.962 102n42.68 43232即需抽取43名职工作为样本进行调查。(三)倩计成数时样本大小的确定在简单随机重复抽样条件下,得到样本容量:_2_一Z P(1 P)n 二一2一(重复抽样条件下)P在简单随机不重复抽样条件下,我们可以得出倩计总体比例时样本容量的计算公式为:NZ2P(1 P)n (/、重复抽样条件下)N P2 Z2P(1 P)T例根据以往的生产统计,某种产品的合格率为90%现要求绝误差为 5%在置信水平为95%勺置信区间时,应抽取多少个产品作为样本已知,P 90% P 5% Z 1.96万一
16、2 -八z P(1 P) 1.962 0.9 (1 0.9)贝Un 2=2 139P20.052必要样本容量的影响因素.总体力差的大小;.允许误差范围的大小;.概率保证程度;.抽样方法;.抽样的组织方式。第二节抽样的组织形式抽样的组织形式有纯随机抽样、机械抽样、类型抽样、整群抽样和多阶段抽样。一、纯随机抽样.含义:对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本.特点:最符合抽样调查的随机原则,是基本形式。简便易行。.范围:仅适用于单位数不多、标志变异较小、分布较均匀的总体二、类型抽样.含义:先将全及总体中的所有单位按某一主要标志分组,然后在各组中采用纯随机抽 样或机械抽样方
17、式,抽取一定数目的调查单位构成所需的样本。又叫分层抽样或分类抽 样。.方法:A比例分配法n i/n=Ni/NB最佳分配法 根据各层单位的变异程度的大小来分配C经济分配法 除了考虑单位数目和变异程度外,还有调查费用。.特点:能保证分布的均匀性,提高样本的代表性,误差较小;能同时推断总体指标和 各子总体的指标二、机械抽样.含义:是先将全及总体所有单位按某一标志顺序编号排列,然后按照固定顺序和相等 的空间距离或间隔,从中抽取样本单位的一种抽样组织方式。又叫等距抽样或系统抽样。.方法:根据需要计算抽取各个样本单位之间的距离或间隔;然后,按此间隔依次抽取 必要的样本单位。.特点:能保证样本较均匀地分布。是不重复的抽样。4.形式:按无关标志排队,具抽样效果相当于简单随机抽样;按有关标志排队,其抽样 效果相当于类型抽样。四、整群抽样.含
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖北幼儿师范高等专科学校《世界广告名人研究》2024-2025学年第二学期期末试卷
- 陇东学院《化学电源设计与制造》2024-2025学年第二学期期末试卷
- 郑州商学院《环境保护导论》2024-2025学年第二学期期末试卷
- 辽宁理工职业大学《抗干扰技术》2024-2025学年第二学期期末试卷
- 江苏师范大学科文学院《版画基础》2024-2025学年第二学期期末试卷
- 忻州职业技术学院《公共设施设计》2024-2025学年第二学期期末试卷
- 辽宁职业学院《网站前台技术》2024-2025学年第二学期期末试卷
- 2026黑龙江绥化安达市中西医结合医院康复医学科人才招聘2人考试参考试题及答案解析
- 2026年潍坊临朐县人民医院护理人员(非事业编制)招聘(25人)笔试模拟试题及答案解析
- 2026年首都医科大学附属北京天坛医院安徽医院公开招聘工作人员65名笔试备考题库及答案解析
- 【新教材】人教PEP版(2024)四年级下册英语 Unit 1 Class rules A Lets talk 教案
- 北师大版七年级数学下册-基础计算题100题(无答案)
- 石化信息分类编码-装置名称及3
- 国家计委建设部计价格200210号文关于发布《工程勘察设计收费管理规定》的通知上
- 中国文化史复习资料
- 1.追寻文明的足迹
- 项目管理奖罚细则
- 组织生活会工作流程(附流程图)
- SimMarketing营销模拟实验室操作篇
- 气排球比赛计分表
- 汽车式起重机常见事故原因分析及预防
评论
0/150
提交评论