




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章 抽样与参数估计,第一节 抽样与抽样分布 第二节 参数估计基本方法 第三节 总体均值和总体比例的区间估计 第四节 样本容量的确定,第一节 抽样与抽样分布,什么是抽样推断,二、概率抽样方法,三、抽样分布,一、什么是抽样推断,第五章 抽样与参数估计 第一节 抽样与抽样分布,二、抽样方法,第五章 抽样与参数估计 第一节 抽样与抽样分布,概率抽样 (probability sampling),1. 也称随机抽样,第五章 抽样与参数估计 第一节 抽样与抽样分布,按一定的概率以随机原则抽取样本,每个单位被抽中的概率是已知的,或是可以计算出来的,当用样本对总体目标量进行估计时, 要考虑到每个样本单位被
2、抽中的概率,抽取样本时使每个单位都有一定的机会被抽中,2.特点,简单随机抽样 (simple random sampling),第五章 抽样与参数估计 第一节 抽样与抽样分布,简单、直观,在抽样框完整时,可直接从中抽取样本,用样本统计量对目标量进行估计比较方便,当N很大时,不易构造抽样框,抽出的单位很分散,给实施调查增加了困难,没有利用其它辅助信息以提高估计的效率,从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的,2. 最基本的抽样方法,是其它抽样方法的基础,3. 特点,4. 局限性,分层抽样 (stratified sampling),第五章 抽样与参数估计 第一节
3、 抽样与抽样分布,保证样本的结构与总体的结构比较相近,从而提高估计的精度,组织实施调查方便,既可以对总体参数进行估计,也可以对各层的目标量进行估计,将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,2.优点,系统抽样 (systematic sampling),第五章 抽样与参数估计 第一节 抽样与抽样分布,将总体中的所有单位(抽样单位)按一定顺序排列, 在规定的范围内随机地抽取一个单位作为初始单 位,然后按事先规定好的间隔确定其它样本单位,优点:,先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位,操作简便,可提高估计的精度,
4、缺点:,对估计量方差的估计比较困难,整群抽样 (cluster sampling),第五章 抽样与参数估计 第一节 抽样与抽样分布,抽样时只需群的抽样框,可简化工作量,调查的地点相对集中,节省调查费用,方便调查的实施,缺点是估计的精度较差,将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查,2.特点,三、抽样分布 (概念要点),第五章 抽样与参数估计 第一节 抽样与抽样分布,样本均值, 样本比例等,样本统计量,3. 随机变量是,2. 是一种理论概率分布,1. 所有样本指标(如均值、比例、方差等)的相对频数分布或概率分布称为抽样分布,样本均值的抽样分布 (一
5、个例子),【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下,均值和方差,第五章 抽样与参数估计 第一节 抽样与抽样分布,现从总体中抽取n2的简单随机样本,在重复抽样条件下 共有42=16个样本。所有样本的结果为,第五章 抽样与参数估计 第一节 抽样与抽样分布,比较及结论:1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n,第五章 抽样与参数估计 第一节 抽样与抽样分布,式中:M为样本数目,样本均值的抽样分布 (数学期望与方差),第五章 抽样与参数估计 第一节 抽
6、样与抽样分布,1. 样本均值的数学期望,2. 样本均值的方差,重复抽样,不重复抽样,样本比例的抽样分布 比例(proportion),第五章 抽样与参数估计 第一节 抽样与抽样分布,3. 样本比例可表示为,2. 总体比例可表示为,合格品(或不合格品) 与全部产品总数之比,不同性别的人与全部人数之比,总体(或样本)中具有某种属性的单位与全部单位总数之比,容量相同的所有可能样本的样本比例的概率分布 当样本容量很大时,样本比例的抽样分布可用正态分布近似 一种理论概率分布 推断总体总体比例的理论基础,样本比例的抽样分布,第五章 抽样与参数估计 第一节 抽样与抽样分布,样本比例的数学期望 样本比例的方差
7、 重复抽样 不重复抽样,样本比例的抽样分布 (数学期望与方差),第五章 抽样与参数估计 第一节 抽样与抽样分布,样本均值的抽样分布 与中心极限定理, = 50, =10,X,总体分布,n = 4,抽样分布,n =16,当总体服从正态分布N (,2 )时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X 的数学期望为,方差为2/n。即XN(,2/n),第五章 抽样与参数估计 第一节 抽样与抽样分布,中心极限定理 (图示),当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布,中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽
8、样分布近似服从均值为、方差为2/n的正态分布,一个任意分布的总体,第五章 抽样与参数估计 第一节 抽样与抽样分布,T 统计量的分布,设X1,X2,Xn1是来自正态总体N(1,12 )的一个样本, 称,为统计量,它服从自由度为(n-1)的t 分布,第五章 抽样与参数估计 第一节 抽样与抽样分布,t,Z,t 分布,正态 分布,t 分布与正态分布的比较,标准正态分布,不同自由度的t分布,t (df = 5),t (df = 13),抽样分布与总体分布的关系,第五章 抽样与参数估计 第一节 抽样与抽样分布,第二节 参数估计基本方法,一. 点估计 二. 点估计的优良性准则 三、 区间估计,参数估计的方法
9、,第五章 抽样与参数估计 第二节 参数估计基本方法,被估计的总体参数,第五章 抽样与参数估计 第二节 参数估计基本方法,点估计 (概念要点),从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计 2. 点估计没有给出估计值接近总体未知参数程度的信息 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,第五章 抽样与参数估计 第二节 参数估计基本方法,例如: 用样本均值作为总体未知均值的估计值就是一个点估计,1.用于估计总体某一参数的随机变量 理论基础是抽样分布,估计量 (概念要点),第五章 抽样与参数估计 第二节 参数估计基本方法,如样本均值,样本比例等,例
10、如: 样本均值就是总体均值的一个估计量,如果样本均值 x = 3 ,则 3 就是 的估计值,估计量的优良性准则 (无偏性),无偏性:估计量的数学期望等于被估计的总体 参数,第五章 抽样与参数估计 第二节 参数估计基本方法,P( X ),X,无偏,有偏,估计量的优良性准则 (有效性),有效性:一个方差较小的无偏估计量称为一个更 有效的估计量。如,与其他估计量相比 ,样本均值是一个更有效的估计量,第五章 抽样与参数估计 第二节 参数估计基本方法,中位数的抽样分布,均值的抽样分布,B,A,估计量的优良性准则 (有效性),一致性:随着样本容量的增大,估计量越来越接 近被估计的总体参数,第五章 抽样与参
11、数估计 第二节 参数估计基本方法,较小的样本容量,较大的样本容量,B,A,区间估计 (概念要点),1. 根据一个样本的观察值给出总体参数的估计范围 给出总体参数落在这一区间的概率 例如: 总体均值落在5070之间,置信度为 95%,第五章 抽样与参数估计 第二节 参数估计基本方法,落在总体均值某一区间内的样本,第五章 抽样与参数估计 第二节 参数估计基本方法,为显著性水平,是总体参数未在区间内的概率,置信水平,第五章 抽样与参数估计 第二节 参数估计基本方法,3. 常用的显著性水平值有 99%, 95%, 90%,1. 总体未知参数落在区间内的概率,相应的为0.01,0.05,0.10,2.
12、表示为 (1 - ) ,区间与置信水平,均值的抽样分布,(1 - ) % 区间包含了 % 的区间未包含,1 - a,a/2,a/2,第五章 抽样与参数估计 第二节 参数估计基本方法,影响区间宽度的因素,1. 数据的离散程度,用 来测度 样本容量, 置信水平 (1 - ),影响 Z 的大小,第五章 抽样与参数估计 第二节 参数估计基本方法,第三节 总体均值和总体比例 的区间估计,样本容量的确定,总体比例的区间估计,总体均值的区间估计,总体均值的置信区间 ( 已知),总体均值 在1-置信水平下的置信区间为,第五章 抽样与参数估计 第三节 总体均值和总体比例的区间估计,2. 使用正态分布统计量,如果
13、不是正态分布,可以由正态分布来近似 (n 30),总体服从正态分布,且总体方差()已知,1. 假定条件,总体均值的区间估计 (正态总体:实例),解:已知N(,0.152),x2.14, n=9, 1- = 0.95,/2=1.96 总体均值的置信区间为,我们可以95的概率保证该种零件的平均长度在21.30221.498 mm之间,【例】某种零件长度服从正态分布,从该批产品中随机抽取件,测得其平均长度为21.4 mm。已知总体标准差 =0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。,第五章 抽样与参数估计 第三节 总体均值和总体比例的区间估计,总体均值的区间估计 (非正
14、态总体:实例),解:已知 x26, =6,n=100, 1- = 0.95,/2=1.96,我们可以95的概率保证平均每天参加锻炼的时间在24.82427.176 分钟之间,【例】某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36小时)。,第五章 抽样与参数估计 第三节 总体均值和总体比例的区间估计,总体均值的置信区间 ( 未知),3. 总体均值 在1-置信水平下的置信区间为,第五章 抽样与参数估计 第三节 总体均值和总体比例的区间估计,2. 使用 t 分布统计量,总体必须服从正
15、态分布,总体方差()未知,1. 假定条件,总体均值的区间估计 (实例),解:已知N(,2),x=50, s=8, n=25, 1- = 0.95,t/2=2.0639。,我们可以95的概率保证总体均值在46.6953.30 之间,【例】从一个正态总体中抽取一个随机样本, n = 25 ,其均值x = 50 ,标准差 s = 8。 建立总体均值m 的95%的置信区间。,第五章 抽样与参数估计 第三节 总体均值和总体比例的区间估计,总体比例的置信区间,3. 比例P的置信区间为,第五章 抽样与参数估计 第三节 总体均值和总体比例的区间估计,2. 使用正态 分布统计量,1. 假定条件,两类结果,总体服
16、从二项分布,可以由正态分布来近似,总体比例的区间估计 (例题分析),【例】某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间,解:已知 n=100,p65% , z/2=1.96,该城市下岗职工中女性比例的置信区间为55.65%74.35%,第五章 抽样与参数估计 第三节 总体均值和总体比例的区间估计,总体比例的置信区间 (实例),我们可以95的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在63.6%76.4%之间,【例】某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机
17、选取了200人组成一个样本。在对其进行访问时,有140人说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。,第五章 抽样与参数估计 第三节 总体均值和总体比例的区间估计,估计总体均值时样本容量n为 重复抽样 不重复抽样 样本容量n与总体方差成正比,与边际误差成反比,与可靠性系数成正比,估计总体均值时样本容量的确定,其中:,第五章 抽样与参数估计 第三节 总体均值和总体比例的区间估计,样本容量的确定 (实例),解:已知2=1800000,=0.05, Z/2=1.96,=500,应抽取的样本容量为,【例】一家广告公想估计某类商店去年所
18、花的平均广告费用有多少。经验表明,总体方差约为1800000元。如置信度取95%,并要使估计处在总体平均值附近500元的范围内,这家广告公司应抽多大的样本?,第五章 抽样与参数估计 第三节 总体均值和总体比例的区间估计,估计总体均值时样本容量的确定 (例题分析),【例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本容量?,第五章 抽样与参数估计 第三节 总体均值和总体比例的区间估计,解: 已知 =2000,E=400, 1-=95%, z/2=1.96 12 /22置信度为90%的置信区间为,即应抽取97人作为样本,第五章 抽样与参数估计 第三节 总体均值和总体比例的区间估计,根据比例区间估计公式可得样本容量n为 重复抽样 不重复抽样,估计总体比例时样本容量的确定,4. E的取值一般小于0.1 5 未知时,可取最大值0.5,其中:,第五章 抽样与参数估计 第三节 总体均值和总体比例的区间估计,估计总体比例时样本容量的确定 (例题分析),
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 防火材料安全管理办法
- 不锈钢车间管理办法规定
- 消防员培训管理办法规定
- 互联网安全分级管理办法
- 江苏关于ppp管理办法
- 淄博市农村电缆管理办法
- 师河区室内绿化管理办法
- 银行安全工作管理办法
- 临淄区民生项目管理办法
- 沈阳特殊人士管理办法
- 老年急重症诊疗及护理
- 中小学家长会期中期末家长会253
- 驱动电机与电机控制器
- 2024年便携式储能行业分析报告
- 医联体协议书(2024版)
- 2023年全国职业院校技能大赛-中药传统技能赛项规程
- 11 《爱莲说》对比阅读-2024-2025中考语文文言文阅读专项训练(含答案)
- 动物园野生动物驯养繁殖或驯养观赏可行性研究报告
- 煤矿开掘技术操作规程
- 2023年上海市长宁区高三年级下册二模英语试卷含详解
- 肺功能进修总结汇报
评论
0/150
提交评论