第四讲 用样本推断总体1.ppt_第1页
第四讲 用样本推断总体1.ppt_第2页
第四讲 用样本推断总体1.ppt_第3页
第四讲 用样本推断总体1.ppt_第4页
第四讲 用样本推断总体1.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、用样本推断总体,问题一:,二战中的点估计德军有多少辆坦克? 二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国人在制造坦克时是墨守成规的,他们把坦克从1开始进行了连续编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了它们的生产编号。那么怎样利用这些号码来估计坦克总数呢?我们可以通过本章点估计的方法解决这个问题。,问题二,某人想知道自己所承包的池塘的鱼的总数N,第一次随机捞出50条,将这50条鱼作标记后又放回池塘,等它们完全融入其他鱼后又随机捕捞100条,发带有标记的鱼有2条,你能帮他估计出鱼塘里现鱼的数量N吗? 解:已作记号的鱼的样本比例为 那么总体(池塘里的所有鱼)中作记号的鱼的比例为

2、 既有:50/N=0.02 故:N=50/0.02=2500 这是一个典型的用样本比例来估计总体比例从而再推断总体单位总量的实例。,统计推断的过程,参数估计的方法,点估计,从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计 例如: 用样本均值作为总体未知均值的估计值就是一个点估计 2.点估计没有给出估计值接近总体未知参数程度的信息 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,被估计的总体参数,1. 用于估计总体某一参数的随机变量 如样本均值,样本比例、样本中位数等 例如: 样本均值就是总体均值的一个估计量 如果样本均值 x = 3 ,则 3 就是

3、的估计值 理论基础是抽样分布,估计量,估计量的优良性准则,无偏性:估计量的数学期望等于被估计的总体 参数,估计量的优良性准则(有效性),有效性:一个方差较小的无偏估计量称为一个更 有效的估计量。如,与其他估计量相比 ,样本均值是一个更有效的估计量,估计量的优良性准则(一致性),一致性:随着样本容量的增大,估计量越来越接近被估计的总体参数,区间估计,1.根据一个样本的观察值给出总体参数的估计范围 给出总体参数落在这一区间的概率 例如: 总体均值落在5070之间,置信度为 95%,置信区间估计(内容),落在总体均值某一区间内的样本,总体未知参数落在区间内的概率 表示为 (1 - 为显著性水平,是总

4、体参数未在区间内的概率 常用的显著性水平值有 99%, 95%, 90% 相应的 为0.01,0.05,0.10,置信水平,置信区间与置信水平,均值的抽样分布,(1 - ) % 区间包含了 % 的区间未包含,影响区间宽度的因素,数据的离散程度,用 来测度 样本容量 置信水平 (1 - ),影响 Z 的大小,总体均值的置信区间( 已知),1.假定条件 总体服从正态分布,且总体方差()已知 如果不是正态分布,可以由正态分布来近似 (n 30) 2. 使用正态分布统计量,总体均值 在1-置信水平下的置信区间为,总体均值的区间估计(正态总体),解:已知N(,0.152),x2.14, n=9, 1-

5、= 0.95,/2=1.96 总体均值的置信区间为,我们可以95的概率保证该种零件的平均长度在21.30221.498 mm之间,【例】某种零件长度服从正态分布,从该批产品中随机抽取件,测得其平均长度为21.4 mm。已知总体标准差 =0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。,总体均值的区间估计(非正态总体),解:已知 x26, =6,n=100, 1- = 0.95,/2=1.96,我们可以95的概率保证平均每天参加锻炼的时间在24.82427.176 分钟之间,【例】某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95

6、的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36小时)。,总体均值的置信区间 ( 未知),1.假定条件 总体方差()未知 总体必须服从正态分布 使用 t 分布统计量,3. 总体均值 在1-置信水平下的置信区间为,总体均值的区间估计,解:已知N(,2),x=50, s=8, n=25, 1- = 0.95,t/2=2.0639。,我们可以95的概率保证总体均值在46.6953.30 之间,【例】从一个正态总体中抽取一个随机样本, n = 25 ,其均值x = 50 ,标准差 s = 8。 建立总体均值m 的95%的置信区间。,总体比例的置信区间,1.假定条件 两类结果

7、总体服从二项分布 可以由正态分布来近似 使用正态分布统计量,3. 总体比例 的置信区间为,总体比例的置信区间实例,我们可以95的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在63.6%76.4%之间,【例】某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了200人组成一个样本。在对其进行访问时,有140人说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。,根据均值区间估计公式可得样本容量n为,估计总体均值时样本容量的确定,样本容量n与总体方差2、允许误差、可靠性系数Z之间的关系为 与总体方差成正比 与

8、允许误差成反比 与可靠性系数成正比,其中:,样本容量的确定实例,解:已知2=1800000,=0.05, Z/2=1.96,=500,应抽取的样本容量为,【例】一家广告公想估计某类商店去年所花的平均广告费用有多少。经验表明,总体方差约为1800000元。如置信度取95%,并要使估计处在总体平均值附近500元的范围内,这家广告公司应抽多大的样本?,根据比例区间估计公式可得样本容量n为,估计总体比例时样本容量的确定,其中:,样本容量的确定实例,【例】一家市场调研公司想估计某地区有彩色电视机的家庭所占的比例。该公司希望对比例p的估计误差不超过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有

9、可利用的p估计值)。,应抽取的样本容量为,正态总体方差的区间估计,1. 估计一个总体的方差或标准差 2. 假设总体服从正态分布 3. 总体方差 2 的点估计量为S2,且,4. 总体方差在1-置信水平下的置信区间为,正态总体方差的区间估计实例,【例】对某种金属的10个样品组成的一个随机样本作抗拉强度试验。从实验数据算出的方差为4。试求2的95%的置信区间。,正态总体方差的区间估计计算结果,解:已知n10,s2 4,1-95% 2置信度为95%的置信区间为,从某学院男生中随机抽取30 名学生,测得身高(cm ) 分别为170 、175 、172 、168 、165 、178 、180 、176 、

10、177 、164、.,数据如下表,以95% 的置信度估计该学院男生的平均身高。,利用Excel计算置信区间,利用Excel计算必要样本数,例:某县进行农村经济情况调查,已知农户平均年收入标准差为30元,要求把握程度(置信度)为95.45%,抽样极限误差为5元,计算应抽取的样本户数?如下图所示。,“样本容量计算”工作表,必要样本容量计算,计算公式,建立工作表,样本比例为p, 样本容量为n,计算公式,区间估计总结,注:,区间估计必要样本容量n的确定,其中:,其中:,帮想节约调查费用的广告公司拿主意,某广告公司为了估计某地区收看某一新电视机目的居民人数所占比例,要设计一个简单随机样本的抽样方案。该公

11、司希望有90%的信心使所估计的比例只有2个百分点左右的误差。为了节约调查费用,样本将尽可能小,在这种情况下应该抽取多少样本?,案例一,总统选举的民意调查(背景),据美国竞选业专业杂志 Campaigning Reports统计历次美国总统竞选的花费: 2004年为6.93亿美元;2008年高达13亿美元。整个总统竞选过程中,候选人一般会花费10-15%的竞选经费在民意调查上。如何确定被调查的人数是首先要考虑的问题。,案例二,学生每天上网的时间的区间,一、某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间(单位:小时) ,得到下面数据。

12、要求:该校大学生平均上网时间的置信区间,置信概率为90% 上网时间 3.3, 4.4, 2.1, 4.7, 3.1, 2, 1.9, 1.4, 6.2, 5.4, 1.2, 1.2, 5.8, 2.6 ,5.1, 2.9, 2.3, 6.4, 4.3, 3.5, 4.1, 1.8,4.2 ,2.4, 5.4, 3.5, 3.6, 0.5, 4.5, 5.7, 0.8, 3.6 3.2, 2.3, 1.5, 2.5,案例三,汽车性能调查,调查消费者对上海地区某一个主要制造商所生产的汽车的性能的满意程度。许多人抱怨该车刚开始传动系统不佳为了更好地了解传动系统的问题,采用由上海一个修理企业所提供的实际传动系统的维修记录为样本。以下数据为50辆汽车传动系统出现故障时所行驶的实际里程的数据。求95%的置信区间,案例四,85092 32609 59465 77437 32534 64090 32464 59902 39323 89641 94219 116803 92857 63436 65605 85861 64342 61978 67998 59817 101769 95774 121352 69568 74276 66998 40001 72

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论