第三讲抽样分布和估计(PPT 34)_第1页
第三讲抽样分布和估计(PPT 34)_第2页
第三讲抽样分布和估计(PPT 34)_第3页
第三讲抽样分布和估计(PPT 34)_第4页
第三讲抽样分布和估计(PPT 34)_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第三讲,抽样分布和估计,2,概率论与统计学之间的关系,一个概率论的问题:假定有一个大盒子中有 10,000个球,分布如下: 70%的黑球和 30%的白球 随机抽取100个球,得到60个黑球和40个白球的概率是多少? - 给定一个总体(盒子中的所有小球)的已知特征(70% 和30%),研究一个试验(抽取小球)的可能的结果 (例如 60-40) 。,3,一个统计学的问题: 假定一个大盒子中有 10,000个小球(黑和白)。随机抽取100个小球,发现其中有60个黑球和40个白球。那么黑球在盒子中所占的比例是多少?- 观察到一个试验(抽取小球)的结果 (60-40), 推断出这个总体(盒子中的所有小球)的特征(比例),4,总体样本理论统计推断采用一个(有代表性的)子总体(样本)来对总体的某些特征进行科学的推断。,5,总体,扑克筹码总体, 中国所有MBA学生的身高总体, 深圳所有居民的收入总体, 金融资产收益总体可以认为被研究的总体包含了一个非常大的(或无限的)数量的元素,这些元素以一定的方式分布。,6,样本,从盒子中随机抽取100个扑克筹码 从中国随机抽取的200个MBA学生的身高 随机抽取的1000个深圳居民的收入 观察到的金融资产的收益样本必须是总体的一个具有真实代表性的子集。只有依靠这样的样本,我们才能得出科学的(符合统计学的)结论。,7,例:EAI的抽样问题 (p.185),人事主管要制定一项公司2500名管理人员的简报。 内容包括平均年薪、已完成培训项目的管理人员所占比例。 如果已有全部2500人的信息 如果没有,8,几个问题,如何抽样? 样本和总体有什么样的关系? 如何由样本估计出平均年薪及完成培训的比例?估计的误差有多大? 某人声称该公司管理人员平均年薪为53000元,你是否同意这个说法? 该公司管理人员的年薪有什么样的分布?(是正态分布吗?),9,统计推断的基本概念,总体:有限总体、无限总体; 样本; 统计推断的任务:通过样本来了解总体。 为什么需要抽样:1) 总体无法得到;2) 时间成本不允许;3) 实验具有破坏性。,参数:总体的特征例:P(正面), P(不合格品)深圳居民的平均收入统计量:从样本中计算出的任何量例:在100次抛掷硬币中得到正面的比例在随机抽取的1000枚芯片中不合格品的比例随机抽取的1000个深圳居民的平均收入 估计量:用来估计参数的统计量,11,统计推断的内容之一,估计参数 点估计和区间估计管理人员年薪,12,统计推断内容之二,假设检验:是否可以选用这个模型? 例子:是否可以使用模型N(53000,16062)来刻画管理人员的年薪? 思想:如果该模型是好的,那么 和53000相差很多的可能性不能太大。,13,简单随机抽样,有限总体的简单随机抽样:等概率抽样;有放回抽样:独立性无放回抽样:非独立性 抽样方法: 利用 Excel,14,无限总体的简单随机抽样:独立性; 例子:某快餐店11:3013:00午饭时间顾客从点餐到拿到食品的时间。,15,样本和总体分布,例子:筹码 一个箱子中有10000个筹码,其中50%为5元, 30%为10元, 10%为15元, 10%为30元。,y P(y)5 .510 .315 .130 .1,16,从中抽一个容量为30的样本:,19,抽样分布,样本不同, 值也不同。那么 取不同值的可能性分别是什么?的概率分布称作它的抽样分布。 抽样分布在统计推断中的中心地位。 抽样分布取决于总体的分布(模型)以及抽样的方式。抽样方式总体分布= 抽样分布,20,样本均值的抽样分布 (无限总体),如果总体服从 , 那么简单随机样本的均值服从正态分布如果样本容量n非常大,而且总体的期望是,方差是2+,那么简单随机样本的均值 近似服从正态分布 (中心极限定理),21,样本比率的抽样分布 (无限总体),小样本情况x服从二项分布B(n,p).大样本情况,按照中心极限定理,近似地,22,正态分布的图形,23,一个例子,一种电器元件设计的服务寿命为3000小时,标准差为800小时。一名顾客买了49个元件。这49个元件的平均寿命至少为2750小时的概率为多大?至少为3000小时呢?,24,样本方差的抽样分布,如果 是来自正态总体 的一个随机样本,定义样本方差为:,25,认识卡方分布,26,方差未知时样本均值的抽样分布,正态总体,2未知,使用样本方差s2来替代2,则样本均值满足:n30时,可以用标准正态分布近似。,27,正态分布和t 分布的比较,28,估计的误差,不能以个别估计值作为评价准则; 估计的误差:,29,对估计量的评价,无偏性:偏差是零; 有效性:方差最小; 一致性:样本容量增加会降低估计误差。样本均值(比率)是对总体均值(比率)的一个无偏的、有效的、一致的估计量。,30,Estimate Population,Parameter.,with Sample,Statistic,Mean,Proportion,p,Variance,s,2,Population Parameters Estimated,2,Difference, - ,1,2,x - x,1,2,_,_,_,31,联合食品公司的案例,针对“联合食品公司”的案例(P.44 案例2-1),我们假设调查的100个客户组成一个简单随机样本。尝试回答下面的问题: 1)所有客户一次购买金额的平均值是多少?2)所有使用信用卡的客户一次购买金额的平均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论