Session11样本与样本分布.ppt_第1页
Session11样本与样本分布.ppt_第2页
Session11样本与样本分布.ppt_第3页
Session11样本与样本分布.ppt_第4页
Session11样本与样本分布.ppt_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Data, Model and Decisions 数据、模型与决策,Session 11 Sampling and Sampling Distribution 样本与样本分布,The Sampling Problem of EAI. 电子联合公司的抽样问题,实际应用,电子联合公司的人力资源部要拟定一份公司2500名经理的简介,需要介绍经理们的平均年薪和已完成公司培训计划的经理的比例,我们所关心的问题是如何从经理 样本中而不是从所有2500名经理 总体中得到我们所需要的信息,Statistical Inference 统计推断,统计推断的目的是要从样本所包含的信息推断出总体的信息 总体(population)是研究中所有感兴趣个体的集合 样本(sample)是总体的一个子集 样本结果只是提供了总体特征价值的一个估计 参数(parameter)是总体的一个数量特征 应用合理的抽样方法样本结果能够提供总体特征的一个很好的估计,Simple Random Sampling 简单随机抽样,有限总体(Finite Population) 从容量为N的有限总体总进行抽样,如果容量为n的每个可能样本被抽到的可能性相等,称容量为n的样本为简单随机样本. 在抽下一个元素前将抽到的元素放回去,这种形式的抽样称为放回抽样(Sampling with Replacement). 在抽下一个元素前将抽到的元素不放回去抽样称为不放回抽样. 计算机产生的随机数是常用的自动取样过程,无限总体(Infinite Population) 无限总体的简单随机抽样满足条件: 每个个体都来自同一个总体. 每个个体的抽取相互独立. 如果所研究的总体是一正在进行的过程,统计总体的每个个体不可能,则通常认为总体是无限的. 对于无限总体不能进行标号,抽样过程不能用随机数.,Simple Random Sampling 简单随机抽样,Point Estimation 点估计,为了估计总体的某个参数值,计算对应样本的特征来进行估计 我们用 来点估计总体均值 . s 来点估计总体标准差 . 来点估计总体比例 p.,Example: Harvard University 哈佛大学,哈佛大学每年收到7,000个优秀学生的入学申请,申请表中包含了大量申请人的信息。包括个人学术能力测试(SAT)成绩和是否是本州居民。 入学主管需要知道下面一些信息: 平均SAT成绩 本州居民比例,实际举例,Alternative #1: 对7000个样本的总体调查 SAT 成绩 总体均值 总体标准差 本州申请人 总体比例,Example: Harvard University 哈佛大学,实际举例,Alternative #2: 选取50个样本进行统计(随机数) 4-Digit Applicant Random Number Included in Sample 1744 No. 1744 5436 No. 5436 3865 No. 3865 4790 No. 4790 4835 No. 4835 9902 Number exceeds 7,000 8190 Number exceeds 7,000 6836 No. 6836 etc. etc.,Example: Harvard University 哈佛大学,实际举例,简单随机抽样的数据 No. Applicant SAT Score In-State 1 Bonnie Reight 1025 Yes 2 Willie Neilson 950 Yes 3 Fannie Lennox 1090 No 4 Derek Clapton 1120 Yes 5 Winona Driver 1015 Yes . . . . . . . . 50 Kevin Costmore 965 No Total 49,850 34 Yes,Example: Harvard University 哈佛大学,实际举例,点估计: 的点估计 的点估计 P 的点估计,Example: Harvard University 哈佛大学,实际举例,Sampling Distribution of 的抽样分布,的抽样分布是样本均值所有可能取值的概率分布,E (x ) = 这里 = 总体均值,总体均值=?,总体中抽取样本,计算样本均值,用样本均值推断 总体均值,的标准差 有限总体 无限总体 如果n/N .05 ,有限样本可看做无限总体. 是有限总体矫正因子. 是指均值标准差,Sampling Distribution of 的抽样分布,Central Limit Theorem中心极限定理,当样本容量很大时,样本均值的抽样分布可以近似看成正态分布,SAT成绩的抽样分布,Example: Harvard University 哈佛大学,实际举例,Sampling Distribution of 的抽样分布,的抽样分布是样本比例所有可能取值的概率分布,这里 p = 总体均值,总体比例P=?,总体中抽取样本,计算样本比例,用样本比例推断 总体比例,比例的标准差 有限样本 无限样本,Sampling Distribution of 的抽样分布,本州申请人比例 的样本分布,Example: Harvard University 哈佛大学,实际举例,Properties of Point Estimators 点估计的特征,无偏性(Unbiasedness) 如果样本统计值等于总体参数值 有限性(Efficiency) 点估计有最小的标准差 一致性(Consistency) 当样本增加时,点估计越来越接近总体参数,Unbiasedness 无偏性,P(X),Efficiency有效性,Consistency一致性,Other Sampling Methods 其他抽样方法,Stratified Random Sampling 分层随机抽样 Cluster Sampling 整群抽样 Systematic Sampling 系统抽样 Convenience Sampling 方便抽样 Judgment Sampling 判断抽样,Stratified Random Sampling 分层随机抽样,Cluster Sampling 整群抽样,Systematic Sampling系统抽样,在总体容量较大的情况下,抽取简单随机样本很费时间,因为首先要寻找随机数,代替简单随机抽样的一种方法就是系统抽样 从5000个元素的总体中抽取50个元素作为一个样本,可在总体的每100个元素中抽取一个元素 其他的样本元素确定:从第1个被抽取的元素开始,在总体目录上每隔100个元素抽取一个作为样本元素 由于抽取第1个元素是随机的,所以我们一般假定系统抽样也具有简单随机抽样的特征,Convenience Sampling 方便抽样,便抽样是一种非概率抽样技术 优点是样本的抽取和数据收集相对较容易,方便抽样的效果可能很好,也可能不好。 有时候,研究人员设计出一些适应于方便抽样的统计方法,他们认为可以将方便样本看成随机样本。 在用从方便样本中所得到的结果对总体进行推断时要格外小心,Judgment Sampling 判断抽样,另一种非概率抽样技术 先由对所研究题目较有权威的人员从总体中抽取他或她感到最能代表总体的个体或元素进入样本 例如,某记者可以抽取他认为能够代表所有参议员观点的两名或三名参议员进行调查 样本结果的质量却要依赖于拍取样本人员的判断 在用判断样本所得出的结论对总体进行推断时仍然要小心谨慎。,Session Summary 本讲小结,小结,介绍了简单随机抽样和抽样分布的概念,说明了如何抽取一个简单随机样本,如何根据样本中所收集到的数据建立总体参数的点估计 和 估计量都是随机变量,这些随机变量的概率分布称为抽样分布 还描述了样本均值和样本比例的抽样分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论