第3章 抽样分布与参数估计_第1页
第3章 抽样分布与参数估计_第2页
第3章 抽样分布与参数估计_第3页
第3章 抽样分布与参数估计_第4页
第3章 抽样分布与参数估计_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,.,3.1抽样分布3.2点估计3.3区间估计,.,3.1抽样分布,为什么要抽样?为了收集必要的资料,对所研究对象(总体)的全部元素逐一进行观测,往往不很现实。,抽样原因,元素多,搜集数据费时、费用大,不及时而使所得的数据无意义,总体庞大,难以对总体的全部元素进行研究,检查具有破坏性,炮弹、灯管、砖等,.,统计学基本概念,总体(全体)Population所有感兴趣的对象样本Sample总体的一部分总体参数Parameter关于总体的概括性度量统计量Statistic关于样本的概括性度量抽样从所研究的对象中随机取出一部分进行观察,由此获得有关总体的信息。,.,抽样分为概率抽样与非概率抽样其中概率抽样分为:纯随机抽样、等距抽样、分层抽样、整群抽样,.,常用的总体参数,总体平均数总体方差总体标准差总体比率(总体成数),.,样本平均数样本方差样本标准差样本比率(样本成数),.,样本统计量经常被用作估计总体参数。点估计就是运用样本数据值计算出一个样本统计量的值,将其作为总体参数的估计值。如用去估计问题是不同的样本提供不同的估计值样本越大,估计的性质越好,但成本也越高了解估计的性质有多好解决办法:以样本的抽样分布作为理论基础。,.,抽样分布,从一个总体中随机抽出容量相同的各种样本,从这些样本计算出的某统计量所有可能值的概率分布,称为这个统计量的抽样分布。从一个给定的总体中抽取(不论是否有放回)容量(或大小)为n的所有可能的样本,对于每一个样本,计算出某个统计量(如样本均值或标准差)的值,不同的样本得到的该统计量的值是不一样的,由此得到这个统计量的分布,称之为抽样分布。样本统计量是一个随机分布量。,.,设由四个同学组成的总体,样本总体N4。随机变量X表示某个学生的年龄X的所在取值为18,20,22,24。总体均值和总体方差各为多少?212.236总体概率分布?,.,所有样本容量为2的样本,.,.,.,总体分布与样本抽样分布的关系,.,.,.,.,样本均值的抽样分布,一个总体10,5,8,7,10,,.,有放回(withreplacement)抽样,.,一个样本统计量的概率分布被称为该统计量的抽样分布,.,.,.,.,.,中心极限定理的作用,建立起值与样本均值之间的数值关系.不论该总体服从何种分布,只要当样本容量足够大(),样本均值的分布都大致服从正态分布。,.,例:某高校在研究生入学体检后对所有结果进行统计分析,得出其中某一项指标的均值是7,标准差2.2。从这个总体中随机选取一个容量为31的样本。(1)计算样本均值大于7.5的概率,(2)计算样本均值小于7.2的概率,(3)计算样本均值在7.2和7.5之间的概率。,.,样本容量大于30,由中心极限定理可知,样本均值的分布近似均值为即,.,(1)(2)(3),.,例:在北京一居室的房租平均为每月1500元,房租的分布并不服从正态分布,随机抽取容量为50的样本,样本的标准差是200元,请问样本均值至少为1600元的概率是多少?,.,.,.,.,.,.,例:已知某高校女生比例为46%,现对全体学生做两次随机抽样,n=200和n=1000,求这两次抽样中女生的比例在50%以上的概率。,.,3.2点估计,.,3.2.1点估计的概念,点估计是以样本统计量作为相应总体参数的估计量例如:用样本均值直接作为总体均值的估计值点估计的优点能够提供总体参数的具体估计值,可以作为行动决策的数量依据点估计的不足任何点估计不是对就是错,并不能提供误差情况如何、误差程度有多大的信息,.,3.2.2点估计的优良性标准,无偏性设总体的参数为,其估计量为,如果即估计量的数学期望等于被估计的总体参数,我们称估计量是参数的无偏估计量样本平均数是总体平均数的无偏估计量无偏性是对估计量的一个常见而重要的要求,.,点估计的优良标准(续),一致性设是参数估计量,若对于任意的,当时依概率收敛于,则称为的一致估计量对任意有,有效性设和都是参数的无偏估计量,若对任意,且至少对于某个上式中的不等号成立,则称较有效,.,矩估计法,借助样本矩去估计总体的矩用样本的一阶原点矩来估计总体的均值用样本的二阶中心矩来估计总体的方差,.,例3.1矩法估计例题,设总体,为总体的样本,求,的矩法估计量。解:,.,例3.2灯泡平均寿命分析,设从某灯泡厂某天生产的灯泡中随机抽取10只灯泡,测得其寿命为(单位:小时)1050,1100,1080,1120,1200,1250,1040,1130,1300,1200。试用矩法估计该厂这天生产的灯泡的平均寿命及寿命分布的方差。解:,.,极大似然估计法,求极大似然估计的一般步骤写出似然函数对似然函数取对数,并整理求导数解似然方程,.,例3.4极大似然估计例题,设总体X服从N(,),是X的样本值,求,的极大似然估计解:似然方程为:,,S2的极大似然估计量分别为,,,,.,频次分析模块,AnalyzDescriptiveStatisticsFrequenciesStatistics,均值,中位数,众数,样本数据值总和,数据分布的斜度,数据分布的峰度,最大值与最小值之差,标准差,方差,均值标准差,最大值,最小值,计算四分点,按顺序分组,设置指定的百分点,.,频次分析模块(续),从100个样本中推断总体的净重均值为343.76g,方差为17.053,从100个样本中推断总体的净重均值为343.76g,方差为17.053,从100个样本中推断总体的净重均值为343.76g,方差为17.053,样本方差,样本均值,.,描述统计模块,AnalyzeDescriptiveStatisticsDescriptivesOptions,标准差,均值,方差,净重均值、方差估计值,结果同Statistics表,标准差,均值,方差,标准差,均值,净重均值、方差估计值,结果同Statistics表,方差,标准差,均值,标准差,均值,标准差,均值,方差,标准差,均值,.,3.3区间估计,.,3.3区间估计,.,.,用一个区间去估计未知参数,即把未知参数值估计在某两界限之间设是来自密度的样本对给定的,如能找到两个统计量及,使得是置信度,置信度也称为置信概率是置信度为的的置信区间称为显著性水平(SignificanceLevel)。,.,.,置信区间,区间示意图置信区间表达了区间估计的精确度,置信概率表达了区间估计的可靠性,它是区间估计的可靠概率;而显著性水平表达了区间估计的不可靠的概率可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度,.,.,3.3.1总体方差已知时,总体均值的估计,,为来自总体的样本样本均值服从数学期望为、方差为/n的正态分布,即当已知时,可得到1-置信度下,的置信区间为置信区间的宽度为:,.,.,例3.6零件直径问题,已知某零件的直径服从正态分布,从该批产品中随机抽取10件,测得平均直径为202.5mm,已知总体标准差=2.5mm,试建立该种零件平均直径的置信区间,给定置信度为0.95。解:已知,=202.5mm,n=10,=0.95,查标准正态分布表,得=1.96,所以在置信度下,的置信区间为即202.5-1.962.5/,202.5+1.962.5/,计算结果为:200.95,204.05,.,.,.,.,.,.,.,.,3.3区间估计,用一个区间去估计未知参数,即把未知参数值估计在某两界限之间设是来自密度的样本对给定的,如能找到两个统计量及,使得是置信度,置信度也称为置信概率是置信度为的的置信区间称为显著性水平(SignificanceLevel)。,.,置信区间,区间示意图置信区间表达了区间估计的精确度,置信概率表达了区间估计的可靠性,它是区间估计的可靠概率;而显著性水平表达了区间估计的不可靠的概率可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度,.,3.3.1总体方差已知时,总体均值的估计,,为来自总体的样本样本均值服从数学期望为、方差为/n的正态分布,即当已知时,可得到1-置信度下,的置信区间为置信区间的宽度为:,.,例3.6零件直径问题,已知某零件的直径服从正态分布,从该批产品中随机抽取10件,测得平均直径为202.5mm,已知总体标准差=2.5mm,试建立该种零件平均直径的置信区间,给定置信度为0.95。解:已知,=202.5mm,n=10,=0.95,查标准正态分布表,得=1.96,所以在置信度下,的置信区间为即202.5-1.962.5/,202.5+1.962.5/,计算结果为:200.95,204.05,.,3.3.2总体方差未知时,总体均值的估计,n30时通常用样本方差来估计,只需将中的用S近似代替即可n30时即1-置信度下,的置信区间为,.,例3.7大学生平均完成作业时间,某大学从该校学生中随机抽取100人,调查到他们平均每人每天完成作业的时间为120分钟,样本标准差为30分钟,试以95%的置信水平估计该大学平均每天完成作业时间。解:根据题意可知:=120,S=30,n=100且=0.95,=1.96故在95%的置信度下,的置信区间为即120-1.9630/10,120+1.9630/10,计算结果为:114.12,125.88,.,3.3.3总体方差的区间估计,由于当总体为正态分布时,其中所以在1-置信度下,的置信区间为,.,3.3.4总体比率的区间估计,总体比率总体比率:p=M/N设N为总体容量,M为具有某种特点(性质)的元素数样本比率样本比率:从N中抽取n个为样本,其中具有某种特点的元素数为X(X=0,1,n),.,3.3.4总体比率的区间估计,给定置信度为1-时,有总体比例p在1-置信水平下的置信区间为,(未知时),.,例3.9城市下岗女职工比例,某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。解:已知n=100,p65%,1-=95%,=1.96故该

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论