版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计推断在统计方法中的地位,假设检验,统计方法,描述统计,推断统计,统计推断的目的在于认识未知的总体参数及其分布特征。统计推断包括参数估计和假设检验,即通过样本统计量来估计和检验总体的参数。,第四章统计推断,第一节参数估计第二节假设检验本章小结,参数估计的过程,总体参数:均值、比率、方差等,样本统计量:样本均值、方差、比率,第一节参数估计,重点和难点:区间估计单个正态总体参数(总体均值、总体方差),第一节参数估计,一、估计量与估计值估计量用来推断总体参数(参数统一用表示,统计量统一用表示估计值对于具体的样本值,估计量的取值,同一个参数可以有多个不同的估计量。参数是唯一的,但估计量(统计量)是随
2、机变量,取值是不确定的。参数估计的方法,估计方法,点估计,区间估计,二、点估计用样本估计量的值直接作为总体参数的估计值,不考虑任何抽样误差因素。,例如,在全部产品中,抽取100件进行仔细检查,得到平均重量克,合格率,我们直接推断全部产品的平均重量克,合格率,没有给出估计值接近总体参数程度的信息,点估计的方法主要有矩估计法和最大似然估计法(极大似然估计法),最大似然估计法是由费舍尔(Fisher)引进最大似然思想:有两个射手,一人的命中率为0.9,另一人的命中率为0.1,现在他们中的一个向目标射击了一发,结果命中了,估计是谁射击的?(估计命中率高的人所为)一个试验有若干个可能结果A1,A2,,如
3、果一次试验中A1发生了,那么一般来说作出的估计应该是有利于A1的出现,即使A1出现的概率最大。,最大似然估计法的基本方法:1、若总体X是离散型随机变量,设其概率函数为,其中是未知参数且分布形式已知,是可能取值的范围。又设是来自X的一个样本,则的联合概率函数应为。若取得样本观测值为,则有样本观测值的概率为,(1),显然是的函数,称为样本的似然函数。,为参数的估计值,即求得使,此时所得到的与样本值有关,记为,称为参数的最大似然估计值,统计量称为参数的最大似然估计量。,(2),2、若总体X是连续型随机变量,其概率密度函数为,的分布形式已知,为未知参数,是的可能取值范围。设是来自X的一个样本,则此样本
4、的联合密度函数为。又设是样本的观测值,则随机点落在点的邻域内的概率近似为其值随的取值而变化,易见它是的函数。,(3),按照最大似然估计法,应取参数的估计值使函数式(3)取到最大值,又因与无关,故只需考虑函数的最大值,此处也称为样本的似然函数。若则称为的最大似然估计值,称为的最大似然估计量。,(4),(5),一般情形下,和关于可微,且和在同一处取得极值,且是单调函数,因此,的最大似然估计则是使成立,为计算方便,通常采用微积分中求极值的一般方法,即从方程求得,式(7)称为对数似然方程,(6),(7),求最大似然估计量的步骤:,最大似然估计法也适用于分布中含有多个未知参数的情况.此时只需令,对数似然
5、方程组,对数似然方程,(8),例2总体X的概率分布为,解,利用总体X的如下样本值3,1,3,0,3,1,2,3求的最大似然估计,(9),(10),无偏性:估计量抽样分布的数学期望等于被估计的总体参数,即,P(),B,A,三、估计量的评选标准,无偏,有偏,简单随机样本的样本均值是总体期望的无偏估计.,简单随机样本的样本方差是总体方差的无偏估计,有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效,A,B,的抽样分布,的抽样分布,P(),一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数,A,B,较小的样本容量,较大的样本容量,P(),四、区间估计,在点估计的基础上,
6、根据样本统计量的抽样分布对样本统计量与总体参数的接近程度确定的一个概率度量(置信度),给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的。抽样分布是区间估计的理论基础。,(一)基本概念,由样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间,置信区间,其中,是总体参数未在区间内的比率,也称之为显著水平常用的置信水平值有99%,95%,90%相应的为0.01,0.05,0.10,置信水平,在同样的方法得到的所有置信区间中,包含总体参数真值的次数所占的比率
7、称之为置信水平,表示为,即有100(1-)%的区间包含总体参数真值。,比如,某班级平均分数在7585之间,置信水平是95%,样本统计量(点估计),置信区间,置信下限,置信上限,置信水平=,对置信区间的理解,有以下几点需要注意:(1)如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该种方法构造的区间称为置信水平为95%的置信区间。(2)总体参数的真值是固定的、未知的,而用样本构造的区间则是不固定的。(3)在实际问题中,进行估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平下的置信区间。置信区间是带有置信概率的取值区间。,置
8、信区间与置信水平,样本均值的抽样分布,100(1-)%区间包含了100%的区间未包含,1a,a/2,a/2,(二)定义设总体X的分布函数F(x;)含有未知参数,(是的可能取值范围),对于给定值(01),若由来自X的样本X1,X2,Xn所确定的两个统计量,对于任意满足,(11),则称随机区间为的置信度为1的置信区间,和分别称为置信度为1的双侧置信区间的置信下限和置信上限。,注:F(x;)也可换成概率密度函数或分布律。,(三)区间估计的一般步骤(共3步),(1)构造一个样本的函数,它包含待估未知参数,而不含其他未知参数,并且W的分布已知且不依赖于任何未知参数;,(2)对于给定的置信度1-,定出两个
9、常数,使;,(3)若能从得到等价的不等式,其中都是统计量,则有那么就是的一个置信度为1-的置信区间,(12),(13),(四)单个正态总体参数的区间估计设为总体的样本,分别是样本均值和样本方差,设给定置信度1-。1.均值的置信区间,(1)已知,求的置信区间,对给定的,查附表1得临界值使得即,(13),(14),将上式括号内不等式转化为等价形式,此时有,所以,的置信度为1的置信区间为,/2,/2,1-,(15),(16),(17),(2)未知,求的置信区间,并且,右边的分布不依赖任何未知参数,对给定的,查附表2得临界值使得,即,将上式括号内不等式转化为等价形式,(18),(19),则有,所以,m
10、的1-a置信区间为,1-,(20),(21),总体正态?,n30?,2已知?,否,是,是,否,否,是,实际中总体方差总是未知的,因而这是应用最多的公式。在大样本时t值可以用z值来近似。,根据中心极限定理得到的近似结果。未知时用s来估计。,例题:设在正常条件下,某机床加工的小孔的孔径X(单位:厘米)服从分布。长期积累资料表明。今从加工的小孔中,测得10个孔径的平均值为1.416。试求的置信区间(置信度为0.95)。,解:,从附表1中查出,,故置信上下限为,所以,置信区间为(1.386,1.446),【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建
11、立该批灯泡平均使用寿命95%的置信区间,解:已知N(,2),n=16,1-=95%,t/2(n-1)=t0.025(15)=2.131根据样本数据计算得:,总体均值在95%置信水平下的置信区间为,该种灯泡平均使用寿命的置信区间为1476.8小时1503.2小时,2、方差的置信区间,因是的无偏估计量,由,并且上式右端的分布不依赖于任何未知参数,对给定的,查附表3得临界值使得,即,(22),(23),s2的置信度为1的置信区间为,注意:在密度函数不对称时,如分布和F分布,习惯上仍是取对称的分位点(概率对称)来确定置信区间。,(24),【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品
12、中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间。,解:已知n25,1-95%,根据样本数据计算得s2=93.212置信度为95%的置信区间为,该企业生产的食品总体重量标准差的的置信区间为7.54g13.43g,思考题:1、设总体X的概率密度为其中参数未知,是来自总体X的一个简单随机样本,记N为样本值中小于1的个数,求参数的最大似然估计。,2、设某种清漆的9个样品,其干燥时间(以h计)分别为6.0,5.7,5.8,6.5,7.0,6.3,5.6,6.1,5.0,又假设干燥时间总体服从正态分布N(,2),在以下条件下,试
13、求的置信度为0.95的置信区间:(1)若由以往经验知;(2)若未知。,3、一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。,4、顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与许多因素有关,比如,银行的业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在3个业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短,银
14、行各随机抽取的10名顾客,他们在办理业务时所等待的时间(单位:min)如下:,已知等待时间服从正态分布,要求:(1)构建第一种排队方式等待时间标准差的95%的置信区间。(2)构建第二种排队方式等待时间标准差的95%的置信区间。(3)根据(1)和(2)的结果,你认为哪种排队方式更好?,第二节假设检验,假设检验的过程,一、假设的陈述假设:对总体参数的具体数值所作的陈述。假设检验:先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。假设检验的过程:逻辑上运用反证法,统计上依据小概率原理。,原假设与备择假设原假设研究者想收集证据予以反对的假设,又称“0假设”总是有符号,或
15、表示为H0H0:=某一数值指定为符号=,或例如,H0:10cm,备择假设研究者想收集证据予以支持的假设,也称“研究假设”。总是有符号,或表示为H1H1:某一数值,或某一数值例如,H1:24,原假设和备择假设是一个完备事件组,成对出现,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设等号“=”总是放在原假设上因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),最常用的有三种情况:双侧检验、左侧检验和右侧检验。检验以“假定零假设为真”开始,如果得到矛盾说明备择假设正确。,二、两类错误与显著性水平两类错误,显著性水平两类错误不
16、可避免;要减小其中的一种错误,通常只能通过增加另一种错误的方法做到。允许犯第一类错误的概率a称为显著性水平。通常a取为0.01,0.05,0.1。根据a可以确定检验统计量的临界值,并根据统计量的样本观测值和临界值得出检验结论。,三、检验统计量与拒绝域检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设(拒绝或不能拒绝零假设)作出决策的某个样本统计量。拒绝域:检验统计量取值的集合,当根据样本得到的检验统计量的值属于该集合时,拒绝零假设。不能拒绝零假设的检验统计量取值的集合称为接受域;划分拒绝域和接受域的数值称为临界值。,0,临界值,临界值,a/2,a/2,样本统计量,拒绝H0,拒绝H
17、0,抽样分布,1-,置信水平,(双侧检验),(左侧检验),(右侧检验),假设检验步骤的总结根据实际问题的要求,陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0,四、单个总体参数的假设检验,z检验(单侧和双侧),t检验(单侧和双侧),2检验(单侧和双侧),均值,一个总体,方差,总体均值的检验,均值检验中检验统计量的选择,总体正态?,n30?,2已知?,否,是,是,否,否,是,实际中总体方差总是未知的,因
18、而这是应用最多的公式。大样本时t值可以用z值来近似。,根据中心极限定理得到的近似结果。未知时用s来估计。,增大n;数学变换等。,均值的双边检验问题双侧检验和单侧检验中决策规则的确定方法有一定差异,下面我们通过几个例子加以说明。例1:某厂生产的铁丝抗拉力服从正态分布,其平均抗拉力为570kg,标准差为8kg。由于更换原材料,标准差不会变,但不知其抗拉力是否不变,从中抽取10个样品,得平均抗拉力575kg,能否认为平均抗拉力无显著变化?(=0.05),1、提出零假设和备择假设2、选择检验统计量:根据题意(2已知)3、检验统计量的观测值4、显著性水平等于0.05。,决策规则:|Zobs|Z/2时拒绝
19、零假设,否则不能拒绝零假设。本例中统计量的观测值等于1.976,因此结论是拒绝零假设,认为平均抗拉力有显著变化。,统计量的观测值等于1.976,右侧检验问题例2:平均说来,一个有丈夫和两个孩子的家庭主妇每周用于与家庭有关活动的时间不超过55h。抽取8个家庭主妇的每周工作时间作为样本,得到数据:58,52,64,63,59,62,62,55。有妇联组织认为每周平均工作时间超过55小时,你的结论是什么?(假设总体为正态分布),解:根据题意(2未知),观测到的统计量的值等于,0,t,Z,t,拒绝域,接受域,1-,置信水平,统计量的观测值等于2.94,决策规则:tobst时拒绝零假设,否则不能拒绝零假设。本例中统计量的观测值等于2.94,拒绝零假设。,左侧检验问题例3:一家公司付给生产一线雇员的平均工资是每小时20.0元。公司最近准备选一个新的城市建子公司,备选的城市有几个,能获得每小时工资低于20.0元的劳动力是公司选择城市的主要因素。从备选的某城市抽取20名工人,样本数据的结果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 实行村干部请假制度
- 检测站外检安全制度
- 机关办公室会议管理制度
- 2026年河北沧州肃宁职教中心公开招聘代课教师1名笔试备考题库及答案解析
- 2026重庆医科大学博士后招聘笔试备考题库及答案解析
- 2026广东佛山市三水产业发展集团有限公司公开招聘3人笔试备考试题及答案解析
- 2026稻城亚培人力资源服务有限公司招聘亚丁景区临床医生7人(四川)笔试模拟试题及答案解析
- 2026江西赣州市于都县招聘城市社区工作者(专职网格员)26人笔试备考题库及答案解析
- 上海建工集团2026届春季校园招聘笔试备考试题及答案解析
- 2025-2026年(春季)江盐集团(晶昊盐化)校园招聘4人笔试备考试题及答案解析
- 2026春人教版(新教材)小学美术二年级下册《设计小名师》教学设计
- 国新控股(雄安)有限公司相关岗位招聘11人笔试参考题库及答案解析
- 2026小学教师资格证考试《综合素质》能力测试试题含答案
- (2026版)子宫颈上皮内瘤变2级(CIN2)管理中国专家共识解读课件
- 2026年Q3新媒体热点营销:开学季内容策划与用户触达
- 【模板】洁净厂房和设施验证报告
- 国家糖尿病基层中医防治管理指南(2025版)
- 北京协和医学院攻读医学科学(理学)硕士学位研究生培养方案
- 船舶绿色制造技术
- 2026年安徽林业职业技术学院单招(计算机)考试参考题库附答案
- 安全环境职业健康法律法规文件清单(2025年12月版)
评论
0/150
提交评论