第四讲 估计与检验.ppt_第1页
第四讲 估计与检验.ppt_第2页
第四讲 估计与检验.ppt_第3页
第四讲 估计与检验.ppt_第4页
第四讲 估计与检验.ppt_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四讲 估计与统计检验,沈建荣 ,一、区间估计,总体均值区间估计,总体均值置信水平为100(1-)%的置信区间为:,注意: 1、估计成立的条件是:样本必须是随机、独立的; 2、使用t分布表时,要求总体必须是近似正态的,需对样本作正态性检验; 3、置信水平不是概率(置信区间是确定的而不是随机的),可以认为以置信水平(如95%)相信总体均值在执行区间内;或是说,置信水平这一计算方法可以使得置信区间以95%的概率覆盖总体均值。,大样本下:,方差未知: 或小样本下,例1,某小组随机抽样调查了250户家庭的年收入,样本均值为9.8万,样本标准差为4.8万。小组给出一个置信区间(9.2,10.4),但未给

2、出置信水平。 1、问该区间的置信水平?(试比较两种分布的情形) 2、小组给出解释:该地区家庭平均年收入为9.210.4的概率为95%,这种说法对吗? 3、若同时有10个小组在进行相同的独立调查,问9个或以上小组得出的95%置信区间都覆盖总体均值的概率是多少?提示:可以将每一个区间是否覆盖总体均值作为一次Bernoulli试验。令Y为覆盖总体均值的全金属区间数,显然YBin(10,0.95),单侧置信区间,总体均值100(1-)%的置信区间:,下限为:,上限为:,例2,1、同例1,问总体均值95%置信区间的下限? 当置信水平提高时,估计的可靠性将(提高 or 降低)?精确性将(提高 or 降低)

3、?,比例置信区间,若XBin(n,p),由中心极限定理,传统方法是以样本p代替总体p进行区间估计,最近的研究表明,Agresti Coull区间有改进,置信水平为100(1-)%的置信区间计算公式如下:,若下限小于0则用0代替,上限大于1则用1代替。,例3:,某企业从所购买的元件中随机抽检了150份,有5份不合格,估计不合格品率95%置信区间。(试用传统方法和Agresti Coull 方法分别计算比较),根据指定精度确定所需样本数,为获得总体平均100(1-)%的置信区间,且要求区间宽度不超过D时,则需从这个总体中抽取随机样本数为:,总体方差未知的两阶段法: 阶段1:从总体中抽取n1个先期样

4、本(如n1 =30),计算这个样本的方差S2; 阶段2:以S2替代总体未知方差计算所需样本数n,若nn1,再补抽 n n1 份样本。,另:请同学们自行计算确定总体比例所需样本数。,例4,例1中,若要求所获得总体均值99%置信区间的偏差为(+-)0.5万元,问至少要调查多少样本? 例3中,若要求所获得总体不合格品率99%置信区间的偏差为(+-)0.5%万元,问至少要抽取多少样本?,两个总体均值之差的置信区间,根据第三讲的知识,请同学们自行给出大样本情形下的计算公式。 小样本不能使用中心极限定理,可以使用t分布,计算公式:,例5,欲比较A、B两医院住院病人的住院天数。随机抽取A医院64个住院病历,

5、计算平均住院天数为6.54天,标准差为1.2;随机抽取B医院81个住院病历,计算平均住院天数为6.24天,标准差为0.96。则两个医院住院病人平均住院天数差的95%置信区间是多少?有人认为两个医院病人的住院时间没有差异,与上述数据矛盾吗?为什么?,例6,随机抽取A、B两地空气污染指数PSI,如下表所示,假设两地空气污染指数都服从正态分布,试估计两地PSI平均差95%置信区间。,例7,有文献给出一项对睡眠习惯的研究结果。在一个由87个成年人组成的样本中,每天躺在床上的平均时间为7.70小时(不管处于清醒状态还是睡眠状态),标准差为1.02小时,其中处于睡眠状态的平均时间为7.06小时,标准差为1

6、.11小时。所以躺在床上的平均清醒时间为7.70-7.06=0.64小时。有可能建立平均清醒时间95%的置信区间吗?如果行,是多少?如不行,为什么?,例8:数据对的置信区间,某轮胎制造商希望比较新、旧材料制成的轮胎的磨损情况。从每种轮胎中各选一个随机安装在10辆前驱汽车左、右前轮上。4万公里后测量磨损情况如下(单位:mm) :,问新、旧材料轮胎磨损差值95%的置信区间。,两个总体比例之差的置信区间,若XBin(nx,px),Y Bin(ny,py),则 px- py 置信水平为100(1-)%的置信区间的计算方法为:,传统方法:,改进方法:,例9,重复交易次数是顾客满意度的一个很好的度量。某企

7、业随机抽取了今年的120个交易账户,有56个订购次数在2次以上。从去年抽取80个样本,有30个订购次数在2次以上。试计算这两年中订购次数在2次以上顾客的比例之差的置信水平为95%的置信区间。,二、假设检验,问题1,某校新入学学生被随机分配进入高一两个班,人数都是70人,化学课分别由2个老师任教。期末考试的平均分分别是70.5和72.4分,标准差都为5.4分。其中第一个班有一个学生想找第2个班的老师补课,他的选择有道理吗?,分析,每一次考试都包含很多随机因素; 老师1可以认为自己的教学水平(以学生考试平均分来测量)为72.4分; 老师1可以认为老师2的教学水平其实和自己是一样的,这次考试的结果是

8、因为自己班级发挥不好而对方班级发挥的好。 对于这种具有随机性的结果的证明只能寻求统计意义上的检验。,统计检验,检验1:老师1的教学水平达不到72.4。 零假设(null hypothesis,也称原假设)H0: 172.4,备择假设(alternate hypothesis) H1: 1 72.4。 检验2:老师1与老师2的教学水平有差异。 零假设H0: 1 - 2 = 0,备择假设H1: 1 2 0。,假设检验的概念,假设:对总体参数包括总体均值、比例、方差等的一种看法。 假设检验:事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立。通常依据统计上的小概率不显著原理而

9、对0假设作反证。 0假设:待检验的假设,表示为 H0 备择假设:与0假设对立的假设表示为 H1,假设检验思想示例图,因此我们拒绝假设 = 50,样本均值,抽样分布,P- 值(P-Value),首先我们假设0假设成立,P-值是观测到的随机样本与0假设不一致的强度的度量。计算步骤(以均值检验为例): 在0假设H0为真的条件下,求样本均值 的分布, 这个分布称为 的0分布; 在0假设为真的条件下,计算观察值与H0不一致(大于、小于或不等于)的概率即为P-值。 当P-值充分小(如 ),我们就放弃H0,而认为H1成立。判断阈值 称为显著水平(significant level),当P ,此时我们称在显著

10、水平下拒绝原假设。,总体均值统计检验,对总体和样本的假设同前。对形如H0: 0 ,或H0: 0,或 H0: =0 的0假设进行检验,检验统计量为:,P-值就是对应分布密度曲线下某一区域的面积,分别对应的是单尾检验(右侧面积),单尾检验(左侧面积),双尾检验(双侧面积)。,大样本下:,方差未知: 或小样本下,总体比例的统计检验,对总体和样本的假设同前。对形如H0:p p0 ,或H0:p p0 ,或H0:p = p0 的0假设进行检验,若np0和n(1-p0)都大于10,则有检验统计量为:,P-值计算同上。,例10,某有线电视服务商在免费提供了一个月的某付费频道后进行了调查。他们随机抽取了400个

11、家庭组成样本,其中25个家庭愿意付费续订该频道。该公司能够得出结论认为该地区有超过5%的家庭愿意付费观看该频道吗?,两个总体均值差的检验,对总体和样本的假设同前。对形如H0: X -Y D0 ,或H0:X -Y D0 ,或 H0:X -Y = D0 的0假设进行检验,检验统计量为:,大样本下:,方差未知: 或小样本下,或当两总体方差近似相等时,可以采用合并样本方差的方法:,续,P-值计算同上。,两个总体比例差的检验,设XBin(nx,px)和YBin(ny,py)相互独立且nx和ny都很大。对形如H0: pX - pY 0,或H0: pX - pY 0,或 H0: pX - pY = 0 的0

12、假设进行检验,检验统计量为:,P-值计算同上。,例11,为确定某燃油添加剂是否具有节油的功能,某司机记录了自己的油耗。6箱油的平均油耗为7.4升/百公里,标准差为0.63;使用添加剂后的4箱油平均油耗为7.0升/百公里,标准差为0.75。添加剂价格为200元,问是否有必要使用该添加剂?此外,该实验是否存在瑕疵?,例12,某课题组调查企业项目风险管理的方法。 45个建筑企业样本中有17家企业采用了风险转移的方法,38个IT类企业中有16家企业采用了风险转移的方法。你能认为IT企业风险转移比例高于建筑企业吗?,关于P-值,P-值不能证明0假设的真实性;(科学方法本质上是否定虚假) 例:某建筑工程师

13、要为桥墩混凝土选定水泥,其抗压强度必须大于0 ,在对某一品牌水泥进行多次试验后测度平均值和方差,然后进行假设检验。若他采用的假设检验为: H0: 0, H1: 0 ,计算得到P-值为0.168,他能否采用这一品牌水泥? P-值显著也不一定有现实的意义。 例:调查2 X 200个某一学校两个专业学生毕业一年后平均月工资分别为1587元和1590元,方差都为100,这两个专业的毕业生工资差异显著吗?这种差异有实际意义吗?,关于显著性水平a的值,在固定的a水平下所作判断可能导致两类错误:,犯第I类错误的概率不会大于a。 通常我们选取a足够小,但我们也希望确定第II类错误是可控的,于是定义功效(Pow

14、er)如下: 功效 = 1 - P(第II类错误) 功效需在采样之前确定。,多项分布与c2检验,频数分析 以下资料是从某工厂搜集而来的缺勤数。在0.05 的显著水平之下,试判定一周内每天的缺勤率是否有差异。,检验,H0: p1= p2= p5= 1/5, 当各单元格的期望次数或理论次数不小于5时,在0假设下有统计量,其中:Oi为观察值,Ei为期望值,列联表(contingency table),用于检验随机的列属性(随机变量)对选定的(或随机的)行变量是否表现为一致分布(或独立、相关)。,检验,H0: 对每一列 j 有,p1J= p2J= =pIJ,例12,男性和女性的意外发生地点的分布是否有一致性。警方提供的一个150 件意外的样本如下表。在0.05 的显著水平之下

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论