统计学贾俊平第8章 假设检验.ppt_第1页
统计学贾俊平第8章 假设检验.ppt_第2页
统计学贾俊平第8章 假设检验.ppt_第3页
统计学贾俊平第8章 假设检验.ppt_第4页
统计学贾俊平第8章 假设检验.ppt_第5页
已阅读5页,还剩136页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第8章假设检验,8.1假设检验的问题8.2单个总体的假设检验8.3两个总体的假设检验8.4假设检验的进一步讨论,2,需要无罪证明的证明,引例,引例,引例1:再谈女士品茶在实验中,那位女士被奉上一连串的已经调制好的茶,其中,有的是先加茶有的先加奶,各占一半情形一:如果只给那位女士一杯茶,那么即使她没有区分能力,她也有50%的机会猜对。如果给两杯茶,她仍可能猜对。事实上,如果她知道两杯茶分别以不同的方式调制,她可能一下子全部猜对(或全部猜错)情形二:这位女士能做出区分,她仍然有猜错的可能。或者是其中的一杯与奶没有充分地混合,或者是泡制时茶水不够热。即便这位女士能做出区分,也很有可能是奉上了10杯茶,她却只是猜对了其中的9杯,引例,引例2:维生素真相(见BBC视频)2007年2月28日出版的国际权威医学杂志美国医学会杂志发表了一项由多国研究人员共同完成的研究。这项研究显示,服用维生素E死亡率增加4%,服用茁胡萝卜素死亡率增加7%,服用维生素A死亡率增加16%,没有证据表明维生素C能延年益寿,5,8.1假设检验的一般问题,假设检验的基本思想假设的陈述两类错误与显著性水平检验统计量与拒绝域检验中的P值,假设检验的基本思想,什么是假设(hypothesis)?对总体参数的具体数值所作的陈述总体参数包括总体均值、比率、方差等分析之前必须陈述,我认为这种新药的疗效比原有的药物更有效!,假设检验的基本思想,假设检验(hypothesistesting)先给予总体未知参数一个假设值,再利用样本或实验结果来推断此假设的可信度。逻辑上采用反证法,依据统计上的小概率原理概率证伪,假设检验的基本思想,小概率原理在一次试验中,一个几乎不可能发生称为小概率事件在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设小概率的大小一般由研究者事先确定,假设检验的基本思想,IdentifythePopulation,Assumethe,population,平均GPA(学分绩点)is3.5,(),REJECT,TakeaSample,NullHypothesis,No,notlikely!,假设检验的基本思想,=3.5,不太可能得到这个样本均值.,.如果事实上,这正是总体的均值.,.因此我们拒绝原假设=3.5.,的抽样分布,2.4,如果H0为真,假设的陈述,原假设和备择假设原假设?(nullhypothesis)稻草人待检验的假设,又称“0假设”研究者想收集证据予以反对的假设总是有等号,或表示为H0例如,H0:某特定值若为不等式(或)也可写为=例H0:3.5,假设的陈述,备择假设(alternativehypothesis)与原假设对立的假设,也称“研究假设”这与原假设为互斥研究者想收集证据予以支持的假设。总是有不等号:,或表示为H1例如,H:”(寿命延长)建立的原假设与备择假设应为H0:1500H1:1500,双侧检验和单侧检验,一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立研究者总是想证明自己的研究结论(废品率降低)是正确的备择假设的方向为“”(废品率降低)建立的原假设与备择假设应为H0:2%H1:2%,双侧检验和单侧检验,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验检验权在销售商一方作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不正确的备择假设的方向为“”(寿命不足1000小时)建立的原假设与备择假设应为H0:1000H1:1200=0.05n=100临界值(s):,检验统计量:,在=0.05的水平上不能拒绝H0,不能认为该厂生产的元件寿命显著地高于1200小时,决策:,结论:,Z,0,拒绝域,0.05,1.645,单个总体均值检验,总体均值的检验(2未知小样本)假定条件总体为正态分布2未知,且小样本使用t统计量,单个总体均值检验,例解某汽车制造商宣称该公司一款低价车肇事平均修车费低于等于$200。消费者基金会认为修车费高于此数值,欲检证下列假设:H0:uu0H1:uu0消费者基金会不愿在证据不充分的条件下,随意驳斥制造商的宣称,因此将假设检定的显著水平严格地定在1%。因为检证肇事修车的成本甚高,因此消基会仅找了9个样本点,发现:245,305,175,250,280,160,250,195,210,单个总体均值检验,H0:200H1:200=0.0n=100临界值(s):t.01,8=2.896,检验统计量:,在=0.01的水平上不能拒绝H0,不能认为收费较高,决策:,结论:,Z,0,拒绝域,0.01,2.896,单个总体均值检验,例解一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05),单个总体均值检验,H0:40000H1:30时,两样本均值的抽样分布为近似正态分布,1,21/n1,2,22/n2,1-2,两总体均值的检验,独立样大样本(12、22未知,)如果是大样本(n30),则我们可以用样本方差s2來取代未知的总体方差2。,两总体均值的检验,例解(P&G)公司宣布含氟牙膏Crest可以防止蛀牙,为了检证此一假设,我们找了一群牙齿健康状况相同的十岁小朋友,将之分成用含氟及用普通牙膏两组,观察一年后纪录其蛀牙状况假设从用普通牙膏的小朋友中取100个随机样本,其蛀牙平均值为4.8颗,方差为s12=1.1颗。在从用含氟牙膏的小朋友中取120独立样本,计算其平均蛀牙数为3.6颗,方差为s22=0.9颗,在显著水平5%下检定上述的假说,两总体均值的检验(续),RejectH0,两总体均值的检验,例解IsthereevidencetoconcludethattheaveragemonthlychargeintheentirepopulationofAmericanExpressGoldCardmembersisdifferentfromtheaveragemonthlychargeintheentirepopulationofPreferredVisacardholders?,两总体均值的检验,两总体均值的检验,独立小样本(12=22)检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等12=22检验统计量,其中:,两总体均值的检验,NYSENASDAQNumber2125SampleMean3.272.53SampleStdDev1.301.16Assumingequalvariances,isthereadifferenceinaverageyield(a=0.05)?,1984-1994T/MakerCo.,例解YoureafinancialanalystforCharlesSchwab.IsthereadifferenceinaveragedividendyieldbetweenstockslistedontheNYSE&NASDAQ?Youcollectthefollowingdata:,两总体均值的检验,p-Value2,(p-Valueisbetween.02and.05)0,a=.05,检验统计量,临界值=1.8331df=n-1=9,Reject,a=.05,1.8331,决策:RejectH0tSherejectionzone.,结论:Thenewsoftwarepackageisfaster.,3.66,两总体比率之差检验,比率之差检验假定条件两个总体是独立的两个总体都服从二项分布n1p15,n1q15,n2p25,n2q25可以用正态分布来近似检验统计量,两总体比率之差检验,例解在高校学生的一个随机样本中,36名男生中有16人说他们购买食品时看生产日期,而36名女生中则有28人说说好们购买食品时看生产日期,判断在这一点上,女生是否比男生更细心?(=0.05),两总体比率之差检验,H0:1-20H1:1-20=0.05n1=36,n2=36临界值(s):,检验统计量:,决策:,结论:,在=0.05的水平拒绝H0,女生显著高,两总体方差比检验,两个总体方差比的检验假定条件两个总体都服从正态分布,且方差相等两个独立的随机样本假定形式H0:s12=s22或H0:s12s22(或)H1:s12s22H1:s12)检验统计量F=s12/s22F(n11,n21),两总体方差比检验,两总体方差比检验,NYSENASDAQNumber2125SampleMean3.272.53SampleStdDev1.301.16IsthereadifferenceinthevariancesbetweentheNYSE&NASDAQatthea=0.05level?,1984-1994T/MakerCo.,例解YoureafinancialanalystforCharlesSchwab.IsthereadifferenceinaveragedividendyieldbetweenstockslistedontheNYSE&NASDAQ?Youcollectthefollowingdata:,两总体方差比检验,H0:s12=s22H1:s12s22a=.05df1=20df2=24临界值:,检验统计量:决策:结论:,Donotrejectata=0.05.,0,F,2.33,0.415,.025,Reject,Reject,.025,1.25,Thereisinsufficientevidencetoproveadifferenceinvariances.,8.4假设检验的进一步讨论,区间估计与假设检验比较,根据置信区间检验求出双侧检验均值的置信区间若总体的假设值0在置信区间外,拒绝H0,2已知时:,2未知时:,区间估计与假设检验比较,抽样分布,H0值,上限,下限,a/2,a/2,样本统计量,1-,置信水平,H0值,区间估计与假设检验比较,左侧检验:求出单边置信下限若总体的假设值0小于单边置信下限,拒绝H0,区间估计与假设检验比较,右侧检验:求出单边置信上限若总体的假设值0大于单边置信下限,拒绝H0,区间估计与假设检验比较,假设检验的局限小心诠释统计显著性样本很大时,即使效应(effect)差异不大也会产生统计显著性;但可能因为效应差异不大而没有实际的效用数据上呈现的统计显著性应配合资料形态来诠释离群值的检查等配合估计区间来诠释置信区间也估计效应的大小,区间估计与假设检验比较,例析1000组配对样本的相关系数为0.08,在1%的显著性水平下具有显著性,仅表示有足够的证据认为总体相关系数不是零且应为正在实用上,0.08的相关性常可忽略而不会影响后续分析以散布图检查资料的相关性检查数据间是否具有函数关系,或是离群值影响相关性的强度等以相关系数的置信区间来了解相关性的强度,区间估计与假设检验比较,置信区间只能在预先规定的概率前提下进行计算,而假设检验能够根据样本数据获得的统计量(Z,t)及样本的其他信息(如自由度n)获得确切的概率P值,假设检验的几点补充说明,再谈统计显著性统计显著性的价值在于,指出“效应(effect)的发生并非偶然”的证据。可应用于:新药产品的有效性与安全性需显著性证据法庭在审理差别待遇的诉讼需要统计显著性营销者需要知道新的广告策略是否显著地优于旧的策略医学研究者要了解新的疗法是否显著得好,假设检验的几点补充说明(续),检验的原理是“小概率事件在一次试验中不发生”,以此作为推断的依据,决定是无法拒绝或拒绝。但是这一原理只是在概率意义下成立,并不是严格成立的,即不能说小概率事件在一次试验中绝对不可能发生,假设检验的几点补充说明(续),在假设检验中,原假设与备选假设的地位是不对等的。一般来说是较小的,因而检验推断是“偏向”原假设,而“歧视”备选假设的。因为,通常若要否定原假设,需要有显著性的事实,即小概率事件发生,否则就认为原假设成立。因此在检验中无法拒绝,并不等于从逻辑上证明了的成立,只是找不到不成立的有力证据。在应用中,对同一问题若提出不同的原假设,甚至可以有完全不同的结论,假设检验的几点补充说明(续),从另一个角度看,既然是受保护的,则对于的肯定相对来说是较缺乏说服力的,充其量不过是原假设与试验结果没有明显矛盾;反之,对于的否定则是有力的,且越小,小概率事件越难于发生,一旦发生了,这种否定就越有力,也就越能说明问题,假设检验的几点补充说明,P-值多小才可信的衡量基础:H0的可信程度:若H0已被相信行之有年,则需较强的证据(P-值较小)才可说服别人。拒绝H0的后果:若拒绝H0后会引起昂贵的改变如产品包装,则需较强的证据(P-值较小)来支持新包装会提升产品的销售的说法。,假设检验的几点补充说明,常用的显著水平有10%,5%,1%及0.1%法庭在审理差别待遇的诉讼案件多使用5%的显著性水平显著与不显著之间并没有明显的界限,显著性证据的强度如同P-值减少一样是渐进的P-值为0.49与0.51提供的证据强度并没有太大的差别不应把常用的显著性水平当做一成不变的标准,假设检验的几点补充说明,两种常见错误马后炮专家从已经发生的事件中通过检验倒推“规律”多次重复寻找期望结果,Aha!找到几个具显著性的指标了!,小结,条件,检验统计量,拒绝域,H0、H1,(1)H0:=0H1:0,z,(2)H0:0H1:0,(3)H0:0H1:,z,0,z,0,正态总体2已知,小结,条件,检验统计量,拒绝域,H0、H1,(1)H0:=0H1:0,t,(2)H0:0H1:0,(3)H

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论