统计学--假设检验_第1页
统计学--假设检验_第2页
统计学--假设检验_第3页
统计学--假设检验_第4页
统计学--假设检验_第5页
免费预览已结束,剩余94页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第7章假设检验,正如一个法庭宣告某一判决为“无罪(notguilty)”而不为“清白(innocent)”,统计检验的结论也应为“不拒绝”而不为“接受”。JanKmenta,统计名言,案例,辛普森杀妻案,辛普森案(英语:O.J.Simpsonmurdercase,又称加利福尼亚人民诉辛普森案,英语:Peoplev.Simpson)是美国加利福尼亚州最高法院对前美式橄榄球明星、演员OJ辛普森进行的刑事诉讼,在该案中,辛普森被指控于1994年犯下两宗谋杀罪,受害人为其前妻妮克尔布朗辛普森及其好友罗纳德高曼。该案被称为是美国历史上最受公众关注的刑事审判案件。,案发时间,1994年6月12日深夜案发后凌晨,辛普森门外有血迹现场滴落的血痕中有辛普森的血,辛普森家中血手套和辛普森的脏衣服都有被害人的血,法庭战争检方的“铁证如山”与“梦幻律师团”,在检方看来,本案可谓是“铁证如山”,本案中无论是证据数量,还是证据的可信程度,在检方看来,都达到了很高的标准。,控辩双方几个关键的地方,控方:检方在审判的最初几周出示证据,证明辛普森曾有对妮可尔的家庭暴力史。辩方:时遭受丈夫家庭暴力中,遭受丈夫伤害的概率为1%,控方:鞋码与辛普森的相似,辛普森手上有划痕辩方:世界上与辛普森鞋码一样的人数不胜数,在左手有伤痕的人也不尽其数,所以这样的证据对案件的判断是没有任何价值的。,控方:在犯罪现场发现的血液,DNA鉴定发现与辛普森是完全一致的,而DNA鉴定两个人一致的可能性只有万分之。辩方:在洛杉矶300万人口中,就有300个人DAN一致,辛普森是洛杉矶人口的1人,所以,辛普森是杀人凶手的概率只有0.03%。如果认为新浦森有罪的话,那么误判的概率将高达99.97%.最终无罪释放。,控方:平时遭受丈夫家庭暴力中,非正常死亡的,其凶手为丈夫的概率为80%。控方:可能会有很多与辛普森鞋码一样的人,但也会有很多左手有划痕的人,但辛普森是一个嫌疑犯,不能把他放在所有的人当中去进行归类,于是只能放在嫌疑犯中,在嫌疑犯中,跟辛普森鞋码吻合的人的概率非常之小,法庭宣判过程,法官假定辛普森无罪控方搜集证据证明他有罪,只有当证据充足的时候才能宣判有罪,否则要接受法官的假定。,辛浦森(SimpsonsParadox)悖论,160,166,36,290,326,总的看,白人有19/160=12%的被告被判处死刑,与之对应,黑人只有17/166=10%的被告被判死刑,白人死刑率要高一些.但如果考虑受害者的种族,结论就相反了.当受害者是白人时,有11/63=17.5%的黑人被告被判死刑,而只有19/151=12.6%的白人被告被判死刑.当受害者是黑人时,白人被告没一个人(0%)被判死刑,而黑人被告确有6/103=5.8%的被判死刑.,控方:DNA鉴定辩方:把辛普森至于300万人群当中,但新浦是是嫌疑犯,所以应把他放在嫌疑犯这个人群中,那么样本与他一致的也就他一个人,综上,只有辛普森一个人符合三个条件,第7章假设检验,7.1假设检验的基本问题7.2一个总体参数的检验,学习目标,1.理解假设检验的基本思想和基本步骤;2.理解假设检验的两类错误及其关系;3.熟练掌握一个总体平均数、总体成数各种假设检验方法;4.利用P-值进行假设检验。用Excel进行检验,假设检验知识结构,7.1假设检验的基本原理7.1.1怎样提出假设?7.1.2怎样做出决策?7.1.3怎样表述决策结果?,第7章假设检验,7.1.1怎样提出假设?,7.1假设检验的基本原理,1.什么是假设?,假设:定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想。是对总体参数的一种假设。常见的是对总体均值或比例和方差的检验;在分析之前,被检验的参数将被假定取一确定值。,我认为到KFC消费的人平均花费2.5美元!,2、市场调研中常见的假设检验问题,一项跟踪调查的结果表明,顾客对产品的了解程度比6个月前所做的类似调查中的显示要低。结果是否明显降低?是否低到需要改变广告策略的程度?一位产品经理认为其产品购买者的平均年龄为35岁。为检验其假设,他进行了一项调查,调查表明购买者平均年龄为38.5岁。调查结果与其观点的差别是够足以说明此经理里的观点是不正确的?,3、问题在哪里?,某广告商宣称其代理的A产品的合格率达到99%,质检人员为了验证,随机抽取了一件产品,发现是一件次品。质检人员会是什么反应呢?,什么是假设检验?(hypothesistest),先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理小概率是在一次试验中,一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设,原假设(nullhypothesis),又称“0假设”,研究者想收集证据予以反对的假设,用H0表示所表达的含义总是指参数没有变化或变量之间没有关系最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它总是有符号,或H0:=某一数值H0:某一数值H0:某一数值例如,H0:10cm,null,也称“研究假设”,研究者想收集证据予以支持的假设,用H1或Ha表示所表达的含义是总体参数发生了变化或变量之间有某种关系备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设总是有符号,或H1:某一数值H1:某一数值H1:某一数值,备择假设(alternativehypothesis),【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设,提出假设(例题分析),解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为H0:10cmH1:10cm,【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设(例题分析),解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为H0:500H1:500,【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,提出假设(例题分析),解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为H0:30%H1:30%,提出假设总结,H0:通常是将研究者不愿相信的、不认可的、想拒绝的结论H0:=某一数值H0:某一数值H0:某一数值H1:与原假设是对立的,通常是研究者想要支持的、愿意相信的结果H1:某一数值H1:某一数值H1:”或“”,称为右侧检验,双侧检验与单侧检验,双侧检验与单侧检验(假设的形式),以总体均值的检验为例,7.1.2怎样做出决策?,7.1假设检验的基本原理,假设检验的步骤,1.提出原假设H0和备择假设H12.构造适当的检验统计量3.给定显著性水平0.01,0.05,0.104.计算检验统计量的值5.做出判断,假设检验的基本思想,.因此我们拒绝假设=50,样本均值,m,=50,抽样分布,H0,两类错误与显著性水平(了解),研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误原假设和备择假设不能同时成立,决策的结果要么拒绝H0,要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误第类错误(错误)原假设为正确时拒绝原假设第类错误的概率记为,被称为显著性水平2.第类错误(错误)原假设为错误时未拒绝原假设第类错误的概率记为(Beta),显著性水平(significantlevel),事先确定的用于拒绝原假设H0时所必须的证据能够容忍的犯第类错误的最大概率(上限值)2.原假设为真时,拒绝原假设的概率抽样分布的拒绝域3.表示为(alpha)常用的值有0.01,0.05,0.104.由研究者事先确定,错误和错误的关系,依据什么做出决策?,若假设为H0=500,H1临界值,拒绝H0,用统计量决策(左侧检验)H1:m临界值,拒绝H0,抽样分布,H0,临界值,拒绝H0,1-,置信水平,RegionofNonrejection,RegionofRejection,a,统计量决策规则,给定显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较作出决策双侧检验:H1:mm0,I统计量I临界值,拒绝H0,31.96,拒绝左侧检验:H1:mm0,统计量临界值,拒绝H0,31.96,拒绝当单侧检验时,只要统计量与z或t大小比较方向与备择假设符合一致时,拒绝不过,总而言之,无论是哪一种检验形式,只要I统计量I临界值,拒绝H0,用P值决策软件操作中的sig.即为P值(P-value),如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,也就是我们拒绝原假设面临的风险P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设被称为观察到的(或实测的)显著性水平决策规则:若p值临界值,拒绝原假设,说明在统计上是显著的,总体均值的检验(2已知)(例题分析大样本),H0:=255H1:255=0.05n=40临界值(c):,检验统计量:,决策:,结论:不拒绝原假设,用Excel中的【NORMSDIST】函数得到的双尾检验P=0.312945不拒绝H0,没有证据表明该天生产的饮料不符合标准要求,总体均值的检验(z检验)(P值的计算与应用),第1步:进入Excel表格界面,直接点击【fx】第2步:在函数分类中点击【统计】,并在函数名菜单下选择【NORMSDIST】,然后【确定】第3步:将z的绝对值1.01录入,得到的函数值为0.843752345P值=2(1-0.843752345)=0.312495P值远远大于,故不拒绝H0,总体均值的检验(2未知)(例题分析大样本),【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(=0.01)样本均值为1.3152,左侧检验,总体均值的检验(例题分析大样本),H0:1.35H1:1.35=0.01n=50临界值(c):,检验统计量:,-2.60611.65,或者(P=0.000088=0.05),改良后的新品种产量有显著提高,决策:,结论:,总体均值的检验(z检验)(P值的图示),总体均值的检验(小样本),1.假定条件总体服从正态分布小样本(n42=0.10df=10-1=9临界值(s):,统计量:,不拒绝H0(p=0.52185),没有证据表明装填量的标准差不符合要求,决策:,结论:,Excel中的统计函数,ZTEST计算Z检验的P值TDIST计算t分布的概率TINV计算t分布的临界值TTEST计算t分布检验的P值FDIST计算F分布的概率FINV计算F分布的逆函数(临界值)FTEST计算F检验(两个总体方差比的检验)单尾概率,假设检验知识结构,本章小结,假设检验的基本原理一个总体参数的检验用Excel进行检验利用P值进行检验,1、假设检验是预先对总体参数的取值做出假定,然后用样本数据验证,做出是接受还是拒绝原来假设的结论的一种方法。2、假设检验的基本概念有:小概率原理、原假设和备择假设、检验统计量、接受域和拒绝域、显著性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论