抽样及抽样分布课件_第1页
抽样及抽样分布课件_第2页
抽样及抽样分布课件_第3页
抽样及抽样分布课件_第4页
抽样及抽样分布课件_第5页
已阅读5页,还剩181页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验问题假设检验问题如果一个人说他是素食者。如何证明?很难!反之,如果要证明这个人吃过肉很容易,只要有一次就足够了。肯定什么事物很难,而否定却要相对容易得多。这就是假设检验背后的哲学。在假设检验中,要设立一个原假设(“从未吃过肉”就是一个例子);而设立该假设的动机主要是利用人们掌握的反映现实世界的数据来找出假设与现实之间的矛盾,从而否定这个假设。假设检验的思想如果一个人说他是素食者。如何证明?很难!假设检验的思想从一个例子看假设检验的思想例:100个银行职员样本的月收入8300元,你是否能接受“全体银行职员的平均月收入μ为8250元?12000元?8000元”?很难说,因为如果“μ=8000元”这个说法(假设)成立,样本均值8300离μ=8000不太近也不太远,出现的可能性不好判断。假设检验遵从“小概率事件一次实验发生概率极小”原则。带有概率性质的反证法

从一个例子看假设检验的思想例:100个银行职员样本的月收入统计推断参数估计假设检验通过样本统计量推断总体参数的置信区间利用样本信息判断对总体参数的假设值是否成立第六章假设检验(参数检验)hypothesistesting检验思想的逻辑:(20世纪30年代费歇尔提出)利用样本信息判断对总体参数的假设值是否成立统计推断参数估计假设检验通过样本统计量推断总体参数的置信区间本章主要内容假设的基本概念—显著性水平—假设检验的种类—假设检验中的两类错误—假设检验的规则—假设检验的步骤单一总体的均值或比率的假设检验两个总体均值或比率差异的假设检验本章主要内容假设的基本概念

消协接到消费者投诉,指控某品牌饮料容量不足,包装上标明的容量为500毫升。消协随机抽取50代该种饮料,测得平均重量为498.35毫升,标准差4.33毫升。消协能否根据样本数据,判定是生产中的正常波动,还是厂家有意所为?生产线加工的产品废品率长期不超过1%,某日抽取100件,两件是废品,生产线是否正常?。。。。。。?差异产生的原因:原因一:样本来自总体,样本差异源于由抽样的随机性原因二:样本不属于已知总体,差异源于总体本身消协接到消费者投诉,指控某品牌饮料容量不足,包装上假设检验的步骤根据实际问题提出假设给定显著性水平确定原假设成立条件下统计量的抽样分布计算检验的统计量根据检验统计量的结果,按照检验规则作出决策假设检验的步骤根据实际问题提出假设第一节假设检验的概念

一假设检验的有关概念

假设:关于总体参数值的一种看法或陈述

零假设(Nullhypothesis)接受检验的基本假设,

带等号:

nochangenodifference

据样本数据结果欲推翻的假设

备择假设(Alternatihypothesis)零假设的对立假设,不带等号:

据样本数据结果欲支持的假设第一节假设检验的概念一假设检验的有关概二假设检验的种类双尾检验:拒绝域在两侧单尾检验:拒绝域在一側——左单尾检验:拒绝域在左側——右单尾检验:拒绝域在右側二假设检验的种类双尾检验:拒绝域在两侧怎样建立零假设和备择假设对某种标准是否符合进行检验:将标准作为原假设.例:某机床配件的规格为1.5毫米,委托外企业加工,对加工后的配件进行检验,检验研究结果:研究者对研究结果的假设设为备择假,备择假设应该按照实际世界所代表的方向来确定

某医药研究机构发明一种治疗感冒的新药,以往感冒药效持续时间最长可达24小时,对新药持续时间检验对某种观点有效性的检验:(相信与否)

某电脑显示器制造商申称,其寿命不低于10000小时

怎样建立零假设和备择假设关于设立假设的讨论购货方与销货方双方协定,产品的次品率高于3%,则购货方可以退货,如果你是购货方,对产品质量进行检验:

如果销货方一贯信誉很好,如何假设?如前例:

如果销货方信誉不太好,如何假设?如前例左右都可以设,看先验信息、依据背景考虑:严格:反方向设;宽松:顺方向设零假设是研究者想用证据推翻的内容备择假设是研究者想用证据支持的内容一对假设的设立会体现研究者的主观意愿关于设立假设的讨论购货方与销货方双方协定,产品的次品率高于3例某公司设计了一种充气包,这种充气包在发生交通事故时能对司机起到缓冲保护作用。该公司广告称该充气包在发生交通事故时不超过0.2秒钟即可将气包充好,现随机抽取100个样本,测得其平均充气时间为0.19秒,标准差为0.01秒,对该公司广告的真实性作出决策。例某公司设计了一种充气包,这种充气包在发生交通事故时能对

表述方法1表述方法2假设H0:μ≤0.2秒H0:μ≥0.2秒H1:μ>0.2秒H1:μ<0.2秒Ⅰ生产的充气包的平均充气时间不超过0.2秒,但却拒绝了H0认为不合格。这使厂商失去业务机会。充气包的平均充气时间超过0.2秒,但却拒绝了H0,认为合格,这势必导致人身伤亡,并导致商誉严重损失。型错误Ⅱ平均充气时间超过0.2秒,但却认为其低于0.2秒,而接受H0。这势必导致人身伤亡,并导致商誉严重损失。平均充气时间不超过0.2秒,但却接受了H0,认为超过了0.2秒,不合格。这使厂商失去业务机会。型错误态度努力防止将合格产品误判为不合格的风险,重在保护厂商利益。努力防止将不合格产品误判合格的风险,重在保护消费者利益。表述方法1表述方法2假设H0:μ≤0.2秒H0:μ≥0.2三、显著性水平小概率事件发生的概率。(小概率事件在一次实验中发生的概率很小).原假设是正确而根据样本的信息却拒绝了原假设的概率,也叫拒绝域。根据实际问题事先确定,一般取0.01,0.05,0.10。检验结果显著(significant)意味着有理由拒绝零假设。因此,假设检验也被称为显著性检验(significanttest)。表明样本统计量和总体参数的差异显著三、显著性水平

拒绝/接受域的图示拒绝域拒绝域接受域显著性水平越小,越不容易拒绝原假设,显著性水平越大,越容易拒绝原假设,很小/大的显著性水平说明什么拒绝域拒绝域拒绝/接受域的图示拒绝域拒绝四、两类错误第一型错误(弃真错误)

原假设为真,样本信息提供拒绝原假设的统计证据。

拒绝一个正确的原假设.犯这个错误的概率为即显著性水平.统计中将只控制I型错误,不考虑错误的检验称显著性检验第二型错误(取伪错误)备择假设为真,样本信息提供不能拒绝原假设的统计证据。接受了一个错误的原假设,犯这个错误的概率为零假设备择假设哪个正确?有可能犯错误的是?四、两类错误零假设备择假设哪个正确?有可能犯错误一个小概率事件出现,因此拒绝原假设。a值越大,表明犯弃真错误的概率越大,越容易拒绝原假设,此时称检验越严格。如果在Ⅰ型错误的概率为5%或1%下拒绝原假设,说明100次拒绝原假设结论中,平均有5次或1次是错误的。a值需要由检验目的来确定,当取伪造成的损失大于弃真造成的损失时,应扩大a值。显著性水平的给定对检验结果有一定影响,在一个水平下是显著成立的,在另一个水平下可能不成立。这正是统计学意义上的结论的严格性与科学性所在。一个小概率事件出现,因此拒绝原假设。反方向变动

同时减少犯两种错误的概率奈曼和皮尔逊提出:

在控制I型错误的概率的条件下,

尽量使II型错误的概率减少。。

两类错误的关系好的检验法则:如果减小拒绝域,就意味着扩大接受域,从而扩大了犯取伪错误的概率。弃真和取伪是一对矛盾1)扩大样本量,2)使用更好的统计量,才可以使二者同时缩小反方向变动同时减少犯两种错误的概率两类错误的关系好检验统计量是数据的代表根据原假设可知检验统计量的分布检验统计量的实现值是否小概率事件小概率事件发生了,称检验结果显著原假设和备择假设并不对称假设检验与区间估计的关系

(在接受原假设,则必覆盖总体参数)

检验统计量检验统计量是数据的代表检验统计量五、假设检验的决策结果:原假设真实,样本数据支持接受原假设原假设不真实,样本数据不支持接受原假设原假设真实,样本数据不支持接受原假设原假设不真实,样本数据支持接受原假设为真不真实接受拒绝判断正确弃真错误取伪错误判断正确五、假设检验的决策结果:为

传统假设检验的步骤根据实际问题提出假设规定显著性水平确定原假设成立条件下统计量的抽样分布计算检验的统计量按照决策规则作出决策传统假设检验的步骤根据实际问题提出假设

传统的假设检验的决策规则单側检验:双側检验:传统的假设检验的决策规则单側检验:双側检验:消协接到消费者投诉,指控某品牌饮料容量不足,包装上标明的容量为500毫升。消协从市场随机抽取50袋,测得平均重量为498.35毫升,标准差4.33毫升。消协能否根据样本数据,判定是生产中的正常波动?还是厂家有意所为?显著性水平0.05标准化临界值

消协接到消费者投诉,指控某品牌饮料容量不足,包装上标明的容量标准化临界值

某高校进行数学教学方法改革,组成一个实验班30人用新方法教学,在期末的统一考试中,实验班平均成绩为80分,全年级平均77分,标准差12分,实验班的平均成绩与全年级平均成绩相比,是否显著提高?标准化临界值

某高校进行数学教学方法改革,组成一个实验非标准化临界值

优点:可对几个统计量同时进行检验非标准化临界值

非标准化临界值例

包装上标明的容量为500毫升。消协从市场随机抽取50袋,测得平均重量为498.35毫升,标准差4.33毫升。在显著性水平取0.05时检验这批产品是否合格?P182(例6.1)—188非标准化临界值例

包装上标明的容量为500毫升。消协从市场随

指成立时,样本统计量的取值等于或超过所观察到的值的概率。即否定的最低显著性水平。反映实际观察到的数据与原假设之间不一致程度的概率(犯第一类错误的概率)。例如:P值=0.01,表明如果给定一个真实的零假设,检验统计量等于或超过实际观察到的极端值的概率是0.01。

现代检验方法:用P值(概值)进行检验指成立时,样本统计量的取值等于或超过P值的计算

右单尾检验P值=

左单尾检验P值=双尾检验P值=P值的计算右单尾检验P值=t分布的P值一次概率论考试试题难度较大,出卷老师估计平均分约50分,随机抽取5份卷子,平均分65分,标准差11.6分,求P值若原假设为真,样本均值高于65分的概率仅为2.5%(即求本次抽样高于65分的概率)t分布的P值

p值的决策规则:

P值P值P值P值第二节单一样本的假设检验

----大样本下总体平均数的检验

例1(P191)某厂生产一种出口罐头,标准规格为每罐净重250克。根据以往经验,标准差为3克。随机抽取100罐进行检验,称得其平均净重为251克。该批罐头是否合乎规格?第二节单一样本的假设检验

决策规则:如则接受H0如则拒绝H0,接受H1结论:因为Z=3.33大于1.96,所以拒绝H0答:在显著性水平为0.05下,拒绝H0标准化临界值

非标准化临界值25095%Z01.96-1.96统计量Z=3.33拒绝域拒绝域C1C2决策规则:非标准化临界值25095%Z01.96-1.96统计量拒绝域251249Z

3.33

3.33P值1.961.96拒绝域拒绝域决策规则:则统计量落在接受域里则接受H0则统计量落在拒绝域里则拒绝H0250.6249.4251249Z3.333.33P值1.96例2某公司设计了一种充气包,这种充气包在发生交通事故时能对司机起到缓冲保护作用。该公司广告称该充气包在发生交通事故时不超过0.2秒钟即可将气包充好,现随机抽取100个样本,测得其平均充气时间为0.19秒,标准差为0.01秒,对该公司广告的真实性作出决策。例2某公司设计了一种充气包,这种充气包在发生交通事故时能

例2(右单尾检验)

例2(右单尾检验)

例2(左单尾检验)

例2(左单尾检验)

左单尾即置信区间下限检验问题:0.19.0.1980.2左单尾即置信区间下限检验问题:0.19.0.198P值检验(例2续)-1.645-100.05P值检验(例2续)-1.645-100.05例3某药厂研制出一种降低胆固醇的新药,行业标准规定:患者服用此药一疗程后胆固醇平均下降30个单位以上,标准差不超过10个单位为有效,才能投入生产。对100名患者进行药效观察,平均胆固醇下降了32个单位。该药是否可投入生产?例3某药厂研制出一种降低胆固醇的新药,行业标准规定例3(左单尾检验)P168

-1.645拒绝域Z=2例3(左单尾检验)P168

-1.例3(右单尾检验)P168

1.645拒绝域Z=2例3(右单尾检验)P168

1.6P—值检验法(例3续)P—值检验法(例3续)100个银行职员样本的月收入8300元,标准差640元,你是否能接受“全体银行职员的平均月收入μ高于8000元”?为0.05右尾接受原假设,左尾拒绝原假设,结论相同,逻辑不同100个银行职员样本的月收入8300元,标准差640元,你例4一种零件标准寿命应达到1200小时以上,标准差为300小时,随机抽取100件,平均寿命为1245小时。在显著性水平0.05下确定这批零件是否合格?例4一种零件标准寿命应达到1200小时以上,标准差为30小样本下总体平均数的假设检验例5某校有自主招生资格,自主招生笔试考核后,招生办估计数学的平均成绩至少为90分.从中随机抽出20份,平均成绩为83分,样本标准差为12分.试在0.01的显著性水平下检验招生办所做的推测是否正确.小样本下总体平均数的假设检验例5某校有自主招生资格例P201例P201总体平均数的假设检验例6某银行对各个网点的业务员的服务进行评价,问卷中采用李克特量表(0-10),规定7分以上为优秀,在某网点随机抽取的当日60份业务员的电子记录结果,平均7.25分,标准差1.052,该网点是否可以评为优秀?如果此例用正态统计量检验如果此例用双尾检验总体平均数的假设检验例6某银行对各个网点的业务员的总体比率的假设检验例7某企业的产品畅销于国内市场。据以往资料,,购买该产品的顾客有50%是男性。该企业的负责人关心这个比率是否发生了变化,于是该企业委托一家咨询机构进行调查,这家咨询机构从众多的购买者中随机抽选了400名进行调查,结果有210名为男性,检验“50%的顾客是男性”的观点。显著性水平为0.05总体比率的假设检验例7某企业的产品畅销于国内市场。据以抽样及抽样分布课件样本量大小对检验结果的影响某种产品要求其使用寿命不得低于1000小时。已知这种元件的寿命服从标准差为100小时的正态分布。现中随机抽查了25件,测得平均使用寿命为972小时。1、在0.05的显著性水平下,检验这批产品是否合格;2、如果抽取50件样本进行检查,在其它条件不变的情况下,检验这批产品是否合格。假设::1000,:1000=-1.4,P值=P(Z≤-1.4)=0.0808

=-1.98,P值=P(Z≤-1.98)=0.02385为什么结论不一致?分母大小不同意味什么样本量大小对检验结果的影响某种产品要求其使用寿命不得低于10某农场为了试验某种农作物的新品种是否会比原品种的产量更高,分别在若干块面积为0.1亩的试验地进行试种,每块试验地上所收获的产量如下表(单位:kg)。假定产量服从正态分布且两种品种产量的方差相等,在5%的显著性水平下,1、新品种与原品种的产量有显著差异?2、新品种比原品种的产量有显著提高?单双尾检验对决策结果的影响某农场为了试验某种农作物的新品种是否会比原品种的产量更高,分原品种11108997107112120981031019295新品种211810792116110105106112124

1、新品种与原品种的产量有显著差异?2、新品种比原品种的产量有显著提高?11089971071121209810310192新品种2β错误的计算某IT公司以往的职工平均年龄为33.5岁,现了解这个平均年龄是否发生了变化,抽取250人,=34.8岁,已知σ=14.2岁在α=0.05条件下检验该职工平均年龄是否发生变化。解:平均数大样本双尾检验(σ已知)。H0:μ=33.5H1:μ≠33.5α=0.05z=±1.96抽样标准误=0.898临界值33.5±1.96×0.89831.7,35.3决策规则:若<31.7或>35.3,拒绝H0;若31.7≤≤35.3,接受H0因为=34.8,所以接受H0如果真值μ=34.5岁β错误的计算某IT公司以往的职工平均年龄为33β=P(接受H0|μ=34.5)=(31.7≤≤35.3|μ=34.5)=P〔31.7≤≤34.5〕+P〔34.5<≤35.3〕=P〔≤z≤0〕+P〔0<z≤〕=P〔-3.12≤z≤0〕+P〔0<z≤0.89〕=0.4991+0.3133=0.8124当μ=34.5时,错误地接受H0:μ=33.5的概率为81.24%。这个概率较大,是因为μ=34.5这个真实的参数值很接近假设的μ=33.5参数值,很难区分假设值与真值的差异,即很容易犯Ⅱ型错误。β=P(接受H0|μ=34.5)抽样及抽样分布课件抽样及抽样分布课件功效曲线功效曲线抽样及抽样分布课件单一样本(总体)假设检验总结单一总体平均数平均数比率Z检验1or2tailt检验1or2tailZ检验1or2tail未知小样本已知单一样本(总体)假设检验总结单一总体平均数平均数比率Z检第三节双样本假设检验

一配对样本(matchedpairs两种配对方法)设为各对观察值之差

第三节双样本假设检验抽样及抽样分布课件抽样及抽样分布课件

例:某健美俱乐部在广告中称,在该俱乐部参加一期训练班至少减少体重17斤,为验证其广告的真实性,调查人员随机抽取了10位参加者,资料如下:在水平下,判断参加一期训练班是否至少减肥17斤?训练前189202220207194177193202208233训练后170179203192172161174187186204差值d19231715221619152229两均值差异的假设检验(配对样本)训练前189202220207112345123非标准临界值非标准临界值两总体均值差异的假设检验(独立样本)----观察两个总体的参数是否具有显著区别两总体标准差已知或大样本两总体标准差未知但相等(计算合并统计量)两总体标准差未知但不相等两总体均值差异的假设检验(独立样本)----观察两个总体的假设形式:双尾左单尾右单尾假设形式:两总体标准差已知或大样本两总体服从正态分布,已知两总体为任意分布,未知,但样本容量足够大。服从或近似服从正态分布:检验统计量:

例P207两总体标准差已知或大样本两总体服从正态分布,抽样及抽样分布课件两总体标准差未知但相等(计算合并统计量)

无偏估计量是对两样本方差计算加权平均为合并估计量(pooledestimator)。自由度为的T分布两总体标准差未知但相等(计算合并统计量)

无偏估计量是对两样两总体方差未知且不相等

由直接计算统计量两总体方差未知且不相等由直接计算统计Levene’sTestforQualityofvariancet-testforEqualityofMeansFSig.tdfSig.(2-tailed)MeandifferenceStd.ErrorDifferenceEqualvarianceassumed.02.9642.30444.048.7394.0.3636Equalvariancenotassumed2.01340.582.051.7394.0.3673P210Levene’sTestfort-testforEq两比率差异的假设检验(独立大样本)

---两个总体比率是否相等双尾右单尾左单尾两比率差异的假设检验(独立大样本)---两个总体比率

地区问卷份数欲购买家庭数A15075B200103例:调查了两个地区居民欲购买液晶电视的意向,数据如下:地区问卷份数欲购买家庭数A15075B200103例:调查了

双样本(总体)假设检验总结本章完双样本(总体)假设检验总结本章完假设检验的过程和逻辑先提出原假设,比如m=5。这种原假设也称为零假设(nullhypothesis),记为H0。再提出备择假设(alternativehypothesis),比如m>5。备选假设记为H1,通常是被认为可能比零假设更符合数据所代表的现实。。比如上面的H1为m>5;这意味着,样本均值应该大于5;至于是否显著,依检验结果而定。检验结果显著(significant)意味着有理由拒绝零假设。故假设检验也被称为显著性检验(significanttest)。假设检验的过程和逻辑先提出原假设,比如m=5。这种原假设也称假设检验的过程和逻辑有了两个假设,就要根据数据来对它们进行判断。数据的代表是作为其函数的统计量;它在检验中被称为检验统计量(teststatistic)。根据零假设(不是备选假设!),可得到该检验统计量的分布;再看这个统计量的数据实现值(realization)属不属于小概率事件。也就是说把数据代入检验统计量,看其值是否落入零假设下的小概率范畴;如果的确是小概率事件,那么就有可能拒绝零假设,或者说“该检验显著,”否则说“没有足够证据拒绝零假设”,或者“该检验不显著。”假设检验的过程和逻辑有了两个假设,就要根据数据来对它们进行判假设检验的过程和逻辑在零假设下,检验统计量实现值及(沿着备选假设的方向)更加极端值的概率称为p值(p-value)。如果得到很小的p值,就意味着在零假设下小概率事件发生了。如果小概率事件发生,是相信零假设,还是相信数据呢?当然多半是相信数据,拒绝零假设。假设检验的过程和逻辑在零假设下,检验统计量实现值及(沿着备选假设检验的过程和逻辑归纳起来,假设检验的逻辑步骤为:1.写出零假设和备选假设;2.确定检验统计量;3.确定显著性水平a;4.根据数据计算检验统计量的实现值;5.根据这个实现值计算p-值;6.进行判断:如果p-值小于或等于a,就拒绝零假设,这时犯(第一类)错误的概率最多为a;如果p-值大于a,就不拒绝零假设,因为证据不足。假设检验的过程和逻辑归纳起来,假设检验的逻辑步骤为:假设检验的过程和逻辑多数计算机软件有的直接给出p-值,有的用significant的缩写“Sig”。使用户使用非常方便之处。比如a=0.05,而假定所得到的p-值等于0.001。这时如果采用p-值作为新的显著性水平,即新的a=0.001,于是就可以说,在显著性水平为0.001时,拒绝零假设。这样,拒绝零假设时犯错误的概率实际只是千分之一而不是旧的a所表明的百分之五。在这个意义上,p值又称为观测的显著性水平(observedsignificantlevel)。假设检验的过程和逻辑多数计算机软件有的直接给出p-值,有的用假设检验的过程和逻辑使用临界值是前计算机时代的产物。当时计算p-值不易,只采用临界值的概念。但从给定的a求临界值同样也不容易,好在习惯上仅仅在教科书中列出相应于特定分布的几个有限的a临界值(比如a=0.05,a=0.025,a=0.01,a=0.005,a=0.001等等),或者根据分布表反过来查临界值(很不方便也很粗糙)。现在计算机软件都给出p值和统计量的实现值,让用户自己决定显著性水平是多少。假设检验的过程和逻辑使用临界值是前计算机时代的产物。当时计算假设检验的过程和逻辑a并不一定越小越好,因为这很可能导致不容易拒绝零假设,使得犯第二类错误的概率增大。当p-值小于或等于a时,就拒绝零假设。所以,a是所允许的犯第一类错误概率的最大值。当p-值小于或等于a时,就说这个检验是显著的。无论统计学家用多大的a作为显著性水平都不能脱离实际问题的背景。统计显著不一定等价于实际显著。反过来也一样。假设检验的过程和逻辑a并不一定越小越好,因为两总体比率之差为一不为零的常数两总体比率之差为一不为零的常数例:对两个班学生参加新东方英语培训情况进行调查:结果如下一班:调查45人,参加人数19人二班:调查65人,参加人数23人

能否据调查结果认为一班学生参加新东方英语培训的比率高于二班5%?例:对两个班学生参加新东方英语培训情况进行调查:结果如下抽样及抽样分布课件某农场为了试验某种农作物的新品种是否会比原品种的产量更高,分别在若干块面积为0.1亩的试验地进行试种,每块试验地上所收获的产量如下表(单位:kg)。假定产量服从正态分布且两种品种产量的方差相等,在5%的显著性水平下,1、新品种与原品种的产量有显著差异?2、新品种比原品种的产量有显著提高?单双尾检验对决策结果的影响某农场为了试验某种农作物的新品种是否会比原品种的产量更高,分原品种11108997107112120981031019295新品种211810792116110105106112124

1、新品种与原品种的产量有显著差异?2、新品种比原品种的产量有显著提高?11089971071121209810310192新品种2H0:=35H1:

≠35?原假设;备择假设;选择的态度:拒绝?接受?对容量为100的样本,,原假设H0是否成立。由抽样分布知道,如果H0成立,则

服从N(0,1)分布。H0:=35H1:≠35?给定=0.05则有即或区域是小概率事件,也即或是小概率事件。但是已知,小概率事件发生了,这是一个矛盾,拒绝H0:=35。给定=0.05则有

检验统计量落入拒绝域,该厂商有欺骗行为检验统计量落入接受域,实验班成绩显著提高检验统计量落入拒绝域,该厂商有欺骗行为检验统计量落入接受域,假设检验问题假设检验问题如果一个人说他是素食者。如何证明?很难!反之,如果要证明这个人吃过肉很容易,只要有一次就足够了。肯定什么事物很难,而否定却要相对容易得多。这就是假设检验背后的哲学。在假设检验中,要设立一个原假设(“从未吃过肉”就是一个例子);而设立该假设的动机主要是利用人们掌握的反映现实世界的数据来找出假设与现实之间的矛盾,从而否定这个假设。假设检验的思想如果一个人说他是素食者。如何证明?很难!假设检验的思想从一个例子看假设检验的思想例:100个银行职员样本的月收入8300元,你是否能接受“全体银行职员的平均月收入μ为8250元?12000元?8000元”?很难说,因为如果“μ=8000元”这个说法(假设)成立,样本均值8300离μ=8000不太近也不太远,出现的可能性不好判断。假设检验遵从“小概率事件一次实验发生概率极小”原则。带有概率性质的反证法

从一个例子看假设检验的思想例:100个银行职员样本的月收入统计推断参数估计假设检验通过样本统计量推断总体参数的置信区间利用样本信息判断对总体参数的假设值是否成立第六章假设检验(参数检验)hypothesistesting检验思想的逻辑:(20世纪30年代费歇尔提出)利用样本信息判断对总体参数的假设值是否成立统计推断参数估计假设检验通过样本统计量推断总体参数的置信区间本章主要内容假设的基本概念—显著性水平—假设检验的种类—假设检验中的两类错误—假设检验的规则—假设检验的步骤单一总体的均值或比率的假设检验两个总体均值或比率差异的假设检验本章主要内容假设的基本概念

消协接到消费者投诉,指控某品牌饮料容量不足,包装上标明的容量为500毫升。消协随机抽取50代该种饮料,测得平均重量为498.35毫升,标准差4.33毫升。消协能否根据样本数据,判定是生产中的正常波动,还是厂家有意所为?生产线加工的产品废品率长期不超过1%,某日抽取100件,两件是废品,生产线是否正常?。。。。。。?差异产生的原因:原因一:样本来自总体,样本差异源于由抽样的随机性原因二:样本不属于已知总体,差异源于总体本身消协接到消费者投诉,指控某品牌饮料容量不足,包装上假设检验的步骤根据实际问题提出假设给定显著性水平确定原假设成立条件下统计量的抽样分布计算检验的统计量根据检验统计量的结果,按照检验规则作出决策假设检验的步骤根据实际问题提出假设第一节假设检验的概念

一假设检验的有关概念

假设:关于总体参数值的一种看法或陈述

零假设(Nullhypothesis)接受检验的基本假设,

带等号:

nochangenodifference

据样本数据结果欲推翻的假设

备择假设(Alternatihypothesis)零假设的对立假设,不带等号:

据样本数据结果欲支持的假设第一节假设检验的概念一假设检验的有关概二假设检验的种类双尾检验:拒绝域在两侧单尾检验:拒绝域在一側——左单尾检验:拒绝域在左側——右单尾检验:拒绝域在右側二假设检验的种类双尾检验:拒绝域在两侧怎样建立零假设和备择假设对某种标准是否符合进行检验:将标准作为原假设.例:某机床配件的规格为1.5毫米,委托外企业加工,对加工后的配件进行检验,检验研究结果:研究者对研究结果的假设设为备择假,备择假设应该按照实际世界所代表的方向来确定

某医药研究机构发明一种治疗感冒的新药,以往感冒药效持续时间最长可达24小时,对新药持续时间检验对某种观点有效性的检验:(相信与否)

某电脑显示器制造商申称,其寿命不低于10000小时

怎样建立零假设和备择假设关于设立假设的讨论购货方与销货方双方协定,产品的次品率高于3%,则购货方可以退货,如果你是购货方,对产品质量进行检验:

如果销货方一贯信誉很好,如何假设?如前例:

如果销货方信誉不太好,如何假设?如前例左右都可以设,看先验信息、依据背景考虑:严格:反方向设;宽松:顺方向设零假设是研究者想用证据推翻的内容备择假设是研究者想用证据支持的内容一对假设的设立会体现研究者的主观意愿关于设立假设的讨论购货方与销货方双方协定,产品的次品率高于3例某公司设计了一种充气包,这种充气包在发生交通事故时能对司机起到缓冲保护作用。该公司广告称该充气包在发生交通事故时不超过0.2秒钟即可将气包充好,现随机抽取100个样本,测得其平均充气时间为0.19秒,标准差为0.01秒,对该公司广告的真实性作出决策。例某公司设计了一种充气包,这种充气包在发生交通事故时能对

表述方法1表述方法2假设H0:μ≤0.2秒H0:μ≥0.2秒H1:μ>0.2秒H1:μ<0.2秒Ⅰ生产的充气包的平均充气时间不超过0.2秒,但却拒绝了H0认为不合格。这使厂商失去业务机会。充气包的平均充气时间超过0.2秒,但却拒绝了H0,认为合格,这势必导致人身伤亡,并导致商誉严重损失。型错误Ⅱ平均充气时间超过0.2秒,但却认为其低于0.2秒,而接受H0。这势必导致人身伤亡,并导致商誉严重损失。平均充气时间不超过0.2秒,但却接受了H0,认为超过了0.2秒,不合格。这使厂商失去业务机会。型错误态度努力防止将合格产品误判为不合格的风险,重在保护厂商利益。努力防止将不合格产品误判合格的风险,重在保护消费者利益。表述方法1表述方法2假设H0:μ≤0.2秒H0:μ≥0.2三、显著性水平小概率事件发生的概率。(小概率事件在一次实验中发生的概率很小).原假设是正确而根据样本的信息却拒绝了原假设的概率,也叫拒绝域。根据实际问题事先确定,一般取0.01,0.05,0.10。检验结果显著(significant)意味着有理由拒绝零假设。因此,假设检验也被称为显著性检验(significanttest)。表明样本统计量和总体参数的差异显著三、显著性水平

拒绝/接受域的图示拒绝域拒绝域接受域显著性水平越小,越不容易拒绝原假设,显著性水平越大,越容易拒绝原假设,很小/大的显著性水平说明什么拒绝域拒绝域拒绝/接受域的图示拒绝域拒绝四、两类错误第一型错误(弃真错误)

原假设为真,样本信息提供拒绝原假设的统计证据。

拒绝一个正确的原假设.犯这个错误的概率为即显著性水平.统计中将只控制I型错误,不考虑错误的检验称显著性检验第二型错误(取伪错误)备择假设为真,样本信息提供不能拒绝原假设的统计证据。接受了一个错误的原假设,犯这个错误的概率为零假设备择假设哪个正确?有可能犯错误的是?四、两类错误零假设备择假设哪个正确?有可能犯错误一个小概率事件出现,因此拒绝原假设。a值越大,表明犯弃真错误的概率越大,越容易拒绝原假设,此时称检验越严格。如果在Ⅰ型错误的概率为5%或1%下拒绝原假设,说明100次拒绝原假设结论中,平均有5次或1次是错误的。a值需要由检验目的来确定,当取伪造成的损失大于弃真造成的损失时,应扩大a值。显著性水平的给定对检验结果有一定影响,在一个水平下是显著成立的,在另一个水平下可能不成立。这正是统计学意义上的结论的严格性与科学性所在。一个小概率事件出现,因此拒绝原假设。反方向变动

同时减少犯两种错误的概率奈曼和皮尔逊提出:

在控制I型错误的概率的条件下,

尽量使II型错误的概率减少。。

两类错误的关系好的检验法则:如果减小拒绝域,就意味着扩大接受域,从而扩大了犯取伪错误的概率。弃真和取伪是一对矛盾1)扩大样本量,2)使用更好的统计量,才可以使二者同时缩小反方向变动同时减少犯两种错误的概率两类错误的关系好检验统计量是数据的代表根据原假设可知检验统计量的分布检验统计量的实现值是否小概率事件小概率事件发生了,称检验结果显著原假设和备择假设并不对称假设检验与区间估计的关系

(在接受原假设,则必覆盖总体参数)

检验统计量检验统计量是数据的代表检验统计量五、假设检验的决策结果:原假设真实,样本数据支持接受原假设原假设不真实,样本数据不支持接受原假设原假设真实,样本数据不支持接受原假设原假设不真实,样本数据支持接受原假设为真不真实接受拒绝判断正确弃真错误取伪错误判断正确五、假设检验的决策结果:为

传统假设检验的步骤根据实际问题提出假设规定显著性水平确定原假设成立条件下统计量的抽样分布计算检验的统计量按照决策规则作出决策传统假设检验的步骤根据实际问题提出假设

传统的假设检验的决策规则单側检验:双側检验:传统的假设检验的决策规则单側检验:双側检验:消协接到消费者投诉,指控某品牌饮料容量不足,包装上标明的容量为500毫升。消协从市场随机抽取50袋,测得平均重量为498.35毫升,标准差4.33毫升。消协能否根据样本数据,判定是生产中的正常波动?还是厂家有意所为?显著性水平0.05标准化临界值

消协接到消费者投诉,指控某品牌饮料容量不足,包装上标明的容量标准化临界值

某高校进行数学教学方法改革,组成一个实验班30人用新方法教学,在期末的统一考试中,实验班平均成绩为80分,全年级平均77分,标准差12分,实验班的平均成绩与全年级平均成绩相比,是否显著提高?标准化临界值

某高校进行数学教学方法改革,组成一个实验非标准化临界值

优点:可对几个统计量同时进行检验非标准化临界值

非标准化临界值例

包装上标明的容量为500毫升。消协从市场随机抽取50袋,测得平均重量为498.35毫升,标准差4.33毫升。在显著性水平取0.05时检验这批产品是否合格?P182(例6.1)—188非标准化临界值例

包装上标明的容量为500毫升。消协从市场随

指成立时,样本统计量的取值等于或超过所观察到的值的概率。即否定的最低显著性水平。反映实际观察到的数据与原假设之间不一致程度的概率(犯第一类错误的概率)。例如:P值=0.01,表明如果给定一个真实的零假设,检验统计量等于或超过实际观察到的极端值的概率是0.01。

现代检验方法:用P值(概值)进行检验指成立时,样本统计量的取值等于或超过P值的计算

右单尾检验P值=

左单尾检验P值=双尾检验P值=P值的计算右单尾检验P值=t分布的P值一次概率论考试试题难度较大,出卷老师估计平均分约50分,随机抽取5份卷子,平均分65分,标准差11.6分,求P值若原假设为真,样本均值高于65分的概率仅为2.5%(即求本次抽样高于65分的概率)t分布的P值

p值的决策规则:

P值P值P值P值第二节单一样本的假设检验

----大样本下总体平均数的检验

例1(P191)某厂生产一种出口罐头,标准规格为每罐净重250克。根据以往经验,标准差为3克。随机抽取100罐进行检验,称得其平均净重为251克。该批罐头是否合乎规格?第二节单一样本的假设检验

决策规则:如则接受H0如则拒绝H0,接受H1结论:因为Z=3.33大于1.96,所以拒绝H0答:在显著性水平为0.05下,拒绝H0标准化临界值

非标准化临界值25095%Z01.96-1.96统计量Z=3.33拒绝域拒绝域C1C2决策规则:非标准化临界值25095%Z01.96-1.96统计量拒绝域251249Z

3.33

3.33P值1.961.96拒绝域拒绝域决策规则:则统计量落在接受域里则接受H0则统计量落在拒绝域里则拒绝H0250.6249.4251249Z3.333.33P值1.96例2某公司设计了一种充气包,这种充气包在发生交通事故时能对司机起到缓冲保护作用。该公司广告称该充气包在发生交通事故时不超过0.2秒钟即可将气包充好,现随机抽取100个样本,测得其平均充气时间为0.19秒,标准差为0.01秒,对该公司广告的真实性作出决策。例2某公司设计了一种充气包,这种充气包在发生交通事故时能

例2(右单尾检验)

例2(右单尾检验)

例2(左单尾检验)

例2(左单尾检验)

左单尾即置信区间下限检验问题:0.19.0.1980.2左单尾即置信区间下限检验问题:0.19.0.198P值检验(例2续)-1.645-100.05P值检验(例2续)-1.645-100.05例3某药厂研制出一种降低胆固醇的新药,行业标准规定:患者服用此药一疗程后胆固醇平均下降30个单位以上,标准差不超过10个单位为有效,才能投入生产。对100名患者进行药效观察,平均胆固醇下降了32个单位。该药是否可投入生产?例3某药厂研制出一种降低胆固醇的新药,行业标准规定例3(左单尾检验)P168

-1.645拒绝域Z=2例3(左单尾检验)P168

-1.例3(右单尾检验)P168

1.645拒绝域Z=2例3(右单尾检验)P168

1.6P—值检验法(例3续)P—值检验法(例3续)100个银行职员样本的月收入8300元,标准差640元,你是否能接受“全体银行职员的平均月收入μ高于8000元”?为0.05右尾接受原假设,左尾拒绝原假设,结论相同,逻辑不同100个银行职员样本的月收入8300元,标准差640元,你例4一种零件标准寿命应达到1200小时以上,标准差为300小时,随机抽取100件,平均寿命为1245小时。在显著性水平0.05下确定这批零件是否合格?例4一种零件标准寿命应达到1200小时以上,标准差为30小样本下总体平均数的假设检验例5某校有自主招生资格,自主招生笔试考核后,招生办估计数学的平均成绩至少为90分.从中随机抽出20份,平均成绩为83分,样本标准差为12分.试在0.01的显著性水平下检验招生办所做的推测是否正确.小样本下总体平均数的假设检验例5某校有自主招生资格例P201例P201总体平均数的假设检验例6某银行对各个网点的业务员的服务进行评价,问卷中采用李克特量表(0-10),规定7分以上为优秀,在某网点随机抽取的当日60份业务员的电子记录结果,平均7.25分,标准差1.052,该网点是否可以评为优秀?如果此例用正态统计量检验如果此例用双尾检验总体平均数的假设检验例6某银行对各个网点的业务员的总体比率的假设检验例7某企业的产品畅销于国内市场。据以往资料,,购买该产品的顾客有50%是男性。该企业的负责人关心这个比率是否发生了变化,于是该企业委托一家咨询机构进行调查,这家咨询机构从众多的购买者中随机抽选了400名进行调查,结果有210名为男性,检验“50%的顾客是男性”的观点。显著性水平为0.05总体比率的假设检验例7某企业的产品畅销于国内市场。据以抽样及抽样分布课件样本量大小对检验结果的影响某种产品要求其使用寿命不得低于1000小时。已知这种元件的寿命服从标准差为100小时的正态分布。现中随机抽查了25件,测得平均使用寿命为972小时。1、在0.05的显著性水平下,检验这批产品是否合格;2、如果抽取50件样本进行检查,在其它条件不变的情况下,检验这批产品是否合格。假设::1000,:1000=-1.4,P值=P(Z≤-1.4)=0.0808

=-1.98,P值=P(Z≤-1.98)=0.02385为什么结论不一致?分母大小不同意味什么样本量大小对检验结果的影响某种产品要求其使用寿命不得低于10某农场为了试验某种农作物的新品种是否会比原品种的产量更高,分别在若干块面积为0.1亩的试验地进行试种,每块试验地上所收获的产量如下表(单位:kg)。假定产量服从正态分布且两种品种产量的方差相等,在5%的显著性水平下,1、新品种与原品种的产量有显著差异?2、新品种比原品种的产量有显著提高?单双尾检验对决策结果的影响某农场为了试验某种农作物的新品种是否会比原品种的产量更高,分原品种11108997107112120981031019295新品种211810792116110105106112124

1、新品种与原品种的产量有显著差异?2、新品种比原品种的产量有显著提高?11089971071121209810310192新品种2β错误的计算某IT公司以往的职工平均年龄为33.5岁,现了解这个平均年龄是否发生了变化,抽取250人,=34.8岁,已知σ=14.2岁在α=0.05条件下检验该职工平均年龄是否发生变化。解:平均数大样本双尾检验(σ已知)。H0:μ=33.5H1:μ≠33.5α=0.05z=±1.96抽样标准误=0.898临界值33.5±1.96×0.89831.7,35.3决策规则:若<31.7或>35.3,拒绝H0;若31.7≤≤35.3,接受H0因为=34.8,所以接受H0如果真值μ=34.5岁β错误的计算某IT公司以往的职工平均年龄为33β=P(接受H0|μ=34.5)=(31.7≤≤35.3|μ=34.5)=P〔31.7≤≤34.5〕+P〔34.5<≤35.3〕=P〔≤z≤0〕+P〔0<z≤〕=P〔-3.12≤z≤0〕+P〔0<z≤0.89〕=0.4991+0.3133=0.8124当μ=34.5时,错误地接受H0:μ=33.5的概率为81.24%。这个概率较大,是因为μ=34.5这个真实的参数值很接近假设的μ=33.5参数值,很难区分假设值与真值的差异,即很容易犯Ⅱ型错误。β=P(接受H0|μ=34.5)抽样及抽样分布课件抽样及抽样分布课件功效曲线功效曲线抽样及抽样分布课件单一样本(总体)假设检验总结单一总体平均数平均数比率Z检验1or2tailt检验1or2tailZ检验1or2tail未知小样本已知单一样本(总体)假设检验总结单一总体平均数平均数比率Z检第三节双样本假设检验

一配对样本(matchedpairs两种配对方法)设为各对观察值之差

第三节双样本假设检验抽样及抽样分布课件抽样及抽样分布课件

例:某健美俱乐部在广告中称,在该俱乐部参加一期训练班至少减少体重17斤,为验证其广告的真实性,调查人员随机抽取了10位参加者,资料如下:在水平下,判断参加一期训练班是否至少减肥17斤?训练前189202220207194177193202208233训练后170179203192172161174187186204差值d19231715221619152229两均值差异的假设检验(配对样本)训练前189202220207112345123非标准临界值非标准临界值两总体均值差异的假设检验(独立样本)----观察两个总体的参数是否具有显著区别两总体标准差已知或大样本两总体标准差未知但相等(计算合并统计量)两总体标准差未知但不相等两总体均值差异的假设检验(独立样本)----观察两个总体的假设形式:双尾左单尾右单尾假设形式:两总体标准差已知或大样本两总体服从正态分布,已知两总体为任意分布,未知,但样本容量足够大。服从或近似服从正态分布:检验统计量:

例P207两总体标准差已知或大样本两总体服从正态分布,抽样及抽样分布课件两总体标准差未知但相等(计算合并统计量)

无偏估计量是对两样本方差计算加权平均为合并估计量(pooledestimator)。自由度为的T分布两总体标准差未知但相等(计算合并统计量)

无偏估计量是对两样两总体方差未知且不相等

由直接计算统计量两总体方差未知且不相等由直接计算统计Levene’sTestforQualityofvariancet-testforEqualityofMeansFSig.tdfSig.(2-tailed)MeandifferenceStd.ErrorDifferenceEqualvarianceassumed.02.9642.30444.048.7394.0.3636Equalvariancenotassumed2.01340.582.051.7394.0.3673P210Levene’sTestfort-testforEq两比率差异的假设检验(独立大样本)

---两个总体比率是否相等双尾右单尾左单尾两比率差异的假设检验(独立大样本)---两个总体比率

地区问卷份数欲购买家庭数A15075B200103例:调查了两个地区居民欲购买液晶电视的意向,数据如下:地区问卷份数欲购买家庭数A15075B200103例:调查了

双样本(总体)假设检验总结本章完双样本(总体)假设检验总结本章完假设检验的过程和逻辑先提出原假设,比如m=5。这种原

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论