




已阅读5页,还剩114页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
*,*,不象其他科学,统计从来不打算使自己完美无缺,统计意味着你永远不需要确定无疑。GudmundR.Iversen,统计名言,*,怎样解决下面的问题?,一个水库里有多少鱼?一片原始森林里的木材储蓄量有多少?一批灯泡的平均使用寿命是多少?一批产品的合格率是多少?怎样才能知道这些问题的答案?你不可能把一个水库里的水抽干去称鱼的重量,不可能把森林伐完去量木材有多少,不可能把一批灯泡都用完去计算它的平均寿命,也不可能把每一件产品都检测完才知道它的合格率,*,统计应用德军有多少辆坦克?,二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国人在制造坦克时是墨守成规的,他们把坦克从1开始进行了连续编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了它们的生产编号。那么怎样利用这些号码来估计坦克总数呢?在这个问题中,总体参数是未知的坦克总数N,而缴获坦克的编号则是样本假设我们是盟军手下负责解决这个问题的统计人员。制造出来的坦克总数肯定大于等于记录的最大编号。为了找到它比最大编号大多少,我们先找到被缴获坦克编号的平均值,并认为这个值是全部编号的中点。因此样本均值乘以2就是总数的一个估计;当然要特别假设缴获的坦克代表了所有坦克的一个随机样本。这种估计N的公式的缺点是:不能保证均值的2倍一定大于记录中的最大编号,*,统计应用德军有多少辆坦克?,N的另一个点估计公式是:用观测到的最大编号乘以因子1+1/n,其中n是被俘虏坦克个数。假如你俘虏了10辆坦克,其中最大编号是50,那么坦克总数的一个估计是(1+1/10)50=55。此处认为坦克的实际数略大于最大编号从战后发现的德军记录来看,盟军的估计值非常接近所生产的坦克的真实值。记录仍然表明统计估计比通常通过其他情报方式作出估计要大大接近于真实数目。统计学家们做得比间谍们更漂亮,资料来源:GUDMUNDR.IVERSEN和MARYGERGRN著,统计学基本概念和方法,*,统计应用小儿麻痹症实验,1954年,为了检验沙克疫苗对小儿麻痹症预防的有效性而进行了一项实验。大约有20万名儿童注射了无效的盐水,而另外20万名儿童注射了疫苗这项实验是“双盲的”,因为接受注射的儿童不知道是被注射了疫苗还是安慰剂,进行注射并评价结果的医生也不知道在20万名注射疫苗的儿童中,只有33人后来患了小儿麻痹症,而注射了盐水的20万名儿童中后来有115人患了小儿麻痹症。根据这些结果和其他一些结果的统计分析得出结论,沙克疫苗在预防小儿麻痹症方面确实是有效的,第4章用样本推断总体,4.1怎样进行推断?4.2估计总体参数4.3检验总体假设,4.1怎样进行推断?4.1.1用估计量估计总体参数4.1.2用什么方法进行估计?4.1.3用什么样的估计量去估计?,第4章用样本推断总体,4.1.1用估计量估计总体参数,4.1怎样进行推断?,*,关心总体的哪些参数?,*,估计量:用于估计总体参数的随机变量如样本均值,样本比例,样本方差等例如:样本均值就是总体均值的一个估计量参数用表示,估计量用表示估计值:估计参数时计算出来的统计量的具体值如果样本均值x=80,则80就是的估计值,估计量与估计值(estimator&estimatedvalue),4.1.2用什么方法进行估计?,4.1怎样进行推断?,*,点估计(pointestimate),用样本的估计量的某个取值直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计无法给出估计值接近总体参数程度的信息虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量,*,区间估计(intervalestimate),在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在7585之间,置信水平是95%,*,区间估计的图示,x,*,将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平表示为(1-为是总体参数未在区间内的比例常用的置信水平值有99%,95%,90%相应的为0.01,0.05,0.10,置信水平(confidencelevel),*,由样本统计量所构造的总体参数的估计区间称为置信区间统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个总体参数以一定的概率落在这一区间的表述是错误的,置信区间(confidenceinterval),*,置信区间(95%的置信区间),重复构造出的20个置信区间,点估计值,*,置信区间与置信水平,4.1.3用什么样的估计量去估计?(标准),4.1怎样进行推断?,*,无偏性(unbiasedness),无偏性:估计量抽样分布的数学期望等于被估计的总体参数,*,有效性(efficiency),有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效,*,一致性(consistency),一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数,A,B,较小的样本容量,较大的样本容量,P(),4.2估计总体参数4.2.1总体均值的估计4.2.2总体比例的估计4.2.3总体方差的估计,第4章用样本推断总体,4.2.1总体均值的估计,4.2估计总体参数,*,一个总体均值的区间估计,总体均值在1-置信水平下的置信区间,大样本(n30)小样本(n30),总体方差()未知,样本均值分位数值样本均值的标准误差,*,一个总体均值的区间估计(例题分析大样本),【例】一家保险公司收集到由36个投保人组成的随机样本,得到每个投保人的年龄(单位:周岁)数据如下表。试建立投保人年龄90%的置信区间,*,一个总体均值的区间估计(例题分析大样本),解:已知n=36,1-=90%,z/2=1.645。根据样本数据计算得:,总体均值在1-置信水平下的置信区间为,投保人平均年龄的置信区间为37.37岁41.63岁,统计函数CONFIDENCE,*,一个总体均值的区间估计(例题分析小样本),【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:小时)如下。建立该批灯泡平均使用寿命95%的置信区间,*,一个总体均值的区间估计(例题分析小样本),解:已知N(,2),n=16,1-=95%,t/2=2.131根据样本数据计算得:,总体均值在1-置信水平下的置信区间为,该种灯泡平均使用寿命的置信区间为1476.8小时1503.2小时,*,两个总体均值之差的区间估计(独立大样本),1-2在1-置信水平下的置信区间,独立大样本(n130,n230),(x1-x2)分位数值(x1-x2)的标准误差,*,两个总体均值之差的区间估计(独立小样本:12=22),两个正态总体,未知但相等:1=2两个独立小样本(n130和n230),估计量x1-x2的标准化,总体方差的合并估计量,*,两个总体均值之差的区间估计(独立小样本:1222),两个正态总体,未知但相等:12两个独立小样本(n130和n230),估计量x1-x2的标准化,自由度,*,两个总体均值之差的区间估计(匹配样本),两个匹配大样本(n130和n230),d分位数值d的标准误差,d=(1-2)在1-置信水平下的置信区间,两个匹配小样本(n130和n230),*,两个总体均值之差的估计(例题分析独立小样本),【例】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,每个工人组装一件产品所需的时间(单位:分钟)下如表。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间,*,两个总体均值之差的估计(例题分析独立小样本),解:根据样本数据计算得合并估计量为,两种方法组装产品所需平均时间之差的置信区间为0.14分钟7.26分钟,*,两个总体均值之差的估计(例题分析匹配样本),【例】由10名学生组成一个随机样本,让他们分别采用A和B两套试卷进行测试,结果如下表。试建立两种试卷分数之差d=1-295%的置信区间,STATISTICS,*,两个总体均值之差的估计(例题分析匹配样本),解:根据样本数据计算得,两种试卷所产生的分数之差的置信区间为6.3分15.7分,4.2.2总体比例的估计,4.2估计总体参数,*,一个总体比例的区间估计(传统方法),设总体服从二项分布,即X(n,p),P为n次独立伯努利试验成功的概率试验次数n非常大(np10;n(1-p)10),否则该方法不能用当样本很小时,传统方法计算出的1-置信水平下的置信区间能够覆盖总体真实比例的概率小于小于1-传统方法仍被广泛使用当样本量非常大时,传统方法与现代方法的结果几乎相同。小样本情况下,现代方法更适用,总体比例在1-置信水平下的置信区间,样本比例分位数值样本比例的标准误差,*,一个总体比例的区间估计(传统方法),总体比例在1-置信水平下的置信区间,样本比例p的标准化,*,一个总体比例的区间估计(传统方法),【例】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间,解:已知n=100,p65%,1-=95%,z/2=1.96,该城市下岗职工中女性比例的置信区间为55.65%74.35%,*,一个总体比例的区间估计(现代方法),按照传统方法计算出来的置信水平为(1-)的置信区间能够覆盖总体真实比例的概率小于(1-),既是大样本也是如此,更不可能应用于小样本根据经验法则:传统方法要求np(成功次数)和n(1-p)(失败次数)均应该大于10(也有些书上说大于5)对于非常大的样本,传统方法和现代方法的结果几乎相同,但对于小样本或中等样本现代方法更适用,*,一个总体比例的区间估计(现代方法),通过修正试验次数n(样本量)和试验成功的比例P(样本比例)改进置信区间将试验次数n加上4,即用代替n;将试验成功的次数x加上2,即用代替p对于任意大小的样本都可以使用该方法计算置信区间只是在样本较小时,偶尔会有区间下限小于0或区间上限大于1的情况发生。此时可用0代替小于0的下限,用1代替大于1的上限,*,一个总体比例的区间估计(现代方法),设总体服从二项分布,即X(n,p),x为n次独立伯努利试验成功的次数,P为成功的概率定义和总体比例在1-置信水平下的置信区间该区间也称为Agresti-Coull区间(由AlanAgresti和BrentCoull给出,以其姓氏命名)如果下限小于0则用0代替;如果上限大于1则用1代替,*,一个总体比例的区间估计(现代方法),【例】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间,解:,该城市下岗职工中女性比例的置信区间为47.72%79.12%,*,设两总体都服从二项分布,即X1(n1,p1),X2(n2,p2)。x1为n1次独立伯努利试验成功的次数,P1位成功的概率概率,x2为n2次独立伯努利试验成功的次数,P2为成功的概率试验次数n1和n2都非常大(n1p110,n1(1-p1)10;n2p210,n2(1-p2)10),否则该方法不能用对于大样本,传统方法的结果与现代方法比较接近,但对于小样本,传统方法计算出的1-置信水平下的置信区间能够覆盖总体真实比例的概率小于小于1-,两个总体比例之差的区间估计(传统方法),比例之差1-2在1-置信水平下的置信区间,(p1-p2)分位数值(p1-p2)的标准误差,*,p1-p2的标准化,两个总体比例之差的区间估计(传统方法),1-2在1-置信水平下的置信区间,*,两个总体比例之差的区间估计(现代方法),通过修正试验次数n1、n2(样本量)和试验成功的比例P1、P2(样本比例)改进置信区间将试验次数n1和n1各加上2,即用代n1,代替n2;将试验成功的次数x1和x1各加上1,即用代替p1,用代替p2对于任意大小的样本都可以使用该方法计算置信区间,*,两个总体比例之差的区间估计(现代方法),设两总体都服从二项分布,即X1(n1,p1),X2(n2,p2)。x1为n1次独立伯努利试验成功的次数,P1为成功的概率概率,x2为n2次独立伯努利试验成功的次数,P2为成功的概率定义,;,1-2在1-置信水平下的置信区间该区间也称为Agresti-Caffo区间(由AlanAgresti和BrianCaffo给出,以其姓氏命名)如果下限小于-1则用-1代替;如果上限大于1则用1代替,4.2.3总体方差的估计,4.2估计总体参数,*,一个总体方差的区间估计,假设总体服从正态分布一个总体方差在1-置信水平下的置信区间,两个总体方差比在1-置信水平下的置信区间,*,总体方差的区间估计(图示),*,两个总体方差比的区间估计(图示),4.3检验总体假设4.3.1怎样提出假设?4.3.2依据什么作出决策?4.3.3总体均值的检验4.3.4总体比例的检验4.3.5总体方差的检验,第4章用样本推断总体,4.3.1怎样提出假设?,4.3检验总体假设,*,假设与假设检验(hypothesis&hypothesistest),假设是对总体参数的具体数值所作的陈述假设检验是利用样本信息判断假设是否成立的过程逻辑上运用反证法,统计上依据小概率原理,*,原假设(nullhypothesis),研究者想收集证据予以反对的假设表达参数没有变化或变量间没有关系假定样本反映的结果是由于样本与总体之间的随机差异导致的又称“0假设”总是有符号,或4.表示为H0H0:=某一数值指定为符号=,或例如,H0:10cm,null,*,研究者想收集证据予以支持的假设假定样本反映的结果是真实的也称“研究假设”总是有符号,或表示为H1H1:某一数值,或某一数值例如,H1:10cm,或10cm,备择假设(alternativehypothesis),*,【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设(例题分析),解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为H0:500H1:”或“”,称为右侧检验,双侧检验与单侧检验,4.3.2依据什么作出决策?,4.3检验总体假设,*,检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布,用统计量决策(teststatistic),标准化的检验统计量,*,用统计量决策(双侧检验),*,用统计量决策(左侧检验),抽样分布,H0,临界值,a,拒绝H0,1-,置信水平,RegionofRejection,RegionofNonrejection,*,用统计量决策(右侧检验),抽样分布,H0,临界值,2,拒绝H0,1-,置信水平,RegionofNonrejection,RegionofRejection,*,用P值决策(P-value),如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设被称为观察到的(或实测的)显著性水平决策规则:若p值,拒绝H0,*,双侧检验的P值,*,左侧检验的P值,Z,拒绝H0,0,临界值,计算出的样本统计量,1/2P值,*,右侧检验的P值,Z,拒绝H0,0,计算出的样本统计量,临界值,1/2P值,*,拒绝H0,P值决策与统计量的比较,拒绝H0的两个统计量的不同显著性,Z,拒绝H0,0,统计量1,P1值,统计量2,P2值,拒绝H0,临界值,*,原假设的可信度又多高?如果H0所代表的假设是人们多年来一直相信的,就需要很强的证据(小的P值)才能说服他们拒绝的结论是什么?如果拒绝H0而肯定H1,你就需要有很强的证据显示要支持H1。比如,H1代表要花很多钱把产品包装改换成另一种包装,你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本),多大的P值合适?,显著性检验的目的是要描述样本所提供不利于原假设的证据有多强。P值就在做这件事。但是,要证明原假设不正确,P值要多小,才能令人信服呢?这要根据两种情况来确定,*,决策就有可能犯错误,1.第类错误(弃真错误)原假设为正确时拒绝原假设第类错误的概率记为被称为显著性水平2.第类错误(取伪错误)原假设为错误时未拒绝原假设第类错误的概率记为(Beta),*,错误和错误的关系,你要同时减少两类错误的惟一办法是增加样本量,和的关系就像翘翘板,小就大,大就小,*,两类错误的控制,一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的概率定得高些一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第类错误的发生概率,*,怎样表述决策结果?(“显著”与“不显著”),当拒绝原假设时,我们称样本结果是统计上显著的拒绝原假设时结论是清楚的当不拒绝原假设时,我们称样本结果是统计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的,*,怎样表述决策结果?(“接受”与“不拒绝”),你不能证明原假设是什么而只能证明它不是什么假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意为着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但实事上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确,*,怎样表述决策结果?(为什么不说“接受”),【例】比如原假设为H0:=10,从该总体中抽出一个随机样本,得到x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意为着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H0:=10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?我们不知道,*,Significant(显著的)一词的意义在这里并不是“重要的”,而是指“非偶然的”在假设检验中,如果样本提供的证据拒绝原假设,我们说检验的结果是显著的,如果不拒绝原假设,我们则说结果是不显著的一项检验在统计上是“显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的拒绝原假设,表示这样的样本结果并不是偶然得到的;不拒绝原假设(拒绝原假设的证据不充分),则表示这样的样本结果只是偶然得到的,统计显著不等于实际显著(significant),*,统计显著不等于实际显著(统计上显著不一定有实际意义),当原假设被拒绝时,我们称样本结果在统计上是显著的(statisticallySignificant),当不拒绝原假设时,我们称样本结果在统计上是不显著的P值越小,表明结果越显著。但检验结果究竟是“显著的”、“中度显著的”还是“高度显著的”,需要由研究者自己根据P值大小和实际问题来决定在“显著”和“不显著”之间没有清除的界限,只是在P值越来越小时,我们就有越来越强的证据,检验的结果也就越来越显著一个在统计上显著的结论在实际中却不见得很重要,也不意为着就有实际意义。因为P值不仅和样本大小密切相关,也和总体参数的真值有关样本容量越大,P值就越小大的样本几乎总是导致拒绝原假设,*,较大的样本会让显著性检验比较敏感用小样本作的显著性检验敏感度又常常不够在总体真值不变的情况下,大的样本会使P值变小,而小的P值也不一定就有实际显著性无论总体的状况如何,观测值多一点,就可以让我们抓的值抓得准些在假设检验时,不仅要报告P值,而且也要报告样本大小,统计显著不等于实际显著(大样本导致结果显著),*,统计显著不等于实际显著(样本量对检验结果的影响),投掷硬币1000次、4040次和10000次时出现正面样本比例的抽样分布,0.5,0.507,这个结果出乎预料吗?,4.3.3总体均值的检验,4.3检验总体假设,*,一个总体均值的检验(作出判断),样本容量n,*,一个总体均值的检验(例题分析大样本),【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(=0.01),左侧检验,*,一个总体均值的检验(例题分析大样本),H0:1.35H1:1.35=0.01n=50临界值(c):,检验统计量:,拒绝H0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策:,结论:,*,一个总体均值的检验(P值的计算与应用大样本),第1步:进入Excel表格界面,直接点击【f(x)】第2步:在函数分类中点击【统计】,并在函数名的菜单下选择【ZTEST】,然后【确定】第3步:在所出现的对话框【Array】框中,输入原始数据所在区域;在【X】后输入参数的某一假定值(这里为1.35);在【Sigma】后输入已知的总体标准差(若总体标准差未知则可忽略不填,系统将自动使用样本标准差代替)第4步:用1减去得到的函数值0.995421023即为P值P值=1-0.995421023=0.004579P值=0.05,故不拒绝H0,*,两个总体均值之差的检验(独立大样本),1.假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n130和n230)检验统计量12,22已知:12,22未知:,*,两个总体均值之差的检验(独立小样本:12,22已知),假定条件两个独立的小样本两个总体都是正态分布12,22已知检验统计量,*,两个总体均值之差的检验(独立小样本:12,22未知但12=22),假定条件两个独立的小样本两个总体都是正态分布12、22未知但相等,即12=22检验统计量,其中:,自由度:,*,两个总体均值之差的检验(独立小样本:12,22未知且不等1222),假定条件两个总体都是正态分布12,22未知且不相等,即1222样本容量不相等,即n1n2检验统计量,自由度:,*,两个总体均值之差的估计(例题分析独立小样本),【例】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,每个工人组装一件产品所需的时间(单位:分钟)下如表。假定两种方法组装产品的时间服从正态分布,方差未知且不相等。检验两种方法组装产品所需平均时间是否有显著差异?=0.05,*,两个总体均值之差的检验(用Excel进行检验),第1步:将原始数据输入到Excel工作表格中第2步:选择“工具”下拉菜单并选择【数据分析】选项第3步:在【数据分析】对话框中选择【t-检验:双样本异方差假设】第4步:当对话框出现后在【变量1的区域】方框中输入第1个样本的数据区域在【变量2的区域】方框中输入第2个样本的数据区域在【假设平均差】方框中输入假定的总体均值之差在【】方框中输入给定的显著性水平(本例为0.05)在【输出选项】选择计算结果的输出位置,然后【确定】,用Excel进行检验,*,两个总体均值之差的检验(匹配样本),假定条件两个总体配对差值构成的总体服从正态分布配对差是由差值总体中随机抽取的数据配对或匹配(重复测量(前/后)检验统计量,样本差值均值,样本差值标准差,*,两个总体均值之差的检验(用Excel进行检验匹配样本),第1步:选择“工具”下拉菜单,并选择【数据分析】选项第3步:在分析工具中选择【t检验:平均值成对二样本分析】第4步:当出现对话框后在【变量1的区域】方框内键入变量1的数据区域在【变量2的区域】方框内键入变量2的数据区域在【假设平均差】方框内键入假设的差值(这里为0)在【】框内键入给定的显著性水平,然后【确定】,用Excel进行检验,*,两个总体均值之差的检验(TTEST函数的应用),函数语法:TTEST(array1,array2,tails,type)说明:【Array1】为样本1的数据区域【array2】为样本2的数据区域【tails】表示分布曲线的尾数如果tails=1,返回分布的单尾概率如果tails=2,返回分布的双尾概率【type】为检验的类型1代表配对样本检验1代表双样本等方差假设3代表双样本异方差假设,用TTEST进行检验,4.3.4总体比例的检验,4.3检验总体假设,*,一个总体比例检验,假定条件总体服从二项分布可用正态分布来近似(大样本)检验的z统计量,0为假设的总体比例,*,1.假定条件两个总体都服从二项分布可以用正态分布来近似检验统计量检验H0:1-2=0检验H0:1-2=d0,两个总体比例之差的检验,*,一个总体比例的检验(例题分析),【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平=0.05和=0.01,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?,双侧检验,*,一个总体比例的检验(例题分析),H0:=80%H1:80%=0.05n=200临界值(c):,检验统计量:,拒绝H0(P=0.013328=0.01),样本提供的证据还不足以推翻“该杂志声
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商场施工清场方案(3篇)
- 电梯环境改造方案(3篇)
- 景区门楼改建方案(3篇)
- 基础护理教学教学课件
- 服装导购绩效方案(3篇)
- 样品生产控制方案(3篇)
- 民族地区草场承包与民族团结进步协议
- 菜鸟驿站快递网点转让与经营规范协议
- 出租车驾驶员心理健康保障合同
- 厂房拆除与拆除区域安全防护与交通管制合同
- 人教版五年级音乐下册保卫黄河课件模板
- 气象行业天气预报技能竞赛理论试题库资料(含答案)
- 三菱V73电路手册电路图
- 装修设计购销合同
- 一把手讲安全课件:提升全员安全意识
- 3.4重力坝的应力分析资料
- (新版)油田数字化运维理论考试题库-下(判断题)
- YS∕T 1184-2017 原铝液贮运安全技术规范
- 黑龙江省易地调动领导干部周转住房管理办法
- 大型设备吊装安全施工施工方法及工艺要求
- 骨科快速康复(ERAS)
评论
0/150
提交评论