spss讲稿5(1) SPSS参数检验和区间估计(一)_第1页
spss讲稿5(1) SPSS参数检验和区间估计(一)_第2页
spss讲稿5(1) SPSS参数检验和区间估计(一)_第3页
spss讲稿5(1) SPSS参数检验和区间估计(一)_第4页
spss讲稿5(1) SPSS参数检验和区间估计(一)_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS参数检验和区间估计

(一)假设检验概述假设检验是一种根据样本数据来推断总体的分布或均值、方差等总体统计参数的方法。根据样本来推断总体的原因:总体数据不可能全部收集到。如:质量检测问题收集到总体全部数据要耗费大量的人力和财力假设检验包括:参数检验非参数检验统计方法描述统计推断统计参数估计假设检验假设检验的基本原理基本信念:利用小概率原理进行反证明。小概率事件在一次实验中不可能发生。例如:对人民大学男生平均身高进行推断H0:平均身高为173样本平均身高为178,由于存在抽样误差,不能直接拒绝H0。而需要考虑:在H0成立的条件下,一次抽样得到平均身高为178的可能性有多大。如果可能性较大,是个大概率事件(与相比较),则不能认为H0不正确。否则,如果可能性较小,是个小概率事件,但确实发生了,则只能认为H0不正确。概率P值即为观测结果或更极端现象在零假设成立时出现的概率总体分布(populationdistribution)总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体三种不同性质的分布样本分布(sampledistribution)一组样本中各观察值的分布,也称经验分布当样本容量n逐渐增大时,样本分布逐渐接近总体的分布三种不同性质的分布样本抽样分布(samplingdistribution)样本统计量(样本均值,样本比例,样本方差等)的概率分布结果来自容量相同的所有可能样本提供了样本统计量稳定性的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 三种不同性质的分布总体计算样本统计量例如:样本均值、比例、方差样本三种不同性质的分布抽样分布容量相同的所有可能样本的样本均值的概率分布推断总体均值的理论基础【例】设一个总体,含有4个元素(个体)

,即总体单位数N=4。4

个个体分别为x1=1、x2=2、x3=3

、x4=4

。总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差样本均值的抽样分布现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)样本均值的抽样分布计算出各样本的均值3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)X样本均值的抽样分布1.00.1.2.3P(X)1.53.04.03.52.02.5样本均值的抽样分布=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(X)1.00.1.2.31.53.04.03.52.02.5X样本均值的抽样分布=50

=10X总体分布n=4抽样分布Xn=16当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X

的数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)样本均值的抽样分布当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布中心极限定理设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体X样本均值的抽样分布的分布趋于正态分布的过程样本均值的抽样分布假设检验的基本问题假设检验的概念和基本思想什么是假设(hypothesis)假设是对总体参数的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前必需陈述事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立我认为该地区新生婴儿的平均体重为3190克!我认为人口平均年龄为50岁总体抽取随机样本均值

X=20我认为人口的平均年龄是50岁提出假设

拒绝假设!

别无选择.作出决策假设检验的基本问题...因此我们拒绝假设

=50...如果这是总体的真实均值样本均值m=50抽样分布H0这个值不像我们应该得到的样本均值...20假设检验的基本问题假设检验的概念和基本思想假设检验的基本问题假设检验的概念和基本思想依据统计上的小概率原理,采用逻辑上的反证法。小概率:在一次试验中,一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设小概率由研究者事先确定假设检验的基本问题假设检验的概念和基本思想假设检验的基本步骤提出假设确定适当的检验统计量规定显著性水平计算检验统计量的观测值和概率P值作出统计决策假设检验的基本步骤:提出原假设或备择假设什么是原假设?(nullhypothesis)待检验的假设,又称“0假设”,表示为H0研究者想收集证据予以反对的假设(支持不容易,则找一个反例来拒绝)总是有等号,或,表示为:H0:

某一数值H0:

某一数值H0:某一数值例如,H0:

50(岁)假设检验的基本问题假设检验的基本步骤:提出原假设或备择假设什么是备择假设?(alternativehypothesis)与原假设对立的假设,也称“研究假设”,表示为H1研究者想收集证据予以支持的假设。总是有不等号:,

或,表示为:H1:

某一数值H1:

<某一数值H1:某一数值例如,H1:

50(岁),或50(岁)假设检验的基本问题假设检验的基本步骤:确定恰当的检验统计量什么是检验统计量?用于假设检验决策的统计量,用于反映在原假设成立条件下,样本或更极端情况出现的可能性或样本与零假设间的差距。应针对不同的问题选择不同的统计量,如:是大样本还是小样本总体方差已知还是未知如:检验统计量的基本形式为假设检验的基本问题假设检验的基本步骤:规定显著性水平

(significantlevel)什么是显著性水平?是一个概率值,表示为(alpha)原假设为真时,拒绝原假设(弃真)的概率;小概率标准常用的值有0.01,0.05,0.10,由研究者事先确定

值是决定样本能否推翻原假设的依据假设检验的基本问题假设检验的基本步骤:计算检验统计量的观测值和概率P值什么是检验统计量的观测值?即:样本所反映的信息与原假设间的差距。什么是检验统计量的概率P值?即:一个概率值,观察到的样本或更极端情况在原假设成立时出现的可能性如果原假设为真,P值是抽样分布中大于或小于样本统计量的概率假设检验的基本问题H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域抽样分布1-置信水平假设检验的基本问题H0值临界值临界值

a/2a/2

样本统计量拒绝域拒绝域抽样分布1-置信水平假设检验的基本问题H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域抽样分布1-置信水平假设检验的基本问题/

2/

2Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值假设检验的基本问题假设检验的基本步骤:作出统计决策根据给定的显著性水平,查表得出相应的临界值z或z/2,t或t/2。将检验统计量的观测值与水平的临界值进行比较,或将检验统计量的概率P值与进行比较。得出拒绝或不能拒绝原假设的结论若检验统计量观测值的绝对值大于水平的临界值,则应拒绝H0若检验统计量观测值的绝对值小于水平的临界值,则不应拒绝H0若检验统计量的概率p-值<,则应拒绝H0若检验统计量的概率p值>

,则不能拒绝H0假设检验的基本问题一个正态总体参数的假设检验假设检验的基本问题Z检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)

2检验(单尾和双尾)均值一个总体比例方差总体是否已知?用样本标准差S代替t检验小样本容量n否是z检验

z检验大

一个总体均值的假设检验总体均值的检验(2

已知或2未知大样本)假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)使用Z-统计量2

已知:2

未知:

一个总体均值的假设检验总体均值的检验(2

未知小样本)假定条件总体为正态分布2未知,且小样本使用t

统计量

一个总体均值的假设检验t分布:英国酿造化学师戈塞特,小样本研究提出的Student分布

t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布Xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)Z

一个总体均值的假设检验SPSS单样本t检验含义:检验某变量的总体均值与指定的检验值之间是否存在显著差异。例如:人均住房面积的平均值是否为20平方米基本操作步骤(1)菜单选项:Analyze->comparemeans->one-samplesTtest(2)指定检验值:在test后的框中输入检验值应用举例人均住房面积的平均值是否为20平方米注意书写步骤SPSS单样本t检验(3)option选项:Missingvalues:缺失值的处理(单样本检验时以下选项没有差别)

excludecasesanalysisbyanalysis:当分析时涉及到有缺失值变量时再剔除相应的个案excludecaseslistwise:剔除所有含缺失值的个案后再分析参数估计的一般问题点估计(pointestimate)用样本值直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计没有给出估计值接近总体参数程度的信息假设检验统计方法描述统计推断统计参数估计区间估计(intervalestimate)在点估计的基础上,以一定的把握程度(置信水平)将总体参数估计在一个区域(置信区间)内比如,某班级平均分数在75~85之间,把握程度是95%

样本统计量

(点估计)置信区间置信下限置信上限参数估计的一般问题置信区间和置信水平由样本统计量所构造的总体参数的估计区间称为置信区间统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个参数估计的一般问题置信区间和置信水平将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平,表示为(1-为是总体参数未在区间内的比例常用的置信水平值有99%,95%,90%,相应的为0.01,0.05,0.10参数估计的一般问题一个总体均值的区间估计总体均值的区间估计假定条件总体服从正态分布,且方差(2)

已知如果不是正态分布,大样本(n

30)可由正态分布来近似区间估计思路总体均值在1-置信水平下的置信区间为边际误差一个总体均值的区间估计总体均值的区间估计假定条件总体服从正态分布,且方差(2)未知大样本(n

30)总体均值在1-置信水平下的置信区间为总体均值的区间估计假定条件总体服从正态分布,且方差(2)

未知小样本(n<30)t

分布总体均值在1-置信水平下的置信区间为一个总体均值的区间估计利用SPSS单样本t检验进行区间估计option选项:confidenceinterval:指定输出-0的置信区间.默认值为95%.可以再计算99%的置信区间,和95%的置信区间进行对比区间估计和假设检验的关系:如果检验值在置信区间内,则无法拒绝原假设如果检验值不在置信区间内,则拒绝原假设双侧检验和单侧检验双侧检验例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格拒绝原假设有两种可能:大于或小于。我们想要证明(检验)的是这两种可能性中的任何一种是否成立。假设检验中的拒绝域在左右两边均存在建立的原假设与备择假设应为:

H0:

=10H1:

10单侧检验例:一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立研究者总是想证明自己的研究结论(寿命延长)是正确的拒绝假设的情况只有一种例:一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立研究者总是想证明自己的研究结论(废品率降低)是正确的拒绝假设的情况只有一种双侧检验和单侧检验假设研究的问题双侧检验左侧检验右侧检验H0m=m0m

m0m

m0H1m≠m0m<m0m>m0假设检验的类型:双侧检验和单侧检验双侧检验和单侧检验单侧检验中如何提出假设将研究者想收集证据予以支持的假设作为备择假设H1,例如:一个研究者总是想证明自己的研究结论是正确的一个销售商总是想证明供货商的说法是不正确的备择假设H1的方向与想要证明其正确性的方向一致将研究者想收集证据证明其不正确的假设作为原假设H0先确立备择假设H1,再确立原假设H0双侧检验和单侧检验单侧检验如何提出假设例:一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立研究者总是想证明自己的研究结论(废品率降低)是正确的备择假设的方向为“<”(废品率降低)建立的原假设与备择假设应为

H0:2%H1:

<2%为左侧检验双侧检验和单侧检验与研究角度有关H0值临界值a样本统计量拒绝域抽样分布1-置信水平观察到的样本统计量单侧检验中的决策问题(左侧)双侧检验和单侧检验H0值临界值a样本统计量拒绝域抽样分布1-置信水平单侧检验中的决策问题(左侧)双侧检验和单侧检验H0值临界值a样本统计量拒绝域抽样分布1-置信水平计算出的样本统计量P值左侧检验拒绝原假设的区域在左边双侧检验和单侧检验左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积单侧检验如何提出假设例:一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立研究者总是想证明自己的研究结论(寿命延长)是正确的备择假设的方向为“>”(寿命延长)建立的原假设与备择假设应为

H0:

1500H1:

1500,为右侧检验双侧检验和单侧检验与研究角度有关H0值临界值a样本统计量拒绝域抽样分布1-置信水平观察到的样本统计量单侧检验中的决策问题(右侧)双侧检验和单侧检验H0值临界值a样本统计量抽样分布1-置信水平拒绝域单侧检验中的决策问题(右侧)双侧检验和单侧检验H0值临界值a拒绝域抽样分布1-置信水平计算出的样本统计量P值双侧检验和单侧检验右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积右侧检验拒绝原假设的区域在右边【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)(2

已知)单侧检验一个总体参数的单侧检验基本步骤提出假设:H0:

1020,H1:>1020(右侧)选择检验统计量:确定显著性水平:

=

0.05计算检验统计量的观测值和概率P值:决策:P=0.008198在

=0.05的水平上拒绝H0,表明这批灯泡的使用寿命有显著提高Z0拒绝域0.051.645能否站在项目验收者的角度?一个总体参数的单侧检验

【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05)(2

未知小样本)单侧检验!一个总体参数的单侧检验基本步骤提出假设:H0:

40000,H1:

<40000(左侧)选择检验统计量:确定显著性水平:

=

0.05计算检验统计量的观测值和概率P值:决策:P=0.191253在

=0.05的水平上不能拒绝H0,不能认为该轮胎的平均寿命小于40000公里-1.7291t0拒绝域.05站在谁的角度?换个角度呢?应本着尊重样本事实的原则一个总体参数的单侧检验利用SPSS单样本t检验进行单侧检验例如:检验保险公司具有高等教育水平的员工比例的平均值是否低于0.8假设的提出p/2与比较单区间和假设检验的关系:左侧检验中,检验统计量观测值值小于右侧检验中,检验统计量观测值大于则拒绝原假设,否则,不能拒绝利用SPSS单样本t检验进行单侧检验单侧置信区间:应关注问题本身产品寿命等问题中,由于更关注最低值(不得低于某值),可将上限设为+,只计算置信下限次品率等问题中,由于更关注最大值(不得高于某值),可将下限设-,只计算置信上限计算方法:假设检验中的两类错误1. 第一类错误(弃真错误)原假设为真时拒绝原假设,即:弃真错误第一类错误的概率为例如:身高175(真),但抽到的样本是篮球队队员2. 第二类错误(取伪错误)原假设为假时接受原假设,即:取伪错误第二类错误的概率为(Beta)例如:身高200(假),抽到的样本是篮球队队员假设检验中的两类错误红线越接近蓝线(假与真越接近),越大;反之,越小越小,越大;反之,越小通常希望发生这两类错误的概率越小越好但在一定的样本容量下,不可能作到两类错误同时减少通常,较容易控制,而会受到诸多因素的影响。当真值和假设检验值相差较小时,很容易犯取伪错误拒绝零假设,接受备择假设犯错的概率是可控制的,即为接受零假设是无意义的,因为犯错误的可能性是不可控的;应将希望证明的假设放在H1上假设检验中的两类错误【例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(=0.05)双侧检验一个总体比例的检验假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的Z统计量0为假设的总体比例一个总体比例的检验H0:

=14.7%H1:

14.7%

=0.05n

=400临界值(s):检验统计量:在

=0.05的水平上不能拒绝H0认为该市老年人口比重与14.7%无显著差异决策:结论:Z01.96-1.96.025拒绝H0拒绝H0.025一个总体比例的检验利用SPSS单样本t检验进行比例检验例:利用住房调查数据,对总体的性别比例进行推断数据的1、0转换假设检验和区间估计一个总体均值检验和区间估计总结提出原假设和备择假设将希望证明的假设放在H1上,希望推翻的假设放在H0上确定适当的检验统计量总体是否已知?小样本容量n否是

大规定显著性水平计算检验统计量的观测值和概率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论