第六章参数检验的学习_第1页
第六章参数检验的学习_第2页
第六章参数检验的学习_第3页
第六章参数检验的学习_第4页
第六章参数检验的学习_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章参数检验的学习第一页,共四十九页,编辑于2023年,星期一均值比较与均值比较的检验过程均值比较的概念统计分析常常采取抽样研究的方法,即从总体中随机抽取一定数量的样本进行研究来推断总体的特性。由于总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同。又由于实验者测量技术的差别或测量仪器精确程度的差别等等也会造成一定的偏差,使样本统计量与总体参数之间存在差异。由此可以得到这样的认识:均值不相等的两组样本不一定来自均值不同的总体。能否用样本均值估计总体均值?两个变量均值接近的样本是否来自均值相同的总体?换句话说,两组样本某变量均值不同,其差异是否具有统计意义?能否说明总体具有显著性差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。第二页,共四十九页,编辑于2023年,星期一6.1参数检验概述6.1.1推断统计与假设检验推断统计是根据样本数据推断总体数量特征的统计分析方法。推断统计通常包括以下两个内容:一是总体分布已知,根据样本数据对总体分布的统计参数(如均值、方差)进行推断,此时采用的推断方法称为参数估计或者参数检验;二是总体分布未知,根据样本数据对总体的分布形式进行推断,此时采用的推断方法称为非参数检验。第三页,共四十九页,编辑于2023年,星期一统计方法描述统计推断统计估计假设检验参数检验非参数检验第四页,共四十九页,编辑于2023年,星期一6.1.2假设检验的基本思想1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立;2.采用逻辑上的反证法,依据统计上的小概率原理。第五页,共四十九页,编辑于2023年,星期一...因此我们拒绝假设

=50...如果这是总体的真实均值样本均值m

=50抽样分布H0这个值不像我们应该得到的样本均值...20第六页,共四十九页,编辑于2023年,星期一6.1.3假设检验的步骤提出原假设(零假设)H0;确定适当的检验统计量;计算检验统计量的值发生的概率(P值);给定显著性水平;作出统计决策。第七页,共四十九页,编辑于2023年,星期一6.2MEANS过程功能:分组计算、比较指定变量的描述统计量。包括均值、标准差、总和、观测数、方差等等,还可以给出方差分析表和线性检验结果。Analyze->CompareMeans->MeansDependentList:用于选入需要分析的变量,如果选入两个以上变量,系统会在同一张输出表中依次给出分析结果。Layer:用于选入分组变量,如果选入两个以上的变量,系统会根据layer的设置情况作出不同的反应。Options子对话框:用于选择需要计算的描述统计量和统计分析。第八页,共四十九页,编辑于2023年,星期一第九页,共四十九页,编辑于2023年,星期一Statistics框:可选的描述统计量;cellststistics:选入的描述性统计量Statisticsforfirstlayer复选框:用于选择是否检验第一层的分组变量对结果变量的影响有无统计意义。Anovatableandeta:对分组变量进行单因素方差分析,用于度量分组变量和结果变量间的关联性。Eta平方表示由组间差异所解释的结果变量的方差的比例。Testforlinearity:检验线性相关性,即不同组的均值间是否存在线性趋势。当分组变量为数值型变量时系统自动进行线性相关性检验。第十页,共四十九页,编辑于2023年,星期一第十一页,共四十九页,编辑于2023年,星期一6.3单样本的T检验6.3.1检验目的:检验单个变量的均值是否与给定的常数(总体均值)之间是否存在显著差异。如:分析学生的IQ平均分是否为100分;大学生考研率是否为5%。要求样本来自的总体服从或近似服从正态分布。第十二页,共四十九页,编辑于2023年,星期一总体均值的检验总体是否已知?用样本标准差S代替

t检验小样本容量n否是z检验

z检验大第十三页,共四十九页,编辑于2023年,星期一总体均值的检验(2

已知或2未知、大样本)1.假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)

2.使用Z-统计量2

已知:2

未知:第十四页,共四十九页,编辑于2023年,星期一总体均值的检验(2未知小样本)1. 假定条件总体为正态分布2未知,且小样本2. 使用t

统计量第十五页,共四十九页,编辑于2023年,星期一6.3.2单样本T检验的实现思路提出原假设:计算检验统计量和概率P值给定显著性水平与p值做比较:如果p值小于显著性水平,小概率事件在一次实验中发生,则我们应该拒绝原假设,反之就不能拒绝原假设。第十六页,共四十九页,编辑于2023年,星期一6.3.3单样本t检验的基本操作步骤1、选择选项Analyze-Comparemeans-One-SamplesTtest,出现窗口:第十七页,共四十九页,编辑于2023年,星期一2、在TestValue框中输入检验值。3、单击Option按钮定义其他选项。Option选项用来指定缺失值的处理方法。其中,Excludecasesanalysisbyanalysis表示计算时涉及的变量上有缺失值,则剔除在该变量上为缺失值的个案;Excludecaseslistwise表示剔除所有在任意变量上含有缺失值的个案后再进行分析。可见,较第二种方式,第一种处理方式较充分地利用了样本数据。在后面的分析方法中,SPSS对缺失值的处理方法与此相同,不再赘述。另外,还可以输出默认95%的置信区间。至此,SPSS将自动计算t统计量和对应的概率p值。第十八页,共四十九页,编辑于2023年,星期一案例6-1:使用住房状况调查数据,推断家庭人均住房面积的平均值是否为20平方米。第十九页,共四十九页,编辑于2023年,星期一第二十页,共四十九页,编辑于2023年,星期一第二十一页,共四十九页,编辑于2023年,星期一案例6-2:使用“各保险公司人员构成情况”数据,对目前保险公司从业人员受高等教育的程度和年轻化的程度进行推断。具体说就是推断具有高等教育水平的员工平均比例是否不低于0.8,年轻人的平均比例是否为0.5.第二十二页,共四十九页,编辑于2023年,星期一第二十三页,共四十九页,编辑于2023年,星期一第二十四页,共四十九页,编辑于2023年,星期一6.4两独立样本的T检验6.4.1两独立样本T检验的目的利用来自两个总体的独立样本,推断两个总体的均值是否存在显著性差异;两独立样本的样本容量可以相等,也可以不相等;样本来自的总体服从或近似服从正态分布。第二十五页,共四十九页,编辑于2023年,星期一两个独立样本之差的抽样分布

m1s1总体1s2

m2总体2抽取简单随机样样本容量n1计算X1抽取简单随机样样本容量n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X2m1-m2抽样分布第二十六页,共四十九页,编辑于2023年,星期一两个总体均值之差的检验(12、22

已知)1.假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和n230)

2.检验统计量为第二十七页,共四十九页,编辑于2023年,星期一两个总体均值之差的检验(12、22

未知,大样本)检验统计量为第二十八页,共四十九页,编辑于2023年,星期一两个总体均值之差的检验(12、22

未知但相等,小样本)检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等检验统计量其中:第二十九页,共四十九页,编辑于2023年,星期一两个总体均值之差的检验(12、22

未知且不相等,小样本)检验具有不等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知且不相等1222检验统计量第三十页,共四十九页,编辑于2023年,星期一方差齐性检验(LeveneF方法):计算两组样本的均值计算各个样本与本组均值的平均离差绝对值;利用单因素方差分析推断两独立总体平均离差绝对值是否有显著差异。在对两独立样本进行T检验时,两组样本方差相等和不等时使用的计算t值的公式不同,所以首先进行方差F检验。用户需要根据F检验的结果自己判断选择t检验输出中的哪个结果,得出最后结论。如果推断两总体方差相等则看方差相等的T检验值和P值,如果推断两总体方差不相等则看方差不相等的T检验值和P值。第三十一页,共四十九页,编辑于2023年,星期一6.4.2两独立样本T检验的实现思路提出原假设两总体均值不存在显著差异:计算统计量和P值:首先利用F检验确定两个总体的方差是否相等;然后再选择合适的T统计量计算观测值和概率P值;根据显著性水平和概率P值进行统计决策。第三十二页,共四十九页,编辑于2023年,星期一6.4.3两独立样本t检验的基本操作步骤

进行两独立样本t检验之前,正确地组织数据是一个非常关键的任务。SPSS要求将两组样本数据存放在一个SPSS变量中,同时,为区分哪些样本来自哪个总体,还应定义一个分类变量。

SPSS两独立样本t检验的基本操作步骤是:1、选择菜单Analyze-Comparemeans-Independent-SamplesTTest,出现窗口第三十三页,共四十九页,编辑于2023年,星期一第三十四页,共四十九页,编辑于2023年,星期一2、选择检验变量到TestVariable(s)框中。3、选择总体标志变量到GroupingVariables框中。4、单击DefineGroups按钮定义两总体的标志值。其中:Usespecifiedvalues表示分别输入两个不同总体的变量值;Cutpoint框中应输入一个数字,大于等于该值的对应一个总体,小于该值的对应另一个总体。第三十五页,共四十九页,编辑于2023年,星期一5、两独立样本t检验的Option选项含义与单样本t检验的相同。至此,SPSS会首先自动计算F统计量,并计算在两总体相等会不相等下的均值差的方差和t统计量的观测值以及各自对应的双尾概率p值。第三十六页,共四十九页,编辑于2023年,星期一6.4.4两独立样本t检验的应用举例案例6-3:本市户口与外地户口家庭人均住房面积的平均值比较利用住房状况调查数据,分析本市户口与外地户口家庭人均住房面积的平均值是否存在显著差异?分析:该问题中,由于本市户口和外地户口家庭人均住房面积可以看成两个总体,且可近似认为服从正态分布,且样本数据的获取是独立抽样的,因此,可以用两独立样本t检验的方法进行分析。零假设是本市户口与外地户口家庭人均住房面积的平均值无显著差异,即第三十七页,共四十九页,编辑于2023年,星期一第三十八页,共四十九页,编辑于2023年,星期一第三十九页,共四十九页,编辑于2023年,星期一第四十页,共四十九页,编辑于2023年,星期一案例6-4:根据各保险公司人员构成情况数据,分析全国性保险公司与外资和合资保险公司中具有高等教育水平员工比例的均值有无显著差异。第四十一页,共四十九页,编辑于2023年,星期一第四十二页,共四十九页,编辑于2023年,星期一6.5两配对样本的T检验6.5.1两配对样本T检验的目的利用来自两个总体的配对样本,推断两个总体的均值是否存在显著性差异;两配对样本的样本容量应该相等,两组样本观察值的顺序一一对应,不能随意改变;样本来自的总体服从或近似服从正态分布。第四十三页,共四十九页,编辑于2023年,星期一配对样本的t

检验(数据形式)

观察序号样本1样本2差值1x11x21D1=x11-x212x12x22D1=x12-x22MMMMix1ix2iD1=x1i-x2iMMMMnx1nx2nD1=x1n-x2n第四十四页,共四十九页,编辑于2023年,星期一配对样本的t

检验(检验统计量)样本差值均值样本差值标准差自由度df=nD-1统计量D0:假设的差值第四十五页,共四十九页,编辑于2023年,星期一6.5.2两配对样本T检验的实现思路提出原假设:两总体均值不存在显著差异;选择检验统计量。两配对样本T检验是间接通过单样本T检验实现的。配对样本T检验实际上是先求出每对观测值之差值,对差值变量求平

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论