第二部分 单样本和双样本假设检验.ppt_第1页
第二部分 单样本和双样本假设检验.ppt_第2页
第二部分 单样本和双样本假设检验.ppt_第3页
第二部分 单样本和双样本假设检验.ppt_第4页
第二部分 单样本和双样本假设检验.ppt_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 假设检验导论:单样本的z检验,A基本概念,零假设检验 统计决定 一类错误和二类错误 单侧检验和双侧检验,在前四章中,我们对描述性统计做了介绍。特别是通过z分数我们可以计算个体在总体分布中的位置和样本在抽样分布中的位置。换句话说,我们可以描述个体或者样本的特殊性。 那么处于怎样的位置才算是特殊呢?这种特殊性有怎么来验证呢? 这些问题是假设检验所要解决的问题。,最简单的假设检验是将一组被试与总体进行比较,且总体均数和标准差已知。 举个例子,硕士研究生考试包含笔试和面试,面试在最终录取中起到了很大的作用,因为导师更看重素质而不是分数。 有个导师声称,他的眼光很准,他可以看一下学生的眼睛,就能

2、找到好的学生。我们要对他的说话进行验证。,如果我们用智商来代表一个学生的素质(尽管可能并不合适),那么刚才的问题就变成了那个导师可以通过看学生的眼睛来判断他的智商。 我们可以通过如下方式进行检验:让他通过自己的方式挑出25个学生,然后比较这些学生的智商是否真的较高。,被试组选择,要验证该导师的说法,我们要让他选25个他认为高智商的同学,但是这种选择需要加以限制。 如果该导师直接奔向基地班,那这种选择显然是无效的。可选择的办法是,把学校所有学生的照片都找来,让其通过相貌来确定。 这样学校的每一个学生都有相同的机会被选到,而且每一次选取独立于其他的选取。也就是遵循随机取样的原则。,如果该导师选出的

3、学生的平均智商确实高于总体平均,我们能否确认他确实眼光很准呢? 答案是不能。原因在于,我们随便找一个人去选,选出的学生的平均智商都不太可能等于总体平均数。从均数的抽样分布,我们可以得知,高于总体平均数的可能占50%。 也就是说该导师选出的学生平均智商高于总体均数的原因可能是随机因素。,这时,我们可以先做出一个假设,对其进行验证:选取学生的平均智商并不显著高于总体均数,其差异是随机抽样产生的,并不涉及一个特别的选择过程。这就是零假设检验。 接下来,我们要做的就是随机选取25个学生测其智商,重复n次,看有多少次能选到比那个导师选取的学生平均智商更高。也就是确定其概率。,上述的做法会得到智商均数的一

4、个分布,由于这个分布显示的是零假设(没有特殊操作,随机选取)为真时发生的情况,因此被称为零假设分布。 在单样本检验且总体标准差已知的情况下,这个零假设分布就是均数的抽样分布。,通过这个零假设分布,我们可以算出选出比那个导师选择的学生组平均智商更高的概率是多少。 通过z分数来计算,比如该导师选取的25个学生平均智商为104,总体均数为100,标准差为15.那么 查表可知,对应的概率为0.0918。这个概率是通过随机选择而得到该分数的概率,被称为p值。,统计决定,算出其概率之后,我们要做的是做出个统计推断。 因为推断的做出是基于概率的,如果要得到该导师的选择是无效的,也就是说该组学生的平均智商高于

5、总体是随机抽样造成的,我们需要冒一定的风险。小概率事件也时有发生。 我们需要承担的这个风险量被称为水平。 是我们愿意承担的零假设成立的概率。如果实际算出的概率要低于,那么我将会拒绝零假设。,心理学中,每20次中有1次机会能抽到的水平被认为是能接受的最大风险值。也就是0.05. 如果采用0.05的水平,且实验p值小于0.05,那么我们可以再0.05的显著水平上拒绝零假设。也就说,那位导师的眼光显著好于一般人。 如果p大于0.05,我们会认为那位导师的挑选完全无效吗?一般情况下,我们会说没能拒绝零假设(证据不足)。这是数学家Fisher的观点:认为我们要么拒绝零假设,要么保留做出决定的权利。 而N

6、eyman和Pearson则认为,应该提出与零假设互补的备择假设,因此拒绝其中一个就表明倾向于接受另一个。,在上边的例子中,我们把智商转换成了z分数,然后进行统计检验。这种情况下,z分数被称为检验统计量。(后边我们还会讲到t分布)。 检验统计量的分布被认为是零假设分布。 Z分数越大,p值越小,差异越显著。,一类错误和二类错误,前面提到,如果p值远小于0.05,我们拒绝了零假设,但我们还是要承担一定的风险。 比如,我们通过考试来评估学生能力,90分对应着p=0.05,那么我们则会认为90分以上的学生为好学生。但是如果一些学生参加了考试辅导,老师帮他们赌到了一些考试题,使得他们平均分高于90。在统

7、计检验中,我们发现p小于0.05,那我们会得到结论,这些同学能力高于一般水平。 这时,我们显然犯了一个错误。也就是我们拒绝了这些学生水平的一般的假设(零假设),而零假设才是真的,这种错误称为一类错误。虚报、存伪,如果另一组学生平时学习很好,但是由于考试当天集体食物中毒,拉肚子,导致考试成绩不高,p大于0.05,统计推断结果接受零假设,这些学生成绩一般。 这种情况下,我们就犯了二类错误,即零假设为假而我们却接受了它。漏报、去真,一类错误会产生误导。 比如你的实验结果证明你的某种训练可以提高注意力,而注意力的集中有利于学习成绩的提高。那么别人就可能认为你的训练有利于提高学习成绩。 但是如果在你的实

8、验中犯了一类错误,那么其他人用你的训练方法时并不能提高学生的成绩。 降低一类错误的方法就是多次重复实验或者测量,反复证明训练对注意力提高的有效性。,另一种降低一类错误的方法就是选取更低的水平。 但是降低水平会导致更多的二类错误。 水平人为地设为0.05实际上在一类错误和二类错误的可能负性后果之间寻求一种妥协。 在某些特殊的研究中,比如治疗癌症的药物研发中,应选取较大的值。因为这种情况下犯二类错误的后果是相当严重的。,单侧检验和双侧检验,如果前面提到的那位导师挑选的学生平均智商是90,这时我们不会拒绝零假设。 那此时我们是不是就接受零假设,认为这个导师眼光一般呢? 我们不能,因为还有另一种可能,

9、该导师眼光很差。 这样问题就修正为要验证该导师眼光特殊(很好或者很差)。,在之前的检验中,我们要验证该导师的眼光很好,用的单侧(单尾)检验,也就是在Z大于0的一侧。 现在的问题就变成了双侧(双尾)检验,也就是要看分布的两端。 计算样本z分数,单侧和双侧无区别,差别在于p值,双侧是单侧的2倍。,在刚才的例子中,我们犯了一个错误,那就是我们先假设那个导师眼光好,用了单侧检验,发现不能拒绝零假设;然后我们改变主意做了双侧检验。这样做增大了一类错误的概率。单侧的0.05加上双侧中另一侧的0.025。 正确的做法是在做假设检验之前确定是做单侧(操作导致更好或者更差)检验,还是双侧检验(操作会引起差异,不

10、管好坏)。,B基本统计过程,提出假设 选择统计检验和显著性水平 选择样本和收集数据 求拒绝区域 计算检验统计量 做出统计推断 解释结果 单样本z检验的前提条件,提出假设,首先给定一个希望推翻的零假设。 以IQ作为因变量,总人口的平均IQ为100 零假设H0:=100 备择假设HA:双侧:100,单侧; 100或者100,选择统计检验和显著水平,如果我们把单一样本的均数和总体均数比较,且已知研究变量的标准差,则适合的统计检验是单样本z检验。 水平如无特殊要求,设为0.05,选择样本和收集数据,为了保证检验的有效性,必须从所要研究的总体中随机抽取一个样本。 样本越大,假设检验的结果越准确。降低二类

11、错误 基于实际操作的考虑,样本大小会受到必要的限制。,求拒绝区间,拒绝区间可依据临界z分数确定。 临界z分数指z分数之外的面积正好等于值所对应的那个z分数。 双侧:临界z分数为1.96和-1.96,两侧各对应0.025;单侧:临界z分数分别为1.65或-1.65. 单侧比双侧更容易拒绝零假设。,计算假设检验量,做出统计推断,单侧:如果z大于或小于临界z分数,则拒绝零假设; 双侧:如果z的绝对值大于正的临界z分数,则拒绝零假设。 有时也可给出p值,特别是边缘显著。,单样本z检验的前提条件,因变量以等距或等比量尺测量 样本通过随机抽样获得 所测量变量在总体中为正态分布 所抽样总体的标准差与所比较总

12、体的标准差相同,单样本检验的多样性,检验一个已经存在的群体 完成一个单样本实验,为什么单样本检验很少采用,单样本检验的主要问题在于很难从研究的总体中抽取一个真随机的样本; 实验处理加到某一样本上,由于没有对照组很难排除混淆变量。,练习: 一个精神分析师正在检验一种新的抗焦虑药物,这种药物有降低心率的副作用。50个学生服药六周后的平均心率为70,。如果总体的平均心率为72,标准差为12,那么这个精神分析师可以下结论说新药物会显著降低心率吗?,一个心理学家测量了一个班级25个孩子的智商,想看其是否与同龄人有差异,已知智商平均数为100,标准差为15. (1)如果事先对该班孩子不了解,后测得其平均智

13、商为105,这群孩子智商特殊吗? (2)如果事先知道这班孩子是快班的,后测得其平均智商为105,这群孩子智商特殊吗?,第六章 区间估计和t分布,A基本概念,总体标准差未知的大样本z检验 t分布 单样本t检验 估计总体均数,上边我们讲到,如果我们把单一样本的均数和总体均数比较,且已知研究变量的标准差,则适合的统计检验是单样本z检验。 但是如果总体标准差未知呢? 举例,已知上个世纪九十年代中国人均寿命为70岁(这样的信息从网上很容易查到,但是标准差往往查不到),现在你想调查一下目前中国人是否人均寿命增长了。随机抽取了100个今年死亡的人,发现平均寿命为73,标准差为15。那么中国人比以前长寿了吗?

14、,如果总体标准差已知,我们可以轻松计算 现在未知,怎么办? 我们可以用样本的无偏标准差来代替 这就是大样本z检验,前提条件样本要足够大。,对上边提到的问题进行运算:总体均数70,样本数目100,均数73,标准差15,z(0.05)=1.65, z(0.025)=1.96 提出假设 选择统计检验和显著性水平 求拒绝区域 计算检验统计量 做出统计推断,练习:已知去年大学教师人均收入为50000元,现在随机抽取16名大学教师,调查得知他们今年的平均收入为60000元,标准差为10000元,问大学教师今年比去年待遇提高了吗?,很显然,上边的练习中样本数目不够大,其均数的抽样分布不符合正态分布,因此不适

15、用大样本的z检验。 值得庆幸的是,当样本数目较少时,其均数的抽样也满足一个比较规律的分布,即t分布。 t分布类似于标准正态分布。它也是呈钟形、对称、向两端无限延伸,且均值为零。t分布也是一个完全遵从某个数学公式的抽象数学概念。,t分布,由于均数的抽样分布为t分布,所以假设检验量不再是z分数,而是t分数。 公式和大样本z检验一样,也会得到一样的数值,那么大样本z检验和t检验的不同在哪里? 不同在于,服从不同的分布,相同的值会得到不同的拒绝区间。,与标准正态分布不同,t分布依赖于其所采样本的自由度,df=N-1 随着df增加,t分布越来越接近正态分布。 从图中可以看到,对于位于尾端区域的任何一个z

16、值,t分布的p都要大于正态分布,且df越小,p越大。也就是,样本较小时更难达到显著性水平。,前例中,总体均数为50000,样本量为16,样本均数为60000,标准差为10000 查表可知df=16-1=15时,单侧t(0.05)=1.753, tt(0.05),拒绝零假设,大学教师待遇确实提高了。,大样本z检验和单样本t检验中的样本量,在前边讲到的大样本z检验和单样本t检验中都存在的一个问题是样本量究竟要取多少? 我们通过样本来估计总体,取的样本量越大,越能代表总体,而且样本量越大,越容易得到统计显著性结果。 第一,对于t检验,样本量意味着自由度,自由度越大,t的临界值越小; 第二,增加样本量

17、会增加计算所得的t值或z值。 但是也要注意,太大的样本量会使得即使在实验效应本身很微小或缺乏实际意义的情况下统计结果达到显著。,练习: 医院有25名失眠病人,测其焦虑抑郁指数平均为70,标准差为10,已知一般人的焦虑抑郁指数平均为65,问失眠病人比一般人更焦虑吗?,估计总体均数,前边我们讲到了几种情况:总体均数和标准差已知;或者总体均数已知,标准差未知。这些情况下,我们可以分别运用单样本z检验以及大样本z检验或者单样本t检验来解决问题。 但在实际的心理学研究中更多的情况是,总体的均数和标准差都未知。这个时候,我们可以用随机样本来估计总体的均数。 样本量越大,样本均数就越可能接近总体均数。,通过

18、随机样本来估计总体均数,有两种估计方法: 点估计:用单个数字来估计总体均数,比如样本均数; 区间估计:通过一个区间(数值范围)来估计总体均数,置信区间。以均数为中心,占据面积95%或99%的区间。 估计大学生一个月的生活费,点估计平均生活费700元,区间估计平均生活费在600到800之间。,B基本统计过程,求总体均数的置信区间 选择样本量:样本量越大,置信区间越小(越精确); 选择置信水平:95%; 选择随机样本和收集数据:置信区间的准确度依赖于样本的真随机程度; 计算区间的上下限: 大样本: 小样本:,练习: 在华师随机抽取了100个学生,测得平均智商为110,标准差为10,计算华师学生总体

19、的平均智商是多少? 如随机选取的学生是25个,那华师学生总体的平均智商是多少?,区间估计和零假设检验很相似,主要的区别在于样本均数和总体均数的角色互换。 单样本t检验和针对总体均数置信区间的前提假设: 独立随机抽样 正态分布或者t分布 抽样总体和对照总体的标准差相等,第七章 两独立样本均数t检验,前面我们讲到了几种样本均数和总体均数比较的假设检验: 当总体均数和标准差已知的情况下,用单样本z检验; 当总体均数已知,标准差未知的情况下:如果样本数目足够大,用大样本z检验;如果样本数目较小,用单样本t检验; 如果总体均数和标准差均未知,就要用样本来对总体均数进行点估计和区间估计。,前面讲的都是一个

20、样本均数与总体均数的比较,在心理学的研究中,较少会碰到这样的情况。 更多的情况是对两组人(男女、聪明人和笨人)或实验中变量的两个水平(吃药与否、真假字)进行比较。,比如,我们想知道男性和女性在记忆力上是否具有显著的差别。 我们可以随机抽取男性n1和女性n2名,对其进行短时记忆广度测验,来比较他们的得分均数之间是否有显著性差异,其差值是否足够大。 首先我们要提出零假设,也就是男女记忆力无差异,即 备择假设即为,对该假设进行检验,我们需要构造一个差值的零假设分布,也就是说随机选男女两组进行记忆力比较m次(趋近无穷大),我们就可以得到m个差值,这些差值的分布就构成了零假设分布。 要看男女在记忆力是否

21、有差别,也就是要看如果随机选取两组样本有多大的概率能够选到差值为 由于是零假设分布,所以其平均值为零。 那么它的标准差是多少呢?这个差值分布的标准差被称为差值的标准误,我们知道均数抽样分布的标准误为 如果两个样本的标准差均已知,那么差值的标准误也具有类似的形式,总体标准差已知的单样本统计检验公式为 两样本的统计检验公式也相似,由于我们的零假设是 ,因此这部分可以省略。在很多心理学研究中的零假设都是两组均数无差异。 但是,也存在这样的状况,比如想要了解某种增高药物的效果是否具有性别差异,男女身高及其增量本来就是有差别的,这时要考察的是这个增量有没变化,那么零假设应该是,如果男女记忆力的总体标准差

22、未知,这样就需要通过样本来估计总体。 如果样本足够大,那么可以进行针对两个独立均数的大样本检验。 和前边检验的差别在于用无偏估计的样本标准差来代替总体标准差,如果样本数量较小,则采用t检验。 上边的公式由于每一个样本方差被它的样本数单独相除,因此被称为单独方差t检验。 不幸的是,这个公式并不简单遵循t分布。,这种情况下,我们可对上述公式进行修正,使之适用于t分布。这个修正的前提是假定两个总体方差相等,也就是方差齐性。 这个修正涉及的是估计差值的标准误 由于这一估计 的修正方式涉及两个样本方差的联合问题,所以称之为联合方差t检验。,由于修正的前提是两个总体方差相等,这样对两个总体方差的估计就变成

23、了对一个总体方差的估计。 修正的方法就是把两个样本的方差联合起来形成一个对总体方法的单一估计。 这个联合产生的方差称为联合方差,样本方差的无偏估计是平方和除以自由度 联合方差为,差值的标准误为 用联合方差来估计总体方差就可以得到 带入针对两样本均数的t分布公式 可得 这就是联合方差t检验的公式,它服从t分布,可以通过查表来做假设检验。,练习: 研究颜色辨识力好坏对颜色记忆的影响。把50名被试按颜色辨识力排序后平均分配到两组,要求被试从短暂呈现的画面中回忆物体是由哪些颜色组成的。高辨识力组被试回忆颜色均数为12,标准差为4;低辨识力组被试回忆颜色均数为9,标准差为5.那么结论如何?,B基本统计过程,两样本t检验: 提出假设 选择统计检验和显著水平 选择样本和收集数据 求拒绝区域 计算t值 统计推断 两独立样本t检验的前提假设,两独立随机抽样t检验的假设前提: 独立随机抽样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论