




已阅读5页,还剩82页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
平均数的差异性t检验,主讲人:朱丹,2,假设检验,对总体参数、分布形式、相互关系等提出假设,然后利用样本数据来判断该假设论述的合理性。,你相信他们的说法吗?你要如何去证明这些说法是正确或是错误?,为检验此论述,进行随机抽样调查,以样本数据检验此假设是否成立。,假设来西藏旅游的外国旅客平均消费支出8000元。有人提出拉萨市民人均月收入是2500元。有人提出西藏大学学生的平均IQ测验分数是110。,3,假设检验,产生假设检验的原因大致有两个:当对总体参数的真实性感到怀疑,需要通过样本来考察其正确与否时,往往借助于假设检验做出判断(决策)。当对变量间存在某种关系的证据(平均值之差、方差之比等)怀疑时,也会要求进行假设检验。,4,第六章假设检验,第一节假设检验原理第二节单一总体均值的假设检验第三节两个总体均值差的假设检验第四节总体比例与方差的假设检验第五节SPSS在假设检验中的应用,5,第一节假设检验原理,一、建立假设二、接受域和拒绝域三、两类错误四、假设检验的步骤五、p值(p-value)六、正确表述统计决策结果,Back,6,一、建立假设,原假设/虚无假设(nullhypothesis):H0研究者要收集证据予以反对的假设。将研究结果无效的说法作为原假设。设定总体参数等于某一数值。认为两个或两个以上总体参数相等。H0:=2500ORH0:2500(收入)H0:1=2(1会计,2企管,统计学成绩),“等号”始终在H0。,7,一、建立假设,例如:你对某品牌洗涤剂的产品标签中声称:“平均净含量不低于500克”,感到质疑。你想要证实“平均净含量不足500克”。即你想要推翻的是500克,要证实500克。此时,H0:500例如:你研究认为员工满意度和性别有关,你想要以样本数据来支持你的论点。此时,H0:员工满意度和性别无关,8,一、建立假设,备择假设(alternativehypothesis):H1研究者要收集证据予以支持的假设。将研究结果有效的假设作为备择假设。与原假设对立,是要研究的问题。强调差异或方向性。例如,某品牌洗涤剂的产品,H1:500例如,H1:员工满意度和性别有关,9,一、建立假设,H0和H1是互斥的,主要有三种情况:双侧或双尾假设检验(two-tailedtest)H0:=2500,H1:2500单侧或单尾假设检验(one-tailedtest)右侧假设检验:H0:2500,H1:2500左侧假设检验:H1:2500,H1:2500,双侧检验或单侧检验,根据H1来定。,10,例如:灯泡厂商在给用户提供一批灯泡时声称,该批灯泡的平均使用寿命是1600hr。为验证厂商的说法,需要用样本数据进行检验。,提出假设:,H0:=1600;H1:1600,如果样本数据很接近1600hr,则可以接受H0;如果样本数据离1600hr很远,就会拒绝H0,接受H1。,如果有人对用户说:灯泡的平均使用寿命低于1600hr。此时,用户要研究的是是否会小于1600hr。,11,思考题:,想要检验女性职员平均体重是否大于55公斤,如何提出原假设和备择假设?,H0:=55;H1:55或H0:55;H1:55,Back,12,二、接受域和拒绝域,假设设定之后,我们需要一个判别标准,判断拒绝或接受H0。利用“小概率原理”,指发生概率很小的随机事件,在一次试验中几乎是不可能发生的。如果发生了,就可以拒绝提出的原假设。,例如:有一个厂商声称其产品的合格品率很高,可以达到99%,则从一批产品(100件)中随机抽取1件,该件是次品的概率就非常小,只有1%。,如果厂商的宣称是真的,随机抽取1件是次品的情况几乎是不可能发生的。如果这种情况发生了,我们就有理由怀疑原来的假设是否成立,这时我们可以推翻原来的假设。,当然,推论也可能犯错误,确实有1件次品,刚好1次被抽到,这种错误概率是1%(显著水平)。,13,二、接受域和拒绝域,以统计量(称检验统计量,teststatistic)的抽样分布为基础,给定小概率,判断样本数据是否接受H0。检验统计量所有可能取值分两为部分,可以拒绝H0的检验统计量取值的集合称拒绝域。反之,称接受域,不拒绝H0。划分的数值称临界值。接受域的区间概率1-,拒绝域的区间概率。,如何定义接受域和拒绝域?,14,双侧假设检验的拒绝域定义:,在抽样分布两端各/2位置上确定拒绝域边界的临界值。,H0:=0;H1:0,只要0或0,二者之一成立,就可以否定H0。,它有两个拒绝域,两个临界值,每个拒绝域的概率/2。,临界值,拒绝域:,样本数据计算出来的统计量Z0落在拒绝域,则拒绝H0。,15,单侧假设检验的拒绝域定义:,在抽样分布某一端的位置上确定拒绝域边界的临界值。,单侧检验有一个拒绝域,一个临界值,拒绝域的概率。,右侧检验拒绝域:,右侧假设检验拒绝域在右边,左侧假设检验拒绝域在左边。,左侧检验拒绝域:,右侧检验图,Back,16,三、两类错误,以样本统计量推论总体参数,因为样本数据具随机性,存在判断正确和错误的四种概率:,弃真错误又称第I类错误(TypeIerror)。取伪错误又称第II类错误(TypeIIerror)。,假设检验时,希望正确判断并减少犯错误的概率。通过控制(显著性水平,levelofsignificance)减少犯错,此种检验称显著性检验。,Back,17,三、两类错误,弃真错误如前例,厂商声称产品合格率是99%。100件中确实只有1件次品。进行抽样时,刚好1次被抽到次品,这种错误称弃真错误(第类错误),错误概率是1%()。,取伪错误厂商声称产品合格率是99%,实际上仅有90%,表示100件中有10件次品。为了检验厂商宣称是否真实,我们随机抽取20件产品,结果都是合格品,于是我们推断厂商宣称是真实的。犯第二类错误,错误概率。,Back,18,四、假设检验的步骤,Step1:提出原假设H0和备择假设H1例如:H0:=0;H1:0Step2:确定显著性水平是决策中的风险。主观确定。一般取0.05或0.01。,19,四、假设检验的步骤,Step3:选择检验统计量(TestStatistic)假设检验也是从抽样分布出发,借由样本数据计算检验统计量的数值进行推断。确定H0为真时,检验统计量服从的抽样分布。,例如:总体服从正态分布,且已知,则构造检验统计量Z,在H0为真的情况下,有,可以确定临界值,构造拒绝域和接受域。,20,四、假设检验的步骤,Step4:计算检验统计量的数值根据样本数据计算检验统计量的数值。Step5:建立决策准则,进行判断根据值和抽样分布,确定临界值。将检验统计量的数值与临界值相比较,做出是否拒绝H0的判断。或以检验统计量计算p值,确定是否拒绝H0。,Back,21,五、p值(p-value),p值:H0为真时,由样本数据给出的犯第类错误的概率的精确数值(观察到的显著性水平)。统计软件给出检验统计量的数值时,一般都给出该检验统计量数值的p值。,以p值进行假设检验:p值,接受H0p值65,=0.05,因为n=100为大样本,X=69,=10,在H0为真的情况下,构造检验统计量:,由样本数据计算检验统计量的数值:,决策规则(如图),如果ZZ0.05拒绝H0,因为检验统计量Z的数值落在拒绝域,所以拒绝H0。证据显示,参加培训后可以提高词汇记忆任务的成绩。,Back,28,2.小样本的正态总体,已知,检验统计量:,【例】,29,例题(),SAT测验分数遵从=500,=100的正态分布。一位老师办辅导班,希望能够提高学生的SAT分数。随机抽取16个学生参加他的辅导班,其参加测验后得到的平均分数X=554。试问:参加这个辅导班对学生的SAT分数有影响吗?(1)以=0.05为检验标准,进行检验。(2)以=0.01为检验标准,结论有变化吗?,30,(1)解:,H0:=500;H1:500,在H0为真的情况下,构造检验统计量:,由样本数据计算检验统计量的数值:,决策规则(如图),如果ZZ0.05拒绝H0,因为检验统计量Z的数值落在拒绝域,所以拒绝H0。证据显示,参加辅导班对学生的SAT分数有显著影响。,=0.05,正态总体,小样本n=16,X=554,=100,31,(2)解:,H0:=500;H1:500,在H0为真的情况下,构造检验统计量:,由样本数据计算检验统计量的数值:,决策规则(如图),如果ZZ0.01拒绝H0,因为检验统计量Z的数值落在接受域,所以不拒绝H0。证据显示,参加辅导班对学生的SAT分数没有影响。,Back,=0.01,正态总体,小样本n=16,X=554,=100,32,3.小样本的正态总体,未知,检验统计量:,【例】,33,例题:,一位研究者编制问卷来评定抑郁水平,并对相同数量的正常人进行了测量,得到均值=55,且分数呈正态。测验中,高分表示抑郁程度高。为确定测验是否对那些有抑郁的个体有足够的敏感性,随机抽取一个抑郁症病人样本n=21,对其进行测试。得到一组数据如下:59,60,60,67,65,90,89,73,74,81,71,71,83,83,88,83,84,86,85,78,79病人在这一测验上的分数与正常人显著不同吗?(=0.01),34,解:,H0:=55;H1:55,=0.01,正态总体,n=21为小样本,未知,以S估计,在H0为真的情况下,构造检验统计量:,由样本数据计算检验统计量的数值:,双侧检验决策规则:tt0.005(21-1)或tZ0.05拒绝H0,因为检验统计量Z的数值落在接受域,所以不拒绝H0。没有明显证据表明支持率的估计是正确的。,=0.05,n=230大样本,且np和n(1-p)皆大于5,Back,53,2.单一总体方差的假设检验,检验统计量:,拒绝域,拒绝域,拒绝域,Back,54,3.两个总体方差比的假设检验,检验统计量:,拒绝域,拒绝域,拒绝域,Back,55,思考题:,某小区小麦的一般生产水平平均产量为250kg,其标准差为30kg。现用一种化肥进行试验,根据25个小区的抽样结果计算平均产量为270kg。问这种化肥是否使小麦明显增产。=0.05。,56,解答:,H0:=250;H1:250,=0.05,因为n=25为小样本;X=270,=30,H0为真时,检验统计量:,决策规则如图,如果ZZ0.05拒绝H0,Z落在拒绝域,所以拒绝H0。,当=0.05的情况下,数据显示化肥会使小麦明显增产。,57,第五节SPSS在假设检验中的应用,以SPSS进行假设检验时:1.要先提出假设2.自行确定显著性水平3.选择适当的推断统计方法(统计学家已经选择了相应的检验统计量)4.SPSS会根据你选择的统计方法,自动计算出样本检验统计量数值(如:t值、F值和p值)5.以和p值进行判断,决定拒绝或接受H0。,58,第五节SPSS在假设检验中的应用,一、单样本t检验二、两独立样本t检验三、两配对样本t检验,Back,59,一、单样本t检验p.125,分析目的利用来自总体的样本数据,推断该总体的均值是否与指定的检验值之间存在显著性差异。是对单个总体均值的假设检验。假设总体来自正态分布。如:从新生入学成绩的抽样数据推断平均成绩是否为75分;在人口普查中,某地区职工今年的平均收入是否和往年的平均收入有显著差异。SPSS操作AnalyzeCompareMeansOne-SampleTTest输出结果解读例子p.127,60,单样本t检验的应用,在一居民储蓄调查数据中,推断储户总体一次平均存款金额是否为2000元。同时储户一次存款金额总体可近似服从正态分布,因此,可采用单样本t检验来进行分析H0:=2000;H1:2000AnalyzeCompareMeansOne-SampleTTest,61,62,63,64,因为p-value=0.216=0.05,因此不能拒绝H0。数据显示,储户总体一次平均存款与2000元没有显著差异。,95%CI:有95%的把握认为储户总体一次平均存款金额在1721.87(2000-278.13)和3225.69(2000+1225.69)元之间。,65,思考题:,某生产食盐的生产线,其生产的袋装食盐的标准重量为500g,现随机抽取10袋,其重量分别为495,502,508,496,505,499,503,498,505,500。假设重量呈现正态分布,请检验生产线的工作情况。,66,思考题解答:,H0:=500;H1:500,因为双尾检测概率p值0.432大于=0.05,故不拒绝H0,即抽样袋装食盐的重量与500克无显著性差异,有理由相信生产线工作状态正常。,Back,67,二、两独立样本t检验p.130,分析目的利用来自两个总体的独立样本,推断两个总体的均值是否存在显著性差异。如:比较两校高三学生的数学成绩,从两校抽取高三学生,进而检验两校高三学生的平均数学成绩是否有显著差异。两独立样本t检验的前提样本来自的总体应服从或近似服从正态分布,且两组样本相互独立。,68,二、两独立样本t检验,两总体方差相等或不相等,所采用的检验统计量不同。因此,要先对两总体的方差是否相等进行假设检验,SPSS利用LeveneF方差齐性检验方法加以检验(p.131)。SPSS操作p.132AnalyzeCompareMeansIndependent-SamplesTTest输出结果解读p.133Step1:对两总体方差是否相等的F检验。Step2:对两总体均值差的检验。,69,两独立样本t检验的应用,在居民储蓄调查数据中,分析城镇储户与农村储户的一次平均存款金额是否存在显著差异。假设城镇储户与农村储户的一次存款金额总体都近似服从正态分布,因此,可采用两独立样本t检验来进行分析原假设为城镇储户与农村储户的一次平均存款金额无显着差异。H0:1=2;H1:12,70,71,72,73,74,Step1:对两总体方差是否相等的F检验。p-value=0.429=0.05,不拒绝H0。显示两总体方差没有显著差异。,Step2:对两总体均值差的检验。p-value=0.380=0.05,不拒绝H0。显示城镇储户与农村储户的一次平均存款金额无显着差异。,75,思考题:,为比较两种不同品种的玉米的产量,分别统计了8个地区的单位面积产量,具体数据如下表所示。假定玉米产量服从正态分布,且两组样本相互独立。试比较两种玉米产量是否有显著性差异。,76,思考题解答:,数据组织:在SPSS数据文件中建立两个变量,分别是“品种”、“产量”,变量品种的变量值分别为A和B。,77,思考题解答:,H0:A=B;H1:AB,F检验的p值=0.752大于=0.05,可以认为两总体方差无显著性差异。方差相等情况下,两独立样本t检验,双尾检测概率p值0.332大于=0.05,故不拒绝H0,不能认为两种玉米品种的产量有显著性差异。,Back,78,三、两配对样本t检验p.138,分析目的利用来自两个相关总体的样本数据,推断两个总体的均值是否存在差异。假设总体来自正态分布。如:研究减肥茶的效
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年广告设计师调研技巧试题及答案
- 广告设计师考试时尚与广告的结合试题及答案
- 关于纺织行业未来发展的考试试题及答案
- 基本卫生法规试题及答案
- 服装导购考试题及答案
- 提高纺织品检验员考试通过率试题及答案
- 广告设计师考试品牌差异化策略试题及答案
- 湖北省电赛试题及答案
- 童年小学生试题及答案
- 广告设计师需掌握的核心概念试题及答案
- 急性ST段抬高型心肌梗死溶栓治疗专家共识2024解读
- 服务消费券发放的精细化实施方案
- 2025年国家电力安全知识竞赛题库及答案(共50题)
- 团结协作青春展新姿
- 给幼儿园讲医疗知识
- 2024年共青团入团考试题库及答案
- 2024年《BIM技术介绍》课件
- 核心素养视域下小学道德与法治生活化教学策略探究
- 人教版八年级下《生命.生态.安全》教案
- 有理数的加减混合运算教学设计 人教版
- 中职学生心理健康教育专题讲座
评论
0/150
提交评论