教育研究方法第十章假设检验.doc_第1页
教育研究方法第十章假设检验.doc_第2页
教育研究方法第十章假设检验.doc_第3页
教育研究方法第十章假设检验.doc_第4页
教育研究方法第十章假设检验.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章 假设检验辅导第一节 假设检验的基本问题1. 假设检验首先一个步骤是建立Ho(零假设),本章后一部分例题均省去了这一步(从解题来讲这一步确实可以省略),但是应该清楚:任何一种统计量的假设检验,其出发点都是对Ho的检验。统计结论是对Ho能否被拒绝作出推断。2. 假设检验的基本思想是一种“反证法”式的推理,即通过检验Ho的真伪来反证研究假设H1的真伪,若Ho为真,则H1必为假,而Ho为假,H1即为真,而且无论作出Ho是真还是假的结论都是在一个概率水平意义上的推断。3. 假设检验中的“显著”与实际问题中效果的“显著”既有联系又有区别。前者是统计学概念而后者是专业上常用的术语,以两个样本平均数差异为例,当t检验的结果在0.05水平上“显著”,这是从统计学意义来说由样本平均数之间的差异可以作出“两个总体平均数存在差异”的结论。但两总体平均数之间的差异是否具有专业意义(即有否实际上的“显著效果”)还要根据专业上的标准而定。就是说,统计结论“显著”并不一定意味着实际效果的“显著”。在具体应用假设检验时,一定要根据各种条件,使用相应的公式,不可错用,尤其是平均数差异的t检验,条件较多,相应的公式不少,切不能以一代全。每一种统计检验方法都有它的使用条件和对数据资料的要求,在实际应用中,一定要注意它们的使用条件和应用范围,要对相应的前提条件进行检验和证明。第二节 平均数差异显著性检验平均数的显著性检验是常用的参数检验的方法。平均数的显著性检验分两种情况,其一是关于样本平均数与总体平均数差异的显著性检验,在总体服从正态分布,总体方差已知的情况下,用Z检验;总体方差未知的情况下,用t检验。其二是平均数差异的显著性检验,在两个总体都服从正态分布,总体方差均已知的情况下,用Z检验(相关样本和独立样本所用统计量不同);在两个总体都服从正态分布,但是总体方差未知时,用t检验(所用检验统计量方法与两个总体是否独立以及方差是否相等有关)。具体检验统计量见下表。第三节 方差及方差差异性检验方差的显著性检验分为两种情况:一个是样本方差与总体方差差异的检验,用卡方检验;另一个两个样本方差差异性的检验,用F检验。第四节 相关系数的显著性检验相关系数的显著性检验分两种情况:(1)样本相关系数与总体相关系数差异的显著性检验,在总体相关为零的假设下,用t检验;在总体相关不为零的假设下,将相关系数做正态性转换然后用Z检验;(2)两个样本相关系数差异性的检验,在两个样本相互独立时,用Z检验,当两个相关系数由同一组被试算得,用t检验。第五节 计数数据的检验检验计数资料的统计检验主要用卡方检验,可以用来同时检验一个因素两项或多项分类的实际观测数据,与某理论次数分布是否相一致的问题,或有无显著差异的问题;还可用于检验两个或两个以上因素各有多项分类之间,是否有关联或是否具有独立性的问题。卡方检验用于计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,又是一种非参数检验的方法。假设检验方法除了常用的参数检验方法外,还有非参数检验的方法,如本章所讲的符号检验法、符号秩次检验法、中数检验法和秩和检验法就是常用的非参数检验的方法。非参数检验法与参数检验法相比,特点可以归纳如下:(1)非参数检验一般不需要严格的前提假设;(2)非参数检验特别适用于顺序资料;(3)非参数检验很适用于小样本,并且计算简单;(4)非参数检验法最大的不足是没能充分利用数据资料的全部信息;(5)非参数检验法目前还不能用于处理因素间的交互作用。第九章 自测题及参考答案一、选择题1. 研究变量的四种类型分别是( )。A. 称名变量、顺序变量、等距变量和等比变量B. 称名变量、顺序变量、等距变量和随机变量C. 离散变量、顺序变量、等距变量和等比变量D. 称名变量、顺序变量、连续变量和等比变量2. 下列说法中错误的是( )。A. 教育统计主要用于研究内容的分类整理、编制数据的各种图表、定量分析和由样本推论总体等。B. 对研究获得的有效内容进行统计处理,使其成为用数据形式和数据表现形式的研究材料,以数量化的方式说明研究结果,称为研究结果的定量描述。C. 定性研究方法(例如,深度访谈法、参与观察法等)也要求对收集来的数据资料进行相应的统计分析。D. 统计方法是教育科学研究的重要工具、方法,以为“统计万能”的思想虽然有些过激,但是基本上是正确的。3. 下列说法中正确的是( )。A. 对相关关系,至少有这样两种情况:变量X是变量Y的原因(或结果);或X与Y都是其它变量的结果。B. 有相关一定有因果,两个存在相关关系的事物,一定存在因果关系。C. 相关关系与数学中函数与自变量关系的没有区别。D. 相关的概念指两种变量之间的关系或联系程度,它表达的是一种精确、稳定的变化关系。4. 下列说法中错误的是( )。A. 差异量越大,表示数据分布的范围越广,越不集中,差异量越小,表示数据分布得越集中,变动范围越小。B. 自由度是反映分布或数据差异信息的个数,即误差的个数。C. 用量化方式描述一组数据的全貌,仅用集中量数来描述是不够的。因为集中量数仅描述了一组数据的平均水平和典型情况,而事实上,数据具有变异性,即它们并不都等于同一个值,而是分散、变化的。D. 总体方差和总体标准差基本上等于样本方差和样本标准差。5. 下列说法中错误的是( )。A. 算术平均数受抽样变动的影响较小,从同一个总体中随机抽取的容量相同的样本,所计算出的算术平均数与其它集中量指标相比,抽样误差较小。B. 为克服无法对总体进行整体检测的困难,大量的采用了相对容易获得的、对总体抽样的样本数据值。因而,计算样本平均数成为一种主要的方法。C. 算术平均数反应灵敏。一组数据中任何一个数值发生或大或小的变化,所计算出来的算术平均数也会随之变大变小,能灵敏地反应出来。算术平均数不适合代数运算。D. 算术平均数易受极端数据的影响,一旦在数据分布中出现个别极端数据,就会对平均数产生较大影响,从而使人对平均数产生怀疑。二、填空题1. ( )是具有不同比重的数据(或平均数)的算术平均数。比重也称为权重,数据的权重反映了该变量在总体中的相对重要性,每种变量的权重的确定与一定的理论经验或变量在总体中的比重有关。2. 相关系数r的( )1之间。“+”号表示变化方向一致,即正相关,“”号表示变化方向相反,即负相关。相关系数的绝对值大小表示两种变量之间的密切程度,或相关的程度,其取值不同,表示相关程度不同。3. 总体方差2与总体标准差,是以( )时的离差平方的平均数和离差平方的平均数的开平方数。4. 积差相关又称积矩相关,当两种变量都是正态连续变量,而且两者之间存在( ),表示这两种变量之间的相关关系用积差相关。5. 当遇到顺序变量、相应的数据总体不是正态分布、而且抽样的样本容量( )时,采用等级相关法计算变量之间的相关性。三、名词解释1.自由度; 2. 零相关;3. 差异量数; 4. 集中量数;5. 加权算术平均数;6. 次数分布。四、简答题1. 等级相关的使用条件2. 积差相关法的使用条件3. 方差和标准差的优点、缺点4. 算术平均数的优点、缺点5. 几何平均数的使用条件6. 次数分布表的编制步骤五、计算题1. 某小学对学生的成绩记录分三部分组成,即平时练习成绩X1、期中检测成绩X2、期末考试成绩X3。假设这三部分成绩一律采用百分制考评,同时三部分成绩的权重分别是0.20,0.30和0.50。若一位学生的平时作业成绩为X1=90分,期中测验成绩为X2=84分,期末考试成绩为X3=86分,那么该学生的综合考评成绩是多少? 2. 在某中学初三年级学生中,随机抽取30名样本,测得他们的某项考试分数如表9.1中所示。求他们分数的算术平均值。表9.1 30名样本的测验分数5674825974836075846276866377886877897078897278947380967381973. 某实验小学组织对学生进行一项能力测验,共抽出三个样本,获得有关数据如表9.2所示。求其总的标准差。表9.2 三个样本的能力测验计算表样本(K=3)n1234446501091081031213154. 有10名被试学生的反应时间如表9.3所示,求其标准差。表9.3 10名被试的反应时间计算表序号反应时间离差离差平方12345678910186.1174.3118.4201.0164133166123.0120.4119.835.5023.70-32.2050.413.4-17.6015.4-27.60-30.2-30.81260.25561.691069.042540.2179.6309.76237.2761.76912948.6=1506.00=150.6=0=8780.105. 在某小学四年级中,随机抽查30名学生的语文测验(X)和数学测验(Y)成绩,其结果如表9.4所示。两个测验的满分均为100分,试求两个测验分数的积差相关系数。表9.4 语文成绩(上) 、数学成绩(下)586062626363646465667071727273747476787879798080828385858789606465666869707172737476777879808182838385868888898990939496参考答案一、1. A;2. D;3. A;4. D;5. C。二、1. 加权算术平均数2. 数值范围介于3. 总体作为研究对象4. 线性关系5. 小于30三、1.自由度是反映分布或数据差异信息的个数,即误差的个数。自由度(Degree of Freedom)的字面解释是:由于在n个数据中,当样本的数据总值确定后,只有n1个数据可以自由取值,第n个不能自由取值。另一方面,抽样样本总是与总体存在一定的误差,采用自由度的方法是为了对样本数据进行一定的修正,使其能够接近总体的情况。2.零相关:两种变量值变化方向无一定规律,即一种变量值变化时,另一种变量值可能变化也可能不变化,并且不变或变大、变小的机会趋于相等,这两种变量之间的关系称为零相关。3. 度量、描述离中趋势的统计量称为差异量数,差异量越大,表示数据分布的范围越广,越不集中,差异量越小,表示数据分布得越集中,变动范围越小。常用的差异量数有平均差、方差、标准差等。4. 集中量数是代表一组数据典型水平或集中趋势的统计量。集中量数也称平均的数,平均的数也是次数分布中的一个点,反映大量数据向某一点集中的情况,可以说明典型观察值的特征。常用的集中量数包括算术平均数、加权平均数、几何平均数、中位数、众数等,它们的作用都是度量次数分布的集中趋势。 5. 加权算术平均数是具有不同比重的数据(或平均数)的算术平均数。比重也称为权重,数据的权重反映了该变量在总体中的相对重要性,每种变量的权重的确定与一定的理论经验或变量在总体中的比重有关。6. 次数分布也称为频数分布,指的是一批数据中各个不同数值所出现的次数情况,或者是指一批数据在按等距划分的各个区域(组)内出现的次数情况。用专业语言来说,某一个随机事件在n次实验中出现的次数情况称为该随机事件的次数,各种随机事件在n次实验中出现的次数分布情况称次数分布。四、1. 等级相关的使用条件两列观测数据都是顺序变量数据,或其中一列数据是顺序变量数据,另一列数据是连续变量的数据。像对学生的绘画、书法作品、体育项目测试成绩排名次等,就属顺序变量数据。两个连续变量的观测数据,其中有一列或两列数据的获得,主要依靠非测量方法进行粗略评估得到。像语文基础知识水平可用精心编制的掌握测验加以测量,但学生的课文朗读水平却只能根据若干准则由教师给予大体的评估;有些情况下,对书画作品也是由教师进行大体的评估,得到一个粗略的分数。这些类型的数据,经过适当转换后,可采用等级相关法。2. 积差相关法是计算线性相关的基本方法。其使用条件:两种变量都是由测量获得的连续性数据。例如,百分制分数可视为测量获得的连续性数据。两种变量的总体都呈正态分布,或接近正态分布,至少是单峰对称的分布。 必须是成对的数据,而且每对数据之间是相互独立的。两种变量之间呈线性关系(在坐标轴中图形呈现为直线)。样本容量n30,计算出的积差相关系数才具备有效的意义。要排除共变因素的影响。3. 方差和标准差的优点反应灵敏,随任何一个数据的变化而变化;严密确定,一组数据的方差及标准差有确定的值;计算简单,适合代数计算,不仅求方差和标准差的过程中可以进行代数运算,而且可以将几个方差和标准差综合成一个总的方差和标准差;用样本数据推断总体差异量时,方差和标准差是最好的估计量。它们在避免两极端数值影响方面超过其他方式。例如,在避免绝对值方面,优于平均差。方差和标准差的缺点是:不太容易理解,易受大小两极端数值的影响,有个别数值不清或缺失时,无法计算。4. 算术平均数的优点: 反应灵敏。一组数据中任何一个数值发生或大或小的变化,所计算出来的算术平均数也会随之变大变小,能灵敏地反应出来。 严密确定。由同一组数据计算出来的算术平均数是同一个值。 简明易懂,计算简便。算术平均数的意义简单明了,容易理解。计算时,只需用简单的四则运算。 适合代数运算,例如,可以通过几个平均数求它们的总平均数等。 受抽样变动的影响较小,从同一个总体中随机抽取的容量相同的样本,所计算出的算术平均数与其它集中量指标相比,抽样误差较小。算术平均数的缺点: 容易受极端数值(极大或极小)的影响,如果一组数据中绝大多数数值都较高(或较低),而其中只有一个数值极低(或极高),由于每个数据都参加运算的结果,使所计算出来的算术平均数大大下降(或上升),这时,算术平均数就不足以代表这组数据的典型水平。 一组数据中某个数值的大小不够确切或缺失,这时就无法计算其算术平均数。根据上述对算术平均数的特性及其优缺点的分析,可以看出,它所适用的条件是:一组数据中每个数据都比较准确、可靠,无极端数值的影响。5. 几何平均数(Geometric Mean)是算术平均数的一种变形形式。在教育科学研究中,当需要处理的数具有以下两种特点时,一般都是用几何平均数来表示数据的集中趋势。 一组数据中任何两个相邻数据之比接近于常数,即数据按一定比例关系变化。在教育科学研究中,求平均变化率、或对等距与等比量表实验的数据处理,均应使用几何平均数。 当一组数据中存在极端数据,分布呈偏态时,算术平均数不能很好地反映数据的典型情况,此时应使用几何平均数或其它集中量数(如中数、众数)来反映数据的典型情况。6. 简单次数分布表,通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。编制次数分布表的主要步骤:求全距、决定组数、确定组距、确定组限和计算组中值、归类和登记。五、1. 用加权平均数公式进行计算:将平时作业成绩为X1=90分,期中测验成绩为X2=84分,期末考试成绩为X3=86分;代入上式,则该学生的综合考评成绩为:(分)2. 用平均数公式进行计算:3. 先求出总平均数,再将表9.2中的数据代入到公式中,则 4. 将表9.3中的数据代入到标准差公式中,则5. 列表9.5计算,再将表9.4中的数据代入公式进行计算。 表9.4 计算积差相关系数表格序号15960-14.2-19201.64361269.826164-12.2-15148.8422518336265-11.2-14125.44

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论