教育硕士讲座常用数据统计分析方法_第1页
教育硕士讲座常用数据统计分析方法_第2页
教育硕士讲座常用数据统计分析方法_第3页
教育硕士讲座常用数据统计分析方法_第4页
教育硕士讲座常用数据统计分析方法_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

外语研究中的数据统计与分析方法及应用刘国兵河南师范大学外国语学院2015教育硕士开题培训讲座提纲数据的种类何为研究假设常用统计检验应用举例SPSS操作数据种类外语教学研究中涉及到的数据类型很多,不同数据类型需要不同的统计处理方法。因此,在进行数据处理之前,弄清数据所属类型是开展科学研究的前提与基础。常见数据分为四类1定类数据2定序数据3定距数据4定比数据定类数据(NOMINALDATA)定类数据是由定类尺度计量形成的,表现为类别,不能区分顺序。定类尺度,也可称为列名尺度,在四种计量尺度(定类尺度、定序尺度、定距尺度、定比尺度)中属于计量层次最低、最粗略的一种。它只能对事物进行平行的分类和分组,其数据表现为“类别”,但各类之间无法进行比较。例如,民族有汉族、回族、哈尼族等,可以按所属民族对人口进行分组,但每组之间的关系是平等的或并列的,没有等级之分。但从另一层面上说,就因为定类尺度各组间的关系是平等或并列的关系,所以各组或各类之间是可以改变顺序的。定序数据(ORDINALDATA)定序数据是由定序尺度计量形成的,表现为类别,可以进行排序。属于品质数据。定序尺度,也可以称为顺序尺度。与定类尺度相比,它较为精确,而且是高于定类测量的测量层次。定序数据不但可以分类,还可以排序,比较大小与高低。例如,利用定序尺度,教师可以将学生的外语水平分为初级、中级与高级三类,他们依次从前到后一级比一级水平高。另外,人们的受教育程度,可以分为文盲、小学、初中、高中、大学、研究生等类型。除此之外,英语语言水平等级测试,如四级、六级、八级等都属于定序测量尺度。定序数据虽有高低或大小之分,可以排序,但不能进行数学运算。因为定序测量不能说明任意相邻两个变量之间的具体差异。换句话说,在定序测量中,任意相邻两个变量之间的差距不是相等的。例如,我们可以说,高中毕业生比初中毕业生所获得的知识量大,但我们不知道前者比后者具体的知识量大多少。而且,初中毕业生与小学毕业生之间的差距未必等于高中毕业生与初中毕业生之间的差距。有人把学生的语言水平分为1、2、3、4、5级等,这样的测量也属于定序测量。定距数据(INTERVALDATA)定距数据是由定距尺度计量形成的,表现为数值,可以进行加、减运算以精确计算数据。定距尺度,也可以称为间隔尺度,相较定类尺度和定序尺度而言,它对事物能够进行准确测量。定距尺度不仅能比较各类事物的优劣,还能计算出事物之间差异的大小,所以其数据表现为“数值”。定距尺度可以较方便地转换为定序尺度。但需要注意的是,通常定序数据不能转换为定距数据,如五级制分制不能转换为百分制。定比数据(RATIODATA)定比数据是由定比尺度计量形成的,表现为数值,可以进行加、减、乘、除运算。没有负数。定比尺度,也可以称为比例尺度,它与定距尺度属于同一层次。但它与定距尺度的区别在于是否有绝对零点。在定距尺度中,“0”表示某一个数值,而定比尺度中,“0”表示“没有”或“无”。定比测量是最高级别的测量,因为它具有前面三类测量所具有的特征,如分类性、排序性、等距性等。除此之外,定比测量具有绝对零值。例如,一个人的外语水平可能是零,一个人的月收入可能是零,一个人的年龄与身高理论上也可以为零,但绝不可以是负数。对于同一事物或想象来说,测量层次很多时候是相对的,可以因测量方法不同而不同。如,对于学生外语水平的测量,如果用“高、中、低”为标准来收集数据,我们会得到定序数据;如果用具体分数来表示其水平,我们得到的是定距数据。区分不同数据类型WHY现实有不同的形态,因此反应现实的数据就有不同的类型。此外,测量的种类不但与收集、整理、分析资料的方法有关,而且与特定的统计方法有关。只有弄清楚数据的测量层次,明白数据所属类型,才能根据不同类型选择不同的统计方法。例如,对定类数据进行分析时,通常使用卡方检验,而不能使用以正态分布为基础的Z检验或T检验;对定距数据进行差异分析时,通常使用T检验或F检验。请指出下列各项的测量类型1每天学习英语的时间2英语学习的认知方式3学生证编号4每周学习的英语单词量5英语学习动机6一次英语竞赛的名次假设检验的基本原理研究中经常涉及到的问题1教学中采用了一种新的教学方法,新的教学方法与旧的教学方法相比哪个更好2为了研究新教材的实用性,在实验班使用新教材,对照班使用旧教材。期末对比学生成绩,哪个班好,哪个班差3学生的语文成绩与英语成绩是否有一定的相关关系解决办法假设检验要解决以上问题,就要对以上假设进行统计检验。检验的目的就是比较二者之间是否存在显著性差异。统计学上把这种差异检验称之为显著性检验SIGNIFICANCETESTING,把这个检验、推论的过程称作假设检验HYPOTHESISTESTING。显著性检验SIGNIFICANCETEST显著性检验就是利用分布的特性,结合研究假设和样本数据的统计值,对研究假设的可接受性进行验证。这里的“显著”一词对应英语的“SIGNIFICANT”或“SIGNIFICANCE”一词,它在统计学中的意义是PROBABLYCAUSEDBYSOMETHINGOTHERTHANMERECHANCE,即某件事情或事件的发生很可能不是由偶然因素造成的。例如用英语说THEREISASTATISTICALLYSIGNIFICANTCORRELATIONBETWEENVITAMINDEFICIENCYANDSOMEDISEASES,从统计意义上讲,维生素缺乏和部分疾病之间的这种相关关系存在,且不受由偶然因素造成的。研究假设的分类零假设NULLHYPOTHESISTHEREISNODIFFERENCEBETWEENTHEVALUESOFAPARAMETERINTHEPOPULATIONSFROMWHICHTHESAMPLESWEREDRAWN,HENCEWEUSETHETERMNULL备择假设ALTERNATIVEHYPOTHESISTHEREISADIFFERENCEBETWEENTHEVALUESOFAPARAMETERINTHEPOPULATIONSFROMWHICHTHESAMPLESWEREDRAWNTHESTRATEGYOFHYPOTHESISTESTINGISTOTRYTOACCUMULATEENOUGHEVIDENCETOREJECTTHENULLHYPOTHESIS,RATHERTHANTOTRYTOSUPPORTANYOFTHEPOSSIBLEALTERNATIVEHYPOTHESESDIRECTLYTHISISALSOCALLED“THEMETHODOFDISPROOF”外语研究中常见的假设举例零假设1第一语言水平与第二语言水平之间没有相关关系;2第二语言作文的长度与作文质量没有相关关系;3第二语言学习者的动机与第二语言水平之间没有相关关系;4女性与男性之间在第二语言学习效率上没有差异;5本族语者和外语学习者在英语语篇特征的运用上没有差异;6第二语言水平高和水平低的学习者之间,在认知策略使用上不存在差异。备择假设1第一语言水平与第二语言水平之间存在相关关系;2第二语言作文的长度与作文质量之间存在相关关系;显著性水平SIGNIFICANTLEVEL显著性检验的目的是为了确定接受零假设还是拒绝零假设。为了实现这个目的,首先要确定一个标准,即在什么情况下接受零假设,什么情况下拒绝零假设。统计学设定的标准是以概率为基础的。如果有95以上,甚至99以上的概率或把握,可以证明零假设成立,那么我们接受零假设。95和99称之为置信水平。如果只有5以下,甚至1以下的概率证明零假设成立,我们就拒绝接受零假设。因此,拒绝或接受零假设需要一个临界概率,我们称这个临界概率为显著性水平。人们通常把显著性水平定为005或001,即P值SIG值。选题如某研究生以“情感教学法在初中英语课堂教学中的应用”为题,欲对该教学方法在初中英语课堂教学中的应用效果进行研究。研究方法所教两个自然班为研究对象,其中一个班为实验班,利用情感教学法进行教学;另一个班为对照班,利用传统教学法进行教学。研究开始,对两个班进行前测,发现英语成绩无显著性差异;实验进行一年后进行后测,发现实验班英语成绩明显优于对照班,两个自然班的英语成绩存在显著性差异。结论拒绝“两个自然班的英语成绩不存在差异”这一零假设,接受备择假设,即“两个自然班的英语成绩存在显著性差异”。情感教学法适用于初中英语课堂教学。应用举例(1)应用举例(2)某省属重点高中从新一届学生中抽出若干学生组成考查样本,检查高一新生整体水平是否高于往届。根据往年的录取分数,已知往届学生总体成绩服从正态分布,标准差为10分,且进校的平均分数为500分。新一届学生的平均成绩为504分,且总体成绩服从正态分布。请以001的显著水平检验新生的成绩是否高于往届学生。零假设新生的进校成绩与往届学生没有差异检验方法根据已知条件,建立一个均值为500分,标准差为10分的标准正态分布,检验504分是否落在概率为99的区域内。如果落在99的区域内,接受零假设。如果落在99的区域外,即1的区域内,我们可以拒绝零假设而接受备择假设“新生的进校成绩高于往届”。结论经统计检验,504分虽然高于往届新生成绩,但该分数落在99的区域内,因此接受零假设。即本届新生与往届学生相比没有差异,平均分差异由偶然因素(如个别尖子生或特差生)造成。检验方法常用的检验方法有Z检验、T检验、F检验、X2检验等。根据研究问题不同,可以采用单尾(单侧)检验和双尾(双侧)检验的方法。单尾检验分为左尾(左侧)检验与右尾(右侧)检验。判断技巧如果研究问题是某个样本的均值是否小于给定的总体均值,选用左尾检验;如果研究问题是某个样本的均值是否大于给定的总体均值,则选用右尾检验;如果研究问题是某个样本均值是否属于某个特定的总体,选用双尾检验的方法。单双尾检验的差别还在于显著水平相同时,临界值的不同。例如,显著水平为001时,单尾检验的Z值是233,双尾检验的Z值是258;显著水平为005时,单尾检验的Z值是165,双尾检验的Z值是196。T检验(TTEST)应用范围用于检验两个样本的均值之间是否存在显著性差异,被用来估计两个样本的均值是来自同一个总体还是来自不同的总体。在报告结果时,除了P值(SIG值)之外,还要报告具体的T值。统计原理T检验的零假设是,两个样本的均值来自同一个总体。利用零假设,就可以建立一个平均值为、标准差为的T分布模型,对样本数据进行显著性检验。如果计算出的概率大于设定的显著性水平,就认为零假设成立,各均值之间不存在显著性差异。T检验的分类独立样本T检验INDEPENDENTSAMPLESTTEST成对/配对样本T检验PAIREDSAMPLESTTEST独立样本T检验(INDEPENDENTSAMPLESTTEST)独立样本指从两个全然无关的总体中随机抽取的样本。这两个样本属于两个性质或类别完全不同的组别,如男性组对女性组、对照组对实验组。更具体地讲,当我们需要检验一个变量下的两个不同组之间的平均值是否存在显著性差异时,需选用独立样本T检验。也就是说,独立样本的T检验用于“一次处理结果中的两个组”(ONETREATMENTWITHTWOGROUPS)之间是否存在显著性差异。单从考试来看,是“一次考试中的两个组”(ONETESTWITHTWOGROUPS)之间是否存在显著性差异。独立样本T检验计算公式应用实例(见下页)独立样本T检验应用实例例1经过一段时间的教学实验,一位教师想要了解所教班级的男女生之间在英语学习上是否存在显著性差异。他从学生第二学期期末英语考试成绩中,随机抽取男女生各10名,具体分数如下男生60642764356625274841女生64544568496446767061经过计算,男生平均分为457分,女生平均分为597分。为了检验两者之间是否存在显著性差异,需要进行独立样本T检验。检验结果T222,P005)。具体数据见下表。09865501241346级09691488384564级听力08320509551346级08335484254564级阅读STDDEVIATIONMEANN考级情况表1策略和考级情况表述统计表(N590)表2不同水平不同组别之间在“阅读策略”和“听力策略”使用上的差异检验03165031909561E029655E020128701287017901845882140971346133309670002听力EQUALVARIANCESASSUMEDEQUALVARIANCESNOTASSUMED04138041428187E028179E020253002530000200025882174943090309308560033阅读EQUALVARIANCESASSUMEDEQUALVARIANCESNOTASSUMEDLOWER95CONFIDENCEINTERVALSTDERRORDIFFERENCEMEANDIFFERENCESIG2TAILEDDFTSIGFTTESTFOREQUALITYOFMEANSLEVENESTESTFOREQUALITYOFVARIANCES方差齐性检验(见下页)方差齐性检验LEVENESTESTFOREQUALITYOFVARIENCES方差齐性检验的目的是为了检验两个样本的方差是否相等。如果两个样本的方差相等,就用EQUALVARIANCESASSUMED一栏对应的T值和概率值SIG值解释独立样本T检验的结果。如果两个样本方差不等,就用EQUALVARIANCESNOTASSUMED一栏对应的T值和概率值SIG值解释独立样本T检验的结果。成对样本T检验(PAIREDSAMPLESTTEST)成对样本当两个样本来自两个相互关联的两个总体时,统计学上把该样本称之为成对样本。顾名思义,成对样本T检验要求两个样本容量相等,即两个样本的数值个数对等。当同一组研究对象涉及两种情况时,为了比较改组在两种情况下的均值是否存在显著性差异,需要使用成对样本的T检验。换句话说,成对样本T检验用于比较同一组研究对象涉及的两个变量的均值之间是否存在显著性差异。成对样本T检验计算公式应用实例(见下页)成对样本T检验应用实例例1一位英语教师想了解所教新生的英语水平提高程度。新生入校后,进行了水平摸底考试。经过一学期的教学之后,他用同一份试卷(或者难度相同的试卷)对学生再次进行测验。有了两次考试的成绩之后,他就可以选用成对样本T检验对这两次考试结果进行检验,以确定他们之间是否存在显著性差异。例2一位研究者想研究学习策略培训对第二语言学习者语言水平的影响。他首先选取了80名学生作为研究对象,对他们的英语水平进行了测试。之后进行了为期三个月的学习策略培训。培训结束之后,他用同样难度的试卷对学生又进行了测试。之后用成对样本T检验的方法对两次测试成绩进行对比分析,发现二者之间存在显著性差异,学生第二次考试的成绩明显优于第一次考试的成绩。因此,他可以得出结论,学习策略培训有助于第二语言学习者语言水平的提高。用SPSS进行成对样本T检验例3在一项研究中,研究人员从希腊英语学习者的英语作文中选了32个句子,分别让10名英语本族语教师和10名希腊籍英语教师给句子错误的程度评分,然后比较两组教师的评分是否存在显著性差异。评分结果见下页表格。其中,NO代表句子的序号,NS代表英语本族语教师的评分,GS代表希腊英语教师的评分。两组教师对句子错误程度的评分17212233231120113225202121181039273141312035299332530283019312483723291918182529724182839231723366332927253216343152820262527153525434262529211429423372224223113916226292313221236221GSNSNOGSNSNOGSNSNO报告统计结果统计检验结果表明,显著性水平为005时,在给32个英语句子错误程度评分上,英语本族语教师和希腊籍英语教师之间存在显著性差异(T2211,P0035005或P001,说明各组均值之间不存在显著性差异。如果P值小于显著性水平(P005或P001,说明至少两组的均值之间存在显著性差异。但究竟是哪两组之间存在差异,可用多重比较法,比较便捷的多重比较方法是用TUKEYHSD方法进行检验。方差分析中的几个核心概念如果要研究两种教材及三种教学方法对学生学习成绩的影响,该实验为双因素实验。一个因素是教材,它有两种“水平”;另一个因素是教学方法,它有三种“水平”。这个实验称之为23的实验设计,共有6中处理。若一个实验为222设计,则表示该实验有三个因素,每个因素有两种水平,共有8种处理。用方差分析的方法检验某一因素对因变量的作用,成为单因素方法分析;检验某几个因素对因变量的作用,称之为多因素方差分析。方差分析应用实例例1一位研究人员想要考察四种计算机辅助英语教学COMPUTERAIDEDENGLISHINSTRUCTION,简称CAEI方法的教学效果。因此,他做了一项实验。实验设计是,每种方法的教学实践为2个课时。课时结束,对每个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论