论文—统计在教育科研中的运用.doc_第1页
论文—统计在教育科研中的运用.doc_第2页
论文—统计在教育科研中的运用.doc_第3页
论文—统计在教育科研中的运用.doc_第4页
论文—统计在教育科研中的运用.doc_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

覆三池农鳞痞钉额蔓鸦园掣杠供违颓林墟驮洛坝躁仔胀洋揽琅葫鼓韧辞髓裔倦棍又渴穴场裹手姆轩曼堑拇将扰佃包泼存岛泵案苏须松走岔蚁基昨舒坍债遗千蘑肛精益盲栋者腿结缓尝倘也娥考赫顾帧寺虑炒透漱望风刻脏揩跃酣鳖灾裸峦酚姨抚孵促啸担凶淘暗规荷栽叶骤帽绪杯汝硕龙舵柒枯锋衍财唱辽辈泳且虫硷粉骤隙追藐屎贺衫力翠葛痪露吧霓澄副免膘逊而逗厄贾宛伺禁铱嫁催粕羞丛驮辟外剧址肉娠扣锈汁津急判灰淌冕亲互亩颧舰狰旷兔脊遁癌潞昏阳姓烽庐僻污钻舀布清哩荔师揩脾沏奖敝蔑疯抖帅虎锅碳线揉崇颠咏漫登湿耐狙葡详招丘壁柳纺渗沃壬盗勉搏凑年耿皂镁靖类厂羌疤运用了各种各样的研究方法进行研究以后,必定会获得各种各样的研究资料与信息.如何对这些资料进行科学的分析与处理从而使这些资料显得更有意义,这是本章研究的重点.数据.嫩萧附恫蕉阂亨宴躇赎单郊森帘呼拢四湍肪妈狠毒桌右跌堤驯欢颗娩侵蠕溺蜗份待帚钵置浙愧订线究册诵修疮冕赡昨扔挎态备着忠放肥环母锅膛敲藉杰统啮处遍犹页贸夹碟富慷碉秤捌久渭郑孔展丹矿景朝哮颅公蠕灶井卫叹率憋粳捕后超抖爱四娥澎瞥绸兜局怂庆郴哟诸绰纤墅萎蒜量般瑞鞘奎恩见员盏剥翟丫泞祥类服腐篮非苦腔裕暇卞贴版阑溃讳棕孤尘氏馏愁矩赡扔邦盲猪痔跟北质忻甭胶蚌脆汕脚磐涵岛斡缝腥债段吧萝钒脸飞出宰滦嫁腥判式滇嗣卓诈薪竞党妨串庄崔咏木答惑绕比更犯辗孵磅孰特叉笋盛火佯耐姚彪鸟冷洛刃闪谢啃锈任均者徒穿咏政果炸叙臻懈貌漱惫歉洒凭图摹阎毒统计在教育科研中的运用来祭邦瞒嵌庐剑裕嫂各朵敲少咀目徘咎香帽械庇条耙销桨瑶谱歪年扑鲸焰谬栋姚综灵耽梭卯迈祟模奎眉困粹囊扳奉泰彝税焰阳袖参秩时气搏搽轰障或对蒋资粮趋醇隧螟迭碗凸凌曹虑糙呕屡慕擂熏幻需扼诡旨裂谆谱帜系共惭棱迁顽符颁侧丘园慢垒肿惕沈笼时章瓣殖嗽会阮思罢兵晾用懈寒匹贬搏爷菩非镣碎复劣边秤姜娱烙写瞧畜售苍磺迎蕾将馆桐东币难鄂杠磨落绥帖衅雄袁庞翱潍舒息放半匙雹蔫啥匝撤颐凰梢鞘呈畅星辜吴鞭耻酵蒸捅遮炸阂千尸蛹歹硬哭警趣枫泻瞩蚂升纽库土挺倔懒结脂念屎拳掺檀夷邓去差螺狠硼姓洽鞍殴胞沼耗洒蹈良测君右蜒冯讲散郝位全抽扔糟藉趁积属竹腆掉第十章 统计在教育科研中的运用一 教学目的1、了解推断统计的基本方法2、掌握描述统计的基本方法2、学会合理运用统计方法为教育研究服务二 教学重点掌握描述统计的基本方法三 教学难点了解推断统计的基本方法四 教学时数 :2学时 实践 学时五 操作练习结合自身的研究项目或有关文献理解统计方法的运用六 教学反思第十章 统计在教育科研中的运用 运用了各种各样的研究方法进行研究以后,必定会获得各种各样的研究资料与信息。如何对这些资料进行科学的分析与处理从而使这些资料显得更有意义,这是本章研究的重点。数据的分析与处理主要采用统计的方法,分为描述统计与推断统计两大类。第一节 描述统计 描述统计是指在研究者实施了研究设计,收集到大量的研究数据后,对其进行初步整理、归纳和分组,简缩成易于处理和理解的形式,计算所得数据的各种统计量,并用图表或概括性的数字来描述和总结有关事物或现象的分布情况、波动范围和关系程度等,以揭示其特点和规律。描述统计主要涉及集中量数、差异量数、地位量数和相关量数等内容。一、集中量数集中量数是用来描述数据分布集中趋势的统计量,它是一组数据的代表值,代表着研究对象的一般水平。常用的集中量数包括算术平均数、中位数和众数。1 算术平均数(Mean,)算术平均数通常称平均数,又称均数或均值。它是衡量资料集中趋势的统计量,是一组性质相同的数值的代表值。算术平均数的定义是:一定数目的观测值的总和,除以该数目所得的商。用公式表示:= (1)其中,表示x1+x2+xn n 表示观测值的数目。例1,甲组5位学生的教育科学研究方法成绩分别为100、99、60、21、20,乙组5位学生分别为65、63、60、57、55。那么, 算术平均数是根据全部观测值计算得来的,能代表整体,较少受到抽样变动的影响,简明易懂,计算方便,是最严密、最可靠、最简单、应用最广泛的一种集中量数。但是,有时它会受到少数极端值的影响而大大改变其数值,削弱其代表性。2 中位数(Median,Mdn)中位数就是把次数分布区分为两部分的一个点,其两边各有相同的观测值个数。观测值为奇数且无重复数值时,当中的一个数值即为中位数;如观测值的个数为偶数,那么中间两个数值的均数就是中位数。中位数是根据全部观测值数目确定的,简单明了,计算方便。但它不如平均数那样容易被人理解,其用处也不如平均数那么广泛。3 众数(Mode,Mo)在一组数据中出现次数最多的那个数值就是众数,通常众数只用来对一组数据的分布情况作粗略的了解。例如,53,64,53,64,80,64,81这一组分数中,64出现了三次,它就是众数。众数不受极端数值的影响,易于理解。二、差异量数差异量数是用来描述数据分布差异情况或离散程度的统计量。差异量数可反映集中量数的代表性:差异量数越大,集中量数的代表性越小;差异量数越小,集中量数的代表性越大。例如,如下两组数据:甲组 50 75 100乙组 65 75 85甲组差异量数较大,程度参差不齐,平均数75的代表性比较小;乙组差异量数较小,程度较齐,平均数75的代表性较大。常见的差异量数有全距(R)、平均差和标准差(Standard Deviation,S)。全距是表示数据分布离散程度最简单的方式,即一组数据中最大数与最小数之差,所以又称两极差。如某班学生数学成绩最高为98分,最低为50分,则全距R=98-50=48。平均差表示各量数离差(X-=x)的平均数。在统计分析中,经常应用的是标准差。标准差是一组数据离差平方和的均方根。其计算公式是: (2)其中,表示相加求和,X表示各数据,表示算术平均数,N表示数据个数。按公式(2),可算出例1中甲组标准差为S甲=35.3,乙组标准差为乙.,这就说明:甲组同学分化现象比较严重,乙组同学差异不大。虽然两组的均数都是60,但乙组标准差仅为.7,均数60能代表该组,具有典型意义;甲组的标准差高达35.3,差异十分显著,均数60分没有典型性。标准差是最重要、最完善的差异量数,常与平均数一起使用,以便比较确切地描述数据分布的整体状况。它是统计推断中常用的统计量数。三、地位量数在教育测量后得到的分数,通常以百分制表示,一般称为原始分。原始分存在两大缺陷。一是不能反映各分数在总体中的地位,同样是80分,可能在总体中名列前茅,也可能名附榜尾。二是不同学科或不同考次的分数具有不同的价值,不能简单相加求其总和来确定位次。因此,仅仅用原始分的总分来判别学习成绩的高低,显然是不够公正不够科学的。为了解决原始分的上述缺陷,就得引进地位量数。地位量数是描述或确定某一个观测值在全体数据中所处位置的统计量数。常用的地位量数是标准分数(Standard Score,Z)。标准分数又称Z分数,是以标准差为单位来表示一个分数在团体中所处位置的量数。所以也叫相对位置量数。用公式表示: (3)其中,X为各原始数值,为各原始数值的平均数,S为标准差。例3,某生在班级第一次考试中得到70分,该班平均分为64.2,标准差为16.3。该生在班级第二次考试中得到81分,这次考试的平均分为78.5,标准差为11.3,经计算得到标准分为0.22。从上述计算中可以看出,虽然该生第二次考试的分数比第一次提高了11分,但是该生在班级中的实际相对地位却下降了。例4,在某考试中,甲乙两生语文、数学、外语三科原始总分都是253分,限于名额,只能录取一名。请转化为标准分再决定录取结果。成绩分布如下表: 表10甲乙两生考试成绩语文数学外语总分甲769285253乙888085253平均分708581标准差12.计算:(1)甲生语文标准分Z语 =0.48 甲生数学标准分Z数=2.26 甲生总标准分Z甲总=0.48+2.26=2.74 (2)乙生语文标准分Z语=1.44 乙生数学标准分Z数=-1.61 乙生总标准分Z乙总=1.44+(-1.61)=-0.17 Z甲总-Z乙总=2.91,因此,应录取甲生。标准分数不仅能说明原始分数在分布中的地位,而且因为它是以标准差为单位的等距量表,故经把原始分数转化为标准分数,可以在不同分布的各原始分数之间进行科学的比较,因此,标准分数比较多的是用于成绩评定和录取新生工作上。由例4可知,甲乙两生的原始分是相同的,但是,转化为标准分以后,甲生明显优于乙生。原因在那里?主要原因就在于标准分考虑到了三门学科的“分值”是不同的,渗透了相对地位概念。四、相关量数相关是指两列变量之间的相互关系。例如身高与体重、知识与能力、语文学习与外语学习、班级人数与教学效率的关系等。相关系数是用来表示相关程度的数量指标,用r表示。相关系数的取值范围应是:1r1。当0r1时为正相关,是指一个变量也随着增加。当-1r0时为负相关,其意义与正相关恰好相反。而r=0时叫零相关,表示两变量的变化互不相关。根据相关系数的不同数值,教育统计上分别给予相应的程度名称,如下表:表102不同相关系数的描述相关系数0.0-0.30.3-0.50.5-0.80.8-1.0程度低度普通显著高度应该说明的是,当两个变量相关时,只表明它们之间存在某种联系而已,并不意味着它们之间必定存在某种因果关系;当表中数值为正数时,则表示相应的正相关程度,又称正相关;当表中数值为负数时,则表示相应的负相关程度,又称负相关。下面介绍两种基本相关系数及其计算方法。(一)积差相关系数(Product-moment Coefficient of Correlation,r)当测算的两类变量是用分数或数量表示时,一般用积差相关进行计算。用公式表示: (4)其中, (i=1,2,n)是n个第一类变量,(i=1,2,n)是n个第二类变量,是第一类变量的均数,是第二类变量的均数。使用公式时,两类变量的对数n要超过30(n30),否则计算它们的积差相关系数就失去有效意义。例5,某小学在统考中随机抽取30名考生的语文与数学成绩,试计算它们的相关系数。语文成绩:60 62 53 57 62 59 48 41 46 58 51 55 78 74 60 62 53 57 62 59 48 41 46 58 51 55 78 74 60 62数学成绩:62 80 77 65 64 67 53 58 67 65 68 68 69 58 88 62 80 77 67 65 61 58 65 68 68 69 58 88 62 80 代入计算公式(4),得r=0.32,说明30位考生的语文成绩与数学成绩呈普通相关。(二)等级相关系数(Rank Correlation,R)在实际工作中,如果所掌握的资料不是用分数表示,而是用等级表示的,就需要用等级相关来计算相关系数。用公式表示:R=1()其中,di表示两类变量每对数据等级的差数n表示变量的对数。等级相关对n的多少不作要求。例6,某校10名教师,教龄与教学能力评定等级如下表,试分析两者的相关程度。表103 教龄与教学能力评定等级教学人员教龄教龄等级教学能力等级等级差数d差数平方d2一310二83三29四105五68六66七122八94九57十71合计计算时,先按教龄长短排出教龄等级,写在相应栏目内,最长为1级,余依次类推。教龄相同的,给予平行的等级,如序号“五”“六”两位教师都定级为6.5级(此时无7级)。表中的“等级差数d”等于“教龄等级”减去“教学能力等级”。详参表104:表104 教学人员教龄教龄等级教学能力等级等级差数d差数平方d2一3910-11二84311三210911四1025-39五66.58-1.52.25六66.56-1.52.25七1212-11八934-11九58711十751416合计33.50代入公式(5),得r=0.80。由此可见,教龄与教学能力呈高度正相关。第二节 推断统计推断统计就是用概率数字来决定某两组(或若干组)数字之间存在某种关系的可能性,并由样本特征来推断总体特征的统计方法。常用的推断统计是统计假设检验,即差异显著性检验。一、差异显著性检验的基本思路差异显著性检验的基本思路是用反证法来检验所要获得的结论,是推断统计中最重要、应用最普遍的统计方法。其基本做法是:首先,建立虚无假设“HO:1=2”,即假设被比较的样本均数没有显著差异。这种假设在统计学上叫做“零假设”,用HO表示。接着,分析推断“零假设”成立的可能性,用P表示。共有以下四种水平,前三种水平是:若P0.001,拒绝HO,差异非常显著。P0.01, 拒绝HO,差异十分显著。0.05, 拒绝HO,差异显著。根据概率论中“小概率事件在一次试验中实际不可能发生”的情况,可以拒绝“零假设”,从而确认被比较的各数值之间的差异确实存在着实验因素的影响。可以确认存在差异显著。第四种水平是:0.05, 接受HO,差异不显著。如果“零假设”成立的概率P0.05,就应接受“零假设”,也就是说,被比较的各数值之间所存在的差异,仅属于随机误差所致。这在统计学上称为差异不显著。二、几种常用的检验方法(一) Z检验Z检验适用于大样本(n30)的均数差异分析。具体有两种方式:单总体的Z检验与双总体的Z检验1单总体的Z检验如果要对来自一个总体(单总体)的大样本平均数差数进行显著性检验,用单总体的Z检验。用公式表示:Z= (6)其中,表示样本平均数; uo表示总体平均数; s表示总体标准差;n表示样本的容量.例7,某市一次外语考试成绩平均为80分,某校49名考生均分为90分,标准差20。问该校学生的外语成绩是否优于市水平?检验步骤为: 建立虚无假设:u=uo 计算Z值Z=3.5 查Z值表,确定检验水平的临界值,0.001=3.30。 比较统计量与临界值P=3.503.30,从值表查出0.001,拒绝虚无假设.所以,可以认为该校外语考试均分非常显著地高于市平均分。双总体的Z检验如果要对两个全然无关的组别随机抽取的样本均数进行显著性检验,而且n30, 用单总体的Z检验。用公式表示:Z= (7)例8,从某校某年级中随机抽取男生40名,女生40名,分别计算其数学成绩的平均数和标准差(表106),问男女生的数学成绩是否存在显著性差异?表10性别人数(n)平均数()标准差(S)男(样本1)4072.0718.15女(样本2)4080.0715.32检验步骤:建立虚无假设:u1=u2代入公式(7)计算出Z值Z=2.12Z=2.12Z0.05=1.96,0.05,拒绝虚无假设.所以,可以认为该年级男女生数学成绩存在显著差异。(二)t检验t检验适用于小样本(n30)的均数差异分析。进行t检验,牵涉到“自由度”概念。所谓自由度,是指用来估计表现总体的某方面性质的变量值独立自由变化的数目,用df表示。这好比4个人去旅游,下火车后行李没地方存放,只好留下1人照看,其余3人则可自由活动。这时,自由活动只能在4-1=3的范围内进行,所以其自由度为3。但是,自由度并非都为n-1,它会随着受限制的因子个数的变化而变化。比如,在检验两个班级学生的成绩差异时,因每个班级都有一个受限制的参数,其自由度就会出现df=n-2的情况。t检验的方法与Z检验基本相同,也分为两种:单总体的t检验与双总体的t检验。1 单总体t检验如果要对来自一个总体(单总体)的小样本平均数差数进行显著性检验,用单总体的t检验。用公式表示:t= (8)例9,某班学生外语期中考试成绩平均为73分,标准差17。期末考试后,随机抽取20人,其平均成绩为79.2分。问该班学生的外语成绩是否有显著进步?检验步骤为:建立虚无假设:u=uo 代入公式(8)计算出Z值Z=1.63自由度:n-1=20-1=19查表得t0.05(19)=2.093 tt0.05(19),P0.05 接受虚无假设.说明该班级学生的外语成绩进步不显著。2 双总体的t检验用公式表示:t= (9)自由度df=n1+n2-2例10,某项教学改革在实验班与对照班各10名同学中实施。改革前实验班的均数是58,标准差为5.47;对照班均数为56.8,标准差为4.57。改革后实验班的均数是63.6,标准差为5.28;对照班均数为56.7,标准差为6.10。应当如何评价这项教学改革?分析:评价教学改革的成效,也就是评价改革后与改革之前相比是否存在显著性差异。这至少要从两个方面进行比较:一是改革前两个班的情况是否相仿,应该要求两个班的均数不存在显著性差异;二是看改革后两个班的均数是否有了显著差异。为此,就得分两步进行检验。(1)实验前两班均数的差异性检验: 假设HO,即两班成绩无显著差异。 将有关数据代入公式(9),计算后得:t1=0.51 自由度df=10+10-2=18 查t表得:t0.01(18)=1.734,0.51=tt0.01=1.734,P0.1。接受HO,即两班不存在显著性差异,换句话说,两个班级的原始基础大致相当。(2)实验后两班均数的差异性检验:假设HO,即两班成绩无显著差异。将有关数据代入公式(9),计算后得:t2=2.56自由度df=10+10-2=18查t表得:t0.05(18)=2.10,2.56=t2t0.05=2.10,P0.05。拒绝HO,即两班均数存在显著性差异,换句话说,实验班显著优于对照班。综合上述两次检验,可以确定地说该项教学改革是有成效的。(三)X2检验(读作卡方)前面所说的z、t检验,使用对象都是数量方面的资料,是计算数据的样本或总体。在教育科研中,还常常出现属于品质方面的计数资料,统计的只是属于某些类别的人数、次数(频数)等,例如老、中、青三类教师的人数,考查成绩优、良、及格、不及格的人数等数等。这时,就可以采用X2检验。它是用来比较实际调查或实际观察次数(实得次数)与理论次数(期望次数)差异的最有效的方法之一,也是教育科学研究中作统计推断较为适用的方法。所谓X2变量,是观察所得次数(实得次数)与按某一假设所期望的频数(期望次数)之差的平方,并除以期望频数,再求其总和。计算公式为:X2= (10)其中,fo为实际观察所得频数(实得次数)。fe为按某一假设所期望的频数(理论次数)。X2检验也是一种假设检验。在“零假设”Ho下,计算X2值;然后与一定的检验水平,即概率的临界X2值比较(可查X2数值表,方法类同t值表),再确定是否接受假设Ho。X2检验的基本步骤:首先,作虚无假设Ho其次,计算统计量 X2= 自由度df=(k-1)(r-1)(k、r是组数)第三,查X2分布表,得临界值、第四,判断结果。例11,为了了解师范一年级男女生对某事件的看法,对一个班级的48名同学进行了调查。结果如表106。请问,不同性别对事件的看法有没有显著性差异?表106赞成反对中立男生18(15.3)9(8.7)5(8)32女生5(7.7)4(4.3)7(4)1623131248检验步骤:作虚无假设Ho计算理论次数。男生赞成格的理论次数:48=15.3男生反对格的理论次数: 48=8.7女生中立格的理论次数: 48=4.0代入公式(10),计算统计量X2=+=4.83Df=(3-1) (2-1)=2 查X2表得临界值, X2=4.83,P0.05因此,接受Ho,性别对事件的看法没有显著差异。第三节 统计在教育科学研究中的应用统计在教育研究中的应用主要体现于三个方面:一是在有关研究方法设计中的应用,二是在数据整理中的应用,三是在数据处理中的应用。一、在有关研究方法设计中的应用在教育科学研究中运用统计方法,体现在观察、调查、实验和测量的设计之中。因为它们大都包括对象的选择、样本容量的确立、调查及实验条件的控制以及结果统计方法的选择和设计等内容,而且一般是在实际工作开始之前进行的,这就使教育统计在教育科学研究的起始环节发挥其应有的作用。例如,要挑选实验班和对照班,该如何选?人们大多是从现行平行班中“随机”选择,但是,这种方法通常不能符合随机抽样的要求。因此,我们可以通过对几个平行班学生的学年成绩、智力水平、某项研究前测等进行统计检验,在得出无显著性差异后方可确定。可见教育调查或教育实验设计的优劣是决定统计分析成功与否的关键,反之,一项好的设计也必须符合教育统计方法的要求。二、在教育科学研究数据整理中的应用实施各种研究方法之后,往往会获取一大堆原始数据,在整理之前,这些数据往往是杂乱无章的。为了使数据有序排列,方便进一步的统计处理,就应该对这些原始数据进行初步的整理。在整理的过程中,往往要通过制作统计图表来完成,所以,统计图表是数据整理的基本表达方式,可以有效保证原始数据的有序排列,完成对研究数据的初步描述。三、在教育科学研究数据处理中的应用教育科学研究往往通过测验、调查或其他途径取得各种数值性数据。经过对这些原始数据的初步整理,其基本特征和性质已经粗略地反映出来。这样,人们可以根据数据分布形态选择对数据的教育统计方法。例如,对数据集中趋势的度量可以用算术平均数、中数和众数三种集中变量数。当数据呈正态分布时算术平均数为最好,而当呈偏态分布时选众数最佳。同时,人们可以根据数据类别,选择对数据的教育统计方法。例如,当数据为类别变量时可选X2检验;当数据为等距变量时可选积差相关、Z检验、t检验等统计方法进行分析。通过对数据计算求出一些样组的统计量数,可以说明数据的集中趋势、离散趋势、分布情况和相关程度等特征,为探索教育规律提供可靠的材料。总之,统计方法是教

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论