心理与教育统计学教案.doc_第1页
心理与教育统计学教案.doc_第2页
心理与教育统计学教案.doc_第3页
心理与教育统计学教案.doc_第4页
心理与教育统计学教案.doc_第5页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章 导论课时安排:3课时教学课型:理论课教学目的要求:掌握统计学的内容,了解统计学的特性与原则;理解教育统计学的概念与意义;熟练掌握学习统计的基础知识教学重点与教学难点:预备知识教学方法、手段、媒介:教科书、板书、多媒体教学过程与教学内容 心理与教育统计学 学习意义与要求 发展简史 研究内容 预备知识-基础概念第一节 统计学与心理教育统计学一、统计与统计学的含义1、统计是总括起来计算之意,是对某一现象或事物的有关资料进行搜集、整理、计算、分析的工作过程。统计有三层含义,一是统计资料,即反映各种现象的数据资料;二是统计工作,即具体搜集、整理、分析统计资料的工作过程;三是统计学,即研究统计原理与方法的科学。统计学的分类一是应用统计学,它是与研究对象的特征密切结合的各科专门统计;二是数理统计学,它是为各门应用统计学提供数理方法论基础的一门学科,其内容主要是运用概率的知识来解释统计数据数量关系的模式。2、心理与教育统计学心理与教育统计学是专门研究如何搜集、整理、分析在心理和教育方面有实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门学科。简言之,教育统计学是运用统计学的一般原理和方法研究教育科学领域数量关系的一门科学。第二节 学习教育统计学的意义与要求 一、学习教育统计学的意义 (一)为教育科学研究工作提供科学方法(二)为学校实施科学管理提供有效工具(三)顺利地阅读教育或心理研究的研究报告和文献二、对教育统计的辨证态度一是统计无用论。二是统计万能论。三、学习教育统计学的要求(一)掌握统计的词汇(二)获得并扩大计算的技能(三)学习正确理解和解释统计结果(四)学会使用统计方法(五)掌握统计的逻辑第三节 统计学与教育统计学的发展简史(自学)一、统计学的发展史略统计学的发展一般可分为四个时期:国势学派。 第一个时期约为公元前3世纪至公元17世纪:政治算术学派。 第二个时期是十七至十八世纪:政治算术学派。第三个时期是十九世纪:数理统计学派。第四个时期是十九世纪末至今:数理统计学派。二、心理与教育统计学的产生、发展与现状最初将统计学应用到心理与教育领域的是英国的人类学家、生物学家高尔顿20世纪40年代以前,统计学的内容大都属于描述性统计。20世纪40年代以后,发展了推断统计的内容。三、教育统计学的发展趋势与特点(一) 为了节省时间而简化程序(二)取消所谓的“简捷法”(三)多元分析法的日趋兴盛(四) 统计学内容日趋丰富第四节 研究内容(一)统计学的内容 统计学的内容由描述统计、推断统计实验设计三部分构成。描述统计是对实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均。通过描述统计的工作,我们可以把大量零散的、杂乱无章的资料加以简化、概括,从而更加清晰明确地显示出这些数据的分布特征。推断统计又称抽样统计,它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应的团体。换言之,就是根据已知的情况推测未知的情况。推断统计主要用于两个方面,一是从单一样本得到的统计量去推断较大总体的有关特征,我们称之为统计估计或参数估计。二是比较多个样本或总体的差别情况,评价一项实验的结果,我们称之为假设检验。描述统计和推断统计均是针对数据进行计算的分析方法,因此,只要有数字我们就可以进行计算和分析。然而,要使这些数据真实、可靠地反映客观现实,首先要保证其本身的可靠性和有效性,因此仅靠分析方法是远远不够的,还需要一种获得准确数据的理论与方法,即实验设计。实验设计是研究如何更加合理、有效地获得观测资料,怎样更正确、更经济、更有效地达到实验目的,以揭示实验中各种变量关系的实验计划。统计学的内容之间既互相区别,又互相联系。从统计学发展的历史来看,先有描述统计,后有推断统计,再有实验设计,因此描述统计为前驱,推断统计为核心,实验设计为后衍。但是从实验研究进程来说,则应先进行实验设计,再进行描述统计和推断统计。第五节 预备知识一、1、数据类型数据的分类(一)根据变量性质的划分1名称变量:指一事物与其他事物在属性、类别上不同,其数据形式是计数数据。名称变量有时也同数字表示事物间的不同,其数值不说明事物间差异的大小,只是分类的符号。统计方法主要有次数计算、百分比、检验、相关等。2顺序变量:指事物的某一属性的多少或大小按顺序排列起来的变量。有等级性,是一种既无相等单位又无绝对零点的变量,其统计方法有中位数、百分位数、等级相关、秩次检验等。3等距变量:指只具有相等的单位,而没有绝对的零点的变量,其统计方法有平均数、标准差、t检测、f检验、积差相关等。4比率变量:是一种既有相等的单位,又有绝对零点的变量,常用的统计方法除上述方法外,还有几何平均数,相对差异量数等。 顺序变量、等距变量和比率变量统称度量数据(quantitative data),这是因为它们是用一定的测量工具或测量标准测量时所获得的数据。(二)根据变量的连续性划分 1连续变量:指取值可以是某区间内任一数值的随机变量,它是指测量单位之间可以划分成无限多个细的小单位的,其数字形式多取小数。从量尺的直观性来看,是指在量尺上任何两点之间都有取值的可能性。单位是否可以分成无限多个细小的单位,是由单位所标志的客观事物本身固有特性所决定的,而不是由使用上的需要和习惯而决定的。2离散变量:指测量单位之间不能再细分的数字资料,其数字形式常取整数。离散变量和连续变量在数轴上的意义分别为,离散变量是数轴上的一个点,连续变量是数轴上的一段距离。三、变量与数据(一)变量的定义变量(variable)又称随机变量(random variable),数学中把不断变化的,可取不同值的量称为变量,统计学则根据测验数据的特性来定义的。从观察所得的数据具有三个特性,即离散性,变异性和规律性。变量是具有变异性的数据。(二)变量与数据的区别在统计学中把在取值之前不能预料到取什么值的量称为变量(随机变量);如果一旦某个数值被取定了,成这个数值为随机变量的一个观察值,即数据。(三)根据变量之间的关系划分 根据变量的关系分为自变量和因变量。自变量是在实验中由实验者操纵控制的因素,因变量则是在实验中由自变量所引起并被测量的变化量。三、总体与个体总体是指客观存在的,并在同一性质的基础上结合起来的许多个别单位的整体,即具有某一特性的一类事物的全体,又叫母体或全域。它具有同质性、大量性和差异性的特征。个体是构成总体的基本单位或单元,又称元素或个案。根据总体所包含的个体数量,有有限总体和无限总体的区分。若总体包含的个体数目是有限的称有限总体。若总体包含的个体数目是无限的,则为无限总体,如研究七岁男童身高的发展变化。样本与样本容量样本指从总体中抽出的一部分个体。样本中所包含的个体数目称样本容量或含量,用符号n或n表示。样本有大小之分,大样本容量一般在30以上或50、100以上,小样本容量在30以下。总体与样本也是相对的,可大可小,其大小是根据研究目的而确定的。四、次数、比率、频率与概率五、参数与统计量参数是表示总体特征的量数。统计量则是直接从样本计算出的量数,代表样本的特征。参数与统计量各有一套符号表示方法。作业题1.如果不考虑测量结果,下列变量中哪些是连续变量,哪些是离散变量?时间 ( ) 性别 ( )家庭的大小 ( ) 绝对感觉阈限 ( )职员工作评定等级 ( ) 测验成绩 ( )2试从变量的性质上,连续性上及数据类型上指出下列观测值所属的变量类型。李芳在班上名列第5名。 ( )初二(3)班有女生24人。 ( )王鹏跑100米用了16秒4。 ( )丹丹的身高是150厘米。 ( )朱华英做对了10道题。 ( )郭明明的数学测验是90分。 ( )第二章 第二章 数据的搜集、整理与表达课时安排:4课时教学课型:理论课,实践课教学目的要求:了解数据搜集的方法,掌握数据整理的方式,熟练掌握数据表达的方法教学重点与教学难点:重点-数据的表达,难点-次数分布表的编制教学方法、手段、媒介:教科书、板书、多媒体教学过程与教学内容第一节 数据的搜集第二节 数据的整理第三节 数据的表达 第一节 数据的搜集一、 一、 数据资料的来源数据资料按照时间周期可分为经常性资料和一时性资料。经常性资料主要是日常工作中的记录和统计报表等。如日常的教育工作记录有教育教学的工作记录。统计报表是教育部门逐级向上呈报的各种内容的报表,如教师职称变动的年报表,学生流失率的季报表,学生入学率的年报表等。一时性资料是在一定时限内所收集有关问题的资料,来源主要有调查、测量和实验。第二节 数据的整理一、检查数据检查数据主要从数据的准确性、完整性和及时性着手。准确性要求观测的数据是真实可靠的,检查需从逻辑性、完整性和及时性三方面进行。二、整理方式数据整理的方法一般有顺序分布法、等级分布法和次数分布。如10个分数为70,79,71,60,69,70,70,45,69,71。用顺序分布法和等级分布进行整理。(一)顺序分布法顺序分布法是将数据(x)接大小顺序先排列起来,然后用次数(frequency)表示相同数据的出现数目,形成一个简单次数表。如上述10个数据整理后见表2-1。 (二)等级分布法 等级分布法分无重复等级的整理方式和有重复等级的整理方式两种 1无重复等级时整理方法。表2-1 简单次数分布表791712703692601451102有重复等级时的整理方法。先按顺序排列数据,再划分等级,划分等级时对重复等级级需根据其实际的排序位置求平均等级。如上述数据的等级分布见表2-2。表2-2 等级分布表1 2 3 4 5 6 7 8 9 10 分数x 79 71 71 70 70 70 69 69 60 45等级r 1 2.5 2.5 5 5 5 7.5 7.5 9 10 (三) (三) 次数分布法次数分布法是从一群数据中求其全距,决定组数、组距、组限,然后进行归类汇总形成一个有规律的表式的数据整理方式,又称分组次数分布。第三节 数据的表达一、 一、 统计表统计表是以表格的形式表达统计资料数量关系的方式或工具。(一)统计表的基本格式。编制统计表应遵循两大原则,一是表的结构要简单明了,避免臃肿包罗万象的大表;二是表的层次要清楚,项目排列要有逻辑性。1统计表的基本内容。一个统计表主要容包括线条、标题、标目和数字。一个统计表的线条要越少越好,其基本线条主要有顶线、底线、横线,另外还可以有辅助线。另外,在制作统计表过程中常见错线有封口线、多条的横线、及总标目处斜线。标题由表题和表序构成,位于顶线的上方。表题是表的名称,需用简单明了的语词表达。表序为表在文章或书藉中的顺序,可用数字或符号表示。标目有不同的划分标准。从位置上有横标目和纵标目。横标目指标目它与所代表的统计数字处在同一横行,纵标目则指标目与所代表的统计数字处在同一纵列。标目的内容有主语、定语和谓语分。主语是从数量特征方面说明表中统计资料的性质,一般是标示指标或指标体系的,定语是从时空、条件等方面对主语进行修饰或限制,一般是指分组或分组体系,谓语是指具体的统计资料,即统计数字。数字是统计表的基本语言,一律用阿拉伯数字来表示,并且要求数位对齐不留空格。若出现空格时则需一定的符号来表示。表2-3 统计表的基本格式横标目的总标目(可空)纵标目的总标目纵标目(主语)横标目(定语)数字(谓语)合 计2统计表的种类。1)简单表是指“定语”部分未经分组,只有罗列单位名称、地点时序等的表,如表2-4所示。表2-4 某大学心理系历年招生人数统计表 1995 1996 1997 1998 1999 2000 2001 2002人数 37 52 49 49 52 48 43 502)分组表是指定语按照一个分类标志进行分组的表。如表2-5所示。表2-5 高中男女生测验焦虑(tai)统计表总 分(t)情 绪 分(e)忧 虑 分(w)男生女生男生女生男生女生平均数34.4136.6213.6814.5112.6213.03标准差 7.39 8.38 3.67 3.92 3.53 4.253)复合表是指“定语”按照两个或两个以上的分组标志进行多层分组所形成的表格。如表2-6所示。表2-6 高中各年级男女生测验焦虑的统计表高 一 高 二 高 三男 生 女 生 男 生 女 生 男 生 女 生 总 34.92 36.64 34.50 36.81 34.23 36.41分 s 7.42 7.81 7.42 9.05 7.29 8.24(二)次数分布表的编制过程与方法例2-1:某校50名学生心理系学生的心理与教育统计成绩为71,81,74,61,78,79,68,67,81,79,61,81,70,64,90,62,73,73,56,52,79,70,69,63,74,87,52,57,66,72,54,76,75,88,81,80,60,63,80,74,77,69,53,48,66,83,81,45,78,71。1求全距。全距是全部数据的距离,也称极差,用最大值减去最小值,即 例2-1的全距为: 2定组数和组距。组数是一群数据分组的数目,用表示。组距指每一组所包含的间隔或数据单位,用表示。确定方法有二:一是经验法:根据经验将数据分为1020组,其中以1015组为最佳。组距一般选择2,3,4,5,10等。原则上,当样本容量较大时,组距相应地小一些,组数相地多一些;当样本容量较小时,组距相地大一些,组数相应地少一些。二是计算法:当数据来自于一个正态分布的总体时,可以用计算法,其结果较为精确。, 或 例2-1的组数与组距为:3定组限。组限是每一组的起止点或每一组的界限。有表达界限和精确界限之分。1)表达界限,又称指定界限,表示方法有三种。 a b c2034 3035 302529 2530 252024 2025 202)精确界限,又称实际界限,表示方法有两种。 a b29.534.5 29.534.49924.529.5 25.520.49919.524.5 9.524.4994登记次数与汇总。次数是某一事件在某一类别中出现的数目,又叫频数,用表示。总次数则为各组次数之和,用表示。如例2-1经整理形成的次数分布表见表2-7。表2-7 学生统计学成绩分布表次数组中值频率累积次数()相对累积次数下上上下下上上下90-94 1920.0250 1100 285-89 2870.0449 3 98 680-84 8820.164711 94 2275-79 8770.163919 78 3870-7410720.203129 62 58 65-69 6670.122135 42 7060-64 7620.141542 30 8455-59 2570.04 844 16 8850-54 4520.08 648 12 9645-49 2470.04 250 4100 501.00(三)次数分布表中的几项基本运算1组中值。每一组的中点值,常用或表示,其计算公式为 2频率和百分频率。频率是每一组的数据个数除以数据的总和,又称相对次数,用符号表示。百分频率则是频率与百分数的乘积。即 , 3累积次数和相对累积次数累积次数以简单次数为基础,从最低组开始逐级累加直至最高组,或从最高组开始逐级累加直至最低组,用符号或表示。相对累加次数是各组累积次数与总次数的比值,即二、 二、 统计图统计图是以几何图形和形象图形表示统计资料数量关系的工具。(一)制图的基本要求统计图由图目和图轴、图题和图序、图形和图例要素等构成。1确定图目和图轴。2图题是图的名称,要求文字简明扼要。图序是图的序号,用数字或字母表示等均可。 3图形是统计图的主要内容,其线条为图中最粗者。图例用以说明图形所表示的内容。(二)图形的种类1从图形形状上分可有直条图、圆形图、直方图、折线图、散点图。2从图形维度上分有二维图和三维图。3从图形来源上分有几何图、象形图和统计地图等。 (三)主要统计图的绘制方法1直条图的绘制过程与要求1)选择基线轴。2)条宽一致。3)条形排序。2圆形图的绘制过程与要求。1) 1) 求各个组成部分的比重(p)。 2) 2) 求角度数。角度=3603)确定各个部分的位置。3直方图绘制过程与要求1)作横轴。2)作纵轴。标明次数3)绘制矩形。4多边图的绘制过程与要求1) 1) 以组中值(m)为纵轴的刻度,以次数为横轴的刻度。2) 2) 用直线连接相邻的两点。3) 3) 在最高组和最低组两端各空出一个组的位置,折线与基线相交。(四)次数分布的常见形态作业题1将下列100名雇员上班用于路途中的时间(单位:分钟)数据整理成次数分布表,计算组中值、频率、百分频率、累积次数及累积百分频率,并绘制统计图。44.0 44.0 35.4 28.4 37.0 46.0 35.4 19.4 20.4 56.4 43.236.2 36.2 38.4 49.2 31.8 86.4 12.6 27.4 14.0 39.4 39.415.8 15.8 28.8 38.0 44.0 38.4 74.0 23.0 11.4 39.8 30.229.2 29.2 40.6 49.6 30.4 12.2 123.8 42.0 47.0 32.4 39.235.2 35.2 56.4 31.0 45.0 90.2 100.0 39.0 37.0 49.4 28.212.6 12.6 27.0 47.8 52.6 41.0 40.0 28.0 23.6 37.6 37.830.0 30.0 45.8 18.0 41.0 22.6 24.2 89.6 90.4 43.0 29.856.2 56.2 24.8 12.6 53.6 125.4 16.2 39.0 40.8 33.6 39.445.6 45.6 37.4 18.0 50.6 103.4 52.4 20.2 64.6 22.2 60.042.2 42.0 16.2 108.2 44.0 42.6 39.4 37.6 41.4 40.42若要比较男女生英语测验成绩的情况,选用哪类图形较好。3研究者调查了2000名顾客对乘坐飞机舒适度不满的情况,结果如下,绘制统计图。表2-8 顾客调查结果抱怨类别抱怨数量放脚空间不足672座位不舒适814过道狭窄136行李架不足198休息室不足46其它的不满134第三章 集中量数课时安排:6课时教学课型:理论课,实践课(课堂同步练习)教学目的要求:识记和理解各种集中量指标的概念,熟练掌握各种平均指标的计算方法,掌握均数、中数和众数的应用范围教学重点与教学难点:重点是算术平均数和加权平均数,难点是各种集中量指标的应用选择教学方法、手段、媒介:教科书、板书、多媒体教学过程与教学内容第一节 算术平均数第二节 中位数第三节 众数第一节 算术平均数一、算术平均数的定义算术平均数(arithmetic mean)是所有观测值(或变量值)的总和除以总数所得的商。简称平均数、均数或均值。其符号系统既有表示样本平均数的数学符号和英文符号(mean),又有表示总体参数的希腊字符。二、算术平均数的计算方法(一)定义式 例3-1:10名学生的心理与教育统计成绩为68,77,63,79,70,79,70,79,86,80。试问这组数的平均数为多少?(二)加权式1加权式的通式加权平均数是观测数据()与其相应次数()乘积的和除以总次数()所得的商,这是加权式的一般公式,即如例3-1用加权式计算方法如下。表3-1 加权平均数计算示例 86 80 79 77 70 68 63 1 1 3 1 2 1 12加权式的变式1)求总平均数已知各组平均数求总平均数时,并不是简单地以各组平均数之和除以平均数的个数。因为各组平均数的大小受各组人数多少的影响,所以需考虑人数权数的影响。总平均数(total mean)是以群组人数()与群组平均数()乘积的和除以总人数(),其计算公式为例3-2:某校初三期末物理考试后,经初步统计得知一班55人的平均成绩为80.5,二班52人的平均成绩为78.2,三班56人的平均成绩为83。试问该年级的平均物理成绩是多少?2)归一化均数例3-3赵卓的数学成绩,平时为90,期中为84分,期末为83分,该学科平时、期中、期末分数之比为2:3:5。试问赵卓数学的学期成绩是多少?或3)求次数分布的均数组中值计算法 4)简捷式式中为简化值,为假设平均数,为组距。例3-4:57名学生的高等数学成绩分布如表3-2。计算过程:选择假设平均数(一般选次数最多,且位于中间组的组中值),本例确定简化值。简化值有一规律,即假设平均数所在组的值为0,大于假设平均数各组的值依次为1,2,3,;小于假设平均数各组的则依次为-1,-2,-3,;由此,简化值可以直接按顺序书写而不需计算。计算各组次数与简化值乘积的和()代入公式,计算平均数表3-2 简化平均数计算表组别85-898733980-8482821675-79771311370-7472150065-69679-1-960-64626-2-1255-59572-3-650-54521-4-4577三、算术平均数的性质性质一:一组变量值的和等于变量的个数与其平均数的乘积,即性质二:一组变量值的离均差之和等于零,即性质三:在一组变量值中,每个变量值加上或减去、乘以或除以常数,所得的平均数等于原平均数减去或加上,除以或乘以常数。性质四:一组变量值的离均差平方和最小,即最小第二节 中位数一、 一、 中位数的意义中位数又称中点数,简称中数,用符号或表示,是位于按一定顺序排列的一组数中央位置的数值。例如有一组数据为3 , 5,6,7,10,位于中央位置的数是6,而在它两侧各有两个数据分布。二、 二、 中位数的计算(一)原量数的计算法1 1 中数附近无重复数时若数据个数(n)为奇数时: ;最后再由位置数确定中数。 若数据个数(n)为偶数时:2 2 中数附近有重复数时有重数时,需考虑重复数的影响。如2,3,4,4,6,9,9,9,10,14,17,第六个位置的数9,但有三个其确定如下 。 第一个9 第二个9 第三个98.50 8.833 9.166 9.449图3-1 重复数9的分布其公式为 若数据经整理形成了次数分布表,则求其中数的公式为 (用于由低分组向高分组累积次数时) (用于由高分组向低分组累积次数时)表3-3 中数计算表组别85-89357380-848541175-7913462470-7415333965-699184860-64695455-59235650-54115757 分析过程 求累积次数,由下往上累加或由上往下累加。 确定中数位置。本例为57,则有。 在累积次数栏中找包含28.5的累积次数并确定中数所在的组。因为本例累积次数33或39包含了28.5,所以中数所在组为70-74。 确定公式中各符号的内容,有,代入公式计算中数解法一: 解法二 三、百分位数和四分位数求例3-4次数分布表中30%和85%位置上的数,计算步骤如下。 确定百分位置及百分位数所在的组。30%的位置为,其所在组为65-69;85%的位置为 ,其所在组为80-84。 确定有关数值30%时:, 85%时:,第三节 众数一、 一、 众数的定义众数(mode)是指一群数据中出现次数最多的那个数值,又称范数,用符号表示。众数的确定方法二、众数的确定方法(一)观察法对于一群数量较少原始数据可以根据众数的定义直接采用观察法来确定众数,即以次数最多的数值为众数。如果数据经过整理形成了次数分布表,则可以确定次数最多一组的组中值为众数, (二)计算法1皮尔逊经验公式。 如例3-4,均数为72.61,中数为73,则其众数为 2、金氏(w i king)插补法。 例3-5:某大学数学系106名学生在一次概率论的考试中成绩分布如表3-4所示,试问其众数是多少?表3-4 106名学生概率论考试成绩次数分布表90-9485-8980-8475-7970-7465-6960-6455-5950-5413515212618107106由上表可知,次数出现最多的组为65-69,共26次,故有,三、均数、中数、众数的关系与应用(一)均数、中数、众数的关系当次数分布为正态分布时,均数、中数、众数落在横坐标上重合为1点,三个指标值相等,即当次数分布为偏态分布时,中数居于众数与均数的中间,且均数与中数的距离约占均数与众数的距离的三分之之一,中数与众数的距离约占均数与众数距离的三分之二,即 (二)均数、中数、众数的比较与应用表3-5 均数、中数、众数的优缺点及应用比较表均 数中 数众 数优点1符合优良集中量的2已知和,即可求3便于进行加权处理4统计推断的结果更可靠、稳定1符合优良集中量的2少受极端数值的影响1符合优良集中量的应用1加权平均数2离差、相关计算,进行统计推断3考试评估1有极端数值时2测量单位的性质有怀疑3上下端距离不确定4采用百分体制时1粗略估计数据的集中量2出现多峰分布时不足1易受极端值的影响2组距不确定时无法计算1易受抽样偏差影响2不适合代数法处理使用价值很少作业题1某校2001级心理班学生的普通心理学的考试成绩如下表。试问平均数、中数、众数分别是多少?百分之40和百分之86位置上的分数是多少?四分位数分别是多少?表3-11 学生普通心理学考试成绩分布表2请就下列各组数据选择最佳的集中量指标,并计算出结果。 7,10,4,8,9,10,6,8 8,5,9,10,11,14,11,12,40 17,19,12,16,18,10,22,18,173某一团体成员的年龄分布如下表所示。试问表示它们集中趋势的恰当指标是什么?为什么?并计算出你所选定的指标。表3-12 年龄分布表25岁以下25-34岁35-44岁45-54岁55-64岁64岁以上454030552815第四章 差异量数课时安排:5课时教学课型:理论课,实践课(课堂同步练习)教学目的要求:熟练掌握方差与标准差意义与分析方法;了解其他差异量数指标的思想,掌握差异量数与中心动差的关系,了解偏态量与峰态量教学重点与教学难点:重点和重点方差与标准差教学方法、手段、媒介:教科书、板书、多媒体教学过程与教学内容第一节 方差与标准差1第二节 其他差异量数5第三节 差异量的比较与应用6第四节 中心动差7第一节 方差与标准差一、方差与标准差的定义 从例4-1看,两列数据的分布不大一样。尽管平均指标相同,却无法说它们的分布相同,因为它们的差异情况大不相同。以两列数据的平均数作为比较标准,看每个数据()与其平均数()的差距大小(),即每个数据离均差的大小;再来看一列离均差的平均大小。即有 对每一个离均差进行平方后再求和,即;再求离均差平方算术平均数,即为方差表4-1 方差的含义与计算表第1栏第2栏第3栏第4栏第5栏第6栏第7栏编号甲离均差()离差平方乙离均差()离差平方18-4-7163-9-318129-395-749310-245-7494131 717-525513119-3961424131 311714242198181539332144196048960736 方差是离均差平方的算术平均数,表示一列数据平均差距的平方,其样本方差用符号表示,总体方差用符号表示。标准差就是方差的算术平方根,表示一列数据的平均差距。样本标准差用符号或表示,总体标准差则用符号表示。 以表4-1的结果代入标准差公式,可得 二、方差和标准差的分析方法(一)定义式 方差的定义式 标准差的定义式 (二)计算式 方差 标准差 表4-2 方差与标准差的原量数计算表第1栏第2栏第3栏第4栏第5栏编号甲组x观测值的平方乙组x观测值的平方18643929815253101005254131697495131699816141961316971419621441815225331089961200961888 计算步骤: 1)求原始数据的和,即,见表4-2的第2栏和第4栏。 2)将每一数据()平方,并求其平方和(),见表4-2的第3栏和第5栏 3)代入方差和标准差的公式,计算结果方差: 标准差: 计算式的推导过程: 又 , 将其代入定义式,即有 同理,(三)加权式例4-2:某班32名学生的创造性思维测验成绩如表4-3所示,试问该班学生创造性思维测验分数的平均差距是多少?或标准差是多少?表4-3 学生创造性思维成绩分布表第1行40-4435-3930-3425-2920-2415-19第2行人数173118232第3行组中值423732272217第4行422599629717634904第5行13.758.753.75-1.25-6.25-11.250第6行189.062576.562514.06251.562539.0625126.5625第7行189.0625535.937542.187517.1875312.5000253.1251350.00001基本式 计算过程如下: 1)求各组次数与组中值的乘积()及乘积和(),见表4-3的第4行。 2)求平均数 3)求各组的离均差()及各组的离均差平方,见表4-3的第5行和第6行。 4)求各组的次数与离差平方的乘积及其连加和,见表4-3的第7行。 5)代入公式,计算结果简捷式过程如下: 1)确定各组的简化值,见表4-4的第4行。 2)求各组简化值的平方,即,见表4-4的第5行。 3)求各组次数与简化值乘积及连加和(),见表4-4的第6行。4)求各组次数与简化值平方的乘积及连加和(),见表4-4的第7行。 5)代入公式,计算结果。表4-4 学生创造性思维成绩分布表第1行40-4435-3930-3425-2920-2415-19第2行人数173118232第3行组中值423732272217第4行3210-1-2第5行941014第6行31430-8-48第7行928308856(四)方差与标准差的组合方差: 标准差: 例4-3:有四个学习小组参加英语竞赛,经初步统计四个学习小组竞赛成绩统计量如表4-5所示,试问其总平均数和总标准差是多少?表4-5 四个学习小组英语竞赛成绩统计量学习小组人数()均数()标准差()a20808636b1875711c16708-416d20706-41674 分析过程: 1)求总平均数 2)求离差和离差的平方 3)代入公式,计算结果 第二节 其他差异量数 一、全距全距是一列数据中最大数与最小数的差距,又称极差,用符号(range)表示,其公式为 二、平均差平均差是以离差绝对值的和除以总次数所得的商。平均差用符号表示,其公式为 三、百分位差和四分位差百分位差表示某两个百分位数之间差异程度的指标。常用的百分位差如,。四分位差是百分位差的特例,用于分析()与()之差的一半,即第三节 差异量的比较与应用一、各种差异量指标的比较优良差异量的条件:一要感应灵敏,二要严密确定,三思意义简明,四要计算简单,五要适合代数法的处理,六要少受抽样变动的影响。各差异量比较详见表4-6。表4-6 各种差异量指标的比较类别优 点缺 点应 用标和准方差差1.感应灵敏2.严密确定3.适合代数法处理4.受抽样变动影响小1.原理难理解2.计算较复杂3.受极端值影响较平均差大1.反映变量值的离散程度2.进行统计估计和假设检验3.用于求正常范围4.计算变异系数,标准分数和标准误等全距1.意义简明2.计算简单1.易受极端值的影响2.不反映全部数据的差异情况使用价值极小平均差1.意义简明2.计算简单3.严密确定1.受极端值的影响2.不适合代数法的处理使用较少百位分差1.意义简明2.不受极端数的影响3.组距不确定时可用1.不反映全部数据差异情况 2.不适合代数法的处理3.受抽样变动影响较大1.不需精细的结果2.比较团体各阶段之间的差异二、集中量数与差异量数的关系(一)在多组数据分布比较时,当集中量相同差异量不同,或是差异量相同集中量不同时,均不能冒然下结论说各组分布相同。这是因为,无论哪种情况它都只表明数据的分散情况,并不能判断分布的优劣等。正如例4-1甲、乙两列数据的分布,虽然其平均数相等,但标准差却大不相同,所以其分布情况也大不一样。正如图4-1所示,图为平均数相等,标准差不相等;图为标准差相等,平均数不相等,它们曲线形状或坐标位置不相同;图为平均数和标准差均不相等时的曲线开关与位置。2利用平均数和标准差分析数据的分布,一般会有四种情况。一是平均数相同或相近,标准差各异;二是平均数相同或相近,标准差也相同或相近;三是标准差相同或相近,平均数各异,四标准差各异,平均数也各异。其中,只有第二种情况才能能做出分布相同或相近的结论。3集中量是量尺上的一个点,差异量是量尺上的一段距离。4一组数据分布的集中量代表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论