语言统计第四章离中趋势与差异量数.ppt_第1页
语言统计第四章离中趋势与差异量数.ppt_第2页
语言统计第四章离中趋势与差异量数.ppt_第3页
语言统计第四章离中趋势与差异量数.ppt_第4页
语言统计第四章离中趋势与差异量数.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节 离中趋势与差异量数 一、离中趋势的概念 二、差异量数的作用 三.主要的差异量数分类 第二节 两极差 一、两极差的概念 二、两极差的求法 第三节 四分差 一、四分差的概念 二、四分差的求法 第四节 平均差 一、平均差的概念 二、平均差的求法 第五节 标准差与方差 一、标准差与方差的概念 二、标准差与方差的求法 第六节 标准差的应用数据的标准化 一、考分比较 二、标准化与标准分 三、标准分的应用 四、标准分与正态分布和百分位的关系,第四章 离中趋势与差异量数,第一节 离中趋势与差异量数 一、离中趋势的概念: 离中趋势指的是一组数据的变异或离散程度。对离中趋势进行度量的统计量称作差异量数。离中趋势的度量是描述统计的一个重要方面。 二、差异量数的作用: 1.能从另一个角度了解数据的性质。 2.有助于检验或说明集中量数的代表性 差异量数越大,集中量数的代表性就越小; 差异量数越小,集中量数的代表性就越大; 差异量数为零,则说明数据中各个数值之间没有任何差异,都等于平均数,平均数的代表性最大 三.主要的差异量数分类: 1.;两极差 2.四分差 3.平均差 4.标注差与方差,举个例子: 我们两组假设的分数来举个例子: 第一组:60 75 78 80 82 85 100 第二组:74 77 80 80 80 83 86 两组分数段饿平均差都是80,然而其离散程度却差别很大,如果每组数据中的最大值与最小值之差来表示离散程度,那么第一组为(100-60)=40,第二组为(86-74)=12。两者离散程度的不同表明其分数分布的差异;,第二节 两极差,一、概念 两极差也称全距,用符号R表示。所谓两极差就是一组数据中最高值与最低值之差。 二、两极差的求法 R=最大数值-最小数值 三、小结: 1.两极差是简单而粗略的差异量数 2.不能反映中间数值的差异情况,也受两极 端异常数值的影响。 3.可以作为数据分布的初步统计,在一定程度上反映数据的差异情况(前提是分布比较对称、没有极端数值),第三节 四分差 一、概念 四分差指一个分布中,中间50%的次数的全距之半,用符号Q表示。 正如中数把一个次数分布分成两半那样,有一些点把一个次数分布分成四等份,这些点称作四分点或四分位数。第一个四分点(或称下25分点)用Q1表示,其下有全部数值的1/4或25%,其上则有全部数值的3/4或75%,其上则有全部数值的1/4或25%。,二. 四分差的求法 要求四分差,首先要求Q1和Q3的值。对于分组数据,用下列公式求之(方法同中数的求法,其实中数就是第二个四分点) 式中Lb-该四分点所在组的精确下限; fQ1,fQ3-该四分点所在组的次数; fb-该四分点所在以下的累积次数; N-数据中的数值个数; i-组距,已知:N=100,i=5; Q1的位置为N/4=25,即在1014组,该组的精确下限为9.5/,该组以下的累积次数(Fb)为8;,我们下面以表4.1的分组数据未说明四分差的计算过程:,Q3的位置为3N/4=75,即在2529组,改组的精确下为24.5。该组以下的累积次数(Fb)为72;,三、小结 分差不受两极端值的影响,故两极差稳定可靠 不能反映全部数据的差异情况,而且不适于代数运算 适用于两极端数据不清,无法计算其他差异量数; 四分差常与中数结合适用,第四节 平均差 一、概念 平均差:是指一组数据中各个数值与平均数之差的平均(实质上是用数值离开平均数的距离来表示离散程度),一般用符号AD表示。 二、平均差的求法: 平均差是基于算术平均数上的一个差异量数,而根据算术平均数的一个重要性质,一组数据中每个数值与算术平均数的差(即离均差)之和等于零即( ),因此求平均差时,要取离均差的绝对值。,对于未分组数据,首先要计算每个数值的离均差,取其绝对值,然后把所有离均差相加,再除以数值的个数。公式表示如下:,例如10学生在一次完型填空练习中的得分为(满分20分) 9,11,12,12,15,15,16,16,17,18,即以每组组中点代表该组各数值。首先计算组中点与平均数之差,取其绝对值,再乘以该组次数,然后把各组的计算结果累加,最后除以总次数N.以表4.2中的数据为例.,三、小结 1.平均差的优点 平均差优于两极差和四分差 用数值离开平均数数的平均距离来表示数据的分散程度,符合人们的常识,易于理解和接受。 它的计算考虑了每一个数值,因而稳定可靠,不易受极端数值的影响也不易受样本变化的影响。 2.缺点 计算过程中需要取绝对值等原因,它不适合代数方法的运算,因而在进一步的统计分析中很少使用。,第五节 标准差与方差,一、 概念 标准差是度量离中趋势的最常用的差异量数。作为样本统计量的标准差一般用符号S或者SD表示,而作为总体参数的标准则用希腊字母。标准差的平方即为方差,分别用符号S2(样本统计量)和2(总体参数)来表示。 二、标准差与方差的求法 下面就从未分组数据(原始数据)、次数分布数据和分组次数分布数据三个方面讨论一下标准差和方差的计算方法。,1.未分组数据标准差和方差的求法 第一步:计算个数值与平均数之差(离均差) 第二步:求离均差的平方 第三步:把平方离均差相加,求”平方和“; 第四步:把平方和除以数值的个数,求得方差; 第五步:方差的平方根即为标准差。用公式表示:,显然,由于涉及到平均数,上述公式使用起来很不方便;我们可以在上述的公式的基础上得出一个不涉及平均数的求标准差的公式:,下面我们仍用上例中的数据说明公式的用法,三个公式计算结果一样,但计算过程要简便得多。,2.次数分布数据标准差和方差的求法: 如果已有次数分布表,那么标准差和方差的计算将更加简便。计算公式为:,3.分组次数分布数据标准差和方差的求法 从分组次数分布数据标准差和方差的公式如下:,三、小结 标准差与方差的概念易于理解,适于代数运算,能反映所有数据的差异情况,不易受抽样变动的影响。,第六节 标准差的应用数据的标准化,标准差的重要应用之一是对数值型数据进行标准化。在语言和语言教学研究中,标准化处理的主要用途是便于对考试分数的比较。 一、考分比较 考分在各自分数组中所处的相对位置是可以进行比较的。虽然这同样无法保证百分之百的可比性,但这至少为比较不同考试的分数找到了一个较为可靠的途径。,二、标准化与标准分 我们可以用公式表示这一标准化过程: 该式表示:先从一个分数中减去平均分,求出该分数离开平均分的距离(分数低于平均数时,差为负数;反之为正数),然后再除以标准差,即得标准分。,标准分具有以下几个特点:,三、标准分的应用 通过把原始分数转换为标准分,原分数不见了,而代之以一个抽象的相对位置(标准分无实际单位),这样就可以用同一把尺子来衡量和比较不同考试(因而不同质)的分数。 利用标准分,可以把不同质的考试分数合成(求和或平均数),然后再加以比较。,四、标准分与正态分布和百分位的关系 百分位是指把一组分数从高到低排列并分为100等分,以百分位等级表示某个分数在全部分数中所在的位置,即在全部考分仲有百分之几的分数是低于该分数的或有百分之几的分数是高于该分数的。 百分位表是在累计次数分布表的基础上编制的,标准分就是通过标准化把一个成呈正态分布的变量转换成标准正态分布。在正态分布的情况下,分布曲线下任意两个标准之间的面积、任一标准以上的买年纪或任一标准差以下的面积在总面积中的百分比都是一样的。,总结,离中趋势指的是一组数据的变异或离散程度。对离中趋势进行度量的统计量称作差异量数。离中趋势的度量是描述统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论