版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
常用统计量数详解演示文稿第1页,共77页。(优选)常用统计量数第2页,共77页。Outline第一节集中量数一、算术平均数二、几何平均数三、中数与众数第二节差异量数一、平均差二、方差与标准差三、差异系数第三节地位量数一、百分位分数二、百分等级分数第3页,共77页。第一节集中量数一、算术平均数二、几何平均数三、中数与众数第4页,共77页。集中量数集中量数对数据的集中趋势的度量确定一组数据的代表值第5页,共77页。常用的集中量数算术平均数mean加权平均数几何平均数geometricmean中数median众数mode第6页,共77页。问题某部门有5名一般职员和1名经理。一般职员的薪水是3000元,而经理的薪水是10000元,请问该部门收入的平均水平是多少?第7页,共77页。算术平均数:可简称为平均数或均数,是用以度量次数分布集中趋势及位置最常用的集中量数。(一)总体平均数与样本平均数(二)加权平均数第8页,共77页。(三)算术平均数的性质1.每一个观测值加上一个相同常数C,其平均数为原来的平均数加常数C2.每一个观测值乘以一个相同常数C,其平均数为原来的平均数乘常数C3.每个观测值都乘以一个相同常数c,再加上一个常数d后,计算得到的平均数等于原平均数乘以该常数c再加上常数d4.观测值与平均数的差(离均差)的总和等于零5.观测值与任意常数C的离差平方和不小于观测值与平均数的差的平方和。-离差平方和最小,样板平均数是总体平均数的最佳估计。第9页,共77页。算术平均数的优点反应灵敏,确定严密,简明易解,计算简便并能作进一步的代数演算,是应用最普遍的一种集中量数。适用情境:数据准确可靠,且又同质,需要每一个数据都能加入计算,同时还要作进一步的代数运算时,一般都用算术平均数表示集中趋势。易受极端数据影响、出现模糊数据和存在不同质数据时无法计算第10页,共77页。几何平均数适用条件:1.一组数据中任何两个相邻数据之比接近于常数,即数据按一定比例关系变化。在教育与心理研究中,求平均增长率或对心理物理学中的等距与等比量表实验进行数据处理,均应使用几何平均数。2.当一组数据中存在极端数据时,分布呈偏态,算术平均数不能很好地反映数据的典型情况,此时应使用几何平均数或其他集中量数(如中数、众数)来反映数据的典型情况。第11页,共77页。(一)几何平均数的基本公式第12页,共77页。(二)几何平均数在教育与心理研究中的应用1.心理物理学中等距与等比量表实验的数据处理2.平均增长率的计算第13页,共77页。(一)中数中数又称中位数,符号记为Mdn。中数是指位于一组数列中中间位置的那个数,它可以是数列中的某一个原始数据,也可以不是原始数据而是通过计算得到的一个数。总之,如果将一组数据按大小排列,则中数一定是将数据个数平均分为大小相等两部分的那个数。中数的特点:计算简单,不受极端数据影响,但由于是根据数据的相对位置来确定的,在计算时不是每个数据都加入,从而有较大的抽样误差,不如平均数稳定,且会流失很多的被试信息,同时,中数难以作进一步的代数运算第14页,共77页。(二)众数众数又称为范数,常用Mo表示。众数指次数分布中出现次数最多的那个数的数值。适用条件:当一组数据中出现不同质的情况,或分布中出现极端数据时,常用众数作为集中量数的粗略估计。计算众数的皮尔逊经验法:Mo=3Mdn-2M第15页,共77页。众数
Mode,Mo众数:一组数据中出现次数最多的数如2、3、5、3、4、3、6的众数为3如果次数分布最多的有两个数,而且两个数是相邻的,那么一般取两者的平均值作为众数;如果这两个数不相邻,那么一般需要报告两个众数,而且认为该组数据是bimodal双峰分布的第16页,共77页。第二节差异量数一、平均差二、方差与标准差三、差异系数第17页,共77页。离中趋势的度量
数据离中趋势是表示数据分散程度的一组统计量,反映的是各变量值远离其中心值的程度。表示数据离中趋势的测度有:平均差、方差、标准差、四分位差、极差(全距)、变异系数等。第18页,共77页。一、平均差(Meandeviation)1.定义:也称平均离差,次数分布中所有原始数据与平均数举例的绝对值的平均,用AD表示。2.计算公式平均差的数学性质不是最优的,在实际应用中应用较少。第19页,共77页。二、方差(Variance)与标准差(Standarddeviation)
方差与标准差事最经常用于描述次数分布离散程度的差异量数。(一)总体方差与总体标准差(二)样本方差与样本标准差(三)标准差的合成(四)方差与标准差的意义第20页,共77页。方差与标准差的定义方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平方和的平均数。标准差:方差的算术平方根,表示一列数据的平均差距。第21页,共77页。(一)总体方差与总体标准差总体方差的表示:总体标准差的表示:第22页,共77页。(二)样本方差与样本标准差样本方差的表示:样本标准差的表示:样本方差为什么要除以(n-1)与自由度(degreesoffreedom)有关。自由度是数学名词,在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。若受到k个条件的限制,就只有(n-k)个自由度了。计算样本方差时,n个变量值本身有n个自由度。但受到样本均数的限制,任何一个“离均差”均可以用另外的(n-1)个“离均差”表示,所以只有(n-1)个独立的“离均差”,因此只有(n-1)个自由度。第23页,共77页。(三)标准差的合成方差具有可加性。在已知几个组方差或标准差的情况下,可以计算她们的总方差或总标准差。-只有在应用同一种观测手段,对不同样本的统一特质进行测量时才能使用。标准差的合成,:总平均数;:各小组的平均数i第24页,共77页。练习表4个学习小组的竞赛成绩学习小组nSA20808B18757C16708D20706∑74——第25页,共77页。(四)标准差的性质1.每一个观测值都加一个常数c后,计算得到的标准差等于原标准差。2.每一个观测值都乘以一个常数c,则所得的标准差等于原标准差乘以这个常数。3.每个观测值都乘以同一个常数c(c≠0),再加上一个常数d,所得标准差等于原标准差乘以这个常数c。第26页,共77页。方差和标准差的优缺点(1)反应灵敏;(2)计算严密;(3)受抽样变动影响小(1)不太容易理解;(2)易受极端数值影响;(3)有个别数值模糊不清时,无法计算。方差和标准差是表示一组数据离散程度的最好指标。值越大,说明次数分布的离散程度越大。第27页,共77页。三、差异系数(Coefficientofvariation)1.差异系数也叫变异系数,它是一种相对差异量,常用CV表示。是一组数据的标准差与其相应的均值之比。2.计算公式第28页,共77页。差异系数的适用情境变异系数指出了标准差相对于平均值的大小,用于比较不同总体或样本数据的离散程度。(1)同一团体不同测量的变异的比较,如相同班级不同科目的变异的比较;-两个或两个以上样本所测的特质不同(2)不同团体同一测量的变异的比较,如不同年级同一科目变异大小的比较。-两个或两个以上样本所测的特质相同,但样本间的水平相差较大。第29页,共77页。练习1已知某小学一年级学生的平均体重为25公斤,体重的标准差是3.7公斤,平均身高110厘米,标准差位6.2厘米,问体重与身高的离散程度哪个大?2通过同一个测验,一年级学生的平均分数为60分,标准差为4.02分,五年级学生的平均分数为80分,标准差为6.04分,这两个年级的测验分数中哪一个分散程度大?第30页,共77页。全距(range)也称两极差,是一组数据的最大值与最小值之差。
R=max(Xi)-min(Xi)第31页,共77页。差异系数
Coefficientofvariation变异系数指出了标准差对于平均值的大小,用于比较不同总体或样本数据的离散程度。同一样本不同测量的变异的比较,如相同班级不同科目的变异的比较;不同样本同一测量的变异的比较,如不同年级同一科目变异大小的比较。第32页,共77页。第三节地位量数一、百分位分数二、百分等级分数第33页,共77页。百分位分数百分位分数是一种相对地位量数,它是次数分布中的一个点。把一个次数分布排序之后,分为100个单位,百分位分数就是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。用Pm表示,其中m是特定百分点。eg.P30=60,表明在该次数分布中有30%的个案低于60分。第34页,共77页。计算第p百分位步骤第一步:从小到大排列原始数据第二步:计算指数ii=(p/100)×n,n为项数,p为所求的百分位的位置第三步:若i不是整数,将i向上取整;若i是整数,则第p百分位数是第i项与第i+1项数据的平均值例:有12个职员薪金的数据,求第85和第50百分位数。解:(1)将12个数据从小到大排序如下:
221022252350238023802390242024402450255026302825(2)i=(p/100)×n=(85/100)×12=10.2(3)由于i=10.2不是整数,向上取整,所以第85百分位数对应的是第11项,其值为2630。同理,计算第50百分位(中位数)。i=(50/100)×12=6,是整数,第50百分位数是第6项和第7项的平均值,即(2390+2420)/2=2405。第35页,共77页。百分位分数的计算组下限:组上限:第36页,共77页。二、百分等级分数百分等级分数是一种相对地位量数。百分等级分数与百分位分数不同,是事先知道分布中的一个原始分数,再求这个原始分数在分布中所处的相对位置-百分等级。用PR表示。一个原始分数的百分等级分数,定义为次数分布中低于这个原始分数的次数百分比。百分等级分数指出原始数据在常模团体中的相对位置,百分等级越小,原始数据在常模团体中的相对位置越低;百分等级越大,原始数据在常模团体中的位置越高。第37页,共77页。百分位等级分数的计算公式第38页,共77页。表某市招干考试分数分布表分数分组次数累积次数累积百分数90-9458-8980-8475-7970-7465-6960-6455-5950-5445-4940-4435-3930-3425-2920-2415-1910-145-90-41327517098134131125149136134126138139147151982671900188718601809173916411507137612511102966832706568429282131337100.0099.3297.8985.2191.5386.3779.3272.4265.8458.0050.8443.7937.1629.8922.5814.846.891.740.37P90=73.52X=82,PR=96.28第39页,共77页。百分位量表的特点百分位分数和百分等级分数称为百分位量表。优点:计算简便、意义明确、对各种测验普遍适用。缺点:是一个顺序量表,不具有相等单位,从而不能作进一步的数学运算,无法作进一步的统计分析;另外,由于百分位量表的分布呈长方形,当测验分数的分布为正态或接近正态时,百分位量表将夸大分布中间的原始分数的差异而缩小分布两端的原始分数的差异。第40页,共77页。第四节相关分析一、相关系数及其解释(一)相关:事物间存在联系但又不能作出因果关系的解释(二)相关系数及其解释二、常用相关分析方法及计算第41页,共77页。事物之间的关系因果关系、共变关系和相关关系因果:A→B下雨地上会湿共变:C→A,C→B
严格的说不叫相关,只是A和B之间有某些共同点婴儿身高和树苗高度的关系相关:指两类现象在发展变化的方向和大小方面存在一定的关系,不能确定是否为因果关系广告费支出与商品销售额的关系第42页,共77页。相关的判定1.散点图2.统计分析第43页,共77页。散点图(a)完全正相关(b)完全负相关(c)无相关关系(d)非线性关系(e)正相关(f)负相关第44页,共77页。散点图scatterdiagram第45页,共77页。第46页,共77页。第47页,共77页。第48页,共77页。(一)相关系数及其解释1.相关系数的取值范围:[-1,1](1)正相关Vs.负相关-只表示方向(2)相关程度的大小:相关系数的值2.有相关不一定有因果第49页,共77页。二、常用相关分析方法及其计算(一)积差相关系数(二)等级相关1.斯皮尔曼等级相关2.肯德尔W系数(肯德尔和谐系数)(三)质量相关1.点双列相关2.双列相关第50页,共77页。积差&协方差1.积差的定义:成对变量的离差乘积。2.积差的表示3.协方差(covariance):积差的平均数第51页,共77页。(一)积差相关系数积差相关系数又称积矩相关系数,是英国统计学家皮尔逊提出的一种计算相关系数的方法,故也称皮尔逊相关。这是一种求直线相关的基本方法。记作:rxy。它是利用离差乘积的关系来说明事物的关系,是将原始记分转换为离差乘积(即积差),再转换为标准积差后所求得的标准积差的平均数。积差相关系数实际上就是成对变量标准积差的算术平均数。第52页,共77页。积差相关系数的使用条件(1)两列变量都是等距的或等比的测量数据(2)两列变量所来自的总体必须是正态的或近似正态的对称单峰分布(3)两列变量必须具备一一对应关系第53页,共77页。积差相关系数的计算1.均数已知3.利用原始数据2.标准差已知☆第54页,共77页。表5名学生身高和体重的测查结果编号实测记分离差记分积差标准记分标准积差身高体重XY11707203001.50.00216569-500-0.4100.00315066-20-3601.63-1.52.44418070101100.820.50.4151856815-1-151.22-0.5-0.61∑8503450055——2.24第55页,共77页。等级相关的界定等级相关是根据两列顺序变量数据中各对等级数据的差数来计算相关系数的方法。对于连续变量的数据,必要时可分别把两列数据按大小顺序赋给名次等级,进而采用等级相关法计算相关系数。等级相关法因变量个数的多少而有用于分析两列变量相互关系的斯皮尔曼等级相关和用于分析多列变量相互关系的肯德尔和谐系数和肯德尔一致性系数。第56页,共77页。1.斯皮尔曼等级相关斯皮尔曼等级相关(Spearman’scorrelationcoefficientforrankdata)是英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导出来的,是通过两列变量的成对等级差数来计算相关系数,又叫“等级差数法”,用符号rR或rs表示。斯皮尔曼等级相关适用于两列具有等级顺序的测量数据,或总体为非正态的等距、等比数据。第57页,共77页。斯皮尔曼等级相关的基本公式-无相同等级
Di:二列成对变量的等级差数N:等级个数1.等级差数法2.等级序数法第58页,共77页。练习表2位教育专家对5篇论文的评价结果编号rxryDD201020304052541343125-223-1-244914∑20第59页,共77页。观测变量有相同等级的处理
在观测变量没有相同等级时能够保证
RX=RY,RX2=RY2。如果观测变量出现相同等级时
RX=RY,但RX2RY2。R2随相同等级数目的增多而有规律地减少。t:相同等级的数目第60页,共77页。2.肯德尔W系数(和谐系数)肯德尔W系数又称为肯德尔和谐系数,是表示多列等级变量相关程度一种方法,适用于两列以上等级变量。第61页,共77页。肯德尔W系数的适用资料1.K个评分人评价N个被评价人或N件作品,以分析和评价K个评分人的评价是否一致2.同一个人先后K次评价N个被评人或N件作品,以分析其前后评价是否一致第62页,共77页。肯德尔W系数的计算公式-无相同等级K:评定者的数目R:K个评定者对同一个被评事物所给予的等级之和N:被评定事物的数目SS:R的离差平方和第63页,共77页。有相同等级的W系数n:相同等级的数目第64页,共77页。对W系数的说明1.取值范围:W[0,1]2.相关方向:从实际资料中进行分析。3.相关程度(1)若K个评价者意见完全一致,则W=1;若K个评价者的意见存在一定关系,单又不完全一致,则0<W<1;若K个评价者的意见完全不一致,则W=0。(2)SS越小,评价的一致性程度越低;SS越大,评价的一致性程度越高。第65页,共77页。练习第66页,共77页。第67页,共77页。质
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026福建兴泰开发投资有限公司正式员工招聘4人笔试题库含完整答案详解【考点梳理】
- 2026年南昌大学抚州医学院编外教学科研岗教师招聘2人参考题库及答案详解(夺冠系列)
- 第四单元 第05课时 有关0的乘法(教学课件)数学人教版三年级上册(新教材)-中考备考真题
- 汽车改装技术试题及答案
- 期货从业考试试题及答案
- 信阳高一月考生物试题及答案
- 电大微生物试题及答案
- 心电学技术试题及答案
- 数据要素产权清晰化交易
- 2026年天津市面向甘南籍未就业高校毕业生招聘事业单位工作人员40人参考题库及完整答案详解【全优】
- T-CPQS XF007-2024 全氟己酮系洁净气体灭火系统通.用技术要求
- 物业楼栋管家培训
- 骨质疏松课件完整版
- 人教版二年级下册数学口算混合练习题
- GA/T 804-2024机动车号牌专用固封装置
- EAST5.0数据结构一览表
- DL-T596-2021电力设备预防性试验规程
- 模具确认清单
- 2022新版语文课程标准初中段(7-9年级)课程目标
- 危险化学品生产使用企业老旧装置安全风险评估指南(试行)(可编辑版)
- 公司员工手册范本模板
评论
0/150
提交评论