




已阅读5页,还剩68页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章、集中趋势统计:算术平均数算术平均数的性质,第一、在一组数据中,观察值的总和等于算术平均数的N倍。即:第二、在一组数据中,每个观察值与该组的平均数之差(即离均差)的代数和等于0。即:这个性质表明算术平均数是一组数据的重心,算术平均数受极端数据影响大。,第四章、集中趋势统计:算术平均数算术平均数的性质,第三、在一组数据中,每一个数都加上或减去一个常数C,则所得的平均数为原来的平均数加减常数C;即:若每一个数都乘以或除以一个常数C(),则所得的平均数为原来的平均数的C倍或。即:;。,第四章、集中趋势统计:算术平均数算术平均数的性质,第四、在一组数据中,其观察值是由两部分(或几部分)组成,则该组观察值的算术平均数可以由组成部分的算术平均数而求得。即:第五、在一组数据中,每个观测值与算术平均值差值平方(又称方差)和最小。,第四章、集中趋势统计:算术平均数算术平均数的意义,算术平均数是最常用的集中趋势指标,它既有优点,也有缺点。其优点主要有:1反应灵敏;2有严格的确定性;3适合进一步的代数运算;4受抽样变动影响较小。反应敏感是算术平均数的优点,这恰恰又是它的缺点,算术平均数最主要的缺点就是易受极端值影响而失去典型性。,第四章、集中趋势统计:中数和众数中数的定义和特点,定义:中数(Median),又称中位数,常用Md表示。指一组数据按照大小顺序排位后,位于中间位置的那个数,就是中数。特点:1.不受极端数据的影响;2.对开放分布(即无上限或下限)也可以计算其中数。,第四章、集中趋势统计:中数和众数中数计算方法,1.未分组数据求中数方法中间部分无相同值情况N为奇数:6、7、5、4、7、4、8、5、9、3、7。大小排列3、4、4、5、5、6、7、7、7、8、9N为偶数:2、3、4、4、5、5、6、7、7、7、8、9,5.5,第四章、集中趋势统计:中数和众数中数计算方法,1.未分组数据求中数方法中间部分有相同值情况N为奇数:11、11、11、11、13、13、13、15、1713131312.512.5+1/312.5+2/313.512.67(中位数),第四章、集中趋势统计:中数和众数中数计算方法,1.未分组数据求中数方法中间部分有相同值情况N为偶数:11、11、11、11、13、13、13、15、17、1713131312.512.5+1/312.5+2/313.5,第四章、集中趋势统计:中数和众数中数计算方法,2分组数据求中数方法(公式)或者含中数组下限,n数据总数,中数组以下各组累加频数,中数组频数,中数组上限,中数组以上各组累加频数,i组距。,第四章、集中趋势统计:中数和众数众数的定义及其特征,众数(Mode)又称范数,密集数,通常数等,指在一组数据中次数出现最多的量数,用符号表示。其计算也很简便,只需将数据按大小顺序排列,用观察法直接寻找出现次数最多的那个数即可。如果数据以次数分布表的形式出现,则表中次数最多的那一组的组中值可作为众数。其主要特点:容易获取;在一组量数中,众数可能是一个,也可能不只一个,例如一组量数4,5,8,2,4,3,7,3,9,4,3,其众数就有两个,即3和4;在分组次数分布中,众数受组距和组限的影响很大。,第四章、集中趋势统计:算术平均数、中数和众数之比较共同点,一、平均数、中位数和众数这三个统计量的相同之处主要表现在:1、都是来描述数据集中趋势的统计量;2、都可用来反映数据的一般水平;3、都可用来作为一组数据的代表;4、意义都很明确,计算简捷。,第四章、集中趋势统计:算术平均数、中数和众数之比较一个良好的集中趋势指标应该具备的性质,(1)反应灵敏。即在一组数据中,任何一项数量的变动都会导致集中趋势指标随之变动。(2)客观稳定。即同样的资料,无论在什么时间计算都应该得到同样的结果,不受操作者任何主观因素的影响。(3)意义明确,计算简捷。(4)合适代数法则处理。一种良好的集中趋势指标,应适合代数法则的运算,这样才能用到后面要讲的其他统计学公式中去。(5)对总体的代表性强,受抽样的影响小。,第四章、集中趋势统计:算术平均数、中数和众数之比较算术平均数性质,算术平均数反应灵敏,最客观,最具有代表性。尤其是在适合运算法则方面,算术平均数是其他集中量数所不能做到的。当然,算术平均数也有其不足:当有极端数据时,其集中趋势的代表性就会很差;数据是非连续变量时,求得的算术平均数不易解释,也就是说在实际数值中不一定有此数值;不能直接在次数分布图上看出平均数的大小,必须经过计算才能确定,而中数、众数则可以在次数分布图上直接看出。,第四章、集中趋势统计:算术平均数、中数和众数之比较中数性质,中数符合上述第2、3个性质,其含义简明,易于计算。但由于它是位置居中的那个数,反应不够灵敏。它不受极端数据的影响,这是其优于算术平均数的地方。故当遇到一组数据分布从总体上看是均匀的,但是一端或两端有少数不正常数据(即极端值),就可以用中数。同样在偏态分布中,也最好求中数来看其数据的集中趋势。还有就是在开放的分布中,无法计算其平均数时,采用计算中数。但是中数不能用代数法则进行运算,故不能做进一步的统计分析,而且其受抽样影响较大,较平均数差。,第四章、集中趋势统计:算术平均数、中数和众数之比较众数的性质,众数仅仅符合上述第3个性质,即含义明确,易于计算,而且因众数是一组分布频数最多的数据,故若一组数据是随机抽样的,需要选择一最大可能值时,众数是最为适合的,再有在类别数据中,只能用众数。众数很少受极端值的影响,所以在全距较小、次数分布集中时,众数的代表性较强。众数反应不灵敏,客观性和可靠性较低,不适合代数法则运算。当数据无显著的集中趋势时,众数就失去了意义。,第四章、集中趋势统计:其它集中趋势指标加权平均数,加权平均数(WeightedAverage)是不同比重数据(或平均数)的平均数。前面讲过平均数的计算,是将各个数据的重要性同等看待的。假如各个量数的重要性不同就应该考虑各个数据在这组数据中的重要性,这样把各个数据对该组数据的重要性考虑在内的算术平均数称之为加权平均数或加权算术平均数。计算公式为:,第四章、集中趋势统计:其它集中趋势指标加权平均数计算例题1,第四章、集中趋势统计:其它集中趋势指标加权平均数计算例题2,某中学一年级外语测试,一班40名学生的平均分为80分,二班30名学生的平均分为90分,三班50名学生的平均分为75分,请问全年级的学生外语测试的总平均数是多少?,第四章、集中趋势统计:其它集中趋势指标几何平均数,几何平均数(GeometricMean)又称为对数平均数,是指将N个量数连乘之积再开N次方所得到的根。通常用Mg表示。,第四章、集中趋势统计:其它集中趋势指标调和平均数,1、定义公式2、应用描述学习速度问题求平均单位时间工作量:学会生字数所用时间(分钟)单位时间工作量30152M=2.530103MH=2.4,第四章、集中趋势统计:其它集中趋势指标调和平均数,求平均单位工作量所用时间:解题数量数所用时间(小时)单位工作所用时间2421/122021/101621/81221/6821/4421/2MH=1/7,第五章、离中趋势统计引言,心理学研究所得到的数据大都是具有随机性质,而对随机变量的描述只有前面讲的集中趋势的度量是不够,因集中量数只是描述数据的平均水平和典型情况,它不能对一组数据的全貌进行说明。而数据除了典型情况之外,数据还有变异性的特点。因此,集中趋势相同的两组数据,它们的差异程度也不见得相同。例如:某次心理测验两组被试的得分分别为:甲组:66、68、72、73、75、78、65乙组:49、69、89、91、59、79、61上例两组被试的平均数都是71,但是从数据的分布我们可以看出两组被试得分的离散程度是不同的。,第五章、离中趋势统计离中趋势含义及主要指标,离中趋势含义离中趋势(DivergenceTendency)是指在一组数据分布中,数据的变异或离散的趋势,也就是说数据偏离集中量的程度。而表示变异性即离中趋势的一些统计量,总称做差异量数(MeasureOfDifference)。差异量数越小,数据的分布就越集中,变动范围越小,即集中量数的代表性就越强;差异量数越大,数据的分布就越不整齐,分布范围越大,即集中量数的代表性就越弱。反映离中趋势的主要指标可以反映数据离中趋势的差异量数也比较多,如标准差(方差)、全距(极差)、平均差、四分差等,第五章、离中趋势统计:方差与标准差概念定义,平方和(sumofsquare,简称SS)SS方差(variance)标准差(StandardDeviation,简称为SD或S),第五章、离中趋势统计:方差与标准差方差和标准差的计算,1、基本方法,第五章、离中趋势统计:方差与标准差方差和标准差的计算,2、原始数据计算方法:=,第五章、离中趋势统计:方差与标准差方差和标准差的计算,3、由分组次数分布表计算法,第五章、离中趋势统计:方差与标准差方差和标准差的计算,4、由已知几个小组标准差求总体标准差的方法,第五章、离中趋势统计:方差与标准差标准差的应用(差异系数),差异系数(CoefficientOfVariation)所谓差异系数,也叫相对标准差,又叫变异系数,一般用符号CV表示,是指标准差与其算术平均数的比率,常用百分数来表示。它没有单位,是一种相对系数,其计算公式为:,第五章、离中趋势统计:方差与标准差标准差的应用(差异系数),问题提出一(测量性质或单位不同离散趋势如何比较):已知某地区6岁儿童的平均身高是1.15m,标准差是0.08m;平均体重23kg,标准差是4.2kg,问身高和体重的离散程度哪个大?问题提出二(样本水平不同如何比较):有人用同一份智力测验同时对一至五年级小学生进行测试,结果发现,五年级学生的平均成绩是80分、标准差是5分,而一年级学生的平均成绩是40分,标准差也是5分。问这两个年级的测验分数中哪一个的离散程度大?,CV身高,100%6.96%,CV体重,100%18.26%,CV五年级,100%6.25%,CV一年级,100%12.5%,第五章、离中趋势统计:方差与标准差标准差的应用(标准分数),标准分数(StandardScore):所谓标准分数,是将原始量数与总体平均数的差数除以标准差所得的商数,又称基分数或Z分数。也就是以平均数为中心、标准差为单位,表述一个原始分数在其团体中所处相对位置的数量。其基本公式为:,第五章、离中趋势统计:方差与标准差标准差的应用(标准分数),将原始分转为标准分:某次期中考试,某班同学的数学平均成绩为68分、标准差是10分。考生甲、乙、丙三人的成绩分别为60分、68分、88分,试计算他们数学成绩的标准分数各是多少?,Z甲,-0.8Z,0Z丙,2,第五章、离中趋势统计:方差与标准差标准差的应用(标准分数),标准分数具有如下性质:性质一:Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。性质二:一组数据中,所有原始分数的Z分数之和为零,即Z分数的平均数也为零。性质三:一组数据中,原始分数转化为Z分数后,其标准差为1。性质四:如果原始分数呈正态分布,则转换后得到一个所有Z分数的均值为0,标准差为1的标准正态分布。,第五章、离中趋势统计:方差与标准差标准差的应用(标准分数),标准分数的应用1、标准分数可以比较各个观测值在总体中的相对地位。,第五章、离中趋势统计:方差与标准差标准差的应用(标准分数),标准分数的应用2、标准分数可用于比较几个性质不同的观测值在各自数据分布中相对位置的高低。例题:两个不同年级的学生甲和乙。期中考试结束后,甲的语文考了85分,而乙的语文则考了90分。能否说明甲的语文成绩不如乙呢?已知甲所在班级的语文分均分为75分,标准差为10分;乙所在班级的语文分均分为95分,标准差为5分。,Z甲,1.0、Z乙,1.0,第五章、离中趋势统计:方差与标准差标准差的应用(标准分数),标准分数的应用3、标准分数可以计算不同性质的观测值的总和或平均值。,第五章、离中趋势统计:方差与标准差标准差的应用(标准分数),标准分数的应用4、标准分数经过线性转换后表示标准测验分数标准分数线性转换的一般公式为:公式中,Z为转换前的标准分数,为转换后的标准分数,a、b为常数。如在一项能力测验中,某被试得分为92分,而其所在团体的平均分为110分、标准差为10分,该学生能力测验的标准分数Z1.8,这样让非专业人士看来很难理解,故此,将这一标准分数乘以10变为18,再加上100,该标准分数就转换为82。,IQ=15Z+100,第五章、离中趋势统计:方差与标准差标准差的应用(处理异常数据),研究中用标准差来处理异常数据多数研究采取3个标准差来处理异常数据,也就是说,高于或者低于平均数3个标准差的数据被视为异常数据。,第五章、离中趋势统计:全距,全距(Range)全距是最粗略和最简单的离中趋势指标。对于离散数据,它是一组数据中最大值与最小值之差,所以又叫两极差;对于连续数据,它是最大值上限与最小值下限之差。,第五章、离中趋势统计:平均差,平均差(AverageDeviation)平均差是指一组数据中所有数据与平均数的距离(即离均差的绝对值)的平均数,一般用AD表示。其计算公式为:AD=,第四章、离中趋势统计:四分差四分差定义,四分差(Quartile)也叫四分位距,指第三个四分位数与第一个四分位数之差的一半。公示及图示如下:,第四章、离中趋势统计:四分差四分差的计算方法,未分组数据计算四分差的方法:一组数据:12,8,11,9,13,15,10,14,24,16,20,19,18,21,7,5。求该组数据的四分差。,5,7,8,9,10,11,12,13,14,15,16,18,19,20,21,24;Q1=9.5Q2=13.5Q3=18.5,第四章、离中趋势统计:四分差四分差的计算方法,已分组数据计算四分差的方法:,第四章、离中趋势统计:四分差四分差的意义,1)反映一组数据中间部分的密集程度;2)Q3Q2与Q2Q1的关系可以说明分布是否对称:Q3Q2=Q2Q1对称,Q3Q2Q2Q1正偏斜,Q3Q2Q2Q1负偏斜,第五章、相关分析:相关含义引言,高尔顿和皮尔逊在进行遗传学研究中,系统地考察了许多家庭中父亲与长子的身高关系,研究中的两个变量是父亲的身高和长子的身高。在对样本进行测量的过程中,得到了一组成对的数据。在对这些数据进行分析和描述时,他们发现这对变量的值一起起伏波动,这表明两变量之间存在较强的联系,提出概念。,第五章、相关分析:相关含义因果关系与相关关系,两个变量之间关系有2种:因果关系两个变量之间有时程先后性和唯一性特征。相关关系又称共变关系,指两个变量在数量上存在一定联系。,第五章、相关分析:相关含义相关例子,正相关1、身高与体重2、大学成绩与高考成绩3、正方形边长与周长负相关1、锻炼时间与发病率2、走完一个固定距离所要的时间与速度无相关1、身高与数学成绩,第五章、相关分析:相关含义散点图表示相关关系,第五章、相关分析:相关含义散点图表示相关关系,第五章、相关分析:相关含义相关系数,相关系数:描述两个变量之间相关关系的统计指标。常用相关系数有积差相关系数和等级相关系数,第五章、相关分析:积差相关系数统计积差相关系数的发现,ABABCACDADEAEFAF1316991175655131139811311798119545749749139174974952515151365945115577991313325293249197165完全正相关完全负相关,第五章、相关分析:积差相关系数统计积差相关系数的计算方法,基本公式:式中N为成对数据的个数,SX为X变量的标准差,SY为Y变量的标准差。,第五章、相关分析:积差相关系数统计积差相关系数的计算方法,原始分数计算公式:积差相关分析例题,第五章、相关分析:积差相关系数统计积差相关分析的数据条件,1、两个变量的值均为测量数据,并两个变量的总体均为正态分布或接近正态分布。2、两个变量之间为线性关系。若两个变量是非线性的,就不能计算线性相关。3、必须是成对数据。4、样本容量不易太小,一般来说数据不宜少于50对。,第五章、相关分析:等级相关分析等级相关分析的数据条件,斯皮尔曼等级相关在下列两种情况下适用:1、只有两个变量,并且两个变量具有等级变量的性质,具有线性关系资料,主要用于解决称名数据和顺序数据的相关问题;2、如果是等距或等比的测量数据,且其两个总体不是正态分布,也不要求样本容量大于30,可把数据用等级次序表示,则可用斯皮尔曼等级相关来计算两边的相关系数。,第五章、相关分析:等级相关分析斯皮尔曼等级相关的计算方法,计算斯皮尔曼等级相关的基本公式为:利用等级序数法计算等级相关:例题,第五章、相关分析:相关系数解释,积差相关系数和等级相关系数的取值范围是1到1之间,即11,常用小数的形式表示,一般要取小数点后两位数字。相关系数的正、负号表示相关的方向,正值表示正相关,负值表示负相关,其绝对值表示相关的程度。,第五章、相关分析:相关系数的合并为什么要合并相关系数,在心理学研究中,常常遇到将取自同一总体的几个样本的相关系数合成,求平均的相关系数。也就是说,已经根据总体中的几个不同的样本,分别计算出了两个变量间的多个相关系数,需要求总体样本或较大样本的相关系数。,第五章、相关分析:相关系数的合并合并相关系数方法,相关系数不是等距数据,所以不能采用简单的合成的方法,而需将其转换成等距尺度后再求平均数才有意义。可用统计学家费舍(Fisher)Zr转换法,其转换公式如下:或者而Zr的分布无论总体的大小及其样本容量n的大小,都近似正态分布,Zr是等距的。有了各样本Zr值,可用如下公式求平均值,再转换成合并的相关系数。,第五章、相关分析:相关系数的合并合并相关系数例题,;,再查Fisherr-Zr转换表(见附表)得:,=0.553。,第五章、相关分析:相关研究需要注意的问题相关关系与因果关系问题,相关关系只是简单的描述两个变量之间的关联关系,但是没有解释为什么这两个变量会有关联关系。也就是说,相关关系不能被解释为两个变量间有因果关系。这一点值得注意,因为在研究中经常会犯把相关关系解释为因果关系的错误。如,观看暴力性质的电视和攻击行为存在着正相关,但是我们不能简单地认为观看暴力电视是导致攻击行为的原因。,第五章、相关分析:相关研究需要注意的问题相关关系与因果关系问题,第五章、相关分析:相关研究需要注意的问题假造相关问题,假造相关:因为数据性质或者收集数据方法而造成的虚假的过高或过低的相关现象。产生假造相关的原因:1、变量间线性关系缺乏;2、缩短(或者限制)取值范围;3、样本量过小;4、出现奇异数;5、不同性质总体共存;6、取极端分值。,第五章、相关分析:相关研究需要注意的问题相关系数的解释问题,符号的解释:正相关与负相关大小的解释:Cohen的解释相关程度负正小-0.29-0.10+0.10+0.29中-0.49-0.30+0.30+0.49大-1.00-0.50+0.50+1.00,第五章、相关分析:其它相关分析肯德尔和谐系数,肯德尔和谐系数的适用范围:计算肯德尔和谐系数的原始数据一般是采用等级评定的方法获得的。(1)K个评价者对N个事物进行等级评价,这样就得到K列从1到N的等级资料。(2)一个评价者先后K次评价N个事物,同
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO/IEC GUIDE 98-3-SP1:2008 EN Supplement 1 - Uncertainty of measurement - Part 3: Guide to the expression of uncertainty in measurement (GUM:1995) - Propagation of distribu
- 白桦林主题思想深度解读:初三语文课文教案
- 语文教育与文化传播考试卷
- 地产广告物料加工承揽合同
- 应急照明考试试题及答案
- 银行协同考试试题及答案
- 银川三模考试试题及答案
- 六一公司安排活动方案
- 六一创意小区活动方案
- 六一宴会活动方案
- 微信公众号开发服务协议
- 2025年江苏省南通市中考生物试卷(含答案解析)
- 篮球大单元教学计划
- 河南省信阳市历史中考试题与参考答案(2025年)
- 光伏项目居间服务合同协议书
- DL∕T 5390-2014 发电厂和变电站照明设计技术规定
- 2023年上海浦东新区公办学校储备教师教辅招聘考试真题
- 《压铸件常见缺陷》课件
- 系统整合选择题附有答案
- 2024年贵州省中考理科综合试卷(含答案)
- TSG-T7001-2023电梯监督检验和定期检验规则宣贯解读
评论
0/150
提交评论