社会统计学离中趋势的量度_第1页
社会统计学离中趋势的量度_第2页
社会统计学离中趋势的量度_第3页
社会统计学离中趋势的量度_第4页
社会统计学离中趋势的量度_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

社会统计学离中趋势的量度第一页,共四十七页,2022年,8月28日10名同学的成绩:78808285898790867988另10名同学的成绩556878889910098908583均值相等(84.4),但两组数据有差别吗?是否有必要去计算一下数据之间的差距呢?第二页,共四十七页,2022年,8月28日A组:60,60,60,60,60B组:58,59,60,61,62C组:40,50,60,70,80D组:80,80,80,80,80平均数不同,离势可能相同;平均数相同,离势可能不同。第三页,共四十七页,2022年,8月28日第一节全距与四分位差1.全距(range)全距(R):最大值和最小值之差。也叫极差。全距越大,表示变动越大。对分组资料,不能确知最大值和最小值:

1、组值最大组的组中值减去最小组的组中值

2、组值最大组的上限减去最小组的下限

3、组值最大组的组中值减去最小组的下限;最大组的上限减去最小组的组中值第四页,共四十七页,2022年,8月28日第五页,共四十七页,2022年,8月28日求下列两组成绩的全距:A:78808285898790867988B:556878889910098908583优点:计算简单、直观。缺点:受极端值影响大;没有量度中间各个单位间的差异性,数据利用率低,信息丧失严重;受抽样变动影响大,大样本全距比小样本全距大。第六页,共四十七页,2022年,8月28日2.四分位差(Quartiledeviation)Q·D:第三四分位数和第一四分位数的半距。避免全距受极端值影响大的缺点。

Q·D=

第七页,共四十七页,2022年,8月28日求下列两组成绩的四分位差:A:788082858987908679888481B:5568788899100989085838481A:78,79,80,81,82,84,85,86,87,88,89,90B:55,68,78,81,83,84,85,88,90,98,99,100第八页,共四十七页,2022年,8月28日第二节平均差(Meanabsolutedeviation)离差——各变量值与算术平均数的差平均差——离差绝对值的算术平均数。(meandeviation)1.未分组资料

A·D=

2.分组资料A·D=3.平均差的性质:仍属算术平均数;在受抽样变动、极端值影响,理论意义不易阐述有时以中位数为基准来计算平均差更合理。第九页,共四十七页,2022年,8月28日[例5.2.1]试分别以算术平均数为基准,求85,69,69,74,87,91,74这些数字的平均差。[例5.2.2]试以算术平均数为基准,求下表所示数据的平均差。

第十页,共四十七页,2022年,8月28日人口数(X)户数(f)频率(P)23456785816106410.100.160.320.200.120.080.02合计501.00第十一页,共四十七页,2022年,8月28日第三节标准差S(standarddeviation)意义:克服平均差带有绝对值的缺点,又保留其优点。定义:各变量值对其算术平均数的离差平方的算术平均数的平方根。(均方差)Describeshowscoresofaninterval/ratiovariablearespreadacrossthedistributiontothemeanscore.1.未分组资料

S=

=第十二页,共四十七页,2022年,8月28日S==第十三页,共四十七页,2022年,8月28日方差方差(variance,2,

S2):各数据与平均数差数的平方和的平均值称为方差,也称为变异数。因此,方差的定义公式为:

2=(X-)2/n-1

S2=(X-)2/n-1第十四页,共四十七页,2022年,8月28日例1:求72、81、86、69、57这些数字的标准差和方差。简算式:

S=第十五页,共四十七页,2022年,8月28日2.分组资料S=S===第十六页,共四十七页,2022年,8月28日求下表数据资料的标准差第十七页,共四十七页,2022年,8月28日是反映总体各单位标志值的离散状况和差异程度的最佳测度。(1)以算术平均数为基准计算的标准差比以其他任何数值为基准计算的标准差要小。“最小二乘方”性质——各变量值对算术平均数的离差的平方和,必定小于他们对任何其他数偏差的平方和。(2)它将总体中各单位标志值的差异全包括在内,受抽样变动影响小。但在受极端值影响以及处理不确定组距方面,缺点同算术平均数。方差:标准差的平方。3.标准差的性质第十八页,共四十七页,2022年,8月28日问:已知一组数列的平均数和标准差,此时若将该组数列的每一个变量值均增加10形成一组新数列,请问新数列的平均数和标准差怎样变化。注意:样本标准差(SampleStandardDeviation):n-1样本方差第十九页,共四十七页,2022年,8月28日假如两个学生都通过不同的大学入学考试,共同向一个学校申请奖学金。设Mary参加的是ACT(theAcademicCollegeTestingService)andscored26ACTpoints,[0~36]John参加的是SAT(theStanfordAdmissionsTest)andscored900SATpoints.[200~1600]另有其他数据,ACT:Mean=22,S=2SAT:Mean=1000,S=100请问若只能一人获奖,应该给谁?第二十页,共四十七页,2022年,8月28日4.标准分(standardizedscore)定义:以离差和标准差的比值来测定变量X与的相对位置。使原来不能直接比较的离差标准化,可以相互比较,加、减、平均

Z=z分数的特性:1、z是和X一一对应的变量值。2、Z分数没有单位,是一个不受原资料单位影响的相对数,所以可以用于不同单位资料的比较。3、Z分数实际表达了变量值距总体均值有几个标准差。

Z=2,Z=3.2,标准正态变量第二十一页,共四十七页,2022年,8月28日Z分数的性质:1、Z分数之和等于02、Z分数的算术平均数等于03、Z分数的标准差等于1,方差也等于1实际意义:以均值为基础,以标准差为量度单位,各总体之间可以通过标准分进行合理的比较和相加。第二十二页,共四十七页,2022年,8月28日Z分数的应用(1)可用于比较分数性质不同的观测值在各自数据分布中的相对位置高低。(2)当已知各不同质的观测值的次数分布为正态分布时,可用Z分数求不同观测值的总和或均值,以表示在团体中的相对位置。第二十三页,共四十七页,2022年,8月28日例1:甲班的平均分为80分,乙班的平均分为60分,标准差都为10分,A、B分别属于甲、乙两班。A的成绩为80分,B的成绩为75分,试比较两学生成绩的好坏。例2:甲乙两班的平均分均为60分,甲班的标准差为10,乙班的标准差为20分,A、B分别属于甲、乙两班,成绩均为80分,试比较两学生成绩的好坏。一个20岁的大学生智力测验中作对了35个题目,一个6岁的儿童作对了9个题目,谁更聪明?第二十四页,共四十七页,2022年,8月28日作业1.计算下列数据的全距、平均差、方差和标准差

788082858987908679885568788899100989085832.第二十五页,共四十七页,2022年,8月28日2.求下表频次分布的标准差第二十六页,共四十七页,2022年,8月28日3.下列数据是从16~20岁的抽烟者中抽出的样本。X为每天抽烟支数,mean=15支,S=5支。请完成下表。CaseXZ(standardizedscore)张三17李四30王五4马六20第二十七页,共四十七页,2022年,8月28日第四节相对离势

用离势的绝对离势除以其平均指标就得到离势的相对指标,称为相对离势。当所对比的两个数列的水平高低不同时,就不能采用全距、平均差或标准差进行对比分析,因为它们都是绝对指标,其数值的大小不仅受各单位标志值差异程度的影响,而且受到总体单位标志值本身水平高低的影响;为了对比分析不同水平的变量数列之间标志值的变异程度,就必须消除数列水平高低的影响。第二十八页,共四十七页,2022年,8月28日1、异众比率:非众数的频数与总体单位数的比值。V·R表示意义:能表明众数所不能代表的那一部分变量值在总体中的比重。2、变异系数:绝对离势统计量与其算术平均数的比率,用V表示。(1)全距系数:数列中全距与算术平均数之比。(2)平均差系数:数列中各变量的平均差与其算术平均数之比。(3)标准差系数:数列中各变量的标准差与其算术平均数之比。变异系数的意义:对不同性质、不同水平总体的离散程度进行比较。第二十九页,共四十七页,2022年,8月28日例1:某项调查发现,现今三口之家的家庭最多(32%),求异重比率。某开发商根据这一报导,将房屋的户型大部分都设计为适合三口之家居住的样式和面积,你认为如何呢?例2:设为测体重,得到成人组和婴儿组各100人的两个抽样总体。成人组平均体重为65千克,全距为10千克;婴儿组平均体重为4千克,全距为2.5千克。能否认为成人组体重的离势比婴儿组体重的离势大?例3:对一个群体测量身高和体重,平均身高为170.2厘米,身高标准差为5.30厘米;平均体重为70千克,体重标准差为4.77千克;比较身高和体重的离散程度。第三十页,共四十七页,2022年,8月28日3.偏态系数偏态=算术平均数-众数偏斜系数=偏态/标准差α=0,对称分布;α>0为右偏;α<0为左偏[-3,+3]第三十一页,共四十七页,2022年,8月28日练习:甲乙两单位职工工资资料如下:

试比较哪个单位的职工工资差异程度小

月工资甲单位(人)乙单位(人)600以下21600~70042700~800104800~900712900~1000661000~110045合计3330第三十二页,共四十七页,2022年,8月28日SPSS基本统计在中可以很容易地得出频数分布表,平均数,标准差等。第三十三页,共四十七页,2022年,8月28日界面菜单菜单栏:file(SPSS文件的操作)Edit(编辑菜单)View(用户界面设置菜单)Data(数据文件建立和编辑菜单)Transform(数据基本处理菜单)Analyze(统计分析菜单,主要统计功能)Graphs(统计图形菜单)Utilities(相关应用和设置菜单)Windows(各窗口切换菜单)Help(帮助菜单)第三十四页,共四十七页,2022年,8月28日一、频数分布频数分布:可以概略地看到资料的分布情况,可做初步整理之用,从中还可检查数据输入情况。Analyze——DescriptiveStatistics——Frequencies可选入多个变量。第三十五页,共四十七页,2022年,8月28日第三十六页,共四十七页,2022年,8月28日第三十七页,共四十七页,2022年,8月28日二、描述统计分析过程对于定距以上变量,可以进行集中趋势和离中趋势的统计Analyze——DescriptiveStatistics——Descriptives变量可多选其中选项有:MeanStd.deviationMinimum第三十八页,共四十七页,2022年,8月28日第三十九页,共四十七页,2022年,8月28日Statistics:Dispersion(离差栏):Std.Deviation标准差Variance方差Range全距MinimumMaximum均数的标准误CentralTendency(集中趋势栏)MeanMedianModeSum例:09-01第四十页,共四十七页,2022年,8月28日Distribution(分布参数)Skewness偏度(0,1.5,0.5,-0.5)标准正态分布,值为0;正数,右偏;负数,左偏;值绝对值大于1,则可肯定数据的分布不成正态分布

Kurtosis峰度(0,正,负):尖平程度标准正态分布,值为0;大于0,分布比标准正态分布峰高(尖);小于0,第四十一页,共四十七页,2022年,8月28日第四十二页,共四十七页

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论