第三讲描述统计之常用统计参数_第1页
第三讲描述统计之常用统计参数_第2页
第三讲描述统计之常用统计参数_第3页
第三讲描述统计之常用统计参数_第4页
第三讲描述统计之常用统计参数_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

[问题]反映变量次数分布特征主要有哪些呢?现在是1页\一共有93页\编辑于星期五现在是2页\一共有93页\编辑于星期五1、集中趋势指的是数据分布中大量数据向某方向集中的程度。用以刻划集中程度的统计量,即集中量数。(平均数等)现在是3页\一共有93页\编辑于星期五2、离中趋势(离散性)刻划变量出现(一组数据)的分散程度,即数据分布的离散程度。现在是4页\一共有93页\编辑于星期五第一部分:集中趋势一、算术平均数简称平均数、均数或均值,为与其它几种平均数相区别,也称算术平均数。■符号表示:M、、、

观察数据的平均数总体均值现在是5页\一共有93页\编辑于星期五2、公式其中:是算术平均数;N是总体容量;是变量X的第i次观察值;

①未分组观察数据平均数现在是6页\一共有93页\编辑于星期五[例]某项研究在一年级学生总体中抽取出10名被试,测得他们的分数为60、70、65、78、98、64、89、75、69、75,试求他们的平均分数。现在是7页\一共有93页\编辑于星期五②观察数据整理成次数分布表后平均的计算■注

◆公式隐含了观察数据在各分组区间均匀散布的假设;

◆、f分别是各分组区间的组中值与相应次数现在是8页\一共有93页\编辑于星期五分组区间

组中值划记次数相对次数(频率)累加次数累积相对次数[96.5,99.5)97||

2.021001.00[93.5,96.5)94|||3.0398.98[90.5,93.5)91||||4.0495.95[87.5,90.5)

88||||||||8.0891.91[84.5,87.5)85|||||||||||11.1183.83[81.5,84.5)82|||||||||||||||||17.1772.72[78.5,81.5)79|||||||||||||||||||19.1955.55[75.5,78.5)76||||||||||||||14.1436.3688名高考考生数学成绩统计结果中数动差现在是9页\一共有93页\编辑于星期五3、算术平均数的性质一组数据中每一个数与平均数之差(称为离均差)的总和等于0,即:①性质1现在是10页\一共有93页\编辑于星期五给一组数据中的每一个数加上一个常数C则所得到的新数组的平均数为原来数组的平均数加上常数C,即:②性质2现在是11页\一共有93页\编辑于星期五给一组数据中的每一个数乘上一个常数C,则所得到的新数组的平均数为原来数组的平均数(设为)乘以常数C,即:③性质3现在是12页\一共有93页\编辑于星期五4、平均数的意义应用最广泛的一种集中量数。是总体均值(或“真值”)的最佳估计。依概率1现在是13页\一共有93页\编辑于星期五■通俗的理解

设共有n个观察数据,第i个为,设真值或总体均值为,则有:观察值与真值的差为:现在是14页\一共有93页\编辑于星期五◆算术平均数易受极端数据的影响;◆无法对模糊数据进行处理;5、评价①优点

具有反应灵敏、确定严密、简明易解、计算简单、适合进一步演算和较小受抽样变化的影响等优点。②缺点现在是15页\一共有93页\编辑于星期五6、应用平均数的原则⑴同质性原则⑵平均数与个体数据结合的原则⑶平均数与方差相结合的原则现在是16页\一共有93页\编辑于星期五二、中数1、定义又称中位数,符号Mdn,是指位于一组数据中较大一半与较小一半中间位置的那个数。中数所处的位置以表示。

■注:这个数可能是数据中的某一个,也可能根本不是原有的数据。现在是17页\一共有93页\编辑于星期五是将数据依大小次序排列:◆若数据个数为奇数,则取数列中间的那个数为中数;◆若数据个数为偶数,则取中间两个数的平均数为中数。2、计算方法及分类⑴未分组数据求中数的方法(无重复数据)现在是18页\一共有93页\编辑于星期五①求数据3、6、7、9、20的中数;②求数据3、6、7、9、20、60的中数;■例

现在是19页\一共有93页\编辑于星期五⑵未分组数据求中数的方法(有重复数据)■例子

求数据11、11、11、11、13、13、13、17、17的中数;(数据个数为奇数)1312.513.544现在是20页\一共有93页\编辑于星期五■例子

求数据11、11、11、11、13、13、13、17、17、18的中数;(数据个数为奇数)1312.513.545现在是21页\一共有93页\编辑于星期五⑶分组数据求中数的方法①分组数据的中数当观察数据整理成次数分布表以后,中数的求取也是取序列中将N(观察数据总数)平分为两半的那点作为中数。现在是22页\一共有93页\编辑于星期五②中数的计算公式

i、公式1

◆为中数所在组的精确下限;◆为中数所在组以下各组的累积次数;◆为中数所在组数据的个数;◆i为组距;现在是23页\一共有93页\编辑于星期五ii、公式2

◆为中数所在组的精确上限;◆为中数所在组以上各组的累积次数;◆为中数所在组数据的个数;现在是24页\一共有93页\编辑于星期五■累加曲线求中数示意图现在是25页\一共有93页\编辑于星期五■例子-求下列数据的中数分组区间次数96~99

293~96390~93487~90884~871181~841778~811975~7814现在是26页\一共有93页\编辑于星期五3、中数的特点①计算简单,不受极端数据影响;②没有反映所有数据的信息,从而具有较大的抽样误差,不如平均数稳定.也无法进行进一步的数学分析。现在是27页\一共有93页\编辑于星期五4、应用◆出现两极端数据时;◆当次数分布的两端数据或个别数据不清楚时;◆快速估记时;现在是28页\一共有93页\编辑于星期五三、众数1、定义又称密集数、通常数,符号Mo,它指在一组数中出现次数最多的那个数。2、计算方法直接找出现次数最多的那个数。现在是29页\一共有93页\编辑于星期五■例子3、6、7、7、7、9、20、60现在是30页\一共有93页\编辑于星期五4、应用范围◆一组数据出现不同质的情况◆一组数据中出现极端数据,也用众数作为集中量数的粗略估计。3、皮尔逊经验公式(数据偏态分布)现在是31页\一共有93页\编辑于星期五

ThedataaboutannualsalariesofManagementandExployeesofXYZcompanyarepresentedbelow,canyoucalculatethevaluesofthemode,themedianandthemean(threedifferentmeasuresofcentraltendency)$72,000.0054,000.0026,400.0019,200.0019,200.0019,200.0019,200.0018,000.0016,800.0016,800.0016,800.0014,400.0014,400.0014,400.0014,400.00[Exercise]现在是32页\一共有93页\编辑于星期五◆估计数据次数分布是否呈偏态;估计指标M-Mo>0,正偏态M-Mo<0,负偏态现在是33页\一共有93页\编辑于星期五5、平均数、中数、众数的关系⑴正态分布⑵偏态分布

待图(P68)现在是34页\一共有93页\编辑于星期五四、几何平均数1、几何平均数计算⑴统计学表示法:或Mg⑵计算公式设有一组观察数据,则公式为:现在是35页\一共有93页\编辑于星期五2、适用场合①一组数据中任何两个相邻数据之比接近于常数;

■比较适合求平均增长率②当一组数据中存在极端数据,分布呈偏态时;现在是36页\一共有93页\编辑于星期五欲研究介于与两感觉之间的感觉的物理刺激是多少,随机抽取10个被试,让其调节一个可变的物理量的刺激量,使所产生的感觉恰好介于与之间,然后测量所调节的物理量,结果如下:5.7、6.2、6.7、6.9、7.5、8.0、7.6、10.0、15.6、18.0。求介于与之间的感觉平均物理刺激量是多少?■例(心理物理学)现在是37页\一共有93页\编辑于星期五■例2(平均增长率)在一项有关阅读能力的实验中,阅读的遍数与每遍理解的程度依次是:第一遍:40%第二遍:52%,第三遍:65%,第四遍:75%第五遍:86%,第六遍:97%。问在该实验中被试阅读程度的平均进步率是多少?阅读理解程度的平均增加比率又是多少?现在是38页\一共有93页\编辑于星期五五、加权平均数(Mw)1、计算公式■即权数,刻划各变量在构成总体

的相对重要性现在是39页\一共有93页\编辑于星期五2、为什么要加权?在实际测量数据中,有些数据的权重不一样,此时刻划数据分布的中心位置只能用加权平均数。(生活例子)现在是40页\一共有93页\编辑于星期五■例子某课题组在全国8个省区进行了一项调查,各省区接受调查的人数和平均数如下表,求该项调查的总平均数。现在是41页\一共有93页\编辑于星期五省区代码12345678人数627268400670411314610500平均分数9860829680659688现在是42页\一共有93页\编辑于星期五六、调和平均数MH1、计算公式■N为数据个数是第i个观察数据,或第i个变量值;现在是43页\一共有93页\编辑于星期五2、调和平均数适用范围调和平均数在描述速度方面的集中趋势时,优于其他平均数。◆工作量固定,记录被试完成相同工作量所需时间◆时间量固定,记录被试完成的工作量现在是44页\一共有93页\编辑于星期五■例1[工作量固定]有一学生15分钟学会生词30个,后10分钟学会生词也是30个,问该生平均学习速度是多少?现在是45页\一共有93页\编辑于星期五■例2[时间固定]在一个学习实验中,统计了6名被试在2个小时内完成的解题量,依次为24题、20题、16题、12题、8题、4题,试问这6名被试每小时的平均解题量是多少?现在是46页\一共有93页\编辑于星期五■例子三个不同被试对某词的联想速度如下表,求三个被试的平均联想速度。被试ABC联想词数131313时间(分)2325现在是47页\一共有93页\编辑于星期五第二部分:差异量数■引例现在是48页\一共有93页\编辑于星期五1、动差是借用力学上测量力的旋转趋势的术语而来的一个统计学概念,表示数据离散情况。它将分组数据各组的次数f看成力,且以数值(或组中值)与原点之差作为距离来计算动差。■注:若以平均数作为原点,这种动差称为中心动差。一、动差体系现在是49页\一共有93页\编辑于星期五⑴一级动差2、常见的中心动差(centrelmoment)⑵二级动差

现在是50页\一共有93页\编辑于星期五⑶三级动差⑷四级动差现在是51页\一共有93页\编辑于星期五■注◆三级动差是表示数据分布偏态性的指标;☆表示偏态系数;☆表示数据分布呈正偏态,☆表示数据分布呈负偏态;☆表示数据分布呈对称形;现在是52页\一共有93页\编辑于星期五◆四级动差是表示数据分布峰态性的指标;☆表示峰态系数;☆表示数据次数分布呈高狭峰;☆表示数据分布呈低阔峰;☆表示数据分布呈正态峰;现在是53页\一共有93页\编辑于星期五二、常用刻划数据离散程度的指标㈠平均差(averagedeviation)

1、平均差公式(以符号AD表示)设一组原始数据为,则计算平均差的公式:■是离均差;现在是54页\一共有93页\编辑于星期五有5个被试的错觉实验数据如下,求其平均差?被试12345错觉量(单位:毫秒)1618202217■例现在是55页\一共有93页\编辑于星期五①它是一个能较好地刻划数据分布离散程度的差异量数;②不足之处是它利用了绝对值以致不便于作进一步代数演算,故其实际应用上被方差或标准差取代;2、评价现在是56页\一共有93页\编辑于星期五方差也称变异数,均方,是每个数据与该组数据平均数之差的平方的均值,即离均差平方的平均数。标准差是方差的平方根■样本方差常用表示;样本标准差总体方差常用表示;总体标准差㈡方差与标准差(最常用)1、方差(二级动差)、标准差现在是57页\一共有93页\编辑于星期五设是一个容量为N的总体的第次测定,那么有:⑴总体方差、标准差公式现在是58页\一共有93页\编辑于星期五设从一个总体X中抽取一个容量为n的样本,是样本第次测定值,则样本方差为:注意:是n-1⑵样本方差、标准差现在是59页\一共有93页\编辑于星期五■例子计算一组数据5、6、7、9、8、7的方差与标准差。现在是60页\一共有93页\编辑于星期五⑶分组数据方差与标准差的计算■是各分组区间的组中值;

(AM是估计平均值)现在是61页\一共有93页\编辑于星期五■例子分组区间96~93~90~87~84~81~78~75~72~69~66~63~60~979491888582797673706764612348111719141073116543210-1-2-3-4-5-61215162422170-14-20-21-12-5-67275647244170144063482536现在是62页\一共有93页\编辑于星期五2、方差(或标准差)的合成公式心理学研究有时需要将几组数据的方差合成一个总的方差。(例)⑴总标准差(或)合成公式(符号解释)现在是63页\一共有93页\编辑于星期五■例子在某测定被试反应时的实验中,主试先后对4组被试进行测试,测验的数据如下:(单位:毫秒)组别n(人数)均值S2018.52.13621.62.691117.23.11219.23.0现在是64页\一共有93页\编辑于星期五3、方差与标准差的性质①性质1设有一组观察值,对其每一个观察值加上一个常数C后,得到一组新的一组数据,其中,则这组新的数据的方差与标准差等于原标准差;现在是65页\一共有93页\编辑于星期五②性质2(练习题)一组数据乘以一个常数C,得到新数组,其中设原数据组的标准差是,新数据组的标准差,则有:现在是66页\一共有93页\编辑于星期五③性质3(练习题)设一组观察数据中每一个观察值都乘以同一个常数C(C≠0),再加上一具常数D,得到新数据,其中,则有新数据的标准差等于原先数据的标准差乘以|C|,即:现在是67页\一共有93页\编辑于星期五4、方差与标准差的特点①反应灵敏、计算精确②受抽样变动的影响较少;③计算公式严密确定,容易计算;④适合做代数运算,因方差具有可加性,即总的变异可以分成各种原因造成变异之和;现在是68页\一共有93页\编辑于星期五方差与标准差是表示一组数据离散程度的最好指标;■评价现在是69页\一共有93页\编辑于星期五5、方差与标准差的应用⑴差异系数(Coefficientofvariation又称相对标准差)①功能

刻划几组性质(单位)不同数据和

同性质但样本平均水平(均值)相差

悬殊数据的相对离散程度。[例]宇宙天体与微观世界之间的距离现在是70页\一共有93页\编辑于星期五②差异系数计算公式■s为某样本的标准差;

为该样本的平均数;现在是71页\一共有93页\编辑于星期五某校高考考生语文科平均分63分,标准差为11分,数学科平均分为75分,标准差为12分,试比较该校考生哪一科离散程度大些?■例子现在是72页\一共有93页\编辑于星期五⑶标准分数(Z分数)

①内涵是一个以平均数为参照点、以标准差为单位的表示原始分数在团体中所处位置的相对位置量数。现在是73页\一共有93页\编辑于星期五②计算公式◆X是某个原始数据;◆是X所在数据组的平均数;◆S是X所在数据组的标准差;现在是74页\一共有93页\编辑于星期五③标准分数的应用i、比较性质不同的观察值(数据)在各自数据分布中的相对位置的高低;[例1]现在是75页\一共有93页\编辑于星期五■例1某被试同时接受韦克斯勒智力测验与EPQ的内外向分量表的测验,韦氏智力测验智商得分112分,EPQ内外向分量表的量表分数70分,试求该被试在这二个测验上的Z分数?(已知韦氏智力测验智商平均数是100,标准差是15,EPQ内外向分测验量表分的平均数是50,标准差是10)现在是76页\一共有93页\编辑于星期五ii、计算不同性的观察数据的总和或平均值,以表示在团体中的相对位置;[例2]现在是77页\一共有93页\编辑于星期五■例2下表是高等学校入学考试中两名考生甲、乙的成绩分数,试问根据考试成绩应该录取哪个考生?考试科目原始成绩甲乙全体考生平均数标准差Z分数甲乙语文政治外语数学理化89706268725340728770106556985067581.51.91-.6-.125.375.5-1.67-.3751.5现在是78页\一共有93页\编辑于星期五iii、导出标准测验分数■常见的几种标准测验分数IQ=15Z+100T=10Z+50现在是79页\一共有93页\编辑于星期五iv、异常值的统计取舍现在是80页\一共有93页\编辑于星期五③标准分数的性质i、性质1Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。ii、性质2Z分数的平均数为0,标准差为1。现在是81页\一共有93页\编辑于星期五iii、性质3(略,后面补充)设原始数据呈正态分布,则将原始分数转化为Z分数后服从标准正态分布。现在是82页\一共有93页\编辑于星期五㈢全距与百分位差

1、全距⑴计算公式(举例)⑵评价⑴最简单、最易直观理解;⑵利用数据信息量少,最为粗糙,易受极端值的影响,不可靠;现在是83页\一共有93页\编辑于星期五2、百分位差⑴百分位数(percentile)它指的是量尺上的一个点(数),在此点以下,包括数据分布中全部数据个

数的一定百分比。第m位百分位数就是指在数值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论