第二章 次数分布_第1页
第二章 次数分布_第2页
第二章 次数分布_第3页
第二章 次数分布_第4页
第二章 次数分布_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章第二章 次数分布次数分布I.综述综述II.次数分布表次数分布表III.次数分布图次数分布图IV.茎和叶图茎和叶图V.次数分布的形状次数分布的形状VI.百分位数,百分位等级,插值法百分位数,百分位等级,插值法描述统计的目标:使得一组数据易于理解图和表一个例子一位研究者调查了151位大学生,问他们在过去一年中的应激程度,用的是0到10点量表。151个大学生的数据如下:4,7,7,7,8,8,7,8,9,4,7,3,6,9,10,5,7,10,6,8,7,8,7,8,7,4,5,10,10,0,9,8,3,7,9,7,9,5,8,5,0,4,6,6,7,5,3,2,8,5,10,9,10,6,

2、4,8,8,8,4,8,7,3,8,8,8,8,7,9,7,5,6,3,4,8,7,5,7,3,3,6,5,7,5,7,8,8,7,10,5,4,3,7,6,3,9,7,8,5,7,9,9,3,1,8,6,6,4,8,5,10,4,8,10,5,5,4,9,4,7,7,7,6,6,4,4,4,9,7,10,4,7,5,10,7,9,2,7,5,9,10,3,7,2,5,9,8,10,10,6,8,3用次数分布表整理次数分布表整理在应激量表每一点上的学生数目应激分数 学生数目 百分比 10 14 9.3 9 15 9.9 8 26 17.2 7 31 20.5 6 13 8.6 5 18 11.

3、9 4 16 10.6 3 12 7.9 2 3 2.0 1 1 0.7 0 2 1.3部门有效性South ChinaCentral ChinaNorth ChinaTW: Other DepartmentTW: EditorialTW: Sales and MarketTW: TechnicalPhilippinesHK: Business DevelopHK: SalesHK: Finance Hong KonHK: Customer ServiceHK: RA DevelopmentHK: HK Bureau; RTVDepartmental Effectiveness2.001.90

4、1.801.701.601.501.401.301.201.101.00.90.80.70.60.50.401.341.291.511.071.231.551.281.801.031.141.171.091.081.17公司有效性South ChinaCentral ChinaNorth ChinaTW: Other DepartmentTW: EditorialTW: Sales and MarketTW: TechnicalPhilippinesHK: Business DevelopHK: SalesHK: Finance Hong KonHK: Customer ServiceHK:

5、RA DevelopmentHK: HK Bureau; RTV Company Effectiveness2.001.901.801.701.601.501.401.301.201.101.00.90.80.70.60.50.401.391.241.401.211.271.271.051.531.131.201.171.271.161.14整体满意度 South ChinaCentral ChinaNorth ChinaTW: Other DepartmentTW: EditorialTW: Sales and MarketTW: TechnicalPhilippinesHK: Busine

6、ss DevelopHK: SalesHK: Finance Hong KonHK: Customer ServiceHK: RA DevelopmentHK: HK Bureau; RTVOverall Satisfaction2.001.901.801.701.601.501.401.301.201.101.00.90.80.70.60.50.401.641.221.531.251.321.391.101.501.101.281.261.251.041.29对员工绩效的回馈对员工绩效的回馈Region DRegion CRegion BRegion Aindex2.001.801.601.

7、401.201.00.80.60.401.081.301.67.93不满意百分率最高的项目不满意百分率最高的项目A2 Policies applied fairly41%F1 Training to do job effectively37% D2 Receive all information34%F2 Encouraged to improve skills31%F3 Feedback on performance30%不满意百分率最低的项目不满意百分率最低的项目A1 Contribution to Companys success 2%G1 Good company to work fo

8、r 7%X1 Familiar with objectives and values 9%X2 Local consistent with company 11%X3 Practices values 13%B1 Deliver to customers 13%B2 Commitment to customer satisfaction 13%B3 Meeting customers needs 14%本章学习目标本章学习目标1.学会作次数分布,累计次数分布,和分组学会作次数分布,累计次数分布,和分组次数分布表次数分布表2.学会用茎和叶图,直方图,棒图学会用茎和叶图,直方图,棒图,线图表达线图

9、表达次数分布次数分布3.了解正偏态分布和负偏态分布了解正偏态分布和负偏态分布4.掌握百分位数和插值法掌握百分位数和插值法次数分布次数分布 最简单的描述统计最简单的描述统计描述统计的目的:简化和整理数据的表达。描述统计的目的:简化和整理数据的表达。次数分布(次数分布(FrequencyDistribution):是):是指一批数据在某一量度的每一个类目所出指一批数据在某一量度的每一个类目所出现的次数情况现的次数情况组织此类数据的第一种方法是:建立次数组织此类数据的第一种方法是:建立次数分布表分布表次数分布表和次数分布图就是表达一组数次数分布表和次数分布图就是表达一组数据是如何在某一度量上分布的据

10、是如何在某一度量上分布的例例1: 某个班的某个班的26个学生在一次测验中的分数如下个学生在一次测验中的分数如下(10分为满分):分为满分): 9,2,3,8,10,9,9,2,1,2,9,8,2,5,2,9,9,3,2,5,7,2,10,1,2,9将这些分数作成一个次数分布表将这些分数作成一个次数分布表 X f10 2 9 7 8 2 7 1 6 0 5 2 4 0 3 2 2 8 1 2简单次数分布表简单次数分布表 次数分布表是将位于量数的每一个类目的个体的次数分布表是将位于量数的每一个类目的个体的个数组织成表格的形式个数组织成表格的形式1.- 变量的值变量的值?-填充填充x列列从大到小,每

11、个可能的值从大到小,每个可能的值2.- 每个值出现多少次(发生次数)每个值出现多少次(发生次数)?-填充填充f列列3.- 观察的总数?将次数行求和观察的总数?将次数行求和,将得到将得到S Sf =N4.- 变量的总值?最简单的方法就是求变量的总值?最简单的方法就是求(X)(X)和和 ( (f f) ) 的乘积列,然后将结果求和的乘积列,然后将结果求和 S S(X(Xf f ) )例例1:对于下面的次数分布表:对于下面的次数分布表:a) 此分布中共有几个分数此分布中共有几个分数 (N = ?)?)b) 对这些分数求和对这些分数求和 XN = f = 14X = xf = 33 每个分数的比率和百

12、分率Proportion=p=f/n分组次数分布表分组次数分布表 (Grouped Frequency Tables)当变量的值分布在一个较广的范围时,需要分组次数分当变量的值分布在一个较广的范围时,需要分组次数分布表简捷地描述数据布表简捷地描述数据常常以区间或类别的形式出现常常以区间或类别的形式出现,而不是某一特定值而不是某一特定值.例如例如学生成绩学生成绩,(A=90-99,B=80-89,.).编制分组次数分布表的步骤编制分组次数分布表的步骤1.把所有数据按大小顺序排列把所有数据按大小顺序排列2.求全距求全距3.定组数定组数4.定组距定组距5.写出区间上下限写出区间上下限6.统计每个区间

13、的次数统计每个区间的次数分组的分组的“惯常法则惯常法则”(rules of thumbs) 1.分组次数分布表应该有大约分组次数分布表应该有大约10(5-15)个区间,目的是使这组数据易于直观感受个区间,目的是使这组数据易于直观感受和理解和理解2.所有区间的宽度应该相等所有区间的宽度应该相等3.组距应该是个比较简单的数字,如组距应该是个比较简单的数字,如2,5,10,204.每个区间每个区间开始开始的分数应该是组距的倍数的分数应该是组距的倍数例例3:以下是:以下是22个同学的测验分数,编制个同学的测验分数,编制分组次数分布表分组次数分布表94,92,82,87,81,74,75,78,76,7

14、6,63,60,62,54,51,56,59,43,32,36,25,18 例例3:以下是:以下是22个同学的测验分数,编制分组次个同学的测验分数,编制分组次数分布表数分布表94,92,82,87,81,74,75,78,76,76,63,60,62,54,51,56,59,43,32,36,25,18 分数的分布范围是18-942为组距,分38组5为组距,分16组10为组距,分9组精确界限 (Real Limits)对于一个连续型变量,每个分数实际对应量尺上对于一个连续型变量,每个分数实际对应量尺上的一段区间。分割这些区间的界限叫做精确界限的一段区间。分割这些区间的界限叫做精确界限(real

15、 limits).分割两个邻近分数的精确界限位分割两个邻近分数的精确界限位于两个分数的中间。于两个分数的中间。每个分数有两个精确界限每个分数有两个精确界限,一个在区间的顶端,称一个在区间的顶端,称为精确上限(为精确上限(upper real limit),另一个在区间的另一个在区间的底端,称为精确下限(底端,称为精确下限(lower real limit). 注意一个区间的精确上限也是高一个区间的精确注意一个区间的精确上限也是高一个区间的精确下限下限 次数分布图次数分布图直方图直方图 (histogram) 用一些垂直条画在每个分数之上用一些垂直条画在每个分数之上垂直条的高度代表次数垂直条的高

16、度代表次数垂直条的宽度代表分数的精确区间垂直条的宽度代表分数的精确区间.临近的垂直条连接在一起临近的垂直条连接在一起只有数据是等距或等比量度(连续变量)时,只有数据是等距或等比量度(连续变量)时,才能用直方图才能用直方图直方图直方图Temperature and Aggression (Cohn & Rotton, 1997)绘制一个直方图来表达例绘制一个直方图来表达例2的分布的分布水平轴水平轴-X轴轴(abscissa)-X的值的值垂直轴垂直轴-Y轴轴(ordinate)-次数次数绘制直方图的一般规则绘制直方图的一般规则X轴与轴与Y轴轴的交叉点应该是的交叉点应该是0Y轴高度大约是轴高度大约是

17、X轴的轴的2/3到到3/4 绘制直方图的方法绘制直方图的方法 用坐标纸绘制用坐标纸绘制用用Excel,SPSS等电脑软件等电脑软件绘制绘制棒图(条形图;棒图(条形图;bar graph) 表达质性研究的数据表达质性研究的数据(qualitative data).用一些垂直条画在每个分数用一些垂直条画在每个分数(或类别或类别)之上之上垂直条的高度代表次数垂直条的高度代表次数每个垂直条之间有一段空间。每个垂直条之间有一段空间。只有数据是命名或顺序量度只有数据是命名或顺序量度(离散型变量离散型变量)时,时,才能用棒图才能用棒图Bar Graph折线图(折线图(line graph) 又称次数分布多边

18、图(又称次数分布多边图(frequencydistributionpolygon)在每一分数上面画点在每一分数上面画点点的高度代表次数点的高度代表次数一条连续折线将这些点连接在一起一条连续折线将这些点连接在一起表达数据的变化趋势表达数据的变化趋势折线图(折线图(line graph)茎和叶图茎和叶图 (stem and leaf display) 例例4:考察下列茎和叶图:考察下列茎和叶图8|2717|5866|3025|41694|33|2620|5Stemwidth=10.如何准确地用图表达数据把复杂的观点传递得清晰,准确,高效. 在最短的时间里用最少的笔墨和空间传递最多的信息. 图形的实

19、际差别与数据的差别成正比. 标注清楚,详细,完全. 测度单位要一致.误导读者的图仔细看看 y轴,我们才发现, 原来胆固醇水平不过降低了5%!次数分布的形状次数分布的形状 用用3个特征可以完整地描述一个分布:个特征可以完整地描述一个分布:形状(形状(shape)集中趋势(集中趋势(centraltendency)变异性(变异性(variability)对称分布对称分布(symmetrical distribution) 可以画一条垂直线穿过分布的中央,使得分可以画一条垂直线穿过分布的中央,使得分布的一边恰是另一边的镜象。布的一边恰是另一边的镜象。偏态分布(偏态分布(skewed distribu

20、tion) 分数堆积在分布的一端,而另一端成为比分数堆积在分布的一端,而另一端成为比较尖细的尾端(较尖细的尾端(tail) 偏态分布尾端向右的称为正偏态(偏态分布尾端向右的称为正偏态(positively skewed)(因因为其尾端指向正数为其尾端指向正数)偏态分布尾端向左的称为负偏态(偏态分布尾端向左的称为负偏态(negatively skewed).双峰分布双峰分布(bi-modal distribution )矩形分布(rectangle distribution)一个分布中所有的值都是相同频次百分位数百分位数 (percentile) 以上是描述观察的整体,而我们也可用次数分布以上是

21、描述观察的整体,而我们也可用次数分布来描述某一个别点在一个集合中的位置来描述某一个别点在一个集合中的位置原始分数本身并不提供该点在一个集合中的位置原始分数本身并不提供该点在一个集合中的位置的信息的信息一个分数的等级(一个分数的等级(rank)或百分位数等级或百分位数等级(percentile rank):某一分布中分数在某一值某一分布中分数在某一值之下或等于之下或等于该值的个体所占的百分比该值的个体所占的百分比.当一个分数当一个分数被其百分位数等级被其百分位数等级,该分数称为百分位数该分数称为百分位数(percentile).累计次数分布累计次数分布cf =累积次数(累积次数(cumulati

22、vefrequency)c%=cf/NX100%累积百分比(累积百分比(cumulativepercentage)如何确定百分位数如何确定百分位数对于连续型数据对于连续型数据,必须考虑其精确上限和精确下限必须考虑其精确上限和精确下限如何确定百分位数如何确定百分位数1) -对于分数对于分数4,其对应的累积百分比是其对应的累积百分比是95%.但但注意:分数注意:分数4意味着一个人得分在意味着一个人得分在3.5和和4.5之间之间.累积百分比表明组距的精确上限。因此,累积百分比表明组距的精确上限。因此,95的百的百分位数是与分位数是与4.5相对应相对应(而不是(而不是 4.0).2) 找出分布中找出分

23、布中4分的精确上限和精确下限的累分的精确上限和精确下限的累积次数积次数.-对于分数对于分数4.5,其对应的累积百分比是其对应的累积百分比是95- 对于分数对于分数3.5,其对应的累积百分比是其对应的累积百分比是70 对于分数对于分数4.0,其对应的累积百分比是多少呢?其对应的累积百分比是多少呢?插值法(插值法(Interpolation) 有时你所感兴趣的值并未出现在表内。此时你需要有时你所感兴趣的值并未出现在表内。此时你需要做基于经验的猜测做基于经验的猜测. .插值法的假设是插值法的假设是在所求解点的附近在所求解点的附近1 1个组距单位区个组距单位区间之内间之内的分数和对应的百分比的变化是线性的。的分数和对应的百分比的变化是线性的。 关键在于要找到距求解点最近的两个区间,对关键在于要找到距求解点最近的两个区间,对于较远的区间,则不满足分数和对应的百分比于较远的区间,则不满足分数和对应的百分比线性变化的假设。线性变化的假设。练习使用下表,求出第50个百分点解答14.5-60X - 509.5 -30 (X-9.5)/(14.5 -9.5)=(50-30)/ (60-30) X=12.83在研究中应用次数分布表和次数分布图举例1.被试的人口学资料常常用到次数分布表2.一篇综述中,为描述工作倦怠文献逐年增加的情况,我们用棒图表示概念小测查: 判断正误1.按

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论