下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章次数分布次数分布综述次数分布表次数分布图次数分布的形状茎和叶图百分位数,百分位等级,插值法次数分布综述描述统计的目的:简化和整理数据的表达。次数分布表和次数分布图就是表达一组数据是如何在某一度量上分布的。次数分布:是指一批数据在某一量度的每一个类目所出现的次数情况组织此类数据的第一种方法是:建立次数分布表次数分布表次数分布表的要素变量的值?-填充x列每个值出现多少次(发生次数)?-填充f列观察的总数?将次数行求和,将得到工f = N变量的总值?最简单的方法就是求 (X)和(f)的乘积列,然后将结果求和例1:对于下面的次数分布表:i. 此分布中共有几个分数(N = ?)ii. 对这些分数求
2、和万Xxf42342513三(Xf )例2:某个班的26个学生在一次测验中的分数如下(10分为满分)9, 2, 3, 8, 10, 9, 9, 2, 1, 2, 9, 8, 2,5, 2, 9, 9, 3, 2, 5, 7, 2, 10, 1, 2, 9将这些分数作成一个次数分布表xf比例(相对次数;Proportions).全组中有多大比例取值为X? p = f / N (N =百分比(Percentages).全组中有多大比例取值为X? p *100分组次数分布表常常以区间的形式出现,而不是某一特定值.例如学生成绩,(A = 90-100, B = 80-89, 编制分组次数分布表的步骤i
3、. 求全距ii. 定组数iii. 定组距iv. 写出区间上下限v. 统计每个区间的次数建构这些区间有一系列的“惯常法则”(rules of thumbs )观察的总数).).i.分组次数分布表应该有大约10个区间,目的是使这组数据易于直观感受和理解组距应该是个比较简单的数字,如2, 5, 10, 20ii.2iii.iv.每个区间开始的分数应该是组距的倍数 所有区间的宽度应该相等次数分布图次数分布的数据可以用图简明地概括直方图(histogram ):用一些垂直条画在每个分数之上垂直条的高度代表次数垂直条的宽度代表分数的精确区间.只有数据是等距或等比量度时,才能用直方图注意:对于一个连续变量,
4、每个分数实际对应一段组距.分割这些组距的界限叫做精确界限(real limits ).分割两个邻近分 数的精确界限位于两个分数的中间。每个分数有两个精确界限,一个在组距的顶端, 称为精确上限(upper real limit ),另一个在组距的底端,称为精确下限(lowerreal limit ).注意一个组距的精确上限也是高一个组距的精确下限。例3:绘制一个直方图来表达例2的分布水平轴-X 轴 (abscissa ) - X 的值垂直轴-Y 轴 (ordinate )- 次数棒图(条形图;bar graph ):用一些垂直条画在每个分数(或类别)之上垂直条的宽度代表分数的精确区间.垂直条的高
5、度代表次数每个垂直条之间有一段空间。只有数据是命名或顺序量度时,才能用棒图-作全班同学家乡地区的棒图折线图(line graph ),又称次数分布多边图(frequency distribution polygon )在每一分数上面画点点的高度代表次数次数分布的形状用3个特征可以完整地描述一个分布:对称分布(symmetrical distribution一条连续折线将这些点连接在一起形状(shape),集中趋势(central tendency ),和变异性(variability偏态分布(skewed distribution )中,分数堆积在分布的一端,而另一端成为比较尖细的尾端(偏态分
6、布尾端向右的称为正偏态(positively skewed )(因为其尾端指向正数):可以画一条垂直线穿过分布的中央,使得分布的一边恰是另一边的镜象。tail )偏态分布尾端向左的称为负偏态(negatively skewed )如何描述例2-例3分布的形状?从整体上说,这个班的学生测验情况怎么样?大部分分数是偏高还是偏低?测验容易还是简单? 双峰分布茎和叶图如果数字是两位数,左茎和叶图(stem and leaf display )-将每一数字分解为左边部分(称为茎)和右边部分(称为叶)边的一位就是茎,右边的一位就是叶.例4:考察下列茎和叶图:876543227145863024169326
7、5a) 以10为组距宽度,作相应的分组次数分布表b) 以10为组距宽度,作相应的次数分布直方图c) 如果给定分组次数分布表,能否作出茎和叶图?为什么?百分位数以上是描述观察的整体,而我们也可用次数分布来描述某一个别点在一个集合中的位置一个分数的等级(rank)或百分位数等级(percentile rank):某一分布中分数在某一值之下或等于该值的个体所占的百分 比.当一个分数被其百分位数等级,该分数称为百分位数(percentile ).例4:此表是一次词汇测验的分数Xfp%cfc%52.05540100410.25253895316.4040287028.2020123014.1010410
8、cf = 累积次数(cumulative frequency )c% = 累积百分比(cumulative percentage )如果你在测验中得到 4分,你的百分位数等级是多少?如何确定百分位数注意:对于连续型数据,必须考虑其精确上限和精确下限 - 步骤1) 找出分布中分数在4分之下或等于4分个体的个数,即累积次数.-对于分数4,其对应的累积次数是 38,意周是40个学生中的38个在测验中的得分是 4分或4分以下。2) 这些累积次数转换位累积百分比-对于分数4,其对应的累积百分比是 95%.注意:百分位数不是分数,只是组距.分数4意味着一个人得分在 3.5和4.5之间.累积百分比表明组距的精确上限。因此,95的百分位数是与4.5相对应(而不是4.0 ).其中的一个方法是插值法。插值法(Interpolation )-有时你所感兴趣的值并未出现在表内。此时你需要做基于经验的猜测早上8:00 温度是20度,到中午12:00温度是28度上午9:00是多少度呢?- 步骤:1) 找出两个量数组距的宽度如,时间8到12点;温度60到68度4小时;8度2) 找出组距中已知值的位置=已知值与组距顶端的距离/组距宽度=12 : 00 - 9:00 = 3 小时 / 4 小时=.753)用所得位置(分数)来确定另一量表中对应的所求值与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 IEC 60335-2-3:2022/AMD1:2025 EN-FR Amendment 1 - Household and similar electrical appliances - Safety - Part 2-3: Particular requirements for electric irons,ironing boards
- 【正版授权】 IEC TS 63346-2-3:2025 EN Low-voltage auxiliary power systems - Part 2-3: Design criteria - Low-voltage AC auxiliary power systems for substations
- GB 46521-2025烟花爆竹生产机械设备安全技术规范
- 水电定子线圈行业深度研究报告
- 活动量爪卡尺行业深度研究报告
- 2023年全球市场电机转子铁芯 GIR3480中文总体规模、主要生产商、主要地区、产品和应用细分研究报告
- 印刷跟行业深度研究报告
- 中国少量大麻素市场现状研究分析与发展前景预测报告
- 2025年年终总结会-干部述职评议表
- 无线负控终端机行业深度研究报告
- 国家病案质控死亡病例自查表
- 政务服务标准化管理手册
- 三个和尚幼儿故事课件
- 护理品管圈问题解决型之提高慢性肾功能不全患者饮食指导知晓率
- 石家庄市第四十八中学(原二南)2022-2023学年七年级下学期期中数学试题【带答案】
- 麻醉过敏性休克病例分析
- 2024年沈阳航空航天大学马克思主义基本原理概论(期末考试题+答案)3
- 配电线路巡视培训课件
- 单位大门规划方案
- 实验诊断6出凝血
- 《电气防火安全培训》课件
评论
0/150
提交评论