版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 次数分布Ø 次数分布综述Ø 次数分布表Ø 次数分布图Ø 次数分布的形状Ø 茎和叶图Ø 百分位数,百分位等级,插值法次数分布综述n 描述统计的目的:简化和整理数据的表达。n 次数分布表和次数分布图就是表达一组数据是如何在某一度量上分布的。n 次数分布:是指一批数据在某一量度的每一个类目所出现的次数情况n 组织此类数据的第一种方法是:建立次数分布表次数分布表² 次数分布表的要素Ø 变量的值? -填充x列 Ø 每个值出现多少次(发生次数)? -填充f列Ø 观察的总数?将次数行求和, 将得到S
2、f = NØ 变量的总值?最简单的方法就是求(X) 和 (f) 的乘积列, 然后将结果求和 S (Xf )例1:对于下面的次数分布表:i. 此分布中共有几个分数 (N = ?)ii. 对这些分数求和 Xxf42342513例2: 某个班的26个学生在一次测验中的分数如下(10分为满分): 9,2,3,8,10,9,9,2,1,2,9,8,2,5,2,9,9,3,2,5,7,2,10,1,2,9将这些分数作成一个次数分布表xfn 比例 (相对次数;Proportions). 全组中有多大比例取值为X? p = f / N (N = 观察的总数).n 百分比 (Percentages).
3、 全组中有多大比例取值为X? p * 100 ² 分组次数分布表 l 常常以区间的形式出现, 而不是某一特定值. 例如学生成绩, (A = 90-100, B = 80-89, .). l 编制分组次数分布表的步骤i. 求全距ii. 定组数iii. 定组距iv. 写出区间上下限v. 统计每个区间的次数l 建构这些区间有一系列的“惯常法则”(rules of thumbs)i. 分组次数分布表应该有大约10个区间,目的是使这组数据易于直观感受和理解ii. 组距应该是个比较简单的数字,如2,5,10,20iii. 每个区间开始的分数应该是组距的倍数iv. 所有区间的宽度应该相等次数分布图
4、次数分布的数据可以用图简明地概括Ø 直方图 (histogram):用一些垂直条画在每个分数之上¨ 垂直条的高度代表次数¨ 垂直条的宽度代表分数的精确区间. ¨ 只有数据是等距或等比量度时,才能用直方图u 注意:对于一个连续变量, 每个分数实际对应一段组距. 分割这些组距的界限叫做精确界限(real limits). 分割两个邻近分数的精确界限位于两个分数的中间。u 每个分数有两个精确界限, 一个在组距的顶端,称为精确上限(upper real limit), 另一个在组距的底端,称为精确下限(lower real limit). u 注意一个组距的精确
5、上限也是高一个组距的精确下限。例3: 绘制一个直方图来表达例2的分布¨ 水平轴 - X 轴 (abscissa) - X 的值垂直轴 - Y 轴 (ordinate) - 次数Ø 棒图(条形图;bar graph): 用一些垂直条画在每个分数(或类别)之上n 垂直条的宽度代表分数的精确区间.n 垂直条的高度代表次数n 每个垂直条之间有一段空间。n 只有数据是命名或顺序量度时,才能用棒图- 作全班同学家乡地区的棒图次数分布的形状Ø 用3个特征可以完整地描述一个分布: 形状(shape), 集中趋势(central tendency), 和变异性(variabilit
6、y).u 对称分布(symmetrical distribution): 可以画一条垂直线穿过分布的中央,使得分布的一边恰是另一边的镜象。 u 偏态分布(skewed distribution)中, 分数堆积在分布的一端,而另一端成为比较尖细的尾端(tail)。<- 尾端向左: 负偏态 正偏态: 尾端向右->u 偏态分布尾端向右的称为正偏态(positively skewed )(因为其尾端指向正数)u 偏态分布尾端向左的称为负偏态(negatively skewed).- 如何描述例2-例3分布的形状?- 从整体上说,这个班的学生测验情况怎么样?大部分分数是偏高还是偏低?测验容易
7、还是简单?u 双峰分布茎和叶图u 茎和叶图 (stem and leaf display)- 将每一数字分解为左边部分(称为茎)和右边部分(称为叶). 如果数字是两位数, 左边的一位就是茎,右边的一位就是叶. 例4:考察下列茎和叶图:8765432271458630241693265a) 以10为组距宽度,作相应的分组次数分布表b) 以10为组距宽度,作相应的次数分布直方图c) 如果给定分组次数分布表,能否作出茎和叶图?为什么?百分位数Ø 以上是描述观察的整体,而我们也可用次数分布来描述某一个别点在一个集合中的位置Ø 一个分数的等级(rank) 或百分位数等级(percen
8、tile rank): 某一分布中分数在某一值之下或等于该值的个体所占的百分比. 例4:此表是一次词汇测验的分数:_ Xf p%cfc% 52.05540100 410.25253895 316.40402870 28.20201230 14.1010410 cf = 累积次数(cumulative frequency)c% = 累积百分比(cumulative percentage)1) 95百分位数等级的所对应的测验分数是多少?2) 如果你在测验中得到4分, 你的百分位数等级是多少? l 如何确定百分位数注意: 对于连续型数据, 必须考虑其精确上限和精确下限1) -对于分数4, 其对应的累
9、积百分比是 95%.但注意:分数4意味着一个人得分在3.5 和 4.5之间. 累积百分比表明组距的精确上限。因此,95 的百分位数是与4.5 相对应(而不是 4.0). 2) 找出分布中4分的精确上限和精确下限的累积次数.- 对于分数4.5, 其对应的累积百分比是95- 对于分数3.5, 其对应的累积百分比是70- 对于分数4.0, 其对应的累积百分比是多少呢? l 插值法(Interpolation) - 有时你所感兴趣的值并未出现在表内。此时你需要做基于经验的猜测. 其中的一个方法是插值法。早上8:00 温度是20度,到中午12:00温度是28度上午9:00是多少度呢?- 步骤:1) 找出两个量数组距的宽度如, 时间 8 到 12点;温度60 到68 度4 小时; 8 度2) 找出组距中已知值的位置 =已知值与组距顶端的距离/ 组距宽度= 12:00 - 9:00 = 3小时 / 4 小时 = .753) 用所得位置 (分数) 来确定另一量表中对应的所求值与组距顶端的距离= (分数) X (另一量表组距宽度)= .75 X 8 度 = 6 度再求得插入值-> 28 - 6 = 22 度 (
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教学楼架空层景观设计
- 设计成果汇报动态展示方案
- 科普气味重塑大脑
- 牙周炎常见症状解析
- 美式乡村室内设计方案
- 老年性痴呆综合护理要点
- 连锁药店陈列设计
- 城镇污水处理厂设计
- 热流道注塑模浇注系统设计
- 宠物训狗课程设计
- 2026-2030中国营养酱油行业供需分析及发展前景研究报告
- 2026浙江嘉兴市丰源公共事业管理有限公司招聘笔试参考试题及答案解析
- 2026上海崇明横沙乡招聘事务工作者10人笔试参考题库及答案解析
- 2026-2030中国家用空调市场运行状况及投融资发展趋势研究报告
- 沥青路面灌缝施工技术规范
- 2026年儿童康复科年度质控与安全管理计划
- 苏教版四年级数学下册期末检测卷(带答案)
- 2025年甘肃省兰州市八年级地理生物会考真题试卷(含答案)
- 2026中国具身智能产业发展白皮书
- 国企行测常识900题题库
- 煤矿事故案例分析
评论
0/150
提交评论