




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、佐原健二(4)第4节统计数据也包括制作、统计表和统计数据两种主要格式,本节主要介绍图形和表的使用和制作。本节重点介绍1、公用统计图表和适用的数据类型2、各种统计图表的计算机制作方法、1、条形图(bar charts)、1、图例:x轴作为各组的代表值,y轴(直方图)作为度量值。或者,每个组的代表性值是y轴,度量值是x轴(条形)。2,适用的数据类型:(1)相同的整体,不同的测量指标值(标准分数)比较示例:同一班学生不同科目的考试成绩比较。(2)整体、同质性测量指标值之间的比较。例:徐璐其他班相同科目的考试成绩比较。2、饼图(pie)、1、图例:用每组数据值构成饼图的每个扇区面积。总面积的总和为10
2、0%。2,适用的数据类型:(1)相同的整体,不同部分所占比例的比较,使用饼图;(2)徐璐使用其他整体、同质部分所占比例的比较、饼图。例:徐璐比较两个调查组学生所占的比例。3、线、1、图例:以期间为x轴,以测量为y轴。2、适用的资料类型:随时间变化的数据、发展趋势分析。4、散点图(scatter plots)、1、图例:第一个变量为x轴,第二个变量为y轴。2、适用的数据类型:两个变量相关关系趋势分析。第2(5)章第5节数据分布集中趋势度量,*含义:表示数据集的常规水平值或中心值计算。*一般指标:包括算术平均、中位数、群众数、加权平均、曹征平均、几何平均等。本节包括:1、用于测量不同种类数据集趋势
3、的方法2、计算机常用的集中趋势测量操作方法、1、算术平均值、算术平均值通常称为“平均值”(average)或“平均值”(mean),或者表示为算术平均值是最常用的平均指标;1算术平均值的计算公式;原始数据计算公式(计算机编程公式);(P32 23);每个Xi样本单位的原始测量值N样本量;例如,10名学生的英语考试分数为89、90、67、80、75、89true score的最佳估计。真值是反映某种现象实际水平的分数。在测量过程中,受各种偶然因素的影响,进价往往很难得到。在实际测量中,经常使用“多重测量,平均”方法,用平均值来估计真假。3,算术平均值的优缺点,算术平均值具有良好的平均指标必须具备
4、的几个特征。反应灵敏,公式严格,简洁易懂,适合代数运算。主要缺点:容易受到两个极端数的影响。数据集包含模糊的数字时,无法计算。4,计算和应用算术平均值的原则,(1)同质性原则:算术平均值只能用于表示相似数据的集中趋势。(2)平均值与个人数字相结合的原则:解释个人特征时,要同时看到平均值和个人数据。(3)平均值与标准差、方差的组合原则:描述数据集时,需要同时分析集中趋势和方差图。(4)通常用于表示正态分布数据的集中趋势。2,中值,中值也称为中值,是按顺序排列的数据集中间的数字。通常表示为Md或Mdn,Me。,1,中值计算方法,原始数据计算方法(计算机编程公式)首先是数据集(5个数据的算例),原始
5、数据:24 22 21 26 20对齐: 21 22 24 26位置3360 1 2 3 4 5,中值22,原始数据3360 10表格中资料的累计方向不同,计算公式也不同。最低组中最高组(下)累计频率计算公式,公式中:L表示具有中间值的组的下限Sm-1小于具有中间值的组的下限组的累计频率N表示数据总计FM具有中间值的组的频率数I表示具有中间值的组的组距离中值组:从最低组累计到最高组,达到一半值的组,(P31 2.2)表2 30 计算:30名工人中,中等水平工人每日加工部件数约104个,表3 52名学生数学成绩中位数计算表,二位数特性及应用,中位数不受两端极端数据的影响。 通常用于以下情况:(1
6、)有数字数据类型的极端数据的情况,即数据明显偏向,极差大的情况下(偏振分布);(2)数据集上的单个数据不准确且不明确;(3)按订单尺度衡量的组间隔数据,即数据属于等级特性时。例如:家庭每月平均收入:(1)200-400;(2)400-600;(3)600-800;(4)计算800以上:当地中级家庭人均月收入水平、三重水、重水有两种定义:Mo。理论重数是指与频率分布曲线最高点相对应的横坐标的一点。粗略的群众数是一组数据中出现最多的数字。大众数也是平均指标,也可以用于表示数据集的集中趋势。群众数计算方法,(1)观察法查找粗略群众数未分组的数据。发生最多的是群众数。分组(计数分布表)数据:最频繁数据
7、集的组中值,即群众数。(2)最低组中最高组(底部)累计频率计算公式D1 Mo=L I (P29 2.1) D1 D2公式:L组下限D1组频率与其下限相邻组数的差异d2-组阵列频率与上限相邻组数的差异I表4 30名工人每日加工部件中数计算表、计算、 近似方法:Mo=105近似方法:D1 Mo=l I D1 D2 13-7=100 10(13-7)(13-5)=104.29近似方法:Mo=72.5近似方法例如:车辆安排、服装加工等(3)按一定尺度衡量的组距离式数据,例如:家庭月平均收入:(1)200-400;(2)400-600;(3)600-800;4)800以上的计算:当地大多数家庭的月平均收
8、入水平,3中数,中数,平均值的关系及应用,顾:(1)本市居民家庭平均月收入(2)本市大多数居民家庭月收入(3)本市中等居民家庭月收入,佐原健二(5)第五节数据离散趋势测量,*意思:离散趋势测量是描述数据集中各观察值偏离平均值的情况,即数据的可变性*。特殊指标包括百分位差、象限差、平均差等。本节重点介绍了用于测量不同类型数据离散趋势的方法。计算机常用的离散趋势测量工作方法,1,极差(Rang)是数据集的最大值和最小值之间的差值(也称为总距离)。用r表示。(a)计算原始数据:R=max(xi)-min(xi) (P39 2.8)频率分布数据:顶层组和底层组的值差异或顶层组上限和底层组下限的差异。(
9、2)该数据用于表示偏角分布数据的离散情况。2,方差和标准差,方差:表示偏差平方的算术平均值。也就是说,数据集中每个数据与组平均值的差值、平方的总和、总和除以数据数。整体显示为2,样品显示为S2。平均平方总和、取样总数、标准差(Standard deviation):表示偏差的平方和,以及平均值之后的平方根。方差的平方根。完全表示法,示例显示为s(或SD)。意义:标准差的值越大,表示此数据集的离散度越大。(a)整体方差和标准差的计算方法、原始数据的计算方法、频率分布表的计算方法、比较注意事项、(b)示例方差和标准差的计算方法、原始数据的计算方法(P40 2.10 2.12)、频率分布表的计算方法
10、(P41 2.11 2.13)(,3,“离散系数”(Coefficient of variation),“离散系数”:标准差和算术平均值的百分比。没有单位的相对日志。计算公式:或者,离散系数越大,方差就越高。离散系数的用途,1,徐璐比较不同单位数据的离散度示例:半整体体重测量的标准差为18千克,高度测量的标准差为0.18米,比较两者的离散度。可以直接比较吗?2,比较徐璐其他整体相同测量指标的离散度。例:对全班学生的体重测量,女生的标准偏差为6公斤,男生测量的标准偏差为18公斤,比较两者的离散度。可以直接比较吗?平均差异的优点:表示每个数据偏离平均值的程度,更好地反映了数据的方差图。平均差异的缺点:取绝对值对额外计算不利,所以使用较少。5,应用标准偏差,(1)标准得分计算(标准得分)(* * P2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 7765-2:2025 EN Plastics film and sheeting - Determination of impact resistance by the free-falling dart method - Part 2: Instrumented puncture test
- 【正版授权】 ISO 23317:2025 EN Implants for surgery - Materials - Simulated body fluid (SBF) preparation procedure and test method to detect apatite formation in SBF for initial screenin
- 【正版授权】 ISO 23308-3:2025 EN Energy efficiency of industrial trucks - Test methods - Part 3: Container handling lift trucks
- 【正版授权】 ISO 15238:2025 EN Coal - Determination of total cadmium
- 贵阳贵安2025年公开招聘事业单位工作人员笔试历年典型考题及考点剖析附带答案详解
- 【金华】2025年浙江金华东阳市教育系统公开招聘事业编制教师60人笔试历年典型考题及考点剖析附带答案详解
- 2020-2025年环境影响评价工程师之环评技术导则与标准自我检测试卷A卷附答案
- 1.2幼儿园教学课件
- 办公软件案例教程(Office2016) 课件全套 第1-5篇 行政篇-财务篇
- 兰州大学教学课件
- 财务共享公司建设方案
- 小学数学-二年级升三年级暑假数学作业-口算 +竖式计算
- 2025至2030内燃机市场发展趋势分析与未来投资战略咨询研究报告
- 汽车散热器安装施工方案与技术措施
- 2025年陕西延长石油招聘笔试备考题库(带答案详解)
- 山西省烟草专卖局(公司)笔试试题2024
- 江苏扬州经济技术开发区区属国有企业招聘笔试真题2024
- 华为emt轮岗管理制度
- Alport综合征基因诊断
- 搜身带离技术课件
- 光伏电站设备移交生产验收标准
评论
0/150
提交评论