免费预览已结束,剩余72页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,数据整理与分析,主要内容,数据分组数据显示数据集中趁势数据离中趋势,数据分组,1、将原始资料顺序排序2、确定组数与组距3、确定组限4、将各个数据按其数值大小归入相应的组内,如果数据分布比较均匀、对称,即中间数值次数多,大小极端值次数少,考虑用以下公式来确定组数:组数1+3.322logn,组距(观察值中的最大数值观察值中的最小数值)/组数,数据分组例,【例1】设某企业30个非熟练工人的周工资额(元)如下:106998512184941061101191019591871051061091189612891105111111107103101107106,数据分组例,排序:84,85,87,91,91,94,95,96,97,99,101,101,103,103,105,105,105,106,106,106,106,107,107,109,110,111,111,118,119,121,128,分组计算,组数1+3.322logn=5.9(n=30)分6组组距:每组区间的宽度(观察值中的最大数值观察值中的最小数值)/组数=(128-84)/6=7.3,分6组,组距8,结合实际数据,一、比较计算组距值(7.3),组距为10比较好计算且方便,二、分组的组数相应从6减少为5。最小值为84,下限从80开始,,分5组,组距10,分两组,分组太细会出现什么问题?,数据图示,直方图:频数分配直方图、频率分配直方图次数多边形图累积次数分配图:小于上组限的累积次数分配图、大于下组限的累积次数分配图。特例洛伦茨曲线茎叶图,直方图,以变量值为横坐标、次数为纵坐标,以矩形高度表示各组次数(频数)分配多少。如下图:,频数直方图,直方图,频率分布直方图,次数多边形图,次数多边形图,还可将几种不同数据绘在同一多边形图上用于比较.如图:,累计次数分配图,小于上组限的累积次数分配,累计次数分配图,以变量值为横坐标、以累积计次数为纵坐标描点连接而成的图,如下图:,累计次数分配图,大于下组限的累积次数分配,累计次数分配图,洛伦茨曲线,以人口百分比为横坐标、以累积收入百分比为纵坐标描点连接而成的图形,如图:,基尼系数,反映一国收入的平等程度。如右图基尼系数r=A/(A+B)r=0绝对平等r=1绝对不平等r越大越不平等,反之则越平等。,茎叶图,数据源:21,29,60,1,27,35,66,23,8,38,31,45,57,66,68,62,62,93,68,19,68,72,76,91,46,62,3,10,49,56,52,95按大小排序后如下:1,3,8,10,19,21,23,27,29,31,35,38,45,46,49,52,56,57,60,62,62,62,66,66,68,68,68,72,76,91,93,95,茎叶图,茎叶次数01383109221379431583456935267360222668889726280913554,数据集中趋势,算术平均数几何平均数调和平均数中位数及四分位数众数,算术平均数(概念要点),集中趋势的测度值之一最常用的测度值一组数据的均衡点所在易受极端值的影响,算术平均数(计算公式),设一组数据为:简单算术平均值的计算公式为,设分组后的数据为:相应的频数为:加权算术平均值的计算公式为,简单算术平均数(算例),原始数据:10591368,加权算术平均数(算例),【例2】设某企业经理付给他的雇员的每小时工资分为三个等级:6.5元、7.5元、8.5元。拿这三种工资的人数分别为:14人、10人、2人,则该公司雇员的平均工资为:,加权算术平均数(分组数据算例),【例3】根据表4-1中的数据,计算50名工人日加工零件数的均值,算术平均数的数学性质,1.各变量值与均值的离差之和等于零,2.各变量值与均值的离差平方和最小,几何平均数(概念要点),1.集中趋势的测度值之一2.主要用于计算平均比率及平均发展速度3.计算公式为简单几何平均数加权几何平均数4.数据都为正数时才可计算几何平均数,5.可看作是均值的一种变形,几何平均数(算例),【例4】设某建筑公司承建的四项工程的利润分别为3%、2%、4%、6%。问这四项工程的平均利润率是多少?,几何平均数(算例),【例5】一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。,平均收益率103.84%-1=3.84%,几何平均数(算例),【例6】设某银行有一笔20年的长期投资,其利率是按复利计算的,有1年为2.5%,有3年为3%,有5年为6%,有8年为9%,有2年为12%,有1年为5%,求平均年利率。,调和平均数(概念要点),集中趋势的测度值之一均值的另一种表现形式易受极端值的影响计算公式为简单调和平均数加权调和平均数,调和平均数(说明),加权调和平均,调和平均数(算例),【例7】某人开车,前10公里以时速50公里驾驶,后10公里以时速30公里驾驶。则此人跑这20公里的平均时速为:,【例8】某种蔬菜价格:早上0.4元/斤(x1),中午0.25(x2),晚上0.20(x3),若某人早、中、晚分别购买的金额是1元(m1)、2元(m2)、3元(m3),求平均价格。解:平均价格=总金额/总数量,调和平均数(算例),【例9】某种蔬菜价格:早上0.4元/斤(x1),中午0.25(x2),晚上0.20(x3),若某人早、中、晚分别买2.5斤(f1)、8斤(f2)、15斤(f3),求平均价格。解:平均价格=总金额/总数量,调和平均数与算术平均数的区别,中位数(概念要点),1.集中趋势的测度值之一2.排序后处于中间位置上的值,3.不受极端值的影响4.各变量值与中位数的离差绝对值之和最小,即,中位数(位置的确定),未分组数据:中位数位置,组距分组数据:,未分组数据的中位数(计算公式),数值型未分组数据的中位数(5个数据的算例),原始数据:2422212620排序:2021222426位置:12345,中位数22,数值型未分组数据的中位数(6个数据的算例),原始数据:10591268排序:56891012位置:123456位置=,根据位置公式确定中位数所在的组,设落入第组采用下列近似公式计算,数值型分组数据的中位数(要点及计算公式),数值型分组数据的中位数(算例),【例10】根据右表中的数据,计算50名工人日加工零件数的中位数,众数(概念要点),1.集中趋势的测度值之一2.出现次数最多的变量值:一组数据分布的最高峰点3.不受极端值的影响4.可能没有众数或有几个众数,众数(众数的不唯一性),无众数原始数据:10591268,一个众数原始数据:659855,多于一个众数原始数据:252828364242,计算该企业该日全部工人日产量的众数。,单值型数列的众数(算例),【例11】已知某企业某日工人的日产量资料如下:,数值型分组数据的众数(要点及计算公式),1.众数的值与相邻两组频数的分布有关,4.该公式假定众数组的频数在众数组内均匀分布,2.相邻两组的频数相等时,众数组的组中值即为众数,3.相邻两组的频数不相等时,众数采用下列近似公式计算,数值型分组数据的众数(算例),【例12】某市公寓房租金的统计资料如下表,试求房租金的众数,众数、中位数和算术平均数的关系,右(正)偏分布,众数,中位数,算术平均数,注:对称图形,重叠左右偏时,均值变化最快,中位值次之,众值不变,数据的离中趋势,极差与平均差方差与标准差变异系数四分位差异众比率,极差(概念要点及计算公式),一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响未考虑数据的分布,未分组数据R=max(Xi)-min(Xi),计算公式为,极差(算例),原始数据:10591268排序:56891012极差=12-5=7原始数据:极差=140-105=35,平均差(概念要点及计算公式),离散程度的测度值之一各变量值与其均值离差绝对值的平均数能全面反映一组数据的离散程度数学性质较差,实际中应用较少,计算公式为,未分组数据,组距分组数据,平均差(计算过程及结果),【例13】根据表4-6中的数据,计算工人日加工零件数的平均差,方差和标准差(概念要点),1.离散程度的测度值之一2.最常用的测度值3.反映了数据的分布4.反映了各变量值与均值的平均差异5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差,总体方差和标准差(计算公式),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,总体方差和标准差(算例),原始数据:76908486818786828583,总体标准差(计算过程及结果),【例14】根据表4-7中的数据,计算工人日加工零件数的标准差,总体方差和标准差(简化计算公式),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,总体标准差(计算过程及结果),【例15】根据4-8中的数据,计算工人日加工零件数的标准差,样本方差和标准差(计算公式),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,样本方差和标准差(算例),原始数据:76908486818786828583抽样数据:7684818685样本均值:样本方差:标准差:,变异系数,1.各种变异指标与其相应的均值之比2.消除了数据水平高低和计量单位的影响3.测度了数据的相对离散程度4.用于对不同总体数据离散程度的比较注:变异指标:对数据的差异程度进行度量,包括异众比率、四分位差、极差、平均差、方差和标准差(含比率的标准差)等,变异系数分类及计算公式,极差系数平均差系数标准差
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年教育行业教育信息化发展与在线教育模式创新研究报告及未来发展趋势预测
- 2025年房地产行业房地产行业金融资源配置市场调控认证考核试卷
- 2025云南盈和新能源材料有限公司招聘4人考试笔试参考题库附答案解析
- 2025年中国南水北调集团中线有限公司秋季公开招聘10人(河南有岗)笔试考试参考题库及答案解析
- 2026年延安东辰中学招聘笔试考试备考题库及答案解析
- 2025年安徽省文物考古研究所引进高层次人才(博士)2人笔试考试参考试题及答案解析
- 2025中国科学院微生物研究所真菌学与创新技术研究室研究团组负责人招聘1人考试笔试备考试题及答案解析
- 2026华中科技大学同济医学院附属协和医院肾内科张春教授团队专职研究人员招聘笔试考试备考题库及答案解析
- 2025年北京大学第三医院崇礼院区公开选聘编外工作人员1名笔试考试备考试题及答案解析
- 2025福建福州市人民防空平战结合保障中心招聘编外工作人员1人考试笔试模拟试题及答案解析
- 工艺管道安装施工方案
- 4-6岁幼儿同伴交往能力量表
- 大学生心理健康教育(第三版)教案:第二章 认识自我 悦纳自我
- 柴油发电机组操作培训
- 《几种常见的肥料》课件
- 地方融资平台债务和政府中长期支出事项监测平台操作手册-单位
- 2024年秋儿童发展问题的咨询与辅导终考期末大作业案例分析1-5答案
- Blockly 创意趣味编程(网络共享课)学习通超星期末考试答案章节答案2024年
- 高等传热学全册课件
- 教学课件《变革与突破-19世纪西方美术》
- 【2025高考语文一轮复习】教材内古诗词综合检测
评论
0/150
提交评论