版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
24.4数据的分组第二十四章
数据的分析01理解组内离差平方和与组间离差平方和的定义,明确两者的关联,并能准确计算.02学会运用“组内离差平方和最小”原则对数据进行合理分组,解决实际分类问题.问:校医需分析七年级某班20名学生的身高分布:155,155,156,157,158,159,160,161,162,162,163,165,165,166,167,167,168,169,172,178.若想分为3组制作频数分布表,等距分组法(如150-160,160-170,170-180)可能存在什么问题?有的组人数过多(如160-170集中12人),有的组过少(170-180仅2人),无法清晰反映分布特征.是否存在更科学的分组方法,使得每组内部数据尽可能相似?如何衡量“组内差异度”?问题
一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进人面试.将10名应聘者的笔试成绩(百分制)按从小到大的顺序排列如下:58、64、68、75、76、83、85、89、90、92.公司要从这10人中选部分人进入面试,该如何确定“成绩好”的标准?你有哪些分组方法?基于数据自身特点的分组方法——数据的分组(基于离差平方和)观察排序后的成绩间隔:58|64|68|75|76|83|85|89|90|92.10个数据有几个间隔?每个间隔能将数据分成几组?10个数据有
9
个间隔,每个间隔对应1种“两组分法”(如第1个间隔分“{58}和{64,68,…,92}”,第2个间隔分“{58,64}和{68,…,92}”),共
9
种分法.组内数据差异最小活动1:理解“组内差异最小”的需求那怎样能做到组内数据差异最小呢?活动2:学习“组内离差平方和”的概念与计算
组内离差平方和越小,说明两组内部的数据越集中,分组越合理.d12+d22
称为组内离差平方和,表示两个组内数据的离散程度.以招聘成绩的“第5个间隔”为例,分步计算组内离差平方和:
58|64|68|75|76|83|85|89|90|92.
分组任务:将数据分为9组,每组计算1种间隔的组内离差平方和.观察汇总结果,你能得出什么结论?活动3:验证“组内离差平方和最小”的分法因此最优分法为{58,64,68,75,76}(不进面试)和{83,85,89,90,92}(进面试).最小
活动4:学习“组间离差平方和”的概念与计算
分组第1个间隔799.6444.4第2个间隔521.5722.5第3个间隔322.1922.6第4个间隔323.6920.1第5个间隔283.6960.4第6个间隔437.3806.4第7个间隔592.1652第8个间隔821.5422.5第9个间隔1026.2217.958、64、68、75、76、83、85、89、90、92.最大数据分组的步骤:(1)将数据按从小到大排序;(2)确定所有可能的间隔(n个数据有n-1个间隔,对应n-1种两组分法);(3)计算每种分法的两组平均数及组内离差平方和;(4)选择组内离差平方和最小(或组间离差平方和最大)的分法作为最优分组.例
10个城市某月的每日最高温度的平均数(简称平均高温)如表所示.城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃33-3-1110212212917(1)根据平均高温的组内离差平方和最小的原则,把这10个城市分为两组.解:将表中的数据按从小到大排列,可得-11-3
3
3
9
10
12
17
21
22将它们分成两组共有9种情况,利用计算器或信息技术工具,分别计算组内离差平方和(结果保留小数点后一位),如下表所示.分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔0584.2584.2第2个间隔32380.9412.9第3个间隔98.7285.7384.4第4个间隔132158.8290.8第5个间隔228.8113.2342第6个间隔308.862370.8第7个间隔397.414411.4第8个间隔5620.5562.5第9个间隔789.60789.6最小因此,按组内离差平方和最小的分法为{北京,石家庄,呼和浩特,哈尔滨}和
{上海,广州,海口,成都,贵阳,昆明}(2)根据平均高温的组间离差平方和最大原则,把这10个城市分为两组.所得分组结果与(1)中结果一致吗?分别计算各组数据的平均数和组间离差平方和,如表所示:城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃33-3-1110212212917最大所得分组结果与(1)中结果一致.数据的分组离差平方和组内离差平方和组间离差平方和计算公式应用1.按照“组内离差平方和达到最小”的方法,小明将一组数据分成了两组{80,82}和{87,86,90,85},这两组数据组内离差平方和为
.16
2.如图记录了某地连续5天的日最低气温,若把这5天的最低气温按组间离差平方和最大的原则分成两组,则这两组是__________________和_________________________.{星期一,星期二}{星期三,星期四,星期五}3.学校运动会上,5名学生的跳远成绩(单位:米)分别是
4.2、4.5、4.8、5.2、5.5,体育老师要按照组内离差平方和最小的原则将学生成绩分为两组,用于后续训练安排,求分组方案.解:把这5个数据分为两组,共有4种情况:分为{4.2}和{4.5,4.8,5.2,5.5}时,组内离差平方和=0.58;分为{4.2,4.5}和{4.8,5.2,5.5}
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030中国对香豆酸市场需求量预测与重点企业发展分析报告
- 《笔算乘法》教案(2课时)-2025-2026学年北京版(新教材)小学数学三年级下册
- 建筑施工安全培训考核方案
- 3.2.1 序列标注-新闻稿件词性标注
- 金属加工厂切削液管理细则
- 某铝业厂生产安全检查细则
- 某制药厂药品研发流程细则
- 食品安全卫生知识培训
- 2026年农产品市场流通体系优化:政策赋能与技术创新双轮驱动
- 25-26学年语文(统编版)选择性必修下册课件:第4单元 第13课 (2)宇宙的边疆
- 医院安全生产法课件
- 入团申请汇报答辩大纲
- 2025年禁毒知识竞赛题库(含答案)
- 电厂锅炉保温培训课件
- 轨道交通 机车车辆 电磁发射限值与测量-编制说明
- 国网新闻宣传与企业文化管理专责考试题库含答案
- 2025年乡镇畜牧站人才选拔面试模拟题集及解析
- 能源托管面试题目及答案
- 2025年北京教育融媒体中心招聘工作人员(17人)笔试备考试题附答案详解(a卷)
- 接触网安全操作规程及维护手册
- 2024年高中化学奥林匹克竞赛贵州初赛试卷(含答案)
评论
0/150
提交评论