版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人教版八年级数学(下)24.4数据的分组第二十四章数据的分析新课导入生活里的分类能帮我们高效做事,那杂乱的数据也可以通过“分组”变得清晰——这就是我们今天要学的《数据的分组》.通过合理分组,不仅能快速统计各类数据的数量,还能利用即将要学的“组内离差平方和”判断分组是否让数据更集中、更便于分析.探究新知问题
一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进入面试.将10名应聘者的笔试成绩(百分制)按从小到大的顺序排列如下:
自然,应当选择笔试成绩好的应聘者进人面试.58646875768385899092你认为哪一部分应聘者应当进入面试?那么怎样才算好呢?标准是什么呢?例如,前三名或85分及以上为好成绩,其余为不太好的成绩.但是83分和85分的差距很小,若以“85分及以上”为好成绩的标准,则85分属于好成绩,而83分属于不太好的成绩.这么看,有些标准没有考虑数据自身的特点.从公司确定面试应聘者的角度看,把笔试成绩相对接近的分到同一组,是一种较合理的做法.因此,笔试成绩可以根据组内差异最小的原则进行分组.要使分组后的组内差异最小,将笔试成绩按从小到大的顺序排列,使相互最接近的笔试成绩挨在一起,然后进行分组,可以发现,10个笔试成绩按顺序排列形成了9个间隔,如下.58646875768385899092每个间隔都可以把笔试成绩分成好和差两组,共有9种分法.思考:在前面的学习中,我们知道,离差平方和可以刻画一组数据的离散程度.下面我们利用离差平方和刻画组内数据的离散程度,进而对数据进行分组.怎么刻画组内笔试成绩差异的大小呢?哪种分法能使笔试成绩好和差两组的组内差异最小?一般地,设有一般地,设有n个数据x1,x2,…,xn,假设这些数据都不相等,其平均数记为
x,则离差平方和为
如果把这组数据分为两组,前m(m<n)个数据为一组(称为第一组),后(n-m)个数据为一组(称为第二组),那么这n个数据的离差平方和可以分解为两类离差平方和:一类反映两个组内数据的离散程度另一类反映两组数据之间的差异程度它们的平均数分别记为
x1和
x2,离差平方和分别为
那么=(x1-
x)2+(x2-
x)2+…+(xm-
x)2+(xm+1-
x)2+(xm+2-
x)2+…+(xn-
x)2=(x1-
x1+
x1-
x)2+(x2-
x1+
x1-
x)2+…+(xm-
x1+
x1-
x)2+(xm+1-
x2+
x2-
x)2+(xm+2-
x2+
x2-
x)2+…+(xn-
x2+
x2-
x)2=(x1-
x1)2+(x2-
x1)2+…+(xm-
x1)2+(xm+1-
x2)2+(xm+2-
x2)2+…+(xn-
x2)2
其中d²1+d²2称为组内离差平方和,表示两个组内数据的离散程度;记d²12是m个第一组数据平均数、(n-m)个第二组数据平均数关于总体数据平均数的离差平方和,称为组间离差平方和,表示两个组间的差异.
根据组内离差平方和最小的原则进行分组时,由于d²不变,既可以按d²1+d²2最小来分组,也可以按d²12最大来分组.根据组内离差平方和最小的原则,能使笔试成绩相差较小的应聘者分在同一组,计算这9种分法的组内离差平方和(结果保留小数点后一位).58646875768385899092分析:第一组1个、第二组9个数据,计算组内离差平方和;第一组2个、第二组8个数据,计算组内离差平方和;……如下表所示.分组第一组离差平方和第二组离差平方和第三组离差平方和第1个间隔0799.6799.6第2个间隔18503.5521.5第3个间隔50.7271.4322.1第4个间隔152.8170.8323.6第5个间隔228.854.8283.6第6个间隔411.326437.3第7个间隔587.44.7592.1第8个间隔819.52821.5第9个间隔1026.201026.2观察最后一列组内离差平方和可以发现,当按第5个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为{58,64,68,75,76}{83,85,89,99,92}(1)将数据由小到大排列;数据分组的步骤:(2)从m=1开始,分类讨论所有可能的分组情况;(3)分别计算全部数据和分组后数据的平均数;(4)计算两组的组内离差平方和(或组间离差平方和);(5)组内离差平方和最小(或组间离差平方和最大)的分组即为最合理的分组.知识归纳
例题与练习例10个城市某月的每日最高温度的平均数(简称平均高温)如表所示.城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃33-3-1110212212917根据平均高温的组内离差平方和最小的原则:把这10个城市分为两组.将它们分成两组共有9种情况,利用计算器或信息技术工具,分别计算组内离差平方和(结果保留小数点后一位),如下表所示:解:将表中的数据按从小到大排列:可得-11-33391012172122城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃33-3-1110212212917分组第一组离差平方和第二组离差平方和第三组离差平方和第1个间隔0584.2584.2第2个间隔32380.9412.9第3个间隔98.7285.7384.4第4个间隔132158.8290.8第5个间隔228.8113.2342第6个间隔308.862370.8第7个间隔397.414411.4第8个间隔5620.5562.5第9个间隔789.60789.6观察最后一列组内离差平方和可以发现,当按第4个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为{北京,石家庄,呼和浩特,哈尔滨}{上海,广州,海口,成都,贵阳,昆明}1.把表中10个城市的平均高温按组间离差平方和最大进行分组,应该如何分?结果和按组内离差平方和最小分组一致吗?城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃33-3-1110212212917按组间离差平方和最大的分组方式是:将前4个最低温的城市分为一组,后6个城市分为另一组。结果一致2.某年5个城市的人均生活用电量如下表所示。城市ABCDE人均生活用电量/(kW·h)910886847812788根据人均生活用电量的组内离差平方和最小的原则,把这5个城市分为两组.第一组:A(910)、B(886)、C(847)第二组:D(812)、E(788)3.某班7名学生的数学小测成绩:75,80,85,90,95,100,105,请按“组内成绩更集中”的原则分为两组(一组3人,一组4人),确定最优分组.解:方式1:第一组[75,80,85](3人),
第二组[90,95,100,105](4人).
方式2:第一组[75,80,85,90](4人),
第二组[95,100,105](3人).
最优分组为[75,80,85]和[90,95,100,105](或[75,80,85,90]和[95,100,105]).课堂小结数据的分组
组内离差平方和最小原则:
组内数据越集中,组间差异越清楚,分组才有意义随堂检测1.将数据2,8,4,10,1,7按照组内差异最小的原则分为两组时,需对()种分组方法分别进行组内离差平方和进行计算比较.A.4 B.5 C.6 D.3B2.小明将一组数据分成了两组{78,80}和{84,85,85,86},则第一组离差平方和与第二组离差平方和分别为(
)A.2,3 B.3,2C.3,4 D.2,2D3.关于数据分组的组间离差平方和与组内离差平方和,下列说法正确的是(
)A.总离差平方和=组间离差平方和-组内离差平方和B.组间离差平方和最大时,组内离差平方和也最大C.组间离差平方和最大时,组内离差平方和最小D.分组方式不影响组间和组内离差平方和的大小C4.5个城市的人均用水量数据为:12,15,18,22,25(单位:吨
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全管理工作培训
- 临电安全管理实务培训
- 招标专家培训考试题(含答案解析)
- 女生通信职业规划
- 辐射事故应对预案
- 家庭教育主题指南-1
- 在局2026年春节节后收假收心会上的讲话
- 河南省顶尖名校2026届高一数学第二学期期末综合测试模拟试题含解析
- 变速器厂报废品处置规范
- 安徽省阜阳市临泉县一中2026届高一下数学期末综合测试模拟试题含解析
- 大小微模型赋能先进制造:实践与思考
- 2026年春季学期学校少先队工作计划及分批入队实施方案
- 《身心健康很重要》-2025-2026学年统编版(新教材)小学道德与法治二年级下册
- 急危重症护理(高职)PPT完整全套教学课件
- 四年级美术下册(植物写生)教学课件
- GB/T 27501-2011pH值测定用缓冲溶液制备方法
- 湘教版七年级下册地理导学案
- 东北林业大学电子电工学222年阶段一考试试卷答案
- GA/T 1434-2017机动车查验检验智能终端通用技术要求
- 美学概论-课件
- 西方哲学史-导论课件
评论
0/150
提交评论