版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第20章
数据的初步分析20.5数据分组导入新课
方差可以反映数据的波动程度:方差越大,数据的波动越大;方差越小,数据的波动越小.
我国10个省份某年人均地区生产总值(简称人均GDP,单位:万元)的数据如下表所示:如何将这些省份按人均GDP分成两组,保证“组内省份的GDP差不多,组间差异大”?省份序号12345678910人均GDP/万元15.686.2410.117.1816.4212.137.3710.078.857.16知识模块一组内、组间离差平方和的有关概念及计算探究新知
一个合理的分组原则是使组内离差平方和达到最小,组间离差平方和达到最大.由于总体离差平方和
S2不变,只需考虑使组内离差平方和达到最小即可.省份序号12345678910人均GDP/万元15.686.2410.117.1816.4212.137.3710.078.857.16解:将表中10个数据按从小到大排列,得到6.24,7.16,7.18,7.37,8.85,10.07,10.11,12.13,15.68,16.42.将它们分成两组共有9种情况,分别计算组内离差平方和,如下表.分组组内离差平方和第1个间隔第2个间隔第3个间隔第4个间隔第5个间隔第6个间隔第7个间隔第8个间隔第9个间隔99.54687.02370.70650.82240.05036.28624.71328.39972.195
观察组内离差平方和可以发现,当按第5个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为{省份2,省份3,省份4,省份7,省份8,省份9,省份10}和{省份1,省份5,省份6}.典例精析范例1:研究人员比较两种教学法(甲、乙)的效果.甲教学法组3人,成绩为{85,90,95};乙教学法组3人,成绩为{75,80,85}.(1)计算总平均值;(2)计算总体离差平方和;
(2)总体离差平方和85)2+(90-85)2+(95-85)2+(75-85)2+(80-85)2+(85-85)2=0+25+100+100+25+0=250.(3)计算组内离差平方和;(4)计算组间离差平方和;
组内离差平方和为85-90)2+(90-90)2+(95-90)2+(75-80)2+(80-80)2+(85-80)2=(25+0+25)+(25+0+25)=100.(4)组间离差平方和为3×(90-85)2+3×(80-85)2=3×25+3×25=150.(5)验证总体离差平方和=组内离差平方和+组间离差平方和是否成立.(5)100+150=250成立.知识模块二利用组内离差平方和进行分组10个城市某月的每日最高温度的平均数(简称平均高温)如下表所示.根据平均高温的组内离差平方和最小的原则,把这10个城市分为两组.城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃1191012162123242118城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃1191012162123242118解:将表中的数据按从小到大排列,可得-11-33391012172122将它们分成两组共有9种情况,分别计算组内离差平方和(结果保留小数点后一位),如下表所示.分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔第2个间隔第3个间隔第4个间隔第5个间隔第6个间隔第7个间隔第8个间隔第9个间隔03298.7132228.8308.8397.4562789.6584.2380.9285.7158.8113.262140.50584.2412.9384.4290.8342370.8411.4562.5789.6观察最后一列组内离差平方和可以发现,当按第4个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为{北京,石家庄,呼和浩特,哈尔滨}和{上海,广州,海口,成都,贵阳,昆明}.合理.这样分组大致沿秦岭淮河一线分为南北方.结合地理课所学知识,说一说这样分组合理吗?组内离差平方和最小原则进行数据分组的步骤:(1)列数据:将已知数据按从小到大的顺序排列.(2)列表:分别求数据每一个间隔的分组分成的两组数据的离差平方和.(3)求和:将两组数据的离差平方和求和,选择组内离差平方和最小的分法.(4)写结论:按所求间隔分组,得出结论.典例精析范例2:某班7名学生的数学小测成绩:75,80,85,90,95,100,105,按“组内成绩更集中”的原则分为两组(一组3人,一组4人),确定最优分组.方式1:第一组{75,80,85}(3人),第二组{90,95,100,105}(4人).
离差平方和为(75-80)2+(80-80)2+(85-80)2=25+0+25=50.
离差平方和为90-97.5)2+(95-97.5)2+(100-97.5)2+(105-97.5)2=56.25+6.25+6.25+56.25=125.组内离差平方和为50+125=175.方式2:第一组{75,80,85,90}(4人),第二组{95,100,105}(3人).
离差平方和为(75-82.5)2+(80-82.5)2+(85-82.5)2+(90-82.5)2=56.25+6.25+6.25+56.25=125.
离差平方和为(95-100)2+(100-100)2+(105-100)2=25+0+25=50.组内离差平方和为125+50=175.步骤3:结论最优分组为{75,80,85}和{90,95,100,105}(或{75,80,85,90}和{95,100,105}),组内离差平方和最小,组内成绩更集中.归纳总结数据的分组组内离差平方和:数值越小,组内差异越小组间离差平方和:数值越大,不同组之间差异越明显总体离差平方和=组内+组间根据组内离差平方和最小的原则分组随堂练习1.在跳绳测试中,某小组5位成员每分钟跳绳次数如下:175,176,175,175,180,若根据每分钟跳绳次数的组内离差平方和最小的原则将这5位成员分成两组,则需将数据由________到______排列,共分成________种情况.小大4
B分组第1个间隔012.7612.76第2个间隔0.56.757.25第3个间隔22.674.67第4个间隔505第5个间隔14.8014.83.小明将一组数据分成了两组{78,80}和{84,85,85,86},则第一组离差平方和与第二组离差平方和分别为(
)A.2,3B.3,2C.3,4D.2,2D4.10个城市某月的每日最高温度的平均数(简称平均高温)如表所示.根据平均高温的组内离差平方和最小的原则:把这10个城市分为两组.城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃33-3-1110212212917将它们分成两组共有9种情况,利用计算器或信息技术工具,分别计算组内离差平方和(结果保留小数点后一位),如表所示分组第一组离差平方和第二组离差平方和第三组离差平方和第1个间隔0584.2584.2第2个间隔32380.9412.9第3个间隔98.7285.7384.4第4个间隔132158.8290.8第5个间隔228.8113.2342第6个间隔308.862370.8第7个间隔397.414411.4第8个间隔5620.5562.5第9个间隔789.60789.6将表中的数据按从小到大排列:可得-11-33391012172122
观察最后一列组内离差平方和可以发现,当按第4个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为{北京,石家庄,呼和浩特,哈尔滨}和{上海,广州,海口,成都,贵阳,昆明}.解:将这5个数据从小到大排序:65,69,70,80,81.计算组内离差平方和(保留一位小数):4.5个苹果的直径(单位:mm)分别为65,69,81,80,70,按照“组内离差平方和最小”的原则,把这5个苹果按直径大小分成三组.分组情况组内离差平方和第一组1个,第二组1个,第三
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年及未来5年市场数据中国5G基带芯片行业市场竞争格局及投资前景展望报告
- 2026中医养生异业联盟建设课件
- 2026年及未来5年市场数据中国汽车车桥行业市场竞争格局及投资前景展望报告
- 2026中医养生售后服务体系课件
- 2026中医养生医师选择注意课件
- 13 最后一次讲演 新教材统编版八年级语文下册
- 网络服务平台服务水准承诺保证承诺书(8篇)
- 互联网教育质量管控责任承诺书7篇
- 数据安全防护遵守承诺书范文3篇
- 公司产品品质和信用保证函4篇
- (甘肃二模)甘肃省2026年高三年级第二次模拟考试生物试卷(含答案)
- 2024年广东省深圳市中考语文试题(原卷版)
- 2026届江苏省南京市、盐城市高三一模英语卷(含答案)
- 2026年数据资产合规性评估报告范本
- 统编版(新版)道德与法治八年级下册课件13.1全面依法治国的指导思想
- 2026年南阳农业职业学院单招职业适应性考试题库及答案详解(真题汇编)
- 2025年三季度云南航空产业投资集团招聘(云南云航投现代物流有限公司岗位)考试笔试历年常考点试题专练附带答案详解2套试卷
- 公路工程项目首件工程认可制监理实施细则
- 3.长方体和正方体(单元测试)2025-2026学年五年级数学下册人教版(含答案)
- 八大特殊作业安全管理流程图(可编辑)
- 【《基于西门子S7-300PLC的液位控制系统设计与实现》9300字(论文)】
评论
0/150
提交评论