版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第24章
数据的分析24.4数据的分组
(人教版)八年级下01教学目标02新知导入03新知讲解04课堂练习05课堂小结06板书设计01教学目标0102经历数据分类的活动,知道按照组内离差平方和最小的原则对数据进行分类的方法。能解释数据分析的结果,能根据结果作出简单的判断和预测,并能进行交流.02章节导入数据是信息的载体,从数据中获取信息是统计研究的目的.利用统计图表直观描述数据,可以帮助我们大致了解数据的特征或规律.但要准确把握数据的特征,还需要用数值进行刻画.在社会生活中,人们经常用一个或几个数值刻画一组数据的特征.例如,用人均可支配收入刻画一个地区居民的收入水平,用近视率刻画全国青少年群体的近视情况,用老龄化率刻画一个国家或地区人口的老龄化情况等.这里的人均可支配收入、近视率、老龄化率都是对相关数据某种特征的刻画.
在本章中,我们将在用统计图表直观描述数据的基础上,研究用数值刻画数据特征的方法,学习平均数、中位数、众数、离差平方和、方差、四分位数等一些常用的刻画数据特征的统计量,并用它们解决一些实际问题.对于通过简单随机抽样获取的数据,还将根据样本与总体的关系,用样本的特征估计总体的特征.02新知导入超市商品从“牛奶、面包、牙膏、洗发水”变成“食品区、日用品区、生鲜区”,能快速找到你要的东西.问:校医需分析七年级某班20名学生的身高分布:155,155,156,157,158,159,160,161,162,162,163,165,165,166,167,167,168,169,172,178.若想分为3组制作频数分布表,等距分组法(如150-160,160-170,170-180)可能存在什么问题?02新知导入有的组人数过多(如160-170集中12人),有的组过少(170-180仅2人),无法清晰反映分布特征.是否存在更科学的分组方法,使得每组内部数据尽可能相似?如何衡量“组内差异度”?03新知讲解问题一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进入面试.将10名应聘者的笔试成绩(百分制)按从小到大的顺序排列如下:58646875768385899092你认为哪一部分应聘者应当进入面试?自然,应当选择笔试成绩好的应聘者进人面试.那么笔试成绩怎样才算好呢?可以有不同的标准.例如,前三名或85分及以上等,不管哪种标准,目的都是把笔试成绩分成好和差两组.03新知讲解问题对笔试成绩进行分组,上面提到的标准各有其合理性,在实际中也经常被采用.但这些标准都没有考虑数据自身的特点,这可能导致两个很接近的笔试成绩被分到不同的组.例如,83分与85分的差距很小,若以“85分及以上”为好成绩的标准,则85分属于好成绩,而83分属于差成绩.而从公司确定面试应聘者的角度看,把笔试成绩相对接近的分到同一组,是一种较合理的做法.因此,笔试成绩可以根据组内差异最小的原则进行分组.03新知讲解问题将笔试成绩按从小到大的顺序排列,使相互最接近的笔试成绩都挨在了一起.因此,要使分组后的组内差异最小,只需在已排序数据的基础上寻找分组方法.可以发现,10个笔试成绩按顺序排列形成9个间隔,如图所示.58646875768385899092每个间隔都可以把笔试成绩分成好和差两组,共有9种分法.03新知讲解思考怎么刻画组内笔试成绩差异的大小呢?哪种分法能使笔试成绩好和差两组的组内差异最小?在前面的学习中,我们知道,离差平方和可以刻画一组数据的离散程度.下面我们利用离差平方和刻画组内数据的离散程度,进而对数据进行分组.03新知探究离差平方和:
如果把这组数据分为两组,前m(m<n)个数据为一组(称为第一组),后(n-m)个数据为一组(称为第二组),那么这n个数据的离差平方和可以分解为两类离差平方和:一类反映两个组内数据的离散程度另一类反映两组数据之间的差异程度03新知讲解它们的平均数分别记为
x1和
x2,离差平方和分别为
那么=(x1-
x)2+(x2-
x)2+…+(xm-
x)2+(xm+1-
x)2+(xm+2-
x)2+…+(xn-
x)2=(x1-
x1+
x1-
x)2+(x2-
x1+
x1-
x)2+…+(xm-
x1+
x1-
x)2+(xm+1-
x2+
x2-
x)2+(xm+2-
x2+
x2-
x)2+…+(xn-
x2+
x2-
x)203新知讲解=(x1-
x1)2+(x2-
x1)2+…+(xm-
x1)2+(xm+1-
x2)2+(xm+2-
x2)2+…+(xn-
x2)2
其中d²1+d²2称为组内离差平方和,表示两个组内数据的离散程度;记d²12是m个第一组数据平均数、(n-m)个第二组数据平均数关于总体数据平均数的离差平方和,称为组间离差平方和,表示两个组间的差异.
根据组内离差平方和最小的原则进行分组时,由于d²不变,既可以按d²1+d²2最小来分组,也可以按d²12最大来分组.03新知讲解根据组内离差平方和最小的原则,能使笔试成绩相差较小的应聘者分在同一组,计算这9种分法的组内离差平方和(结果保留小数点后一位).58646875768385899092分析:第一组1个、第二组9个数据,计算组内离差平方和;第一组2个、第二组8个数据,计算组内离差平方和;……03新知讲解分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔0799.6799.6第2个间隔18503.5521.5第3个间隔50.7271.4322.1第4个间隔152.8170.8323.6第5个间隔228.854.8283.6第6个间隔411.326437.3第7个间隔587.44.7592.1第8个间隔819.52821.5第9个间隔1026.201026.2如表所示.观察最后一列组内离差平方和可以发现,当按第5个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为{58,64,68,75,76}{83,85,89,99,92}03新知讲解例10个城市某月的每日最高温度的平均数(简称平均高温)如表所示.城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃33-3-1110212212917解:将表中的数据按从小到大排列,可得-11-33391012172122将它们分成两组共有9种情况,利用计算器或信息技术工具,分别计算组内离差平方和(结果保留小数点后一位),如表所示.03新知讲解例分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔0584.2584.2第2个间隔32380.9412.9第3个间隔98.7285.7384.4第4个间隔132158.8290.8第5个间隔228.8113.2342第6个间隔308.862370.8第7个间隔397.414411.4第8个间隔5620.5562.5第9个间隔789.60789.6
观察最后一列组内离差平方和可以发现,当按第4个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为{北京,石家庄,呼和浩特,哈尔滨}和{上海,广州,海口,成都,贵阳,昆明}.03新知讲解思考结合地理课所学知识,说一说这样分组合理吗?合理.因为第一组中的城市位于我国北方地区,普遍气温偏低,第二组中的城市位于我国南方,温度较高.03新知探究归纳总结
04课堂练习基础题1.将以下10个数据1,9,12,3,2,11,10,4,7,13按数值大小排序后,根据组内离差平方和最小的原则分为两组,最佳的分割点在第
4
个数据点之后.4
04课堂练习基础题城
市ABCDE人均用水量/(立方米/人)430380510456478根据人均用水量的组内离差平方和最小的原则,把这5个城市分为两组.2.去年5个城市的人均用水量如下表所示.04课堂练习基础题解:把数据从小到大排列为380,430,456,478,510,将它们分成两组共有4种情况,分别计算组内离差平方和如下表所示(结果保留一位小数):分
组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔03451.03451.0第2个间隔1250.01474.72724.7第3个间隔2984.0512.03496.0第4个间隔5336.005336.0观察最后一列组内离差平方和可以发现,当按第2个间隔分组时,组内离差平方和最小.因此可将这5个城市分为{A,B}和{C,D,E}04课堂练习提升题1.如图记录了某地连续5天的日最低气温,若把这5天的最低气温按组间离差平方和最大的原则分成两组,则这两组是__________________和_________________________.{星期一,星期二}{星期三,星期四,星期五}04课堂练习提升题解:将这5个数据从小到大排序:65,69,70,80,81.计算组内离差平方和(保留一位小数):2.5个苹果的直径(单位:mm)分别为65,69,81,80,70,按照“组内离差平方和最小”的原则,把这5个苹果按直径大小分成三组.04课堂练习提升题分组情况组内离差平方和第一组1个,第二组1个,第三组3个
74.0第一组1个,第二组2个,第三组2个
1.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 质量保障计划承诺书范文7篇
- 催促完成项目提案的提示函(4篇)
- 供应链管理体系优化与实施指南
- 电商运营实战手册打造爆款产品策略
- 企业市场推广效果监测预案
- 个人财产丢失调查预案警方协助预案
- 连锁超市库存管理与物流配送方案
- 酒店客房服务标准操作流程详细解析
- 企业品牌建设与传播标准化方案
- 商请确认2026年6月份客户订单交付进度的联系函6篇
- 外科无菌术及基本操作
- 2023年辽阳市太子河区数学六年级第二学期期末达标测试试题含解析
- 轮机概论-大连海事大学
- 基数效用理论 序数效用理论 消费者选择
- 大学生健康教育(复旦大学)【超星尔雅学习通】章节答案
- 国际贸易实务题库(含答案)
- SGRQ圣乔治呼吸问卷
- 2023-2025年xx市初中学业水平考试体育与健康考试体育中考理论考试题库
- SB/T 10479-2008饭店业星级侍酒师技术条件
- GB/T 13916-2013冲压件形状和位置未注公差
- 部编四年级下册道德与法治第二单元课件
评论
0/150
提交评论