版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
24.4数据的分组第二十四章数据的分析
1.理解组内离差平方和、组间离差平方和的意义.
2.会根据组内离差平方和最小或组间离差平方和最大的原则,对数据进行分组.在社会生活中,分类现象普遍存在.超市里各种商品按用途不同分类摆放宾馆根据硬件设施、服务水平分成不同的星级对于一组取值多样的数据,对其进行合理分组,也会有助于我们解决问题.探究
数据的分组问题:某校根据义务教育阶段音乐、美术等学科的课程标准,在八年级随机抽取了若干名同学进行艺术测评与分析,下面是对八(1)班抽测到的10名同学的测评分值的数据分析过程:【收集与整理】10名同学的测评分值分组统计如下:分组方式组别测评分值方式一(按平均分相同分组)Ⅰ组80,85,85,90,100Ⅱ组80,85,90,90,95方式二(按分数段分组)甲组80,80,85,85,85乙组90,90,90,95,100分组方式组别中位数众数方差方式一Ⅰ组85
46Ⅱ组
9026方式二甲组8585
乙组9090
【描述与分析】(1)10名同学测评分值的分布情况分组绘制数据统
计量分析表,完成表格;8590616
数据的分组
阅读课本本课时“问题”至“思考”的相关内容,解答下列问题.1.思考:(1)“问题”中的83分与85分的差距很小,若以“85分及以上”为好成绩的标准,则85分属于好成绩,而83分属于差成绩.而从公司确定面试应聘的角度看,把笔试成绩相对______的分到一组,是一种较合理的做法.因此,笔试成绩可以根据组内差异最小的原则进行分组.接近
9探索新知问题一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进入面试.将10
名应聘者的笔试成绩(百分制)按从小到大的顺序排列如下:58646875768385899092你认为哪一部分应聘者应当进入面试?你怎么理解这句话?把笔试成绩分成好和差两组.好差进入面试淘汰58646875768385899092上面的问题可以理解为把这10名应聘者的笔试成绩分成好和差两组,则共有____种分组方法.9那如果要使每组组内的数据差距不大,且组与组之间的数据差别明显,那么你认为应遵循怎样的分组原则?
组内离差
平方和组间离差平方和
最小在前面的学习中,我们学习了离差平方和,了解到d2可以刻画一组数据的离散程度,结合上面的问题,你有什么想法?概念引入:(x1-x)2+(x2-x)2+…+(xn-x)2d2=一般地,设有n
个数据x1,x2,…,xn,其平均数记为x,则离差平方和为如果把这组数据分为两组,前m(m<n)个数据为一组,后(n-m)个数据为一组.它们的离差平方和分别为……m
个数据(n-m)个数据平均数:x1平均数:x2(x1-x1
)2+(x2-x1
)2+…+(xm-x1)2d12=(xm+1-x2
)2+(xm+2-x2
)2+…+(xn-x2)2d22=2.思考:怎么刻画组内笔试成绩差异的大小?哪种分法能使笔试成绩好和差两组的组内差异最小?【答案】利用组内离差平方和来刻画组内笔试成绩差异的大小.第5个间隔分组时,组内离差平方和最小.3.根据组内离差平方和最小的原则,可以计算出9种分法的组内离差平方和,如下表所示:分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔0
第2个间隔18
第3个间隔
第4个间隔
那么(x1-x)2+(x2-x)2+…+(xn-x)2d2==(x1-x1+x1-x)2+(x2-x1+x1-x)2+…+(xm-x1+x1-x)2
+(xm+1-x2+x2-x)2+…+(xn-x2+x2-x)2前m
个数据2倍项的和为2(x1+x2+…+xm-mx1
)(x1-x)由平均数的意义:x1+x2+…+xm=
mx1=0同理,后面(n-m)个数据的2倍项的和也为0.所有2倍项的和为0,计算时就不必考虑了.那么(x1-x)2+(x2-x)2+…+(xn-x)2d2==(x1-x1+x1-x)2+(x2-x1+x1-x)2+…+(xm-x1+x1-x)2
+(xm+1-x2+x2-x)2+…+(xn-x2+x2-x)2=(x1-x1
)2+(x2-x1
)2+…+(xm-x1
)2+(xm+1-x2)2+…+(xn-x2
)2+m(x1-x)2+(n-m)(x2-x)2=d12+d22+m(x1-x)2+(n-m)(x2-x)2d12+d22
称为组内离差平方和,表示两个组内数据的离散程度.
数据的分组
例1
为了解现在初中生每周锻炼时长(单位:小时)的情况,小明在
校园里随机抽取了8名同学进行调查,结果按从小到大排列为5,6,7,
8,8,8,9,13,将数据分为2组,A组{5,6,7,8},B组{8,8,9,
13},计算此时的组内离差平方和以及组间离差平方和.
这组数据的离差平方和,固定不变.最小最大
分组第1个间隔第2个间隔第3个间隔第4个间隔第5个间隔第6个间隔第7个间隔第8个间隔第9个间隔d12d12+d22
d22x1x25880.20799.6799.66182.2518503.5521.563.384.350.7271.4322.166.2585.8152.8170.8323.668.287.8228.854.8283.670.789411.326437.372.790.3587.44.7592.174.7591819.52821.576.4921026.201026.2最小当按第5个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为{58,64,68,75,76}和{83,85,89,90,92}分组第一组离差平方和第二组离差平方和组内离差平方和第5个间隔
第6个间隔
26
第7个间隔
第8个间隔
2
第9个间隔
0
续表观察最后一列组内离差平方和可以发现,当按第5个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为______________________________________.
例
10个城市某月的每日最高温度的平均数(简称平均高温)如表所示.城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃33-3-1110212212917(1)根据平均高温的组内离差平方和最小的原则,把这10个城市分为两组.解:将表中的数据按从小到大排列,可得-11-3
3
3
9
10
12
17
21
22城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃33-3-1110212212917将它们分成两组共有9种情况,利用计算器或信息技术工具,分别计算组内离差平方和(结果保留小数点后一位),如下表所示.1.
(北师八上P153例3改编)现有6个苹果,直径分别为80,65,
70,78,82,75.请按照“组内离差平方和达到最小”的方法,将这6个苹
果按直径大小分成两组.解:将6个数据由小到大排序:65,70,75,78,80,82.把6个数据分成两组,共有5种情况.分别计算组内离差平方和,结
果列表如下:城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃33-3-1110212212917(2)根据平均高温的组间离差平方和最大原则,把这10个城市分为两组.所得分组结果与(1)中结果一致吗?分别计算各组数据的平均数和组间离差平方和,如表所示:分组组间离差平方和第1个间隔-1110.44413.9第2个间隔-712.125585.2第3个间隔-3.6713.43613.7第4个间隔-215.17707.3第5个间隔0.216.4656.1第6个间隔1.8318627.3第7个间隔3.2920586.7第8个间隔521.5435.6第9个间隔6.7822208.5最大所得分组结果与(1)中结果一致.
数据的分组的应用
分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔0
第2个间隔32
第3个间隔
第4个间
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四年级数学运算定律与简便计算练习题(每日一练共38份)
- 宾客用餐安排管理流程细则
- 老人如厕协助护理规范
- 装配线关键零件尺寸控制计划
- 寄养区域安全规定管理程序
- 养殖户合作原材料验收制度
- 生产进度滞后预警纠偏
- 特殊护理岗位人员培训计划
- 涂装线关键传动部件维护制度
- 客户端版本冒烟测试规范文档
- 9686教学培训课件
- 2025年长沙市中考语文试卷真题(含答案及解析)
- 福州三年级期中数学试卷
- 2025中国恶性肿瘤报告
- 温宿县鑫达化工有限责任公司6万吨年甲醛(37%)、9000吨年多聚甲醛、1万吨年甲缩醛项目环境影响报告书
- 凤梨批发合同4篇
- 老年人骨关节疾病防治与护理
- 70篇短文记完1600核心词汇
- 2025年四川省成都市成华区中考二诊英语试题(原卷版+解析版)
- GB/T 3917.3-2025纺织品织物撕破性能第3部分:梯形试样撕破强力的测定
- 人工智能班会主题班会
评论
0/150
提交评论