版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
9.2.2
总体集中趋势的估计
学习目标
1.结合具体实例,理解样本平均数、中位数、众数的统计含义,掌握三类集中趋势统计量的求解方法,能用样本集中趋势估计总体集中趋势.
2.掌握利用频率分布直方图近似估计众数、中位数、平均数的方法,理解直方图估计的近似性与统计合理性.3.辨析平均数、中位数、众数的差异与适用场景,理解三者对极端值的敏感程度不同,能根据数据特征合理选择统计量分析数据、解决实际问题.4.深化“用样本估计总体”的统计大概念,发展数据分析、数学运算、逻辑推理核心素养,形成科学的数据解读与决策思维。.内容解析
核心问题:“数据整体集中在哪里、主流水平如何”?如果我只给你们一张频率分布直方图,把原始数据藏起来,你们还能不能找到这堆数据的‘中心’?你们找到的那个‘中心’,我敢不敢放心地用它来代表全体?。从“数据形态刻画”走向“数据特征量化”的核心进阶课.
第一层——三种“中心”的数学定义及其内在差异。
平均数基于所有数据的数值大小计算,是数值的“重心”;
中位数基于所有数据的排序位置确定,是位置的“中点”;
众数基于数据出现频数确定,是频数的“顶峰”。
三者的数学定义分别对应了数据的三种基本属性——数值大小、顺序位置和出现频次。这三种定义方式的内在差异决定了它们对数据特征的敏感度完全不同:
平均数利用全部数据信息、对极端值高度敏感,
中位数反映数据中间水平、抗极端值干扰;
众数反映数据最密集的局部特征、不受极端值影响(可能不唯一甚至不存在)。
内容解析
第二层——集中趋势度量的选择本质上是“代表性”标准的取舍。什么是数据的“中心”?这个问题没有一个唯一正确的答案。不同的“中心”定义背后,是对“用什么代表一组数据”这一问题的不同回答。平均数用“总和均分”的逻辑定义代表性——每个个体贡献相等的数值份额;中位数用“半数分界”的逻辑定义代表性——一半的数据在它之下、一半在它之上;众数用“最多出现”的逻辑定义代表性——这是最可能观测到的值。这三种代表性标准各有其适用场景和局限,选择哪一种,取决于我们想从数据中“看到什么”。
第三层——统计量选择的背后是“数据价值观”的体现。
这一层次超越了数学操作,进入数据素养的核心:面对同一组数据,选择不同的集中趋势度量会得出完全不同的结论。薪酬报告中用中位数还是平均数,传递的是完全不同的信息;鞋厂最关心众数还是平均数,决定了完全不同的生产策略。统计量不是中立的计算工具,它们分别放大了数据的不同侧面、屏蔽了其他侧面。学会根据问题的实际背景和决策目标选择恰当的统计量,并意识到选择本身就已经是一种“用数据说话”的方式——这是数据分析素养的高阶体现。情景1:某科技公司员工年薪数据(共15人):实习生(2人):4万元、4万元普通员工(8人):8万元、8万元、9万元、9万元、10万元、10万元、11万元、12万元部门经理(3人):25万元、28万元、30万元副总经理(1人):60万元总经理(1人):200万元
【环节一】情境导入——你的“工资”被平均了吗?问题1:如果你是这家公司的HR,招聘时你会对外宣传“公司平均年薪是多少”?问题2:如果你是工会代表,在谈判中你会强调哪个数字?问题3:如果你是媒体记者,要客观报道这家公司的薪酬水平,你会用什么数字?平均数(约28.53万元)中位数(10万元)平均数(约28.53万元)中位数(10万元)中数
4万、8万、9万、10万思考:为什么同一个数据会有三个完全不同的“中心”?哪个是“正确”的?情景1:某科技公司员工年薪数据(共15人):实习生(2人):4万元、4万元普通员工(8人):8万元、8万元、9万元、9万元、10万元、10万元、11万元、12万元部门经理(3人):25万元、28万元、30万元副总经理(1人):60万元总经理(1人):200万元众数:一组数据中出现次数最多的数据,反映数据最密集的主流水平;中位数:排序后位于中间位置的数据,反映数据中等水平、中间位次;平均数:所有数据的算术平均值,利用全部数据信息,反映数据整体平均水平。
面对同一组数据,有三种不同的“中心”。它们哪个“对”?哪个“更好”?
——关键不在于“对错”,而在于我们想从数据中看到什么、想让数据为谁“说话”。
【环节一】情境导入——你的“工资”被平均了吗?名称优点缺点众数体现了样本数据的最大集中点众数只能传递数据中的信息的很少一部分,对极端值不敏感.中位数不受少数几个极端值数据(即排序靠前或者靠后的数据)的影响.对极端值不敏感.平均数与中位数相比,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感任何一个数据的改变都会引起平均数的改变,数据越“离群”,对平均数的影响越大.
【环节一】情境导入——你的“工资”被平均了吗?情景2:日常生活中,我们常说“平均分”“平均水平”,也用“中等水平”“中等收入”等说法。“平均”和“中等”是一回事吗?用数学的语言说——平均数和中位数是什么关系?
【环节二】概念深化——“平均”和“中等”是一回事吗?当数据呈对称分布时,平均数≈中位数,两者的‘中心’指向同一位置在右偏分布中,少数极大值将平均数“拖向”右侧尾部,而中位数不受影响,仍代表“半数分界”在左偏分布中,少数极小值将平均数“拖向”左侧尾部,而中位数不受影响,仍代表“半数分界”平均数大于中位数平均数≈中位数平均数小于中位数结论:平均数总是在“长尾巴”那边
平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关,在图中的三种分布形态中,平均数和中位数的大小存在什么关系?单峰对称右拖尾左拖尾平均数大于中位数平均数≈中位数平均数小于中位数结论:平均数总是在“长尾巴”那边
【环节二】概念深化——“平均”和“中等”是一回事吗?
【环节三】策略建构——什么时候用什么?情景3:
(1)某制鞋厂统计了上个月所有顾客购买的鞋码数据,需要决定下个月各鞋码的生产数量。应当重点关注哪个集中趋势度量?
(2)某市政府要发布年度“居民收入水平报告”,既要反映整体收入状况,又要避免报告被少数超高收入者“绑架”。应当使用哪个集中趋势度量?为什么?
(3)某歌唱比赛中,7位评委对一位选手的评分分别为:9.2,9.3,9.1,9.5,9.4,7.0,9.3。组委会决定“去掉一个最高分和一个最低分,再计算平均分”。这种做法背后的统计道理是什么?众数——它直接对应最可能发生的需求政府发布的统计公报通常同时报告平均数和中位数,但中位数常被用作“典型收入”的代表。既有平均数的信息综合优势,又有中位数的稳健性
【环节四】几何直观——规则重构情景4:
样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始的样本数据,例如,我们在报纸、网络上获得的往往是已经整理好的统计表或统计图,这时该如何估计样本的平均数、中位数和众数?00.020.040.060.080.1频率/组距0.0770.1070.0430.0300.0300.0170.0100.0130.0071.24.27.210.213.216.219.222.225.228.2月均用水量/t一组数据中出现次数最多的数众数:在样本数据的频率分布直方图中,最高矩形的中点的横坐标.月均用水量在区间[4.2,7.2)内的居民最多,可以将这个区间的中点5.7作为众数的估计值.1.众数频数频率
【环节四】几何直观——规则重构情景4:
从直方图中,众数落在哪里最显眼?00.020.040.060.080.1频率/组距0.0770.1070.0430.0300.0300.0170.0100.0130.0071.24.27.210.213.216.219.222.225.228.2月均用水量/t
一组数据按大小顺序依次排序后,当数据个数是奇数时,处在最中间的数是中位数;当数据个数是偶数时,最中间两个数的平均数是中位数.中位数:把频率分布直方图划分成左右两侧面积相等的分界线与x轴交点的横坐标.50%0.2310.552设中位数为,解得面积2.中位数
【环节四】几何直观——规则重构情景4:
00.020.040.060.080.1频率/组距0.0770.1070.0430.0300.0300.0170.0100.0130.0071.24.27.210.213.216.219.222.225.228.2月均用水量/t3.平均数平均数:等于各小矩形的面积乘以其底边中点的横坐标之和.
【环节四】几何直观——规则重构情景4:
加权平均数由频率分布直方图估计总体的集中趋势众数:最高矩形的中点中位数:中位数左边的直方图面积和右边的直方图面积相等
平均数:每个小矩形底边中点的横坐标与小矩形的面积的乘积之和
注:频率分布直方图损失了些样本数据,得到的是一估计值,且所得估值与数据分组有关,有随机性。
【环节四】几何直观——规则重构情景4:
1、某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数.(3)求这次测试数学成绩的平均分.
【环节五】当堂检测——闭环达标1、某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(3)求这次测试数学成绩的平均分.
【环节五】当堂检测——闭环达标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山东省德州市夏津县2024-2025学年七年级上学期语文期末试卷(含答案)
- 第四单元(A卷基础巩固卷)-《思政 心理健康与职业生涯》(高教版) 单元过关卷答案
- 医院专供消毒用品批发合同
- 2026年环境保护法规知识竞赛试题
- 班级生活有规则(第1课时)教学设计-2026-2027学年道德与法治二年级上册统编版
- 提升恙虫病护理质量的探索
- 支原体肺炎的护理研究进展
- 椎管内肿瘤患者的深静脉血栓预防护理
- 护理多媒体课件制作竞技赛
- 护理课件下载的使用技巧与分享
- 湖南省天壹名校联盟2026届高三5月全真模拟适应性考试英语+答案
- 2025河南省中考历史真题(原卷版)
- 2026年基金从业资格考试基金法律法规真题与答案
- 2026宁夏电投永利能源有限公司招聘21人考试备考试题及答案解析
- 2026年山东司法警官职业学院公开招聘人员(42名)笔试备考试题及答案解析
- 中国邮政公司招聘笔试题库2026
- 深基坑监测监控监理实施细则
- 中国肿瘤整合诊疗指南(2025版)结直肠癌及肛管癌解读
- 2026年岭南版小学二年级美术下册(全册)每课教学设计(附目录)
- 2025内蒙古民政厅事业单位笔试试题及答案
- 国为什么说勇于自我革命是党能够引领社会革命的根本原因?参考答案(三)
评论
0/150
提交评论