版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
19.3借助箱线图描述数据的分布问题1某市去年4月30天的空气质量指数(AQI)如下:60,39,65,82,60,89,109,81,73,69,103,156,62,41,55,123,164,73,45,90,64,54,70,59,73,86,91,58,63,82.你认为该市去年4月空气质量怎么样?根据学过的知识,你认为用什么来描述空气质量?平均数反映空气质量的好坏.方差反映空气质量的稳定性.60,39,65,82,60,89,109,81,73,69,103,156,62,41,55,123,164,73,45,90,64,54,70,59,73,86,91,58,63,82.该市去年4月AQI的平均数和方差分别为x
≈77.97,σ2≈839.63.AQIAQI级别AQI类别及表示颜色0~50一级优绿色51~100二级良黄色101~150三级轻度污染橙色151~200四级中度污染红色201~300五级重度污染紫色>300六级严重污染褐红色怎样描述该市去年4月AQI的分布情况呢?AQI(x)25<x≤5050<x≤7575<x≤100100<x≤125125<x≤150150<x≤175频数3157302某市去年4月AQI的频数分布表(1)该市去年4月AQI的类别以良为主,有22天(约占
全月30天的73%)AQI处于50和100之间.(2)有3天类别为优,3天为轻度污染,还有2天AQI异常
大,为中度污染,没有重度污染和严重污染的情况.良优轻度污染中度污染0246810121416255075100125150175AQI频数某市去年4月AQI的频数分布直方图(3)数据的分布左、右不对称,
中心偏向较低的AQI,有一个高峰.(4)AQI处于50和75之间的天数最多.除了分布表和直方图,还常用箱线图来描述数据的分布情况.箱线图概念引入:用最大值(除去异常值之后)、上四分位数、中位数、下四分位数和最小值(除去异常值之后)这五个指标来描述数据分布的统计图称为箱线图.最小值下四分位数中位数上四分位数最大值画箱线图要用到四分位数,你知道什么是四分位数吗?概念引入:一组数据按从小到大的顺序排列,中位数是从中间点把数据分成2等份.将数据分成100等份的每一分点处的值叫作这组数据的百分位数.百分位数的优点:可以较全面地反映出数据的分布信息.60,39,65,82,60,89,109,81,73,69,103,156,62,41,55,123,164,73,45,90,64,54,70,59,73,86,91,58,63,82.在实际应用中,有时候数据个数不多,我们可以用三个特殊的百分位数来刻画.25%分位数50%分位数75%分位数想一想,怎么找出这些特殊的百分数?按从小到大的顺序排列60,39,65,82,60,89,109,81,73,69,103,156,62,41,55,123,164,73,45,90,64,54,70,59,73,86,91,58,63,82.39,41,45,54,55,58,59,60,60,62,63,64,65,69,70,73,73,73,81,82,82,86,89,90,91,103,109,123,156,164.71.5所有数据中小于71.5的占50%,称71.5为这组数据的50%分位数,也叫中位数.用最大值(除去异常值之后)、上四分位数、中位数、下四分位数和最小值(除去异常值之后)这五个指标来描述数据分布的统计图称为箱线图.最小值下四分位数中位数上四分位数最大值画箱线图要用到四分位数,那什么是四分位数呢?箱线图有时也画成横图的形式一组数据按从小到大的顺序排列,中位数是从中间点把数据分成2等份.将数据分成100等份的每一分点处的值叫作这组数据的百分位数.在百分位数中,25
%
分位数、50
%
分位数、75
%
分位数是三个最常用的百分位数,它们把一组数据分为个数相等的四部分,因此分别称为下四分位数、中位数和上四分位数,统称四分位数.百分位数(整组数据)50%分位数(中位数)25%分位数(下四分位数)75%分位数(上四分位数)60,39,65,82,60,89,109,81,73,69,103,156,62,41,55,123,164,73,45,90,64,54,70,59,73,86,91,58,63,82.在实际应用中,有时候数据个数不多,我们可以用三个特殊的百分位数来刻画.25%分位数50%分位数75%分位数可以较全面地反映数据的分布信息怎么找出这些特殊的百分数?最小值下四分位数中位数上四分位数最大值四分位数39,41,45,54,55,58,59,60,60,62,63,64,65,69,70,73,73,73,81,82,82,86,89,90,91,103,109,123,156,164.608971.525%分位数50%分位数75%分位数由于60,71.5,89这三个值把这组按由小到大顺序排列的数据分成四等份,所以称它们为这组数据的四分位数.第一四分位数第二四分位数第三四分位数下四分位数(Q1)中位数(Q2)上四分位数(Q3)1.某校18个班参加艺术节合唱比赛,通过简单随机抽样,抽得8个班的比赛得分为:91,90,94,87,93,96,91,85,
则这组数据的75%分位数为_______.85879091919394969188.593.525%分位数50%分位数75%分位数93.51.某校18个班参加艺术节合唱比赛,通过简单随机抽样,抽得8个班的比赛得分如下:91,90,94,87,93,96,91,85,
则这组数据的75%分位数为_______.85879091919394969188.593.525%分位数50%分位数75%分位数93.52.一组数据按从小到大排列为:16,25,33,39,43,m,65,70.
若这组数据的下四分位数与上四分位数的和是85,
则m
=_____.16
25
33
39
43
m
65
70
4129
下四分位数(Q1)中位数(Q2)上四分位数(Q3)29+
=85m=4747求四分位数的方法:(1)先将这组数据从小到大排列;(2)求这组数据的中位数Q2;(3)求这组数据的下四分位数Q1,上四分位数Q3;
39,41,45,54,55,58,59,60,60,62,63,64,65,69,70,73,73,73,81,82,82,86,89,90,91,103,109,123,156,164.608971.5下四分位数中位数上四分位数现在你知道怎么画箱线图吗?动手试一试.39,41,45,54,55,58,59,60,60,62,63,64,65,69,70,73,73,73,81,82,82,86,89,90,91,103,109,123,156,164.608971.5下四分位数中位数上四分位数先画一条统计量的刻度线.180160140120100806040200箱线图主要由矩形箱体和从箱体延伸出的两条竖直线段(称为须线)构成.箱体须线须线2.一组数据按从小到大排列为:16,25,33,39,43,m,65,70.
若这组数据的下四分位数与上四分位数的和是85,
则m
=_____.16
25
33
39
43
m
65
70
4129
下四分位数(Q1)中位数(Q2)上四分位数(Q3)4729+
=85
39,41,45,54,55,58,59,60,60,62,63,64,65,69,70,73,73,73,81,82,82,86,89,90,91,103,109,123,156,164.608971.5下四分位数中位数上四分位数现在你知道怎么画箱线图吗?动手试一试.39,41,45,54,55,58,59,60,60,62,63,64,65,69,70,73,73,73,81,82,82,86,89,90,91,103,109,123,156,164.608971.5下四分位数中位数上四分位数先画一条统计量的刻度线.180160140120100806040200箱线图主要由矩形箱体和从箱体延伸出的两条竖直线段(称为须线)构成.箱体须线须线思考2:要寻找以下信息,是借助频数分布直方图还是箱线图?①该市去年4月AQI有没有异常值;②按AQI排序分段后,天数最多或最少的那一段AQI的变化范围;③该市去年4月AQI不超过75的天数;④该市去年4月空气质量最好的七八天里,AQI的变化范围.箱线图频数分布直方图箱线图频数分布直方图180160140120100806040200下边缘39下四分位数60中位数71.5上四分位数89上边缘123异常值156和164某市去年4月AQI的箱线图0246810121416255075100125150175AQI频数某市去年4月AQI的频数分布直方图180160140120100806040200下边缘39下四分位数60中位数71.5上四分位数89上边缘123异常值156和164某市去年4月AQI的箱线图0246810121416255075100125150175AQI频数某市去年4月AQI的频数分布直方图①箱线图的核心功能之一是识别异常值.直方图虽然也能看出极端值,但无法明确界定哪些是统计意义上的异常值.②"天数最多或最少"即频数最多或最少的组,需要先看各组的频数分布,再确定该组对应的AQI区间范围.这是直方图的典型应用场景.③需要统计AQI≤75这个区间内包含的频数(天数).直方图可以直接读出该区间对应的矩形高度(频数),而箱线图不保留原始分组频数信息.④"空气质量最好的七八天"即AQI最低的7-8个数据(约占总天数的25%,4月共30天).这对应的是下四分位数附近或以下的数据,箱线图能清晰展示下四分位数、最小值及整体下半部分的分布范围,更适合分析特定百分位区间的波动范围.思考要寻找以下信息,可以借助上面的频数分布直方图还是箱线图?①该市去年4月AQI有没有异常值;②按AQI排序分段后,天数最多或最少的那一段AQI的
变化范围;③该市去年4月AQI不超过75的天数;④该市去年4月空气质量最好的七八天里,AQI的变化范围.0246810121416255075100125150175AQI频数180160140120100806040200频数分布直方图是将涵盖数据最小值和最大值的这一整段等距分组后,回答诸如“每一段内有多少个数据”这样的问题.0246810121416255075100125150175AQI频数180160140120100806040200箱线图则是将所有数据等分为数据量相同的4个组(每组有四分之一总量个数据),通过计算下四分位数、中位数和上四分位数来确定“箱体”的位置,从而回答诸如“中间50%的数据处在哪个范围”这样的问题.这两种统计图在描述数据的整体分布上各有特点,适用于不同的分析需求.图表类型主要功能适用场景频数分布直方图展示数据在各区间内的频数分布看数据集中趋势、分布形态、各区间频数箱线图展示数据的五数概括和离散程度看数据分散程度、中位数、四分位数、异常值箱线图在表示数据方面的特点:1.能直观展示数据分布特征:通过箱线图的箱子,可以直观地看出数据的集中趋势(中位数)、离散程度(四分位距和全距)以及数据的偏态性(箱子上下部分的长短);2.能识别异常值:箱线图能清晰地标记出异常值,超出须的范围的点即为异常值,便于分析数据中是否存在特殊情况;3.数据信息简洁明了:相比于大量原始数据,箱线图用几个关键数值(最小值、下四分位数、中位数、上四分位数、最大值)就能概括数据的主要特征,便于不同数据集之间的比较.2.在某项测试中,甲同学的12次测试成绩见下表:(1)将最小值、下四分位数、中位数、上四分位数和最大值标记在如图所示的箱线图中.(2)甲同学测试成绩中有几次测试成绩大于上四分位数?分别是哪几次?(3)甲同学测试成绩介于70.5和89.5之间的次数是否比介于89.5和97.5之间的次数多?第1次第2次第3次第4次第5次第6次测试成绩909770896270第7次第8次第9次第10次第11次第12次测试成绩71103809298981051009590858075706560
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年厦大附属翔安实验学校公开招聘非在编合同教师备考题库及参考答案详解1套
- 2026年度市政道路施工供应合同
- 彩钢瓦喷面漆施工工艺
- 塑料板地面施工控制要点
- 2026绵阳汇鑫人力资源服务有限公司招聘56人笔试参考题库及答案解析
- 2025年全国一级建造师考试真题及答案解析
- 2026内蒙古呼和浩特市玉泉区西菜园社区卫生服务中心招聘1人笔试备考试题及答案解析
- 2026年深圳市社区工作者招聘考试备考试题及答案详解
- 2026上海市宝山区新江湾实验学校教师招聘(全学段+全学科)笔试备考题库及答案解析
- 2026年襄樊市交通运输系统事业单位人员招聘考试备考试题及答案详解
- 供应商评估打分表
- 广联达教程全套课件
- 体外诊断试剂设计开发与注册申报工作程序
- 【语言学习】趣味识字:孤字的前世今生
- DB32T 1363-2017高速公路养护工程施工安全技术规程
- 水利水电工程设计工程量计算规定
- 2023年技术经纪人初级考试题目
- GB/T 13277.3-2015压缩空气第3部分:湿度测量方法
- GA/T 508-2014道路交通信号倒计时显示器
- GA/T 1356-2018国家标准GB/T 25724-2017符合性测试规范
- 冠状动脉粥样硬化性心脏病lxf课件
评论
0/150
提交评论