版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二十四章数据的分析24.3数据的四分位数目录1.学习目标4.知识点1 百分位数和四分位数6.课堂小结7.当堂小练CONTENTS9.拓展与延伸3.新课导入8.对接中考2.知识回顾5.知识点2 箱线图1.知道百分位数和四分位数,能计算一组数据的四分位数,正确理解四分位数如何刻画数据的取值特征,会用样本数据的数字特征分析相关问题.2.了解四分位数和箱线图的关系,知道箱线图可以直观反映数据分布的信息,感悟百分位数的意义,形成和发展数据观念.学习目标知识回顾
平均数的定义一般地,一组数据按从小到大(或从大到小)的顺序排列,处于中间位置的数叫作这组数据的中位数.中位数的定义一组数据中出现次数最多的数据叫作这组数据的众数.众数的定义
方差的计算公式新课导入
集中趋势和离散程度都是数据分布某一方面的特征.为了获取数据更多的信息,人们还关心数据整体的分布情况.本节我们将学习用四分位数大致刻画一组数据的分布情况.新课讲解知识点1百分位数和四分位数问题某银行有A和B两个理财经营团队.近三年,这两个团队分别负责经营12项理财产品,收益率(单位:%)如下:如果你是一位购买理财产品的投资人,会选择哪个团队的产品?A4.773.986.444.892.153.853.643.213.182.024.114.10B3.183.843.993.673.403.604.104.214.154.443.873.91
新课讲解思考如果投资者还想进一步了解两个团队理财产品收益率的具体情况,例如收益率大部分在什么范围,哪些范围比较集中等信息,那么产品收益率的平均数和方差能反映出这些信息吗?
平均数和方差虽然可以反映产品收益率的集中趋势和离散程度,但无法反映出投资客户关心的这些信息.因此,我们需要能反映产品收益率更多分布信息的统计量.新课讲解由于每个团队的产品收益率的数据个数不多,我们可以用三个特殊的百分位数来刻画.如图所示,把团队A的产品收益率按从小到大的顺序排列.2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.443.915在3.915左侧和右侧的数据中,还可以分别得到它们各自的中位数3.195和4.44,所有数据中小于这两个值的分别占25%和75%,称3.195和4.44分别为这组数据的25%分位数和75%分位数.4.443.19550%分位数75%分位数25%分位数容易得到这组数据的中位数为3.915,这个值把所有数据分成2等份,所有数据中小于这个值的占50%,称3.915为这组数据的50%分位数.新课讲解
由于3.195,3.915,4.44这三个值把这组按由小到大顺序排列的数据分成四等份,所以称它们为这组数据的四分位数,从小到大分别称为这组数据的第一四分位数、第二四分位数(中位数)、第三四分位数,分别记为Q1,Q2,Q3.2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.443.9154.443.195
第一四分位数
第二四分位数
第三四分位数新课讲解2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.443.9154.443.195
由团队A产品收益率的三个四分位数,可以大致看出其产品收益率的分布情况.
其产品收益率小于3.195%的项目数占总数的25%,产品收益率小于3.915%的项目数占总数的一半,产品收益率大于4.44%的项目数占总数的25%.产品收益率在3.195%至4.44%之间的项目数占总数的50%.
第一四分位数
第二四分位数
第三四分位数3.18,3.40,3.60,3.67,3.84,3.87,3.91,3.99,4.10,4.15,4.21,4.443.893.6354.125第一四分位数第二四分位数第三四分位数类似地,如图,可以得到团队B产品收益率的三个四分位数.
由团队B产品收益率的三个四分位数可以知道,其产品收益率小于3.635%的项目数占总数的25%,产品收益率小于3.89%的项目数占总数的一半,产品收益率大于4.125%的项目数占总数的25%.产品收益率在3.635%至4.125%之间的项目数占总数的50%.新课讲解
一组数据按从小到大的顺序排列,中位数是从中间点把数据分成2等份.将数据分成100等份的每一分点处的值叫作这组数据的百分位数.相比中位数,百分位数可以较全面地反映出数据的分布信息.百分位数的定义将一组按由小到大顺序排列的数据分成四等份的三个值,称为这组数据的四分位数,从小到大分别称为这组数据的第一四分位数(下四分位数)、第二四分位数(中位数)、第三四分位数(上四分位数),分别记作Q1,Q2,Q3.四分位数的定义新课讲解例1.某射击运动员射击12次,成绩(单位:环)如下:10,10.2,10.3,9.8,10.8,10.5,10.8,10.6,10.9,10.8,9.9,10.求这组数据的四分位数.
新课讲解练一练1.周老师根据班级学生某次练习中某道题(满分4分)的得分情况,绘制了如下统计图.该班学生这道题得分的下四分位数是______,中位数是______,上四分位数是______.33.54新课讲解练一练2.任何一组数据的四分位数,是否都恰好能把这组数据分成四等份?举例说明.解:四分位数并不总是能将数据分成四等份,特别是当数据的数量不是4的倍数时.但在理论上,四分位数的目标是尽量接近这种划分.新课讲解注意确定一组数据四分位数的步骤及方法步骤方法(1)将数据按从小到大排列(2)确定第二四分位数Q2数据个数是奇数,最中间数是第二四分位数;数据个数是偶数,最中间两数的平均数是第二四分位数;(3)确定第一四分位数Q1和第三四分位数Q3小于Q2数据的中位数是第一四分位数Q1,大于Q2数据的中位数是第三四分位数Q3确定位置是关键:数据个数为奇数和偶数时,中位数的确定方法不同.新课讲解知识点2箱线图2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.443.9154.443.195
第一四分位数
第二四分位数
第三四分位数234567收益率/%团队A产品收益率的箱线图如下图所示.为了更加直观地观察产品收益率的分布特征,我们可以用产品收益率的三个四分位数及最小值、最大值这五个数值画出箱线图.新课讲解234567收益率/%最小值最大值第一四分位数第二四分位数第三四分位数
整个箱体的长度为第三四分位数减去第一四分位数的差,称为四分位距.由箱线图,容易看出产品收益率分布的大致情况,如分布的范围、中位数的大小、集中的范围、分布是否对称等.它主要由矩形箱体和从箱体延伸出的两条水平线段(称为须线)构成.新课讲解你会画出团队B产品收益率的箱线图吗?3.18,3.40,3.60,3.67,3.84,3.87,3.91,3.99,4.10,4.15,4.21,4.443.893.6354.125第一四分位数第二四分位数第三四分位数234567收益率/%探究新课讲解箱线图的画法1.找出一组数据的最小值、第一四分位数、中位数、第三四分位数和最大值,并用5条横线分别对应这5个数据;2.连接第一四分位数和第三四分位数,画出“箱体”;3.将最小值和最大值与“箱体”相连接,中位数在“箱体”中间.注意箱线图可以画成竖直的,也可以画成横向的.新课讲解箱线图也可以按竖直方向画.为了便于比较两个团队产品收益率的分布特征,把两个箱线图按竖直方向并列画在同一幅图中,如左图所示.收益率/%76543210A团队B团队从图中可以发现,两个团队产品收益率的中位数几乎相等(表示中位数的水平线段差不多高),但团队A的产品收益率波动明显比团队B的大(团队A的箱体和须线比团队B的长),这与用平均数、方差比较的结果是一致的.
从箱线图中,还可以看出分布的一些其他特征.
例如,团队B的产品收益率分布比团队A的更对称(中位数对应的水平线段在箱子的中间位置),团队A有约25%的产品收益率高于团队B的最高产品收益率,也有约25%的产品收益率低于团队B的最低产品收益率,等等.新课讲解与直方图、条形图比较,箱线图在表示数据方面有什么特点?与直方图、条形图相比,箱线图具有以下特点:(1)能够清晰地展示数据的分布范围、集中程度,适合分析数据的分布特征;(2)适合多组数据对比,箱线图可以轻松地并排绘制多个数据集,便于直观比较不同组数据的分布差异;(3)适用于大数据集,箱线图在数据量较大时仍然能够清晰展示数据的分布特征,而不会像直方图或条形图那样显得过于拥挤.思考新课讲解例2.根据下表中的数据,分别计算甲、乙两地气温的四分位数,在同一幅图中画出箱线图,据此比较甲、乙两地的气温特点.解:将表中两地的气温(单位:℃)分别按从小到大的顺序排列,可得
甲地9101112131416161821212324
乙地11121314151516171718192021时刻0:002:004:006:008:0010:0012:0014:0016:0018:0020:0022:0024:00甲/℃1191012162123242118161413乙/℃13111214151719212018171615
在同一幅图中画出两地气温的箱线图,如图所示.可以看出,甲、乙两地气温的中位数相同,但甲地气温的波动明显比乙地的大,甲地约有25%时刻的气温高于乙地的最高温度,约有25%时刻的气温低于乙地的最低温度.新课讲解例3.在某场女排决赛中A队战胜B队获得冠军.下图反映了两队队员拦网高度情况,请比较两队拦网高度情况.解:整体水平:A队拦网高度的中位数高于B队,说明A队队员拦网高度的中间水平比B队高;
离散程度:A队拦网高度的四分位距(箱子长度)小于B队,说明A队队员拦网高度的中间50%的数据离散程度比B队小,即B队拦网高度数据在中间部分的差异更大.新课讲解箱线图能较为全面的反映数据的分布情况:1.箱体长度:箱体越长,中间50%的数据越分散;箱体越短,中间50%的数据越集中.2.须线长度:须线越长,说明数据在两端分布越广,数据整体离散程度高;须线越短,说明数据在两端分布越集中,离散程度低.3.上须线显著长于下须线:存在偏大的值;下须线显著长于上须线:存在偏小的值;须线长度基本对称:数据在两端均匀分布.归纳新课讲解练一练1.已知八年级(1)班和(2)班的人数相等,在一次考试中两个班成绩的箱线图如图所示,则下列说法正确的是()A.(1)班成绩比(2)班成绩集中B.(1)班成绩的第三四分位数是80C.(1)班同学的成绩有超过140分的D.(1)班和(2)班成绩的中位数相同D新课讲解练一练2.某书店一个月内每天的书籍销售量的箱线图如图所示.(1)这个月书籍销售量的最大值、最小值及四分位数分别是多少?(2)请分析这个月书籍的销售情况.解:(1)(2)从箱线图中可以看出,每天书籍销售量的分布不对称,有一半的天数销售量集中在90~96;数据的四分位距为93-80=13,说明数据的波动比较大.课堂小结数据的四分位数百分位数四分位数箱线图三个四分位数及最大值、最小值25%分位数,50%分位数,75%分位数一组数据按从小到大的顺序排列,将数据分成100等份的每一分点处的值叫作这组数据的百分位数当堂小练1.求数据组13,15,12,27,22,24,28,30,31,18,19,20的四分位数.
当堂小练2.老师记录了全班40名学生1min跳绳的次数:132136144162144115132136123144136132132159136144129136139153123133144137152138136129129134138149125128128133138134146148绘出这组数据的箱线图.解:最小值是115,第一四分位数是132,第二四分位数是136,第三四分位数是144,最大值是162.绘制箱线图如图24.3-3:当堂小练3.某城市9月份空气质量指数的箱线图如图所示.(1)这个月空气质量指数的最大值、最小值及四分位数分别是多少?(2)请分析这个月空气质量的特点.解:(1)这个月空气质量指数的最大值是110,最小值是30,第一四分位数是40,第二四分位数是50,第三四分位数是80.(2)从箱线图上可以看出这个月空气质量指数在80以下的占比达到75%,说明这个月该城市整体空气质量较好.当堂小练4.某小组8名学生的数学成绩分别为75,80,85,90,90,95,100,100.(1)求这组数据的平均数、中位数、众数;(2)计算第三四分位数.解:(1)平均数:(75+80+85+90+90+95+100+100)÷8=89.375;将数据从小到大排序为75,80,85,90,90,95,100,100,中位数为(90+90)÷2=90;众数是90和100.(2)8×75%=6,第三四分位数是第6个数和第7个数的平均值,即(95+100)÷2=97.5
.当堂小练5.小明抽样调查了两个不同年龄段的人群晚上休息的时间,制作了如下统计图:(1)这两个年龄段的人群晚上休息的时间有什么特点?(2)如果一组是青年组,另一组是老年组,那么你认为哪组有可能是青年组?解:(1)从箱线图来看,A组特点:A组休息时间的中位数大概在23:00左右,数据分布相对集中,说明A组人群晚上休息时间较为接近.B组特点:B组休息时间的中位数大概在22:30左右,数据的分布相对较分散,说明B组人群晚上休息时间差异较大,有部分人休息时间较早,也有部分人休息时间较晚,整体休息时间普遍比A组早.(2)通常情况下,青年人的整体休息时间相对较晚,老年人休息时间较早.因此,A组有可能是青年组.1.某地区今年7月和8月的空气质量指数(AQI)箱线图如图所示.AQI值越小,空气质量越好;AQI值超过200,说明达到重度污染.则下列说法正确的是(
)A.该地区今年7月有重度污染天气B.该地区今年8月AQI值最小值比7月的小C.该地区今年7月的AQI值比8月的AQI值集中D.从整体上看,该地区今年8月
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年社会体育指导员轮滑方向题
- 2026年申论写作素材积累与运用
- 论家风与社会主义核心价值观的内在联系及协同共进
- 论夫妻感情确已破裂认定标准的司法实践与完善路径
- 2026年市场营销师二级笔试题
- 2026年证券从业资格高频考点卷
- 2026年小学生地震自救知识
- 2026年土木工程考试基础理论题集
- 2026年精益生产工程师初级模拟试卷
- 2026年金融趣味知识问答
- 2026江苏苏州市健康养老产业发展集团有限公司下属子公司招聘44人(第一批)笔试历年典型考点题库附带答案详解
- 2026广东江门开平市招聘事业单位工作人员53人考试参考试题及答案解析
- 医药经销商现场审计制度
- 物业管理安全生产检查自查表样例
- 电力5G通信模组测试规范
- (2025版)微针点阵射频临床应用专家共识
- 2025年注册会计师公司战略与风险管理试题测试题及答案
- 船舶防污染监督制度
- 2026年高考物理上海卷含解析及答案
- 2025年中国银行笔试题型及答案
- 2026年高考理科综合新课标二卷真题含解析及答案
评论
0/150
提交评论