数据的四分位数课件 -2025-2026学年人教版数学八年级下册_第1页
数据的四分位数课件 -2025-2026学年人教版数学八年级下册_第2页
数据的四分位数课件 -2025-2026学年人教版数学八年级下册_第3页
数据的四分位数课件 -2025-2026学年人教版数学八年级下册_第4页
数据的四分位数课件 -2025-2026学年人教版数学八年级下册_第5页
已阅读5页,还剩40页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人教版八年级数学(下)第二十四章数据的分析24.3数据的四分位数新课导入体育老师要给班级30名同学的跳绳成绩(单位:次/min)做分层评价,想把成绩分成“优秀、良好、合格、待提升”4个等级,且每个等级的人数大致相等.125,132,138,142,145,150,153,156,158,160,162,165,168,170,172,175,178,180,182,185,188,190,193,195,198,200,205,210,215,220.按从小到大排序找出“中间位置”的成绩,区分前半段和后半段;再把前半段、后半段各自分成两部分,让4个等级的人数基本相同.125,132,138,142,145,150,153,156,158,160,162,165,168,170,172,175,178,180,182,185,188,190,193,195,198,200,205,210,215,220.1、如何精准找到这几个“分割点”,让每个等级恰好包含约7-8名同学?2、只用平均数、中位数,能完成这种“四等分”的分层吗?四分位数探究新知集中趋势和离散程度都是数据分布某一方面的特征.为了获取数据更多的信息,人们还关心数据整体的分布情况.本节我们将学习用四分位数大致刻画一组数据的分布情况.(1)既然平均数和方差不能反映收益率的具体分布范围等信息,那需要什么样的统计量来反映这些信息呢?阅读教材P176-177页,思考下列问题:(2)对于团队A和团队B的理财产品收益率,除了平均数和方差,还有哪些统计量能更详细地描述它们的分布情况?(3)假设引入能反映更多分布信息的统计量,比如分位数等,这些统计量如何帮助投资者更全面地了解理财产品收益率的情况?(4)从投资者角度看,除了收益率的集中趋势和离散程度,还有哪些收益率的分布信息是比较关心的?问题某银行有A和B两个理财产品经营团队.近三年,这两个团队分别负责经营12项理财产品,收益率(单位:%)如下:如果你是一位购买理财产品的投资者,会选择哪个团队的产品?A4.773.986.444.802.153.853.643.213.182.024.114.10B3.183.843.993.673.403.604.104.214.154.443.873.91我们用产品收益率的平均数和方差来进行分析:可以看出团队B收益率的波动较小,产品收益率的稳定性要好于团队A.因此,如果你是稳健性投资者,那么应该选择团队B经营的理财产品;如果你是激进型投资者,那么应该选择团队A经营的理财产品.可以看出团队B的平均收益率略高,但差别不大;

s2A≈1.327s2B≈0.117如果投资者还想进一步了解两个团队理财产品收益率的具体情况,例如收益率大部分在什么范围,哪些范围比较集中等信息,那么产品收益率的平均数和方差能反映出这些信息吗?平均数和方差虽然可以反映产品收益率的集中趋势和离散程度,但无法反映出投资客户关心的这些信息.因此,我们需要能反映产品收益率更多分布信息的统计量.思考:由于每个团队的产品收益率的数据个数不多,我们可以用三个特殊的百分位数来刻画.一组数据按从小到大的顺序排列,中位数是从中间点把数据分成2等份.

将数据分成100等份的每一分点处的值叫作这组数据的百分位数.相比中位数,百分位数可以较全面地反映出数据的分布信息.如图所示,把团队A的产品收益率按从小到大的顺序排列:2.022.153.183.213.643.853.984.104.114.774.806.443.9153.1954.4450%分位数25%分位数75%分位数由于3.195,3.915,4.44这三个值把这组按由小到大顺序排列的数据分成四等份,所以称它们为这组数据的四分位数,从小到大分别称为这组数据的第一四分位数、第二四分位数(中位数)、第三四分位数,分别记为Q1,Q2,Q3.2.022.153.183.213.643.853.984.104.114.774.806.443.9153.1954.44第二四分位数第一四分位数,又称下四分位数第三四分位数,又称上四分位数由团队A产品收益率的三个四分位数,可以大致看出其产品收益率的分布情况.其产品收益率小于3.195%的项目数占总数的25%,2.022.153.183.213.643.853.984.104.114.774.806.443.9153.1954.44第二四分位数第一四分位数第三四分位数产品收益率小于3.915%的项目数占总数的一半,产品收益率大于4.44%的项目数占总数的25%.产品收益率在3.195%至4.44%之间的项目数占总数的50%.类似地,如图,可以得到团队B产品收益率的三个四分位数分别为3.635,3.89,4.125.3.183.403.603.673.843.873.913.994.104.154.214.443.893.6354.125第二四分位数第一四分位数第三四分位数3.183.403.603.673.843.873.913.994.104.154.214.443.893.6354.125第二四分位数第一四分位数第三四分位数由团队A产品收益率的三个四分位数,可以大致看出其产品收益率的分布情况.其产品收益率小于3.635%的项目数占总数的25%,产品收益率小于3.89%的项目数占总数的一半,产品收益率大于4.125%的项目数占总数的25%.产品收益率在3.635%至4.125%之间的项目数占总数的50%.(1)箱线图中第一四分位数、第二四分位数(中位数)、第三四分位数分别是如何确定的?阅读教材P178页,思考下列问题:(2)团队A和团队B的箱线图在形状上有什么差异?这些差异反映了两队理财产品收益率的什么分布特点?(3)除了中位数几乎相等,从箱线图还能看出团队A和团队B理财产品收益率的哪些不同分布信息?(4)四分位数在箱线图中是如何体现的?它能反映数据的什么特征?(5)为什么要把两个箱线图按竖直方向并列画在同一幅图中?这样做有什么好处?阅读教材P178页,思考下列问题:

为了更加直观地观察数据的分布特征,我们可以用三个四分位数及最小值、最大值这五个数值画出箱线图.234567最小值最大值第二四分位数第一四分位数第三四分位数矩形箱体须线须线整个箱体的长度为第三四分位数-第二四分位数的差,称为四分位距.234567收益率/%最小值最大值第一四分位数第二四分位数第三四分位数团队A产品收益率的箱线图如下图所示,它主要由矩形箱体和从箱体延伸出的两条水平线段(称为须线)构成.箱线图中最左侧和最右侧的竖直线段分别表示这组数据的最小值和最大值,中间箱体的左端竖线表示第一四分位数,箱体中部的竖线表示第二四分位数(中位数),箱体的右端竖线表示第三四分位数,整个箱体的长度为第三四分位数减去第一四分位数的差,称为四分位距.234567收益率/%最小值最大值第一四分位数第二四分位数第三四分位数由箱线图,容易看出产品收益率分布的大致情况,如分布的范围、中位数的大小、集中的范围、分布是否对称等.234567收益率/%最小值最大值第一四分位数第二四分位数第三四分位数234567收益率/%类似地,可以画出团队B产品收益率的箱线图,如下图所示.箱线图也可以按竖直方向画.为了便于比较两个团队产品收益率的分布特征,把两个箱线图按竖直方向并列画在同一幅图中,如右图所示.从图中可以发现,两个团队产品收益率的中位数几乎相等(表示中位数的水平线段差不多高),但团队A的产品收益率波动明显比团队B的大(团队A的箱体和须线比团队B的长),这与用平均数、方差比较的结果是一致的.从箱线图中,还可以看出分布的一些其他特征,例如,团队B的产品收益率分布比团队A的更对称(中位数对应的水平线段在箱子的中间位置),团队A有约25%的产品收益率高于团队B的最高产品收益率,也有约25%的产品收益率低于团队B的最低产品收益率,等等.与直方图、条形图比较,箱线图在表示数据方面有什么特点?箱线图可展示四分位数、最大值、最小值等,反映数据分布范围与离散程度,适合多组数据整体分布情况的比较按从小到大的顺序排列的一组数据,可以按以下步骤确定其四分位数:先找出这组数据的中位数,作为这组数据的第二四分位数;然后找出中位数左侧和右侧的数据各自的中位数,分别作为这组数据的第一四分位数和第三四分位数.利用一组数据的三个四分位数,以及最小值、最大值可以刻画这组数据的大致分布情况.排序是前提:必须将数据按由小到大顺序排序(按由大到小顺序排序会出现第一、三四分位数换位).确定位置是关键:数据个数为奇数和偶数时,中位数的确定方法不同.

箱线图的画法(1)找出一组数据的最小值、第一四分位数、中位数、第三四分位数和最大值,并用5条横线分别对应这5个数据;(2)连接第一四分位数和第三四分位数,画出“箱体”;(3)将最小值和最大值与“箱体”相连接,中位数在“箱体”中间.注意:箱线图可以画成竖直的,也可以画成横向的.箱线图能较为全面的反映数据的分布情况:3.上须线显著长于下须线:存在偏大的值;下须线显著长于上须线:存在偏小的值;须线长度基本对称:数据在两端均匀分布.1.箱体长度:箱体越长,中间50%的数据越分散,箱体越短,中间50%的数据越集中.2.须线长度:须线越长,说明数据在两端分布越广,数据整体离散程度高;须线越短,说明数据在两端分布越集中,离散程度低.须线的长短(特别是与箱子长度的对比)能反映两端数据分布的稀疏程度.中位数(Q2)在箱子中的位置能反映数据整体分布的偏斜情况.箱线图的信息解读最大值、最小值提供了数据的范围(极差).Q2靠箱体左侧:数据向右(较大值方向)偏斜(正偏).Q2靠箱体右侧:

数据向左(较小值方向)偏斜(负偏).Q2居中:数据分布较对称.知识归纳1.将数据分成100等份的每一分点处的值叫作这组数据的百分位数.2.一组数据的25%分位数,50%分位数和75%分位数,把这组按由小到大顺序排列的数据分成四等份,所以称它们为这组数据的四分位数,从小到大分别称为这组数据的_______四分位数、________四分位数(中位数)、________四分位数,分别记为Q1,Q2,Q3.第一第二第三例题与练习例根据下表中的数据,分别计算甲、乙两地气温的四分位数,在同一幅图中画出箱线图,据此比较甲、乙两地的气温特点.时刻0:002:004:006:008:0010:0012:0014:0016:0018:0020:0022:0024:00甲/℃1191012162123242118161413乙/℃13111214151719212018171615甲、乙两地气温各有13个数据.甲地气温的最小值为9,最大值为24,三个四分位数分别为解:将表中两地的气温(单位:℃)分别按从小到大的顺序排列,可得甲地

9101112131416161821212324乙地

11121314151516171718192021Q2=16,乙地气温的最小值为11,最大值为21,三个四分位数分别为

Q2=16,

在同一幅图中画出两地气温的箱线图,如图所示.可以看出,甲、乙两地气温的中位数相同,但甲地气温的波动明显比乙地的大,甲地约有25%时刻的气温高于乙地的最高温度,约有25%时刻的气温低于乙地的最低温度.1.某城市9月份空气质量指数的箱线图如图所示.(1)这个月空气质量指数的最大值、最小值及四分位数分别是多少?Q2=16,

最小值最大值(2)请分析这个月空气质量的特点这个月大部分天数空气质量较好,但存在少数指数偏高的情况,整体呈右偏分布,空气质量状况有一定波动2.任何一组数据的四分位数,是否都恰好能把这组数据分成四等份?举例说明。不是的,四分位数不一定能把数据恰好分成四等份。四分位数的定义是将数据按从小到大排序后,把数据分成四等份的三个数(Q₁、Q₂、Q₃),但这是基于位置的划分,而不是严格的数量均分。1,3,5,7,9,11第二四分位数第一四分位数第三四分位数6[1,3]、[5,7]、[9,11]三组数据个数分别为2、2、2,也不是四等份。只有当数据量是4的倍数时,才可能在数量上接近四等份,但四分位数的核心作用是描述数据的分布位置,而非严格均分。3.求下列数据的四分位数:(1)6,7,9,11,13,15,18,20;(2)3,1,0,-1,-3,-3,-1,1,-2,-2,0,-1.解:(1)Q1=8,(2)将这12个数据由小到大排序:-3,-3,-2,-2,-1,-1,-1,0,0,1,1,3.

Q2=12,Q3=16.5.课堂小结四分位数第一四分位数(25%)第二四分位数(中位数)第三四分位数(75%)箱线图:最小值、Q1、Q2、Q3、最大值随堂检测

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论