《统计案例:公司员工的肥胖情况调查分析》课件_第1页
《统计案例:公司员工的肥胖情况调查分析》课件_第2页
《统计案例:公司员工的肥胖情况调查分析》课件_第3页
《统计案例:公司员工的肥胖情况调查分析》课件_第4页
《统计案例:公司员工的肥胖情况调查分析》课件_第5页
已阅读5页,还剩57页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

9.3

统计案例公司员工的肥胖情况调查分析课标定位素养阐释1.了解数据分析的意义.2.了解统计分析报告的主要组成部分.3.会选择合适的图表描述和表达实际问题的样本数据.4.会从实际问题的样本数据中提取刻画其特征的量(如中位数、均值、方差等).5.经历数据分析的全过程,提升数学运算、数学建模、逻辑推理和直观想象的数学素养.一、数据分析简介1.数据分析的含义数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理、分析和推断,形成关于研究对象知识的素养.数据分析是研究随机现象的重要数学技术,是大数据时代数学应用的主要方法,也是“互联网+”相关领域的主要数学方法,数据分析已经深入到科学、技术、工程和现代社会生活的各个方面.2.数据分析的过程数据分析的基本过程包括:收集数据、整理数据、提取信息、构建模型、进行推断、获得结论.3.统计分析报告的主要组成部分(以调查公司员工的肥胖情况为例)(1)标题(2)前言简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况.(3)主体展示数据分析的全过程:首先要明确所关心的问题是什么,说明数据蕴含的信息;根据数据分析的需要,说明如何选择合适的图表描述和表达数据;从样本数据中提取能刻画其特征的量,如均值、方差等,用于比较男、女员工在肥胖状况上的差异;通过样本估计总体的统计规律,分析公司员工胖瘦程度的整体情况.(4)结尾对主体部分的内容进行概括,结合控制体重的一般方法(可以查阅有关文献),提出控制公司员工体重的建议.二、数据分析例题【例题】

近年来,青少年视力水平的下降已经引起全社会的关注.为了使学生意识到保护视力的重要性,某中学开展了一次中小学生视力测试,采用如下的国际标准视力表测试学生的视力,以五分记录,得到全校学生的视力数据.按照简单随机抽样从一至九年级中每个年级各抽查一个班级,得分在5.0及以上的是合格,低于5.0的是不合格,得到的数据统计如下:请你根据给出的数据信息回答下列问题:(1)填写下表中未完成部分的数据;(2)试比较小学(一至五年级)、初中(六至九年级)在视力状况上的差异;(3)试分析初中学生视力比小学学生视力下降的原因;(4)提出保护视力的建议.解:(1)92.00%

91.67%

75.00%

78.95%(2)通过对以上学生视力的数据分析发现,小学的大部分学生的视力都处于正常水平,视力都能保持在5.0以上,初中学生视力的不合格率明显高于小学.从整体测得的结果来看,小学学生视力的平均合格率要高于初中学生.(3)分析其主要原因可能有以下几点:第一,初中学生平时的学习任务相对繁重,导致用眼过多而造成视力正常率较低;第二,初中学生对手机还有电脑的使用较多;第三,初中学生对眼保健操的重视程度不够;第四,初中学生平常的学习行为以及座位没有及时更换.(4)①适当减轻学生的作业负担,尽量让学生当堂消化掉所学知识,以免回家熬夜学习;②通过家校联合的方式来监督学生对手机、电脑的使用,禁止学生带手机进入校园;③加强对学生做眼保健操的监督力度,要让学生将眼保健操视为眼睛的“一日三餐”一样,使做眼保健操成为学生的一种习惯.【变式训练】

某市2013年4月和2018年4月30天的空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):2013年4月:61,76,70,56,81,91,125,161,105,81,88,67,101,115,159,91,77,86,81,83,82,82,64,79,86,85,42,56,49,45;2018年4月:35,54,80,86,72,85,58,72,102,53,10,66,56,36,18,25,23,40,60,89,88,54,79,14,16,40,59,67,108,62.根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空气质量为良;在101~150之间时,空气质量为轻度污染;在151~200之间时,空气质量为中度污染.请你依据所给数据和上述标准,回答下列问题:(1)请根据2013年4月30天的数据完成下表中未完成部分的数据;(2)请根据上面的数据和(1)中表的信息,对该市2013年4月的空气质量给出一个简短评价;(3)请根据2018年4月的空气质量状况,分析政府对大气污染的治理效果.解:(1)4

0.1

0.13

0.07(2)答对下述两条中的一条即可.①该市一个月中空气污染指数有3天处于优的水平,占当月天数的0.1,有21天处于良的水平,占当月天数的0.7,处于优或良的天数共有24天,占当月天数的0.6,说明该市空气质量一般.②轻度污染有4天,占当月天数的0.13,有2天处于中度污染,占当月天数的0.07,污染指数在80以上的接近轻度污染的天数有12天,加上处于轻度和中度污染的天数,共有18天,占当月天数的0.6,超过50%,说明该市空气质量有待进一步改善.(3)2018年4月的30天中,空气污染指数有10天处于优的水平,占当月天数的0.33,有18天处于良的水平,占当月天数的0.6,有2天处于轻度污染,占当月天数的0.07,而且处于优或良的天数共有28天,占当月天数的0.93,说明该市政府对大气污染的治理效果很明显.12345678910111213141516171819202122一、选择题:在每小题给出的四个选项中,只有一项是符合题目要求的.1.现要完成下列2项抽样调查:①从12瓶饮料中抽取4瓶进行食品卫生检查;②某生活小区共有540名居民,其中年龄不超过30岁的有180人,年龄超过30岁不超过60岁的有270人,60岁以上的有90人,为了解居民对社区环境绿化方面的意见,拟抽取一个容量为30的样本.较为合理的抽样方法是(

)A.①抽签法,②分层随机抽样 B.①随机数法,②分层随机抽样C.①随机数法,②抽签法 D.①抽签法,②随机数法A解析

①从12瓶饮料中抽取4瓶进行食品卫生检查,样本容量小,宜用抽签法,②该小区居民的年龄有明显差异,对社区环境绿化的意见不同,宜用分层随机抽样.123456789101112131415161718192021222.[河北承德期末]某文化馆计划从18名女志愿者、12名男志愿者中选调10人参加文化艺术展讲解工作,若按照性别进行分层随机抽样,则应抽取的女志愿者人数为(

)A.7 B.3 C.6 D.4C解析

18名女志愿者、12名男志愿者,比例为18∶12=3∶2,选调10人,按照性别进行分层随机抽样,应抽取的女志愿者人数为10×=6(人).123456789101112131415161718192021223.[辽宁丹东期末]某市为了制定合理的节水方案,对家庭用水情况进行了调查,通过抽样,获得了某年100个家庭的月均用水量(单位:t),将数据按照[0,1),[1,2),[2,3),[3,4),[4,5]分成5组,制成了如图所示的频率分布直方图,则估计全市家庭月均用水量的平均数为(

)A.2.45 B.2.46

C.2.47

D.2.48B12345678910111213141516171819202122解析

由频率分布直方图的性质可知(0.12×2+0.22+0.36+a)×1=1,解得a=0.18,则估计全市家庭月均用水量的平均数为0.12×0.5+0.22×1.5+0.36×2.5+0.18×3.5+0.12×4.5=2.46.123456789101112131415161718192021224.[四川凉山州模拟]样本数据x1,x2,…,xn的平均数

=4,方差s2=1,则样本数据2x1+1,2x2+1,…,2xn+1的平均数、方差分别为(

)A.9,4 B.9,2 C.4,1 D.2,1A解析

=4,s2=1,得所求平均数为2+1=9,所求方差为4s2=4.123456789101112131415161718192021225.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取10位市民,他们的幸福感指数为3,4,5,5,6,7,7,8,9,10.则这组数据的第75百分位数是(

)A.7 B.7.5 C.8 D.8.5C解析

由题意,这10个人的幸福指数已经从小到大排列,因为75%×10=7.5,所以这10个人的第75百分位数是从小到大排列后第8个人的幸福指数,即8.123456789101112131415161718192021226.[湖南衡阳蒸湘期末]将一组互不相等的数据x1,x2,…,x7删去中位数(设中位数为m)后,得到一组新数据,则(

)A.新数据的平均数一定大于原数据的平均数B.新数据的平均数一定小于原数据的平均数C.新数据的第60百分位数一定大于mD.新数据的第60百分位数一定小于mC解析

当原数据的平均数为m时,新数据的平均数等于原数据的平均数,故A,B错误.不妨设x1<x2<…<x7,则m=x4,则新数据为x1,x2,x3,x5,x6,x7,因为6×0.6=3.6,所以新数据的第60百分位数为x5,因为x5>x4,所以新数据的第60百分位数一定大于m.12345678910111213141516171819202122123456789101112131415161718192021227.走路被称为“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.下图为甲、乙两人在同一星期内日步数的折线统计图:则下列结论不正确的是(

)A.这一星期内甲的日步数的中位数为11600B.乙的日步数星期四比星期三少C.这一星期内甲的日步数的平均值大于乙的日步数的平均值D.这一星期内甲的日步数的方差大于乙的日步数的方差12345678910111213141516171819202122B12345678910111213141516171819202122解析

对于A,甲的步数:16

000,7

965,12

700,2

435,16

800,9

500,11

600.从小到大排列为2

435,7

965,9

500,11

600,12

700,16

000,16

800.中位数是11

600.故A正确;对于B,乙星期三的步数为7

030,星期四的步数为12

970,星期四比星期三日步数多,故B不正确;1234567891011121314151617181920212212345678910111213141516171819202122B1234567891011121314151617181920212212345678910111213141516171819202122二、选择题:在每小题给出的选项中,有多项符合题目要求.9.某市举办“口语易”英语口语竞赛,已知某选手平均得分为8.5分,12位评委对其评分具体如下(满分10分):7.0,7.5,7.8,7.8,8.2,8.3,8.5,8.7,9.1,9.2,9.9,10,则下列说法正确的是(

)A.第75百分位数为9.1B.中位数为8.3C.极差为3D.去掉最高分和最低分,不会影响到这位同学的平均得分CD123456789101112131415161718192021221234567891011121314151617181920212210.[四川攀枝花期末]甲、乙两人在相同的条件下投篮5轮,每轮甲、乙各投篮10次,投篮命中次数的情况如图所示(实线为甲的折线图,虚线为乙的折线图),则以下说法正确的是(

)A.甲投篮命中次数的众数比乙的大B.甲投篮命中的成绩比乙的稳定C.甲投篮命中次数的平均数为7D.甲投篮命中次数的第40百分位数是6BC123456789101112131415161718192021221234567891011121314151617181920212211.某学校组建了辩论、英文剧场、民族舞、无人机和数学建模五个社团,高一学生全员参加,且每位学生只能参加一个社团.学校根据学生参加情况绘制如下统计图,已知无人机社团和数学建模社团的人数相等,下列说法正确的是(

)A.高一年级学生人数为120人B.无人机社团的学生人数为17人C.若按分层随机抽样从各社团选派20人,则无人机社团选派人数为3人D.在扇形图中表示“辩论社团人数”的扇形的圆心角大小是90°ACD12345678910111213141516171819202122解析

由题目所给的数据可知,民族舞社团的人数为12,占高一年级总人数的比例为10%,所以高一年级的总人数为12÷10%=120,英文剧场社团的人数为120×35%=42,辩论社团的人数为30,无人机社团的人数与数学建模社团的人数为(120-42-30-12)÷2=18,占高一年级人数的比例是

×100%=15%,故A正确,B错误;分层抽样20人,无人机应派出20×15%=3(人),C正确;辩论社团的人数是30,所以所求的扇形圆心角为

×360°=90°,D正确.1234567891011121314151617181920212212.[辽宁大连二模]某城市100户居民月平均用电量(单位:kW·h),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示,下列说法正确的是(

)A.x=0.0075B.月平均用电量的众数为210和230C.月平均用电量的中位数为224D.月平均用电量的第75百分位数位于区间[240,260)内ACD12345678910111213141516171819202122解析

由直方图的性质可得(0.002+0.009

5+0.011+0.012

5+x+0.005+0.002

5)×20=1,解得x=0.007

5,故A正确;由直方图可知月平均用电量的众数为

=230,故B错误;因为(0.002+0.009

5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a,则(0.002+0.009

5+0.011)×20+0.012

5×(a-220)=0.5,解得a=224,故C正确;因为(0.002+0.009

5+0.011+0.012

5)×20=0.7,(0.002+0.009

5+0.011+0.012

5+0.007

5)×20=0.85,所以月平均用电量的第75百分位数位于区间[240,260)内,故D正确.12345678910111213141516171819202122三、填空题13.[福建漳州期末]一名射击运动员在一次射击测试中射击10次,每次命中的环数如下:5

6

6

7

7

7

7

8

8

9则其射击成绩的方差s2=

.

1.21234567891011121314151617181920212214.现有一组数据满足下面两个条件:①一共有6个互不相等的数;②中位数小于平均数.这组数据可以是

.

1,2,3,4,5,8(答案不唯一)1234567891011121314151617181920212215.如图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[6,14)内的频数为

;数据落在[2,14)内的频率约为

.

136

0.7612345678910111213141516171819202122解析

∵样本数据落在[6,14)内的频率为0.08×4+0.09×4=0.68,且样本容量为200,∴样本数据落在[6,14)内的频数为0.68×200=136;数据落在[2,14)内的频率为(0.02+0.08+0.09)×4=0.76.1234567891011121314151617181920212216.为了解中学生课外阅读情况,现从某中学随机抽取200名学生,收集了他们一年内的课外阅读量(单位:本)等数据,以下是根据数据绘制的统计图表的一部分.学生类别阅读量[0,10)[10,20)[20,30)[30,40)[40,+∞)性别男73125304女82926328学段初中

25364411高中

学生类别阅读量

12345678910111213141516171819202122下面有四个推断:①这200名学生阅读量的平均数可能是26本;②这200名学生阅读量的第75百分位数在区间[30,40)内;③这200名学生中的初中生阅读量的中位数一定在区间[20,30)内;④这200名学生中的初中生阅读量的第25百分位数可能在区间[20,30)内.所有合理推断的序号是

.

②③④

12345678910111213141516171819202122解析

在①中,由学生类别阅读量中男生和女生人均阅读量知,这200名学生的平均阅读量在区间(24.5,25.5)内,故错误;在②中,200×75%=150,阅读量在[0,30)的人数有7+8+31+29+25+26=126(人),在[30,40)的人数有62人,所以这200名学生阅读量的第75百分位数在区间[30,40)内,故正确;在③中,设在区间[0,10)内的初中生人数为x,则x∈[0,15],x∈N*,当x=0时,初中生总人数为116人,=58,此时区间[0,20)有25人,区间[20,30)有36人,所以中位数在[20,30)内,当x=15时,初中生总人数为131人,=65.5,12345678910111213141516171819202122此时区间[0,20)有15+25=40(人),区间[20,30)有36人,所以中位数在[20,30)内,当在区间[0,10)内初中人数取最小值和最大值时,中位数都在[20,30)内,所以这200名学生中的初中生阅读量的中位数一定在区间[20,30)内,故正确;在④中,设在区间[0,10)内的初中生人数为x,则x∈[0,15],x∈N*,当x=0时,初中生总人数为116人,116×25%=29,此时区间[0,20)内有25人,区间[20,30)有36人,所以第25百分位数在[20,30)内,当x=15时,初中生总人数为131人,131×25%=32.75,区间[0,20)内有15+25=40(人),所以第25百分位数在[0,20)内,所以这200名学生中的初中生阅读量的第25百分位数可能在区间[20,30)内,故正确.12345678910111213141516171819202122四、解答题:解答应写出文字说明、证明过程或演算步骤.17.对甲、乙两名同学的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲6080709070乙8060708075(1)甲、乙的平均成绩谁较好?(2)谁的各门功课发展较平衡?123456789101112131415161718192021221234567891011121314151617181920212218.[河南洛阳月考]随着科技的发展,越来越多的农民采用无人播种机、无人旋耕机、无人植保车等一系列“智慧农机”耕种田地,极大地提高了耕作效率.某地区对50名使用了“智慧农机”的农民耕种的田地面积(单位:公顷)进行统计,将数据按[45,55),[55,65),[65,75),[75,85),[85,95]分为5组,画出的频率分布直方图如图所示.(1)估计这50名农民耕种田地面积的中位数(结果保留小数点后一位);(2)估计这50名农民耕种田地面积的平均数及标准差(同一组中的数据用该组区间的中点值作为代表,结果保留整数).12345678910111213141516171819202122解

(1)根据频率分布直方图可得组距为10,所以(0.01+m+0.03+0.03+0.01)×10=1,解得m=0.02;易知[45,55),[55,65)两组数据所占概率为0.3,第三组数据[65,75)概率也为0.3,所以中位数在区间[65,75)内,设中位数为x,所以0.3+(x-65)×0.03=0.5,解得x≈71.7,所以这50名农民耕种田地面积的中位数为71.7公顷.(2)利用频率分布直方图可得,其平均数为10×(50×0.01+60×0.02+70×0.03+80×0.03+90×0.01)=71,其方差为(50-71)2×0.1+(60-71)2×0.2+(70-71)2×0.3+(80-71)2×0.3+(90-71)2×0.1=129,这50名农民耕种田地面积的平均数为71公顷,标准差约为11.1234567891011121314151617181920212219.[湖南湘潭岳塘期末]某中学为了学生的身心健康,加强食堂用餐质量(简称“美食”)的过程中,后勤部门需了解学生对“美食”工作的认可程度,若学生认可系数(认可系数=)不低于0.85,“美食”工作按原方案继续实施,否则需进一步整改.为此该部门随机调查了600名学生,根据这600名学生对“美食”工作认可程度给出的评分,分成[50,60),[60,70),[70,80),[80,90),[90,100]五组,得到如图所示的频率分布直方图.12345678910111213141516171819202122(1)求直方图中x的值和第60百分位数;(2)为了解部分学生给“美食”工作评分较低的原因,该部门从评分低于80分的学生中用分层随机抽样的方法随机选取30人进行座谈,求应选取评分在[60,70)的学生人数;(3)根据你所学的统计知识,结合认可系数,判断“美食”工作是否需要进一步整改,并说明理由.12345678910111213141516171819202122解

(1)由图可知10×(x+0.015+0.020+0.030+0.025)=1,解得x=0.01.因为[50,80)内的频率为0.1+0.15+0.2=0.45<0.6,[50,90)内的频率为0.1+0.15+0.2+0.3=0.75>0.6,所以第60百分位数位于区间[80,90)内,设为m,所以第60百分位数为85.(2)低于80分的学生中三组学生的人数比例为0.1∶0.15∶0.2=2∶3∶4,则应选取评分在[60,70)的学生人数为(3)由图可知,认可程度平均分为=55×0.1+65×0.15+75×0.2+85×0.3+95×0.25=79.5<0.85×100=85,所以“美食”工作需要进一步整改.1234567891011121314151617181920212220.在某中学举行的电脑知识竞赛中,将高一年级两个班参赛的学生成绩进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一,第三,第四,第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)补齐图中频率分布直方图,并求这两个班参赛学生的总人数;(2)利用频率分布直方图,估算本次比赛学生成绩的平均数和中位数.12345678910111213141516171819202122解

(1)第二小组的频率为1-0.30-0.15-0.10-0.05=0.40,所以补全的频率分布直方图如图.12345678910111213141516171819202122(2)本次比赛学生成绩的平均数为54.5×0.30+64.5×0.40+74.5×0.15+84.5×0.10+94.5×0.05=66.5.中位数出现在第二组中,设中位数为x,则(x-59.5)×0.04+0.30=0.50,x=64.5.所以估计本次比赛学生成绩的平均数为66.5,中位数为64.5.1234567891011121314151617181920212221.某工厂生产了10000件产品,为了了解这批产品的质量情况,从中随机抽取100件作为样本,测出它们的某一项质量指数按数据分成[10,12],(12,14],(14,16],(16,18],(18,20],(20,22],(22,24]7组,得到如图所示的频率分布直方图.已知当该产品的质量指数在(16,18]内时,该产品为一等品,每件可获利12元;当该产品的质量指数在(14,16]或(18,20]内时,该产品为二等品,每件可获利10元;当该产品的质量指数在(12,14]或(20,22]内时,该产品为合格品,每件可获利8元;当该产品的质量指数在[10,12]或(22,24]内时,该产品为不合格品,每件亏损6元.12345678910111213141516171819202122(1)估计该工厂生产的这批产品中不合格品的数量;(2)估计这批产品的总利润.12345678910111213141516171819202122解

(1)由题意可得这批产品中不合格品的频率为(0.02+0.03)×2=0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论