版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二讲用样本估计总体课标要求考情分析1.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.2.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.3.能用样本估计总体的取值规律,能用样本估计百分位数,理解百分位数的统计含义1.考查平均数、方差的计算及频率分布直方图的简单应用.2.题型以选择题、填空题为主,出现解答题时常与概率结合1.总体取值规律的估计(1)绘制频率分布直方图的步骤①求极差:即一组数据中最大值与最小值的差.②决定组距和组数:当样本容量不超过100时,常分成5~12极差组数组,组距=
.
③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可以将样本数据多取一位小数分组. ④列频率分布表:登记频数,计算频率,列出频率分布表.
将样本数据分成若干个小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的频率.频率反映各个数据在每组所占比例的大小.⑤画频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一小长方形,它的高等于该组的频率组距,这样得到一系列的长方形,每个长方形的面积恰好是该组的频率.这些矩形就构成了频率分布直方图,各个长方形的面积总和等于1.(2)不同统计图的特点
扇形图主要用于直观描述各类数据占总数的比例;条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率;折线图主要用于描述数据随时间的变化趋势.条形图适用于描述离散型数据,直方图适用于描述连续性数据.2.总体百分位数的估计(1)第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.(3)四分位数
25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.3.总体集中趋势的估计(1)众数在一组数据中,出现次数最多的数据叫做这组数据的众数.(2)中位数
将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)平均数样本数据的算术平均数,4.总体离散程度的估计
(3)标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.【名师点睛】(1)频率分布直方图中的常见结论①众数的估计值为最高矩形的中点对应的横坐标.②平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.③中位数的估计值的左边和右边的小矩形的面积和是相等的.(2)平均数、方差的公式推广
考点一频率分布直方图
[例1](1)为了了解某校九年级
1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图8-2-1所示的频率分布直方图,根据统计图的数据,下列结论错误的是()图8-2-1A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5C.该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320D.该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32
解析:由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值27.5;1分钟仰卧起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30的人数为320;1分钟仰卧起坐的次数少于20的频率为0.1,所以估计1分钟仰卧起坐的次数少于20的人数为160.故选D.答案:D
(2)(2022年全国Ⅱ)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如图8-2-2所示的样本数据的频率分布直方图.(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001)图8-2-2解:(1)由频率分布直方图得该地区这种疾病患者的平均年龄为
x=5×0.001×10+15×0.002×10+25×0.012×10+35×0.017×10+45×0.023×10+55×0.020×10+65×0.017×10+75×0.006×10+85×0.002×10=47.9(岁).(2)该地区一位这种疾病患者的年龄位于区间[20,70)的频率为(0.012+0.017+0.023+0.020+0.017)×10=0.89,∴估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率为0.89.(3)设从该地区中任选一人,此人的年龄位于区间[40,50)为事件B,此人患这种疾病为事件C,【题后反思】频率分布直方图的数据特点
(1)频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.(2)频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.
【变式训练】
1.(2023年梧州市期中)甲、乙两组各八名学生在一次英语听力测试中的成绩(单位:分)如下 甲:9,16,25,18,24,x,27,24. 乙:8,17,y,13,24,28,20,22. 已知甲组数据的25%分位数为14,乙组数据的平均数为18.5,则x,y的值分别为()A.12,16B.12,18C.14,16D.14,18答案:A
2.(2022年天津)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图8-2-3是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()图8-2-3A.8B.12C.16D.18解析:志愿者的总人数为
20(0.24+0.16)×1=50,∴第3组的人数为50×0.36=18,有疗效的人数为18-6=12(人).故选B.答案:B
考点二总体集中趋势的估计1.(2023年南开区校级月考)已知一组数据的频率分布直方图)如图8-2-4所示,则数据的中位数估计值为(
图8-2-4A.64B.65C.64.5D.66
解析:因为(0.03+0.04)×10=0.7>0.5,所以中位数位于[60,70)之间,设中位数为x,则0.03×10+(x-60)×0.04=0.5,解得x=65,即中位数为65.故选B.答案:B
2.(多选题)(2021年全国Ⅰ)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同
解析:设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为x,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为x+c,m+c,σ,t,因为c≠0,所以C,D正确,故选CD.答案:CD
3.(多选题)(2023年福州市期中)为推动学校体育运动发展,引导学生积极参与体育锻炼,增强健康管理意识,某校根据性别比例采用分层抽样方法随机抽取了120名男生和80名女生,调查并分别绘制出男、女生每天在校平均体育活动时间的频率分布直方图(如图8-2-5所示),则()图8-2-5A.a=0.010B.该校男生每天在校平均体育活动时间中位数的估计值为75C.估计该校至少有一半学生每天在校平均体育活动时间超过一小时D.估计该校每天在校平均体育活动时间不低于80分钟的学生中男、女生人数比例为3∶1
解析:对于A,10a+10×0.020+10×0.035+10×0.020+10a+10×0.005=1,解得a=0.010,正确;对于B,a=0.010,前两个小矩形面积之和为0.3,前三个小矩形面积之和为0.65,即中位估计值为65.7,错误;对于C,根据频率分布直方图可得,男生中每天在校平均体育活动时间超过一小时的频率为10×(0.035+0.020+0.010+0.005)=0.700,人数为120×0.7=84,女生中每天在校平均体育活动时间超过一小时的频率为10×(0.030+0.010+0.005)=0.450,人数为80×0.450=36,故学生每天在校平均体育活动时间超过一小时的频率为
=0.6,故该校至少有一半学生每天在校平均体育活动时间超过一小时,正确;对于D,男生中每天在校平均体育活动时间不低于80分钟的频率为10×(0.010+0.005)=0.15,人数为120×0.15=18,女生中每天在校平均体育活动时间不低于80分钟的频率为10×0.005=0.050,人数为80×0.050=4,所以该校每天在校平均体育活动时间不低于80分钟的学生中男、女生人数比例为18∶4=9∶2,正确.故选AC.答案:AC【题后反思】(1)求平均数时要注意数据的个数,不要重计或漏计.(2)求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这两个数据的平均数.
(3)若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5考点三总体离散程度的估计考向1方差与标准差
[例2](2021年全国乙卷文科)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:解:(1)由表格中的数据易得【题后反思】利用样本的方差(标准差)解决优化决策问题的依据
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.考向2分层随机抽样的方差与标准差
[例3](2022年深圳市高三月考)某学校统计教师职称及年龄,中级职称教师的人数为50,其平均年龄为38岁,方差是2,高级职称的教师中有3人58岁,5人40岁,2人38岁,求该校中级职称和高级职称教师年龄的平均数和方差.解:由已知条件可知高级职称教师的平均年龄为【题后反思】计算分层随机抽样的方差的步骤【考法全练】1.(考向1)(2020年全国Ⅲ)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为(
)A.0.01B.0.1C.1D.10
解析:∵样本数据x1,x2,…,xn的方差为0.01,∴样本数据10x1,10x2,…,10xn的方差为102×0.01=1,故选C.
答案:C
2.(考向2)某班成立了A,B两个数学兴趣小组,A组10人,B组30人,经过一周的补习后进行了一次测试,在该测试中,A组的平均成绩为130分,方差为115,B组的平均成绩为110分,方差为215.求在这次测试中全班学生的平均成绩和方差.
⊙统计图表及其应用
[例4]已知某市某居民小区户主人数和户主对户型结构的满意率分别如图8-2-6①和图8-2-6②所示,为了解该小区户主对户型结构的满意程度,用分层随机抽样的方法抽取30%的户主进行调查,则样本量和抽取的户主对四居室满意的人数分别为()①A.240,18C.240,20
②图8-2-6 B.200,20 D.200,18解析:样本量n=(250+150+400)×30%=240,抽取的户主对四居室满意的人数为150×30%×40%=18.答案:A
[例5](2022年贵阳市模拟)某网站为了了解某“跑团”每月跑步的平均里程,收集并整理了2021年1月至2021年11月期间该“跑团”每月跑步的平均里程(单位:千米)的数据,绘制了如图)8-2-7所示的折线图.根据折线图,下列结论正确的是(
图8-2-7A.月跑步平均里程的中位数为6月份对应的里程数B.月跑步平均里程逐月增加C.月跑步平均里程高峰期大致在8、9月份D.1月至5月的月跑步平均里程相对于6月至11月波动性更小,变化比较平稳
解析:由折线图可知月跑步平均里程比6月份高的只有9,10,11,共3个月,比6月份低的有1,2,3,4,5,7,8,共7个月,故6月份对应里程数不是中位数,因此A不正确;月跑步平均里程在1月到2月,6月到7月,7月到8月,10月到11月都是减少的,故不是逐月增加,因此B不正确;月跑步平均里程高峰期大致在9,10,11三个月,8月份是相对较低的,因此C不正确;从折线图来看,1月至5月的跑步平均里程相对于6月至11月,波动性更小,变化比较平稳,因此D正确.答案:D
【高分训练】
1.已知某地区中小学生人数和近视情况分别如图8-2-8①和图8-2-8②所示.为了了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()图8-2-8A.200,20C
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全国自考(教育学)模拟试卷19
- 2026年高考化学考前20天冲刺讲义(四)(原卷版)
- 2026届山东省临沂平邑县联考中考语文考前最后一卷含解析
- 会计实习的总结
- 六年级《老人与海鸥》教学设计
- 六年级数学数和数的运算家庭练习题
- 企业托管协议书(9篇)
- 2026 学龄前自闭症社交距离认知课件
- 2026年财产分割协议标准法律
- 河南四市2025-2026学年高三5月质量检测(许济平洛四模)物理+答案
- 2026年宝鸡市辛家山林业局、宝鸡市马头滩林业局招聘(12人)考试参考题库及答案解析
- 智慧树 创造性思维与创新方法 章节测试答案
- 《装配式建筑概论》考核试题及答案
- 2025版跨境电商合作合同范本协议书2篇
- 【人工智能赋能小学体育教学的对策探究(论文)3800字】
- 社区医院-AI数字员工方案
- 第11课《防恐防暴有办法》课件
- 山东省汽车维修工时定额(T-SDAMTIA 0001-2023)
- 部编版语文六年级上册 第1单元 3 古诗词三首同步练习(有答案)
- 探寻中国茶:一片树叶的传奇之旅学习通章节答案期末考试题库2023年
- 猪的温度要求与夏季猪舍降温措施
评论
0/150
提交评论