2026年高考数学一轮复习(基础版)第九章 统计与成对数据的统计分析_第1页
2026年高考数学一轮复习(基础版)第九章 统计与成对数据的统计分析_第2页
2026年高考数学一轮复习(基础版)第九章 统计与成对数据的统计分析_第3页
2026年高考数学一轮复习(基础版)第九章 统计与成对数据的统计分析_第4页
2026年高考数学一轮复习(基础版)第九章 统计与成对数据的统计分析_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章统计与成对数据的

统计分析

§9.1随机抽样、统计图表

【课标要求】1.了解获取数据的基本途径2会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽

样.3.能根据实际问题的特点选择恰当的统计图表,体会使用统计图表的重要性.

---------------------------落实主干知识---------------------------

1.总体、个体、样本

调查对象的全体(或调查对象的某些指标的全体)称为,组成总体的每一个调查对象(或每

一个调查对象的相应指标)称为,在抽样调查中,从总体中抽取的那部分个体称

为,样本中包含的个体数称为,简称样本量.

2.简单随机抽样

和>比较常用的两种方法.

3.分层随机抽样

一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子息体,在每个

子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样

方法称为,每一个子总体称为.

4.统计图表

(1)常见的统计图表有、、、等.

(2)作频率分布直方图的步骤

①求;

②决定与;

③将数据;

④列频率分布表;

⑤画频率分布直方图.

B自主诊断

1.判断卜列结论是否止确.(请在括号中打7或“x”)

(1)在简单随机抽样中,每个个体被抽到的机会与先后顺序有关.()

(2)抽签法和随机数法都是简单随机抽样.()

(3)在受比例分配的分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.()

(4)在频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.()

2.从某年级500名学生中抽取60名学生进行体重的统计分析,就这个问题来说,下列说法不正确的是

()

A.该年级500名学生的体重是总体

B.该年级每名学生的体重是个体

C.抽取的60名学生的体重是一个样本

D.抽取的60名学生的体重是样本容量

3.“中国天眼”为500米口径球面射电望远镜,是具有我国自主知识产权、世界最大、最灵敏的单口径射

电望远镜.建造“中国天眼”的目的是()

A.通过调查获取数据B.通过试验获取数据

C.通过观察获取数据D.通过查询获取数据

4.从某校随机抽取某次数学考试100分以上(含100分,满分150分)的学生成绩,将他们的分数绘制成如图

所示的频率分布直方图.若共抽取了100名学生的成绩,则分数在[120,130)内的人数为.

国微点提醒

1.利用按比例分配的分层随机抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,可以进行定

的技术处理,比如将结果取成整数等.

2.频率分布直方图中纵轴上的数据是各组的频率除以组距,不要和条形图混淆.

・探究核心题型•

题型一抽样方法

例1(1)(2024.西安模拟)某高校对中文系新生进行体测,利用随机数法对65()名学生进行抽样,先将

650名学生进行编号:001,002,…,649,650.从中抽取50个样本,下面提供随机数表的第4行到第

6行,若从表中笫5行第6列开始向右读取数据,则得到的第6个样本编号是()

322118342978645407325242064438

12234356773578905642

844212533134578607362530073286

23457889072368960804

325678084367895355773489948375

22535578324577892345

A.623B.328C.072D.457

(2)某课题组对甲、乙、丙三地的空气质量进行调查,按地域特点分别在三地设置空气质量观测点.己知

甲、乙、丙三地内观测点的个数分别为20,户z且依次构成等差数列,而20,.丫-10,z成等比数列,

若用按比例分配的分层随机抽样的方法抽取观测点的30个数据,则丙地应抽取的数据个数为()

A.18B.16C.10D.4

思维升华(1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②等可能抽取.

⑵在笠比例分配的分层随机抽样中,抽样比二把巴=—.

总体容■各层个体总量

跟踪训练1(1)下列抽样方法是简单随机抽样的是()

A.某医院从200名医生中,挑选U50名最优秀的医生去参加培训

B.从1()部手机中逐个不放回地随机抽取2部进行质量检验

C.从空间直角坐标系中抽取10个点作为样本

D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查

(2)(2024.驻马店模拟)某电影上映引发「电信诈骗问题的热议,也加大了各个社区反电信诈骗的宣传力

度.己知某社区共有居民480人,其中老年人200人,中年人200人,青少年80人,若按年龄进行按比

例分配的分层随机抽样,共抽取36人作为代表,则中年人比青少年多()

A.6AB.9人C.12人D.18人

题型二统计图表

例2(1)(多选)根据不同年龄段学生身心发展特点,小学生每天唾眠时间应达到10小时,初中生应达

到9小时,高中生应达到8小时.某机构调查了1万名学生睡眠及学习的时间,利用信息得出如图所示

的折线图,则以下判断正确的有()

12«X)

力包灯」训_4).依_____

|()<9a8959441~.91!_9・63

/&

二*,7427“产9师&0煮7阳厂寸

)、7的工券。:7.917.91\

半6.|7.24,9\6.电6.28

=」4.'1,、.\

封5.7

详5.(

W辣w

洋&H&

—KKI1

小学11:lr111

A.高三年级学生平均学习时间最长

B.中小学生的平均睡眠时间都没有达到标准,其中高中生平均睡眠时间最接近标准

C.大多数年龄段学生平均睡眠时间长于学习时间

D.与高中生相比,大学生平均学习时间大幅下降,释放出的时间基本是在睡眠

(2)(多选)(2025・赤峰模拟)某学校组建了合唱、朗诵、脱口秀、舞蹈、太极拳五个社团,该校共有2000

名学生,每名学生依据自己的兴趣爱好最多可参加其中一个社团,各个社团的人数比例的扇形图如图

所示,其中参加朗诵社团的学生有8名,参加太极拳社团的学生有12名,则()

A.这五个社团的总人数为100

B.脱口秀社团的人数占五个社团总人数的20%

C.这五个社团的总人数占该校学生人数的5%

D.从这五个社团中任选一人,其来自脱口秀社团或舞蹈社团的概率为45%

思维升华统计图表的主要应用

(1)扇形图:直观描述各类数据占总数的比例.

⑵折线图:描述数据随时间的变化趋势.

(3)条形图和直方图:直观描述不同类别或分组数据的频数和频率.

跟踪训练2(1)(多选)(2024•深圳模拟)为丰富优质旅游资源,释放旅游消费潜力,推动旅游业高质量发

展,某地政府从2024年国庆期间到该地旅游的游客中,随机抽取部分游客进行调查,得到各年龄段游

客的人数和对景区服务是否满意的数据,并绘制统计图如图所示,则下列结论正确的是()

游客人数占比

扇形图旅游服务满意率

□青年人

□中年人

□老年人

A.到该地旅游的游客中,青年人是老年人的2倍多

氏到该地旅游的老年人的满意人数是青年人的2倍

C.到该地旅游的游客中满意的中年人占总游客人数的24.5%

D.到该地旅游的游客满意人数超过一半

(2)(多选)空气质量指数(AQI)是反映空气质量状况的指数,AQI值越小,表明空气质量越好,AQI不超

过50,空气质量为“优”;AQI大于50且不超过100,空气质量为“良”;AQI大于100,空气质量

为“污染”.如图是某市2023年空气质量指数(AQI)折线图.下列关于该市2023年空气质量的叙述中,

说法正确的是()

某市2()23年空气质量指数(AQI折线图

t2方3卜4,月6力7与819力1(由11'月月

一最小值*平均值.最大值

A.2023年全年平均AQI对应的空气质量等级为优或良

B.每月都至少有一天空气质量等级为优

C.2月、8月、9月和12月均出现污染天气

D.空气质量为“污染”的天数最多的月份是2月份

题型三频率分布直方图

例3某公司为了了解顾客对其旗卜.产品的满意程度,随机抽取〃名顾客进行满意度问卷调查,所得

评分(满分100分)均在[40,100]内,按从低到高将满意度分为四个等级:

调查[40,[50,[60,[70,[80,[90,

评分50)60)70)80)90)100]

满意度

不满意一般良好满意

等级

并绘制如图所示的频率分布直方图.已知调查评分在[70,80)内的顾客为80人.

(1)求〃的值及频率分布直方图中t的值;

(2)若某段时间有10()00名顾客购买该公司的产品,请估计这100()()名顾客中对该公司产品满意度等级

达到“满意”的人数;

(3)该公司设定的预案是:以抽取的样本作为参考,若顾客调查评分的均值低于80分,则需要对该公司

旗卜.产品进行调整,否则不需要调整,根据你所学的统计知识,判断该公司是否需要对旗卜产品进行

调整,并说明理由.(每组数据以区间的中点值代替)

思维升华频率分布直方图的相关结论

(1)频率分布直方图中各小长方形的面积之和为I.

(2)频率分布直方图中纵轴表示频率把,每组样本的频一率-为组距X把频率,即小长方形的面积.

组距组距

⑶频率分布直方图中每组样本的频数为频率X总数.

跟踪训练3某校为了解学生学习的效果,进行了一次摸底考试,从中选取6。名学生的成绩,分成

[40,50),[50,60),[60,70),[70,80),[80,90),[90,10()]六组后,得到不完整的频率分布直方图

如图所示,观察图形,回答下列问题:

频率

组距

().035

().03()

().025

0.020

().015

().010

0.005

________

405060708()9()10:)分数

⑴求分数在区间[7(),80)内的频率,并补全这个频率分布直方图;

(2)根据评奖规则,排名在前10%的学生可以获奖,请你估计获奖的学生至少需要多少分?

答案精析

落实主干知识

1.总体个体样本样本容量

2.抽签法随机数法

3.分层随机抽样层

4.(1)条形图扇形图折线图频率分布直方图(2)①极差②组距组数③分组

自主诊断

1.⑴X(2)4⑶X(4)4

2.D[由题可知,从某年级500名学生中抽取60名学生进行体重的统计分析,其中总体是该年级500名学

生的体重,个体是该年级每名学生的体重,样本是抽取的6()名学生的体重,样本容量是60,故只有D不

正确」

3.C[“中国天眼”主要是通过观察获取数据」

4.30

解析因为频率分布直方图中所有的小矩形面积和为I,PjfU(0.005+0.035+67+0.020+0.010)X10=1,解得

。=0.030,所以分数在[120,130)内的人数为100X0.030X10=30.

探究核心题型

例I(1)A[从第5行第6列开始向右读取数据,第一个数为253,第二个数是313,第三个数是457,下

一个数是860,不符合要求,下一个数是736,不符合要求,下一个数是253,重复,第四个数是007,第

五个数是328,第六个数是623,故A正确.]

20+z=2y,

(2)B[依题意得

.(y-10)2=20z.

解得[尸5。,或舍去)

Z=80(z=0

所以丙地应抽取的数据个数为T—X30=16.]

20+50+80

跟踪训练1(1)B[A选项中,挑选出50名最优秀的医生去参加培训,每个人被抽到的概率不相等,故A

错误;

B选项中,从10部手机中逐个不放回地随机抽取2部进行质量殓验,是简单随机抽样,故H正确;

C选项中,由于被抽取的样本总体的个数是无限的,所以不是简单随机抽样,故C错误;

D选项中,一次性抽取前1()箱,每箱被抽到的概率不相等,所以不是简单随机抽样,故D错误.]

(2)B[设中年人抽取工人,青少年抽取y人,由按比例分配的分层随机抽样可知黑=套,黑=萤,解得

48。3648036

x=15,y=6,故中年人比青少年多9人.]

例2(1)BC[根据图象可知,高三年级学生平均学习时间没有高二年级学生平均学习时间长,故A错

误;

根据图象可知,中小学生的平均睡眠时间都没有达到标准,其中高中生平均睡眠时间最接近标准,

故B正确;

根据图象可知,学习时间长于睡眠时间的有初二、初三、高一、高二、高三,占比为白,睡眠时间长于学

16

习时间的占比为所以大多数年龄段学生平均睡眠时间长于学习时间,故C正确;

16

从高三到大学一年级,学习时间减少了965-5.71=3.94(小时/天),睡眠时间增加了8.52-791=0.61(小时

/天),故D错误.]

(2)BD[对于A,参加朗诵社团的学生有8名,占比为10%,所以这五个社团的总人数为84-10%=

80(人),故A错误;

对于B,参加太极拳社团的学生有12名,可知其占五个社团总人数的124-80=15%,

因此脱口秀社团的人数占五个社团总人数的1一30%—10%—25%—15%=20%,故B正确;

对于C,该校共有2000名学生,所以这五个社团的总人数占该校学生人数的80・2000=4%,故C错

误;

对于D,由选项B易知脱口秀社团共有80X2()%=16(人),舞蹈社团共有80X25%=20(人),两社团共有

36人,所以从这五个社团中任选一人,其来自脱口秀社团或舞蹈社团的概率为36・80=45%,故D正确」

跟踪训练2(l)ACD|由扇形图可知青年人占比45%,是老年人占比20%的2倍多,故A正确;

其中满意的青年人占总人数的0.45X0.4X100%=18%,满意的中年人占总人数的(1一0.45—

0.2)X0.7X100%=24.5%,满意的老年人占总人数的0.2X0.8X100%=16%,故B错误,C正确;

总满意率为18%+24.5%+16%=58.5%>50%,故D正确.]

⑵AEC[根据折线图可知,每月平均AQI都小于100,故2023年全年平均AQI小于100,对应的空气质

量等级为优或良,故A正确;

每月AQI的最小值不超过5(),

故B正确;

2月、8月、9月和12月的AQI的最大值超过100,故C正确;

从折线图只能知道,2月AQI的最大值最大,不能说明2月的空气质量为“污染”的天数最多,

故D不正确」

例3解(1)由题意知

0.02X10〃=80,

10/+0.06+0.1+0.2+60r+90r=1,

所以“=400,/=0.004.

(2)6r=6X0.004=0,024,

则估计这10000名顾客中对该公司产品满意度等级达到“满意”的人数为10000X0.024X10=2400.

(3)由频率分布直方图得,顾客调查评分的均值为45X0.04+55X0.06+65X0.1+75X0.2+85X0.36+95X0.24

=80(分),

由题意知该公司不需要对旗下产品进行调整.

跟踪训练3解(1)设分数在[70,80)内的频率为x,

根据频率分布直方图,可得(0.()1+0.015+0.()2+().()25+0.()()5)XI()+%=1,解得x=().25,

所以分数在[70,80)内的频率为0.25,

补全这个频率分布直方图,如图所示.

(2)因为分数在区间[80,90)内的频率为0.25,在区间[90,100]闪的频率为0.05,

而0.05<10%<0.25+0.05,

设排名前1()%的分界点为90—。,则().()25a+().()05X10=1()%,解得a=2,

所以排名前10%的分界点为88分,即获奖的学生至少需要88分.

§9.2用样本估计总体

【课标要求】1.会用统计图表对总体进行估计,会求〃个数据的第〃百分位数2能用数字特征估计总体集中

趋势和总体离散程度.

---------------------------落实主干知识---------------------------

1.百分位数

一般地,一组数据的第〃百分位数是这样一个值,它使得这组数据中至少有的数据小于

或等于这个值,旦至少有(100—P)%的数据这个值.

2.平均数、中位数和众数

(1)平均数:x=.

(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最的一个数据(当数据个数是

奇数时)或最中间两个数据的(当数据个数是偶数时).

(3)众数:一组数据中出现次数的数据(即频数最大值所对应的样本数据).

3.方差和标准差

n

(1)方差:s2=______________或lExf—x2.

ni=l

(2)标准差:s=.

4.总体方差和总体标准差

(1)一般式:如果总体中所有个体的变量值分别为%,匕,…,%,总体平均数为T,则总体方差S?=

N

《£(匕一

i=1

(2)加权式:如果总体的N个变量值中,不同的值共有©ZWN)个,不妨记为H,匕,…,匕,其中匕

k

出现的频数为£(i=l,2,…,k),则总体方差为S2=(EAYi-Y)2.

i=1

3自主诊断

1.判断下列结论是否正确.(请在括号中打或"X”)

(1)对一组数据来说,平均数和中位数总是非常接近.()

(2)方差与标准差具有相同的单位.()

(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.()

(4)在频率分布直方图中,可以用最高的小长方形底边中点的横坐标作为众数的估计值.()

2.在下列统计量中,用来描述一组数据离散程度的量是()

A.平均数B.众数

C.百分位数D.标准差

3.已知在高考前最后一次模拟考试中,高三某班8名同学的物理成绩分别为84,79,84,86,95,84,

87,93,则该组数据的平均数和众数分别是()

A.86,84B.84.5,85

C.85,84D.86.5,84

4.(2024・周口模拟)已知一组从小到大排列的数据为m2,2,4,4,5,6,b,8,8,若其第70百分位数等

于其极差,则2〃+。=.

B微点提醒

1.若M,X2,…,居的平均数为元,方差为产,那么〃如+小…,〃叱的平均数为"沅+〃,方差为

m2s2.

2.数据Xi,X2,…,X”与数据Xi'=为+m%2'=及+小…,的方差相等,即数据经过平移后方差不

变.

■探究核心题型.

题型一样本数字特征的估计

例1⑴(多选)(2024•郴州模拟)随机抽取8位同学对他们2024年数学新课标全国I卷的平均分进行预

估,得到一组样本数据:97,98,99,100,101,103,104,106,则下列关于该样本的说法正确的有

()

A.平均数为101B.极差为9

C.方差为8D.第60百分位数为101

(2)如期是2023年11月中国的10个城市地铁运营里程(单位:公里)及运营线路条数的统计图,下列判

断正确的是()

2023年11月1。个城市地铁运营数据

A.这10个城市中北京的地铁运营里程最长且运营线路条数最多

B.这10个城市地铁运营里程的中位数是516公里

C.这10个城市地铁运营线路条数的平均数为15.4

D.这10个城市地铁运营线路条数的极差是12

思维升华计算一组〃个数据第〃百分位数的步骤

跟踪训练1(多选)随着互联网的发展,网上购物几乎成为了人们日常生活中不可或缺的一部分,这也

使得快递行业市场规模呈现出爆发式的增长.陈先生计划在家所在的小区内开一家快递驿站,为了确定

驿站规模的大小,他统计了隔壁小区的A驿站和8驿站一周的日收件量(单位:件),得到折线图如

图,则下列说法正确的是()

A驿站-8驿站

25(1

2()019()

20018()

、却一7

15013()1

120^’16。、7()

1(X>

5(1

5()

星期一星期二星期三星期四星期五星期六星期日

A.3驿站一周的日收件量的极差为80

B.A驿站日收件量的中位数为160

C.A驿站口收件量的平均值大于B驿站的口收件量的平均值

D.A驿站和B驿站的日收件量的方差分别记为sl,则*〉s;

题型二总体集中趋势的估计

例2某考试机构举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习

情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情

况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),

[110,130),[130,150]分组,绘制了如图所示的频率分布直方图.

⑴求出图中。的值并估计木次考试的及格率(“及格率”指得分为90分及以上的学生所占的比例);

(2)估计该校学生联考数学成绩的第80百分位数;

(3)估计该校学生联考数学成绩的众数、平均数.

思维升华频率分布直方图中的数字特征

⑴众数:最高矩形的底边中点的横坐标.

(2)中位数:中位数左边和右边的矩形的面积和应该相等.

⑶平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.

跟踪训练2(多选)(2024.佛山模拟)某企业是一所大学的社会实践基地,实践结束后学校对学生进行考

核评分,其得分的频率分布直方图如图所示,该学校规定,把成绩位于后25%的学生划定为不及格,

把成绩位于前25%的学生划定为优秀,则下列结论正确的是()

频率

组距

0.03

0.02------------------------------------

().01------------

o।------------------------►

2()3()4()5()607()8090分数

A.本次测试分数的极差在50~70之间

B.本次测试优秀分数线的估计值为76.2分

C.本次测试分数中位数的估计值为7()

D.本次测试分数的平均数小于中位数

题型三总体离散程度的估计

例3(2024.安康模拟)首届中国航协航空大会在各个展区中设置了多项互动体验活动,吸引了很多的

中小学生.现从某个有互动体验的展区中随机抽取60名中小学生,统计他们的参观时间(从进入该展区

到离开该展区的时长,单位:分钟,时间取整数),将时间分成[40,50),[50,60),…,[90,100]六

组,并绘制成如图所示的频率分布直方图.

[频率

组距

().03()--------------------

0.025...........................—।

0.015……]—|—

().01()

卜卜卜+十M,

♦405()60708090KX)参观时间(分)

(1)由频率分布直方图,估计样本的平均数H和方差";(每组数据以区间的中点值为代表)

(2)为对比展区是否有体验区对中小学生的吸引程度,某工作人员给出了一份该展区中没有体验区的参

观时间的随机数据,经计算得到该组数据的平均值为9=65,方差为s;=178,试判断有体验区的参观

时间的平均值比没有体验区的参观时间的平均值是否有显著提高?(如果五一歹,厘I则认为有显著

提高,否则不认为有显著提高)

(3)利用(2)中的结果,你认为展区是否应该设置互动体验展区?请说明理III.

思维升华总体离散程度的估计

标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标

准差(方差)越小,数据的离散程度越小.

跟踪训练3(1)(多选)(2024•佛山统考)甲、乙两台机床同时生产同一种零件,在10天中,两台机床每

天生产的次品数分别为:

甲:0,1,2,2,0,2,3,3,3,4:

乙:I,3,1,I,0,2,0,1,0,1.

则下列说法正确的是()

A.甲机床每天生产的次品数的平均数大于乙机床每天生产的次品数的平均数

B.甲机床每天生产的次品数的方差大于乙机床每天生产的次品数的方差

C.从这两组次品数的平均数和方差来看,乙机床的性能更好

D.从这两组次品数的平均数和方差来看,甲机床的性能更好

(2)(2024•珠海模拟)甲、乙两班参加了同一学科的考试,其中甲班50人,乙班40人.甲班的平均成绩为

72,方差为90;乙班的平均成绩为90,方差为6().那么甲、乙两班全部90名学生的平均成绩

是»方差是.

答案精析

落实主干知识

l.p%大于或等于

2.(询汨+及+…+*)⑵中间平均数(3)最多

n

71

3.(1,E(X,—%)2

n•1

I=1

⑵层FF

自主诊断

1.⑴X(2)X⑶Y(4)4

2.D|标准差反映了数据离散程度的大小,所以说标准差是用来描述一组数据离散程度的统计量,

故D正确.]

79+3x84+86+87+93+95

3.D[将样本数据按升序排列为79,84,84,84,86,87,93,95,可得平均数元=

8

=86.5,因为84出现次数最多,所以众数为84.]

4.10

解析因为10X0.7=7,所以。,2,2,4,4,5,6",8,8的第70百分位数为?,其极差为8—〃,

所以第=8-。,解得2a+〃=10.

探究核心题型

97+98+994-100+101+103+104+106

例1(l)ABD[平均数为

8

=101,A正确;

极差为106—97=9,B正确;

方差为(97-101)2+(98-101)2+…+(IO6-IOI)2

16+9+4+1+0+4+9+25_£7c错误。

因为60%X8=4.8,故第60百分位数为101,D正确.]

(2)C[北京的地铁运营线路条数最多,而运营里程最长的是上海,A错误;

地铁运营里程的中位数是我等=537.3(公里),B错误;

地铁运营线路条数的平均数为20+27+18+14+17+12+14+10+14+8

10

=15.4,C正确;

地铁运营线路条数的极差是27—8=19,D错误」

跟踪训练1BC[对于A选项,B驿站一周的日收件量的极差为160-40=120,故A错误;

对于B选项,A驿站日收件量从小到大排列为:130,150,160,160,180,190,200,所以中位数为

160,故B正确;

对于C选项,由图可知,4驿站日收件量每天都比8驿站的日收件量多,所以A驿站日收件量的平均值大

于B驿站的日收件量的平均值,故C正确;

对于D选项,由图可知,4驿站日收件量的波动比8驿站的日收件量的波动小,所以,故D错误」

例2解(1)由频率分布直方图的性质,可得(4+0.004+0.013+0014+0.016)X20=1,

解得(7=0.003.

所以及格率为(0.016+0.014+0.003)X20=0.66=66%.

(2)得分在110分以下的学生所占的比例为(0.004+0.013+0.016)X20=0.66,

得分在130分以下的学生所占的比例为0.66+0.014X20=0.94,

所以第80百分位数位于[110,130)内,

由110+20X88-0.66—120

0.94-0.66

估计第80百分位数为120.

(3)由题图可得,

众数的估计值为100.

平均数的估计值为0.08X60+0.26X80+0.32X100+0.28X120+0.06X140=99.6.

跟踪训练2ACD[由频率分布直方图可知,90-20=70,80-30=5(),极差在50-70之间,故A正确;

由频率分布直方图可知,分数不低于80的频率为0.2,分数不低于70的频率为0.5,所以优秀分数线的估

计值在区间[70,80)内,设其为m,则(80—"1)X0.03+0.2=0.25,

解得*78.3,故B错误;

因为分数不低于70的频率为0.5,所以本次测试分数中位数的估计值为70,故C正确;

因为频率分布直方图左拖尾,所以平均数小于中位数,故D正确.]

例3解(1)由题意得,

x=IOX(45X0.010+55X0.015+65X0.015+75X0.030+85X0.025+95X().(X)5)=71,

所以样本的方差为,=10X[(45-71)2X0.010+(55—71)2X0015+(65一刃)2X0.015+(75-71)2X0.030+(85-

71yX0.025+(95-71>XO.(X)5]=194.

(2)由题意得工一歹=71-65=6,

所以M一

所以有体验区的参观时间的平均值比没有体验区的参观时间的平均值有显著提高.

(3)从⑵中可知展区应该设置互动体验展区,这样可以吸引更多的参观者进行观看与体验,使他们能更多地

了解产品,并能更大程度地激发中小学生的兴趣爱好.

跟踪训练3(l)ABC[由题意,可得甲机床每天生产的次品数的平均数为土田

0+1+24-2+0+2+3+3+3+4

=2,

方差为s2=—X[(()-2)2+(1-2)2+(2-2>+(2-2)2+(0-2)2+(2-2)2+(3-2)2+(3-2)2+(3-2)2+(4-2)2]=1.6;

甲10

乙机床每天生产的次品数的平均数为元/二1+3+1+1+。;2+0+1+0+1

乙10

方差为=1)2+(3-1)2+(1-1)2+(1-1)2+(0一1>+(2—1)2+(0—1)2+(1-1)2+(0-1)2+(1-1)2]=0.8.

比较发现乙机床每天生产的次品数的平均数较小而且方差也较小,所以乙机床的性能更好,结合选项,可

得选项A,B,C正确,选项D错误J

(2)80言

解析甲、乙两班全部9。名学生的平均成绩为e产=8。,

方差为江义[90+(72—80)2]+竺义[60+(90—80)2]=三X154-4\160=—

9090993

§9.3一元线性回归模型及其应用

【课标要求】1.了解样本相关系数的统计含义2了解最小二乘法原理,掌握一元线性回归模型参数的最小

二乘估计方法.3.针对实际问题,会用一元线性回归模型进行预测.

・落实主干知识・

1.变量的相关关系

(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关

系称为相关关系.

(2)相关关系的分类:和.

(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在附近,我

们就称这两个变量线性相关.

2.样本相关系数

Z(xf-x)(y,-y)

(l)r=//二】(九.

IE(Xi-x)2z(yi-y)2

#=1yji=i

(2)当,>0时,称成对样本数据;当Y0时,称成对样本数据.

(3)|r|Wl;当|r|越接近I时,成对样本数据的线性相关程度越;当|r|越接近0时,成对样本数

据的线性相关程度越.

3.一元线性回归模型

⑴我们将$="+.称为丫关于x的经验回归方程,

n

b=i=l

其中£(所/2

i=i

.a=y-bx.

(2)残差:减去所得的差称为残差.

B自主诊断

1.判断下列结论是否正确.(请在括号中打7'或“义”)

⑴相关关系是一种非确定性关系.()

(2)散点图是判断两个变量相关关系的一种重要方法和手段.()

(3)经脸回归直线y=bx+a至少经过(为,y),(xi,yi),…,(x”,.%)中的一个点.()

(4)样本相关系数越小,成对样本数据的线性相关程度越弱.()

2.(多选)下列说法正确的是()

A.若两个具有线性相关关系的变量的相关性越强,则样本相关系数r的值越接近于1

B.当r=1时,两变量呈函数关系

C.当经验回归方程为,=0.3—0.7xE寸,变量x和y负相关

D.在经验回归方程,=0.4+0.5]中,当x每增加1个单位时,相应观测值y一定增加0.5个单位

3.(2024・茂名模拟)已知变量x和),的统计数据如表:

X12345

y66788

根据上表可得经验回归方程,=06r+'据此可以预测当x=8时,y约等于()

A.8.5B.9C.9.5D.I0

4.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品,已知该产品的色度,,和色差x之间

满足线性相关关系,且,=().8x—L8,现有一对测量数据为(33,25.2),则该数据的残差为.

回微点提醒

1.经验回归直线过点叵,y).

n

AAExtyi-nxy

2.求b时,常用公式力二母-----.

£xf-nx2

i=l

3.回归分析是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误.

---------------------------探究核心题型----------------------------

题型一成对数据的相关性

例1(1)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是()

样本相关系数八样本相关系数「2

5]()152()253035051()1520253()35

样本相关系数小样本相关系数

A.r4<r2<0<n<r3B.r2</*4<0<rj<ri

C.r2<r.i<O<ri<门D.riV厂2<()<门V厂1

(2)(2024.石家庄模拟)某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7

名男生,测量了他们的身高和体重得下表:

身高X

167173175177178180181

(单位:cm)

体重y

90545964677276

(单位:kg)

由表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论