(含答案及解析)(圆梦高考数学)专题102 统计案例_第1页
(含答案及解析)(圆梦高考数学)专题102 统计案例_第2页
(含答案及解析)(圆梦高考数学)专题102 统计案例_第3页
(含答案及解析)(圆梦高考数学)专题102 统计案例_第4页
(含答案及解析)(圆梦高考数学)专题102 统计案例_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题10.2统计案例

三I题型目录

犍一相关第犍关系数

题型二回归直线方程与样本中心

题型三线性回归方程

题型四非线性回归方程

题型五误差分析

题型六独立性检验

才典例集练

期型一相关关系与相关系数

例I.(2022春.河南省直辖县级单位.高一济源高中校考期末)下列两个变量具有相关关系的是()

A.正方形的边长与面积B.匀速行驶的车辆的行驶距离与时间

C.人的身而与视力D.人的身高与体重

例2.(2023春・河南濮阳•高二统考期末)某公司对其产品研发的年投资额x(单位:百万元)与其年销售量

(单位:千件)的数据进行统计,整理后得到如下统计表;

X12345

y1.523.5815

⑴求变量x和丁的样本相关系数「(精确到0.01),并推断变量“和)'的线性相关程度;(参考;若“20.75,

则线性相关性程度很强;若0.30<川<0.75,则线性相关性程度一般,若M«0.25,则线性相关性程度很弱.)

(2)求年销售量》关于年投资额”的经验回归方程.

Vfr-THv-vi>r-j?rv

参考公式:样本相关系数经验回归方程$,=以+日

.£(%-元)(£-田入犹-师.

中,=上「^-----------=±;~~;------,a=y-lix.参考数据百U7.14

/-加

i=l;=1

举一反三

练习1.(2023春・山东•高三济南市章丘区第四中学校联考阶段练习)(多选)在以下4幅散点图中,所对应

的成对样本数据呈现出线性相关关系的是()

练习2.(2023秋•高三课时练习)相关系数r是衡量两变量之间的线性相关程度的,对此有下列说法:①卜|

越接近于1,相关程度越大;②,越接近于0,相关程度越小;③卜|越接近于1,相关程度越小;④上|越接

近于0,相关程度越大.其中正确的是()

A.①②B.②®C.②③D.①④

练习3.(2023春•江苏常州•高三常州高级中学校考阶段练习)(多选)某学校一名同学研究温差x(C)与本

校当天新增感冒人数(人)的关系,该同学记录了5天的数据:

568912

>-1720252835

经过拟合,发现基本符合经验回归方程),=2.6x+〃,则下列说法正确的有()

参考公式:相关系数公式-----------------

A.样本中心点为(8,25)B.a=4.2

C.当x=5时,残差为-0.2D.若去掉样本点(8,25),则样本的相关系数,•增大

练习4.(2023春・全国•高三卫辉一中校联考阶段练习)(多选)沃柑,因其口感甜柔、低酸爽口,且营养成

分高,成为大家喜欢的水果之一,目前主要种植于我国广西、云南、四川、湖南等地.得益于物流的快速发

展,沃柑的销量大幅增长,同时刺激了当地农民种植沃柑的热情.根据对广西某地的沃柑种植面积情况进行

调查,得到统计表如下:

年份/20182019202020212022

年份代码X12345

种植面积w万亩814152028

1")(一)

附:①样本相关系数.....-;②*=%+》为经验回归方程,

人之(七-司(耳-亍)宜机-旃__

=-------;—=-^-------T,金="%,\/2240«47.33.

r=lr=1

根据上表,下列结论正确的是()

A.该地区这5年沃柑的种植面积的方差为212

B.种植面积),与年份代码x的样本相关系数约为0.972(精确到0.001)

C.丁关于x的经验回归方程为产4瓜+3.2

D.预测该地区沃柑种植面积最早在2027年能突破40万亩

练习5.(2023春•重庆沙坪坝•高三重庆•中校考期中)根据国家统计局统计,我国2018—2022年的新生儿

数量如下:

年份编号X12345

年份20182019202020212022

新生儿数量)’(单位:万人)1523146512001062956

(1)由表中数据可以看出,可用线性回归模型拟合新生儿数量与年份编号工的关系,请用相关系数目猊明相

关关系的强弱:(|国一|,则认为y与x线性相关性很强)

(2)建立y关于X的回归方程,并预测我国2025年的新生儿数量.

参考公式及数据:“质就粮=费篝署漳=’-庇溪I"62。6处”

22

6206,£葭巧以一5+9=-1537,-5x)(S'=1y?-5y),1564.

题型二回归直线方程与样本中心

例3.(2023春・上海宝山•高二上海市行知中学校考期中)己知x,y的对应值如下表所示:

X02468

y1耳13

若y与x线性相关,且回归直线方程为|国则匐

例4.(2023春・湖北武汉•高二武钢三中校考阶段练习)已知由样本数据点集合|因求得的

回归直线方程为|叵1|,且目),现发现两个数据点|冈|和「向上吴差较大,去除后重新求得

的回归直线附斜率为曰,则去除后当耳|时,了的估计值为□「

举一反三

练习6.(2023・上海奉贤•校考模拟预测)已知一组成对数据。8,24),(13,34),(10,38),(-1m)的回归方程为

y=-2r+59.5,则该组数据的相关系数”(精确到0.001).

练习7.(2023春・山东聊城•高三山东聊城一中校联考阶段练习)为研究变量X,),的相关关系,收集得到如下

数据:

X56789

y98643

若由最小二乘法求得y关于人的经验回归方程为),=-1.6工+〃,则据此计算残差为。的样本点是()

A.(5,9)B.(6.8)C.(7,6)D.(8,4)

练习8.(2023春•江苏连云港•高三校考阶段练习)某人工智能公司近5年的利润情况如下表所示:

第x年12345

7

利润加亿元2345

已知变量)'与x之间具有线性相关关系,设用最小二乘法建立的回归直线方程为),=1.2x+a,预测该人工智

能公司第6年的利润约为一亿元.

练习9.(2023春・山东青岛•高三青岛市即墨区第一中学统考期中)某研究性学习小组对春季昼夜温差大小

与某花卉种子发芽多少之间的关系进行研究,据统计得出了昼夜温差x(C)与实验室种子浸泡后的发芽数

y(颗)之间的线性回归方程:y=2Ax+a,且对应数据如下表:

温差X(℃)12345

发芽数W颗3781012

如果昼夜温差为13℃时,那么种子的发芽数大约是()

A.20颗B.29颗C.30颗D.36颗

练习10.(2023春•江苏淮安,高三淮阴中学校联考阶段练习)用碟型),=配版拟合-组数据组

(4)'J(i=l,2,…,7),其中百+%+…+吃=6.设z=lny,变换后的线性回归方程为2=x+5,则y%…H=

题型三线性回归方程

例5.(2023春・重庆北暗•高三重庆市兼善中学校考阶段练习)近年来随着教育科研的不断进步,兼善中学

教育质量不断提高,某知名机构对近年来升入北京航天航空大学兼善学子人数作了如下统计

年份20182019202020212022

时间代号3口地尾电

人数丁(人)地1地同

,0

附:回归方程|1冈|中,

(1)求〉'关于1的回归方程|冈…卜

⑵用所求回归方程预测兼善中学2023年(匚6)升入北航的人数

例6.(2023春•陕西延安•高二峡西延安中学校考期中)某校在一次强基计划模拟考试后,从全体考生中随

机抽取52名,获取他们本次考试的数学成绩(x)和物理成绩(y),绘制成如图散点图:

30405060708090100110120—130140150数学成绩

根据散点图可以看出y与x之间有线性相关关系,但图中有两个异常点A,B.经调杳得知,A考生由于重

感冒导致物理考试发挥失常,B考生因故未能参加物理考试.为了使分析结果更科学准确,剔除这两组数据

505050

后,对剩下的数据作处理,得到一些统计的值:W>,=58(X),Z»=3900,2>/=462770,

l-Ii-l7

5050

Z&-口2=28540,Z()',一刃2T8930,其中巷,达分别表示这50名考生的数学成绩、物理成绩,i=l,

/=1J=I

2,…,50,y与x的相关系数r=0.45.

⑴若不剔除A,B两名考生的数据,用52组数据作【可归分析,设此时y与x的相关系数为ro.试判断ro与

r的大小关系(不必说明理由);

⑵求y关于x的线性回归方程(系数精确到0.01),并估计如果B考生加了这次物理考试(已知B考生的

数学成绩为125分),物理成绩是多少?(精确到0.1)

附:线性回归方程中小=2+加中:b=-------------»a=y-bx.

£(—)2

Z=l

举一反三

练习II.(2023・安徽亳州・蒙城第•中学校联考模拟预测)为调宜某地区植被覆盖面积x(单位:公顷)和

野生动物数量y的关系,某研究小组将该地区等面积花分为40()个区块,从中随机抽取4()个区块,得到样

本数据(七,)力(i=L2,…,40),皆分数据如下:

X・•・2.73.63.23.9•••

y・・・50.663.752.154.3・・・

经计算得:0,0,H,回

(1)利用最小二乘估计建立y关于x的线性回归方程;

(2)该小组又利用这组数据建立了叉关于y的线性回归方程,并把这两条拟合直线画在同一坐标系匾]卜,

横坐标x,纵坐标y的意义与植被覆盖面积x和野生动物数量y一致.设前者与后者的斜率分另1为勺,k>

比较勺,凝的大小关系,并证明.

附:y关于x的回归方程区中,斜率和截距的最小二乘估计公式分别为:

练习12.(2023春・陕西宝鸡•高三眉县中学校考阶段练习)根据统计,某蔬菜基地西红柿亩产量的增加量》(百

千克)与某种液体肥料每亩使用量X(千克)之间的对应数据的散点图,如图所示.

八M百千克)

7----------

6-.........

5--------,

4-----,:

3——,:!

O24568%(千克)

(1)依据数据的散点图可以看出,可用线性回归模型拟合)'与文的关系,请计算相关系数用加以说明(若

后I,则线性相关程度很高,可用线性回归模型拟合);

(2)求y关于4的回归方程,并预测液体肥料每亩使用量为宿••克时,西红柿亩产量的增加量约为多少?附:

0

相关系数公式"口I归方程$,=以+否中斜率和截距的

0

最小二乘估计公式分别为:

练习13.(2023春.贵州黔东南•高三校考阶段练习)随着农村电子商务体系和快递物流配送体系加快贯通,

以及内容电商、直播电商等模式不断创新落地,农村电商呈现高速发展的态势,下表为2017-2022年中国农

村网络零售额规模(单位:千亿元),其中2017-2022年对应的代码分别为1-6.

年份代码X123456

农村网络零售额)’12.513.717.118.020.523.02

⑴根据2017-2021年的数据求农村网络零售额规模关于年度代码x的线性回归方程['因|(乙皿勺值精

确到0.01);

(2)若由回归方程得到的估计数据与剩卜的检验数据的误差不超过I千亿,则认为得到的回归方程是“埋想的”,

试判断(1)中所得回归方程是否是“理想的”.

参考公式:3

参考数据:0,0

练习14.(2023春・广东广州•高三广州市真光中学校考阶段练习)某乡政府为提高当地农民收入,指导农民

种植药材,并在种植药材的土地附近种草放牧发展畜牧业.牛粪、羊粪等有机肥可以促进药材的生长,发展

生态循环农业.下图所示为某农户近7年种植药材的平均收入y(单位:千元)与年份代码x的折线图.并计

算得到0,S,0,叵I,s

区,区,其中向

注:年份代码1-7分别对应年份2016-2022

⑴根据折线图判断,与后T哪一个适宜作为平均攻入y关于年份代码x的回归方程类型?并

说明理由;

⑵根据(1)的判断结果及数据,建立y关于x的回归方程,并预测2023年该农户种植药材的平均收入.

0■

附:相关系数,回归直线的斜率和截距的最小二乘法估”公式分别为:

,a=y-bx,>/1«2.65.

练习15.(2023春・安徽阜阳•高三安徽省临泉第一中学校考阶段练习)某城市的公交公司为了方便市民出行,

科学规划车辆投放,在一个人员密集流动地段增设一个起点站,为了研究车辆发车间隔时间x与乘客等候

人数y之间的关系,经过调查得到如下数据:

间隔时间a分钟)68101214

等候人数(y人)1518202423

(1)易知可用线性回归模型拟合y与x的关系,请用相关系数加以说明;

(2)建立y关于x的回归直线方程,并预测车辆发车间隔时间为20分钟时乘客的等候人数.

附:回归直线,二星+》的斜率和截距的最小二乘估计分别为

相关系数飞"电"广

题型四非线性回归方程

例7.(2023・陕西・西北工业大学附属中学校联考模拟预测)为了反映城市的人口数量x与就业压力指数y之

间的变量关系,研究人员选择使用非线性回归模型叵I对所测数据进行拟合,并设扃一得到的

数据如表所不,则I曰_________.

X46810

z2C56

例8.(2()23•江苏镇江•江苏省镇江中学校考三模)经观测,长江中某鱼类的产卵数V与温度工有关,现将收

集到的温度』和产卵数|区]|的10组观测数据作了初步处理,得到如图的散点图及一些统计量表.

E回回回0

360同同口再

叵一一区一一S

地国乔

表中0

350-••

300-

250■

200-*

150-•

100-•

50-•

.・।।「................r

0202224262830323436工

⑴根据散点图判断,与®_1哪一个适宜作为)'与x之间的回归方程模型并求出

关于x回归方程;(给出判断即可:不必说明理由)

(2)某兴趣小组抽取两批鱼卵,己知第•批中共有6个鱼卵,其中“死卵”有2个;第二批中共有8个鱼卵,

其中,,死卵,,有3个.现随机挑选•批,然后从该批次中随机取出2个鱼卵,求取出“死卵”个数的分布列及数

学期望.

附:对于一组数据局—其回归直线।的斜率和截距的最小二乘估计分别为

举一反三

练习16.(2023春・辽宁•高三辽宁实验中学校考阶段练习)某公司为确定下一年度投入某种产品的宣传费,

需了解年宣传费x(单位:千元)对年销售量y(单位:t)的影响,对近8年的年宣传费曲口年销售量

叵|数据作了初步处理,得到下面的散点图.根据散点图判断,下面四个回归模型中,最适合的

是()

V

62Z

60O

年O

销58

O

售56O

量54O

52O

50O

48%

0^38404244464850525456x

年宣传费(千元)

A.y=bx+aB.|1vlCI冈ID.向

练习17.(2023・全国•高二专题练习)规定抽球试验规则如下:盒子中初始装有白球和红球各一个,每次有

放回的任取一•个,连续取两次,将以上过程记为一轮.如果每一轮取到的两个球都是白球,则记该轮为成

功,否则记为失败.在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个红球,然后接

着进行下一轮抽球,如此不断继续下去,直至成功.

(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数

为陵机变量X,求X的分布列和数学期望;

(2)为验证抽球试验成功的概率不超过他有1000名数学爱好者独立的进行该抽球试验,记牌示成功时抽

球试验的轮次数,)'表示对应的人数,部分统计数据如卜.:

并预测成功的总人数(精确到1);

练习18.(2023・河北•统考模拟预测)为了研究某种细菌随天数1变化的繁殖个数九设|区|,收集数据

如下:

天数X123456

繁殖个数)’612254995190

表(【)

口口也SS0

3.5062.833.5317.50596.5712.08

表(H)

,繁殖个数y

200—;--r—v—:—7—:

150--5-4—?—!—j—

loo…;…彳…+…;…彳…;

5。…十

°・2.4.6.8天纵

⑴根据表(【)在图中作出繁殖个数)'关于天数*变化的散点图,并由散点图判断§=屏+§(□皿J常数)

与[百一|(U而J常数,且叵二|,|g|)哪一个适宜作为繁殖个数》关于天数1变化的回归方程类

型?(给出判断即可,不必说明理由)

(2)根据(1)中的判断结果和表(II)中的数据,建立了关于龙的经验回归方程(结果保留2位小数).

附:对于一组数据向三],|冈…,|冈其经验回归直线|冈|的斜率和截距的最小二乘法估

计分别为,回:

练习19.(2023春・山东聊城•高三山东聊城一中校联考阶段练习)今年刚过去的4月份是“全国消费促进月”,

各地拼起了特色经济“,带动消费豆苏、市场回暖.“小饼烤炉加醺料,灵魂烧烤三件套“,最近,淄博烧烤在

社交媒体火爆出圈,吸引全国各地的游客坐着高铁,直奔烧烤店,而多家店铺的营'小额也在近一个月内实

现了成倍增长.因此某烧烤店老板考虑投入更多的人工成本,现有以往的服务人员增量x(单位:人)与年

收益增量y单位:万元)的数据如下:

服务人员增量力人234681013

年收益增量W万元13223142505658

据此,建立了y与x的两个回归模型:

模型①:由最小二乘公式可求得)'与X的一元线性经验回归方程为自

模型②:由散点图(如图)的样本点分布,可以认为样本点集中在曲线I回I的附近.

对数据进行初步处理后,得到了一些统计的量的值:耳二旧|,眄,0,其

中旧~|,啊I

(1)根据所给的统计量,求模型②中》关于X的经验回归方程(精确到0.1);

(2)根据下列表格中的数据,比较两种模型的决定系数嗝并选择拟合精度更高的模型,预测服务人员增加

25人时的年收益增量.

回归模型模型①模型②

回归方程国_______0

182.479.2

附:样本|冈|的最小二乘估计公式为,|冈一|,刻画样

0

本回归效果的决定系数

练习20.(2023・全国•二三专题练习)党的二十大报告提出,从现在起,中国共产党的中心任务就是团结带

领全国各族人民全面建成社会主义现代化强国、实现第二个百年奋斗目标,以中国式现代化全面推进中华

民族伟大复兴.高质量发展是全面建设社会主义现代化国家的首要任务.加快实现高水平科技自立自强,才能

为高质量发展注入强大动能.某科技公司积极响应,加大高科技研发投入,现对近十年来高科技研发投入情

况分析调研,其研发投入y(单位:亿元)的统计图如图1所示,其中年份代码x=l,2,…,10分别指2013

年,2014年,…,2022年.

,研发费用y(亿元)

85

80

75.•

70•

65•

O12345678910年份代码x

图1

现用两种模型①L区分别进行拟合,由此得到相应的回归方程,并进行残差分析,得

到图2所示的残差图.结合数据,计算得到如下值:

10-0-——0

752.2582.54.512028.67

30

表4

⑴根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由;

⑵根据(1)中所选模型,求出y关于x的回归方程;根据所选模型,求该公司2028年高科技研发投入y

的预报值.(I可归系数精确到0.01)

附:对于一组数据后|其回归直线|冈|的斜率和截距的最小二乘估计分别为

题型五误差分析

例9.(2023春・河南濮阳•高三统考期末)某城市选用一种植物进行绿化,设其中一株幼苗从期察之日起,

第x天的高度为国,测得一些数据如下表所示

第x天1234567

高度1回11469111213

由表格数据可得到)'关于x的经验回归方程为I回——|,则第6天的残差为()

A.|gH'B.2.12C.|目D.0.08

例10.(2023春・浙江•高二统考阶段练习)(多选)某兴趣小组研究光照时长国和向日葵种子发芽数量弱!

最间的关系,采集5组数据,作如图所示的散点图.若去掉叵二(后,下列说法正确的是()

.E(8,ll)

8(2,6)

J-C(3,5)

'(1<)・。(10,2)

Ox

A.相关系数「的绝对值变小

B.决定系数国变大

C.残差平方和变大

D.解释变量”与响应变量N的相关性变强

举一反三

练习21.(2023春•河南新乡•高三统考阶段练习)两个变最)'与*的回归模型中,分别选择了4个不同的模

型,其中拟合效果最好的模型是〔)

A.模型1的决定系数月B.模型2的决定系数|叵]…上

C.模型3的决定系数月D.模型4的决定系数向三]

练习22.(2023•河南南阳•南阳中学校考模拟预测)网络直播带货助力乡村振兴,它作为一种新颖的销售土

特产的方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数x(其中10

场为一个周期)与产品销售额y(千元)的数据统计如下:

直播周期数X12345

产品销售额y(千元)37153040

根据数据特点,甲认为样本点分布在指数型曲线晌|的周围,据此他对数据进行了一些初步处理.如下

表:

母回000

5538265978101

其中I冈.-…

(1)请根据表中数据,建立y关于X的回归方程(系数精确到国);

(2)①乙认为样本点分布.在直线「叵I的周围,并计算得回归方程为I区一|,以及该回归模型的相

关指数|冈试比较甲、乙两人所建立的模型,谁的拟合效果更好?

(3)由①所得的结论,计算该直播间欲使产品销售额达到8万元以上,直播周期数至少为多少?(最终答案

精确至U1)

附:对于一组数据|国------其回归直线|冈----1的斜率和截距的最小二乘估计分别为

0

冈,相关指数:

练习23.(2023・高二课时练习)已知x、y的取值如下表:

X1234

y32487288

根据表中的数据求得y关于x的回归直线方程为|国则这组数据相对于所求的回归直线方程的4

个残差的方差为.

练习24.(2023・四川成都•四川省成都市玉林中学校考模拟预测)如图是某企'11(2()16年至2022年的污水净

化量(单位:吨)的折线图.

注:年份代码1~7分别对应年份2016~2022.

01234567年份代码,

(1)由折线图看出,可用线性回归模型拟合y和t的关系,请建立y关于t的回归方程,并预测2025年该企

业的污水净化量;

⑵请用相关指数说明回归方程预报的效果.

参考数据:00-

0

参考公式;线性回归方程

相关指数:

练习25.(2023・全国•高三专题练习)某种产品的广告支出费用工(单位:万元)与销售量丁(单位:万件)

之间的对应数据如下表所示:根据表中的数据可得回归宜线方程3=2.27X-1.08,店*0.96,以下说法正确

的是()

广告支出费用X2.22.64.05.35.9

销售量y3.85.47.011.6122

A.销售量y的多少有96%是由广告支出费用引起的

B.销售量》的多少有4%是由广告支出费用引起的

C.第三个样本点对应的残差|国回归模型的拟合效果一般

D.第三个样本点对应的残差向二回归模型的拟合效果较好

题型六独立性检验

例II.(2023•全国•模拟预测)2023上海蒸蒸日上迎新跑于2023年2月19日举办,该赛事设有21.6公里竞

速跑、5.4公里欢乐跑两个项目.某马拉松兴趣小组为庆祝该赛事,举行一场小组内有关于马拉松知识的有

奖比赛,一共有25人报名(包括20位新成员和5位老成员),其中20位新成员的得分情况如下表所示(满

分30分):

得分回_ELJ-BLH―Ls_J后

人数234641

得分在20分以上(含20分)的成员获得奖品一份.

(I)请根据上述表格中的统计数据,将下面的同列联表补充完全,并通过计算判断在20位新成员中,是否

有目的把握认为“获奖”与性别有关?

没获奖获奖合计

男4

女78

合计

⑵若5名老成员的性别相同并全部获奖,且进行计算发现在所有参赛人员中,有目的把握认为“获奖”与

性别有关.请判断这5名老成员的性别?

附:参考公式:0"

临界值表:

0.1000.0500.0100.001

2.7063.8416.63510.828

例12.(2023・全国•高三专题练习)为探究某药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为

对照组(不加药物)和实验组(加药物).

(1)设其中两只小鼠中对照组小鼠数目为[研求同1勺分布列和数学期望;

(2)测得40只小鼠体重如下(单位:g):(已按从小到大排好)

对照组:17.318.420.120.421.523.224.624.825.025.4

26.126.326.426.526.827.027.427.527.628.3

实验组:5.46.66.86.97.88.29.410.010.411.2

14.417.319.220.223.623.824.525.125.226.0

(i)求40只小鼠体重的中位数m并完成下面2x2列联表:

(ii)根据2x2列联表,能否有95%的把握认为药物对小鼠生长有抑制作用.

参考数据:

a0.100.050.010

i叵i2.7063.8416.635

举一反三

练习26.(2023春•重庆沙坪坝•高三重庆一中校考期中)有两个分类变量x和V,其中一组观测值为如下的

I反~I列联表:

回0]总计

0]Lg_l10

回誓自30

总计103()40

其中百=1均为大于庄整数,则J,时,在犯错误的概率不超过0.01的前提下为“V和)'之间有

n(ad-be]

关系”.附:K2=

(a+b)(c+d)(a+c)(b+d)

山一1国0.025申卬

a寻目1目寻LgJ

练习27.(2023春・福建三明•高三三明市第二中学校考阶段练习)两个分类变量X和Q其存列联表如表,

对同一样本,口的可能取值集合为|回-能说明X与朝关联的可能性最大的虽附值为.

X合计

回回

a369

陆8寻

合计目14Lg_J

练习28.(2023・上海徐汇・上海市南洋模范中学校考模拟预测)曷据北京冬奥组委会与特许生产商的特许经

营协议,从7月I日开始,包括冰墩墩公仔等在内的2022北京冬奥会各种特许商品将停止生产.现给出某

零售店在某日(7月1日前)上午的两种颜色冰墩墩的销售数据统计表(假定每人限购一个冰墩墩):

(1)若有99%的把握认为顾客购买的冰墩墩颜色与其性别有关,求a的最小值;

(2)在(1)中a取得最小值的条件下,现从所有顾客中选出9人,记选到的人中女顾客人数为X,求X的分

布及数学期望.

附:0

0.050.0100.001

%3.8416.63510.828

练习29.(2023春•云南昆明•高三昆明一中校考期中)对某校900名学生每周的运动时间进行调查,其中有

男生540名,女生360名,根据性别利用分层抽样的方法,从这900名学生中选取60名学生进行分析,统

计数据如下表(运动时间单位:小时)

男生运动时间统计:

运动时间(小时)[。,3)[3,6)[咐[9,12)[12,15)

人数X98124

女生运动时间统计:

运动时间(小时)[。,3)[3,6)[6,9)[9,12)[12,15)

人数y10521

⑴计算x,)'的值;若每周运动时间不低丁•6小时的同学称为“运动爱好者”,每周运动时间低「6小时的同

学称为“北运动爱好者”,根据以上统计数据填写下面的2x2列联表,则是否可以认为在犯错误的概率不超

过0.025的前提下认为“运动爱好者与性别有关”?

男生女生合计

运动爱好者

非运动爱好者

合计

即「n(ad_bc)2,

附:〃=a+Z?+c+d

(o+Z?)(c+d)(a+c)(〃+d)'

尸(代之勺)0.100.050.0250.0100.005

2.7063.8415.0246.6357.879

⑵在抽取的6()名学生样本中,从每周运动时间在[0,3)的同学中任取3人,记抽到的男生人数为随机变量3

求《的分布列和数学期望.

练习30.(2023春•江苏淮安・高三淮阴中学校联考阶段练习)某中学对50名学生的“学习兴趣”却“主动预习”

情况进行长期调查,得到统计数据如下表所示:

主动预习不太主动预习合计

学习兴趣高18725

学习兴趣i般61925

合计242650

⑴现从“学习兴趣一般'’的25个学生中,任取2人,若X表示其中“会主动预习”的学生的人数,求X的分布

列与数学期望;

(2)依据小概率值a=0.001的独立性检验,分析“学习兴趣”是否与“主动预习”有关.

n(ad-bc)2

参考数据、附表及公式:z2=,〃=〃+b+c+d.

(a+b)(c+d)(a+c)(b+d]

a0.100.050.0250.0100.005O.(X)I

Xa2.7063.8415.0246.6357.87910.828

专题10.2统计案例

三I题型目录

犍一相关第犍关系数

题型二回归直线方程与样本中心

题型三线性回归方程

题型四非线性回归方程

题型五误差分析

题型六独立性检验

才典例集练

期型一相关关系与相关系数

例I.(2022春.河南省直辖县级单位.高一济源高中校考期末)下列两个变量具有相关关系的是()

A.正方形的边长与面积B.匀速行驶的车辆的行驶距离与时间

C.人的身而与视力D.人的身高与体重

【答案】D

【分析】根据函数关系及相关关系的定义判断即可.

【详解】对于A,由正方形的面积S与边长"的公式知S=",即正方形的边长与面积具有函数关系,故A

错误;

对于B,匀速行驶车辆的行驶距离S与时间,为S=i%其中u为匀速行驶的速度,

即匀速行驶的车辆的行驶距离与时间具有函数关系,故B错误;

对于C,人的身高与视力无任何关系,故C错误;

对于D,人的身高会影响体重,但不是唯一因素,即人的身高与体重具有相关关系,故D正确.

故选:D.

例2.(2023春・河南濮阳•高二统考期末)某公司对其产品研发的年投资额x(单位:百万元)与其年销售量

)’(单位:千件)的数据进行统计,整理后得到如下统计表;

Xi2345

y1.523.5815

⑴求变量X和)'的样本相关系数「(精确到().01),并推断变量X和)'的线性相关程度;(参考;若|同2().75,

则线性相关性程度很强;若0.30班|<0.75,则线性相关性程度一般,若|收0.25,则线性相关性程度很弱.)

(2)求年销售量丁关于年投资额”的经验回归方程.

nu

EG一5)(凹一7)vX/Z.-/uy

参考公式:样本相关系数〃=下且----f----------="n="一~n-------';经验回归方程»=八+4

悟X,-叫加J**原"〃F

za-可(片-,)-如A

A1

中6=上-----------=――5------,a=y-bx.参考数据同5s7.14

za-对£七一,晓

i=lr-1

【答案】⑴。92,变量X和y线性相关性程度很强

⑵y=3.3x-3.9

【分析】(1)根据公式求出相关系数约等于092,从而得到答案;

(2)根据公式计算出5=3.3,«=-3.9,得到答案.

【详解】(1)由题意,元=3,»=6,

因为fX;=55,Xy;=307.5,X玉匕=123,

5—

-5冷,

j=l123-5x3x633

所以“.—-——]==—x0.92

R2L7155-5x9x7307.5-5x365V51

二斤-5),

因为M20.75,所以变量x和丁线性相关性程度很强.

2%凹一55y

123-5x3x6c、

(2)旌母------------------;­=3.3

55-5x32

/=1

根据&=9-加得,«=6-3.3x3=-3.9

所以年销售廉卜关于年投资额大的经验回归方程为a=3.3x-3.9.

举一反三

练习1.(2023春・山东•高三济南市章丘区第四中学校联考阶段练习)(多选)在以下4幅散点图中,所对应

的成对样本数据呈现出线性相关关系的是()

【分析】根据数据点的分布情况直观判断是占有线性相关关系即可.

【详解】A、B中各点都有线性拟合趋势,其中A样本数据正相关,B样本数据负相关;

C中各点有非线性拟合趋势,D中各点分布比较分散,它们不具有线性相关.

故选:AB

练习2.(2023秋•高三课时练习)相关系数r是衡量两变量之间的线性相关程度的,对此有下列说法:①卜|

越接近于1,相关程度越大;②卜越接近于0,相关程度越小;③卜|越接近于I,相关程度越小;④卜|越接

近干0,相关程度越大.其中正确的是()

A.①②B.②©C.②③D.①④

【答案】A

【分析】根据相关系数的性质可得结论.

【详解】由相关系数性质:卜|越接近于1,成对样本数据的线性相关程度越强,

卜|越接近于0,成对样本数据的线性相关程度越弱,

可知①@正确:

故选:A.

练习3.(2023春・江苏常州•高三常州高级中学校考阶段练习)(多选)某学校一名同学研究温差x(℃)与本

校当天新增感冒人数)'(人)的关系,该同学记录了5天的数据:

X568912

y1720252835

经过拟合,发现基本符合经验回归方程y=2.6x+a,则下列说法正确的有()

参考公式:相关系数公式

A.样本中心点为(8.25)B.4=4.2

C.当*=5时,残差为-0.2D.若去掉样本点(8,25),则样本的相关系数;•增大

【答案】ABC

【分析】根据平均数公式计算可得A正确;由4=》-2.6亍计算可得B正确;根据残差的定义计算可得C正

确;根据相关系数〃的公式分析可得D不正确.

【详解】x=-------------=8,),=------------------

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论