统计案例和回归方程 (学生版)_第1页
统计案例和回归方程 (学生版)_第2页
统计案例和回归方程 (学生版)_第3页
统计案例和回归方程 (学生版)_第4页
统计案例和回归方程 (学生版)_第5页
已阅读5页,还剩22页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题28统计案例和回归方程

【考点预测】

知识点一、变量间的相关关系

1、变量之间的相关关系

当自变量取值•定时,因变量的取值带有•定的随机性,则这两个变量之间的关系叫相关关系.由于

相关关系的不确定性,在寻找变易之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收

集大量的数据-,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.

注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,

而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.

2、散点图

将样本中的〃个数据点=…描在平面直角坐标系中,所得图形叫做散点图.根据散点图

中点的分布可以直观地判断两个变量之间的关系.

(I)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变最的这种相关关系,我们将

它称为正相关,如图(1)所示;

(2)如果散点图中的点散布在从左上角到右下角的区域内:对于两个变量的这种相关关系,我们将

它称为负相关,如图(2)所示.

3、相关系数

若相应于变量x的取值七,变量y的观测值为则变量X与y的相关系数

£(内-x)(y-y)

通常用,•来衡量x与),之间的线性关系的强弱,

42t(另一才

/=|1=1

r的范围为TVrWl.

(!)当厂>0时,表示两个变量正相关;当一<0时,表示两个变量负相关.

(2)卜|越接近1,表示两个变量的线性相关性越强;W越接近0,表示两个变量间几乎不存在线性相

关关系.当m=1时,所有数据点都在一条直线上.

(3)通常当|r|>0.75时,认为两个变量具有很强的线性相关关系.

知识点二、线性回归

1、线性回归

线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.

对于一组具有线性相关关系的数据(汨,乃),(X2,”),…,(&,%),其回归方程),=反+。的求法为

.__〃__

-x)(y,-y)Z%/-

z>=-^—;--------------=-4-------------

力(3T)2力兀2一屋

/.=1—/=1

a=y—bx

其中,x=-V^,y=-Vy;>(x»y)称为样本点的中心.

〃trnM

2、残差分析

对于预报变量y,通过观测得到的数据称为观测值其,通过回归方程得到的),称为预测值,观测值减

去预测值等于残差,自称为相应于点。,凹)的残差,即有e=y-五.残差是随机误差的估计结果,通过

对残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残

差分析.

(1)残差图

通过残差分析,残差点ae)比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样

的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.

(2)通过残差平方和Q=£(y「t.)2分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;

i=l

反之,不合适.

(3)相关指数

Z(),j-5',)2

用相关指数来刻画回归的效果,其计算公式是:/?2=1_弋二

J=1

内越接近于1,说明残差的平方和越小,也表示I可归的效果越好.

知识点三、独立性检验

1、分类变量和列联表

(1)分类变量:

变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.

(2)列联表:

①定义:列出的两个分类变量的频数表称为列联表.

②2x2列联表.

一般地,假设有两个分类变量X和匕它们的取值分别为{M,42}和{.,32},其样本频数列联表(称

为2x2列联表)为

力总计

aha+b

Cdc+d

总计4+Cb+da+b+c+d

从2x2列表中,依据,一与,的值可直观得出结论:两个变量是否有关系.

a+bc+d

2、等高条形图

(1)等高条形图和表格相比,更能直观地反映出两个分类变景间是否相互影响,常用等高条形图表示列

联表数据的频率特征.

(2)观察等高条形图发现,-与二—相差很大,就判断两个分类变量之间有关系.

a+bc+d

3、独立性检验

(I)定义:利用独立性假设、随,机变量K?来确定是否有一定把握认为“两个分类变量有关系”的方法

称为两个分类变量的独立性检验.

(2)公式:K2=----------------------,其中〃=a+〃+c+d为样本容量.

{a+b){c+d)(a+c)(b+d)

(3)独立性检验的具体步骤如下:

①计算随机变量K2的观测值2,查下表确定临界值即:

0.50.400.250.15().100.050.0250.0100.0050.001

k。0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828

②如果就推断“X与y有关系”,这种推断犯错误的概率不超过〃(K22%):否则,就认为在犯错

误的概率不超过〃(代之《)的前提下不能推断“X与y有关系”.

(2)两个分类变量x和y是否有关系的判断标准:

统计学研究表明:

当K?<3.841时,认为乂与丫无关;

当六>3.841时,有95/的把握说X与丫有关;

当代>6.635时,有99/的把握说X与V有关;

当公>10.828时,有99.9/的把握说X与丫有关.

【典型例题】

例1.(山东省枣庄市2024届高三学期3月模拟考试数学试题)某儿童医院用甲、乙两种疗法治疗小儿消

化不良.采用有放同简单随机抽样的方法对治疗情况进行检查,得到两种疗法治疗数据的列联表:

疗效

疗法合计

未治愈治愈

甲155267

乙66369

合计21115136

经计算得到万会4.881,根据小概率值a=0.005的独立性检验(已知/独立性检验中/期=7.879),则可

以认为()

A.两种疗法的效果存在差异

B.两种疗法的效果存在差异,这种判断犯错误的概率不超过0.005

C.两种疗法的效果没有差异

D.两种疗法的效果没有差异,这种判断犯错误的概率不超过0.005

例2.(四川省成都市2024届高三学期第二次诊断性检测文科数学试题)对变量乂y有观测数据

(x"J(ieN'),得散点图1:对变量〃/有观测数据得散点图2.彳表示变量2之间的线性

相关系数,4表示变量〃/之间的线性相关系数,则下列说法正确的是()

----------------------->----------------------〜

Ox0u

图1图2

A.变量X与y呈现正相关,且用<1引B.变量X与y呈现负相关,且用>|引

c.变量x与y呈现正相关,且用>|目D.变量*・与丁呈现负相关,且用<|目

例3.(FHsxl225ylI36)如图,去掉点53,10)后,下列说法错误的是()

y.£(10,12)

♦0(3,10)

・C(4,5)

♦BQ,4)

》(1,3)

0

A.相关系数厂变大

B.残差平方和变大

C.决定系数R2变大

D.解释变量x与预报变量),的相关性变强

例4.(湖南省2024年普通高等学校招生全国统一考试考前演练二数学试题)某骑行爱好者在专业人士指

导下对近段时间骑行锻炼情况进行统计分析,统计每次骑行期间的身体综合指标评分x与骑行用时)’(单

位:小时)如下表:

身体综合指标评分(X)12345

用时(y/小时)9.5887.876.1

由上表数据得到的正确结论是()

参考数据:£(七一元)2=10.火(),「592=7.06.£(斗一无)(),,一59=-8.4,厢=8.402.

1=11=1r=l

参考公式:相关系数「=下声------:----------

)2

JV;=|zafZ/=1Gi

A.身体综合指标评分无与骑行用时y正相关

B.身体综合指标评分工与骑行用时•,的相关程度较弱

c.身体综合指标评分工与骑行川时),的相关程度较强

D.身体综合指标评分.%与骑行用时),的关系不适合用线性叵归模型拟合

例5.(四川省成都市第七中学2024届高三学期期末数学试题)在某病毒疫苗的研发过程中,需要利用基

因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2x2列联表

(部分数据缺失):

被某病毒感染未被某病毒感染合计

注射疫苗1()3U

未注射疫苗3050

合计30100

a0.10.050.010.0050.001

x02.7063.8416.6357.87910.828

计算可知,根据小概率值。=的独立性检验,分析、、给基因编辑小鼠注射该种疫苗能起至J预防该病毒

感染的效果()

Mad-bc)?

附:/=n=a+b+c+d.

(a+b)(c+d)[a+c)(b+d)

A.0.001B.0.05C.0.01D.0.005

例6.(云南省曲靖市2024届高三学期第一次质量监测数学试题)已知变量》关于x的回归方程为

若对y=两边取自然对数,可以发现与x线性相关.现有一组数据如下表所示:

X12345

yee3e4e6c7

则当x=6时,预测的值为()

A.9B.8C.「D.e8

例7.(山东省滨州市2024届高三学期期末数学试题)某学校一同学研究温差x(单位:。C)与本校当天

由上表中数据求得温差x与新增感冒人数》满足经验回归方程),=云+2.6,则下列结论不无酶的是()

A.x与丁有正相关关系B.经验回归直线经过点(8,25)

C.8=2.4D.x=9时,或差为0.2

例8.(云南省大理白族自治州2024届高三第二次复习统•检测数学试题)已知某种商品的广告费支出“

残差为.,(残差=观测值

例9.(天津市八校联考2023-2024学年高三学期期末质量调查数学试卷)学习于才干信仰,犹如运动于健

康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国''的高潮.某

老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:

天数工1234567

一次最多答对题数),12151618212427

参考数据:x=4,y=19,^x;=140,Zy:=2695,^x,.yr.=600,«2.45.

/=!;=li=l

〃7r

Zw-痕]

,-i

相关系数,"i„ifl=7“■I„

出炉)「唇-寸唇3唇f

由表中数据可知该老师每天一次最多答对题数y与天数x之间是相关(填"正''或"负"),其相关系数〃。

(结果保留两位小数)

例10.(2024年普通高等学校招生全国统一考试数学文科猜题卷(七))近年来,随着国家对新能源汽车

产业的支持,很多国产新能源汽车迅速崛起,其因颜值高、动力充沛、提速快、空间大、用车成本低等特

点得到民众的追捧,但是充电难成为影响新能源汽车销量的主要原因,国家为了加快新能源汽车的普及程

度,在全国范围内逐步增建充电桩.某地区2019—2023年的充电桩数量及新能源汽车的年销量如表所

示:

年份20192020202120222023

充电桩数量W万台13579

新能源汽车年销量W万辆2537485872

(1)己知可用线性1可归模型拟合),与x的关系,请用相关系数加以说明(结果精确到0.001);

(2)求,,关于x的线性回归方程,预测当该地区充电桩数量为24万台时,新能源汽车的年销量是多少万

辆?

参考公式:相关系数,=,回归方程y=&+认中斜率和截距的最小二乘估计公式分

点"呼,T

另U为"=-------厂,a=3-bx.

参考数据:£(±-1)2=40,£(方-亍)2=1326,£%/=1430,753040«230.3041.

例11.(湖北省七市州2024届高三学期3月联合统一调研测试数学试题)某高中学校为了解学生参加体育

锻炼的情况,统计了全校所有学生在一年内每周参加体育锻炼的次数,现随机抽取了60名同学在某一周

参加体育锻炼的数据,结果如下表:

一周参加体育锻炼次数01234567合计

男生人数1245654330

女生人数4556432130

合计579II1086460

(I)若将一周参加体育锻炼次数为3次及3次以上的,称为“经常锻炼”,其余的称为“不经常锻炼请完成

以卜.2x2列联表,并依据小概率值。=0.1的独立性检验,能否认为性别因素与学生体育锻炼的经常性有关

系;

锻炼

性别合计

不经常经常

男生

女生

合计

(2)若将•周参加体育锻炼次数为0次的称为“极度缺乏锻炼”,“极度缺乏锻炼''会导致肥胖等诸多健康问

题.以样本频率估计概率,在全校抽取20名同学,其中“极度缺乏锻炼”的人数为X,求E(X)和力(X);

(3)若将一周参加体育锻炼6次或7次的同学称为“运动爱好者”,为进一步了解他们的生活习惯,在样本的

10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为V,求V的分布列和数学期

望.

附:n(ad-bc)2______

4___n=a+b+c+d

(a+b)(c+d)(a+c)(b+d)

a0.10.050.01

2.7063.8416.635

例12.(陕西省汉中市汉台区2024届高三学期第四次校际联考数学试题)大学生刘铭去某工厂实习,实习

结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面枳(单位:mm2)和耗材

量(单位:mm'),得到如下数据:

样本号i12345678910总和

零件的横截面积占0.030.050.040.070.070.040.050.060.060.050.52

耗材量入0.240.400.230.550.500.340.350.450.430.413.9

10/1010

并计算得£茗必=0.2143,£再2_10/£城一所=]49136义10±

|«1\/=1/\1=1/

(1)估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;

(2)求刘铭同学制作的这种零件的横截面枳和耗材量的样本相关系数(精确到0.01);

(3)刘铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为

182mm2,若这种零件的耗材量和其横截面积近似成正比,请帮刘铭计算一下他制作的零件的总耗材量的

^x^-nxy____

估计值.附:相关系数「二『“』,449136。1.221.

例13.在一次抽样调查中测得5个样本点,得到下表及散点图.

⑴根据散点图判断),=4+辰与),=c+h『哪一个适宜作为),关于x的回归方程;(给出判断即可,不必说

明理由)

(2)根据(I)的判断结果试建立了与%的回归方程;(计算结果保留整数)

2>冽-〃f了2a,-可3-刃

参考公式:b=R---------------=J----------------,a=y-bx

£x:一〃♦元2fa-可2

(=1'I

【过关测试】

一、单选题

1.对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,下列结论正确的是()

3535

3030

2525

2020

1515

1010

55

O510152025303505101520253035

样本相关系数为小样本相关系数为小

3535

3030

2525

2020

1515

1010

55

0510152025303505101520253035

样本相关系数为八样本相关系数为小

A.弓B.rA<r2<0<^<ry

C.<r2<0<ry<r]D.47qv0v,iqG

2.(上海市普陀区桃浦中学2024届高三学期期末数学试题)下列命题中,真命题的是()

A.若回归方程>=-2x+0.1,则变量>与x负相关

B.线性回归分析中决定系数用来刻画回归的效果,若该值越小,则模型的拟合效果越好

C.若样本数据外,9,…,&R的方差为2,则数据网0灯…斗即用的方差9

D.若尸(4)与P(B)独立,则尸(AD8)=P(A|8)P(4)

3.(内蒙古呼和浩特市2024届高三学期学业质量监测数学试题)用模型),=屣蛇拟合-组数据组

(4f)(i=l,2,3,…,7),其中凡+&+…+芯=14,设z=lny,得变换后的线性回归方程为z=大+1,则

)1%…%=()

A.e35B.e21C.35D.21

4.(上海市浦东新区2024届高三学期期中教学质量检测数学试卷)通过随机抽样,我们绘制了如图所示

的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下

方的点A后,下列说法正确的是()

4

1年需求量/千克

.35

z5

2

L5

1

9

.05

2—4—6—8—10每-克价格/百元

消费者年需求量与商品每千克价格的散点图

A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关

B.“每千克价格”与“年需求职”这两个变显的线性相关程度不变

C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大

D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小

二、多选题

5.(2024届广东省湛江市高三一模数学试题)某养老院有110名老人,经过一年的跟踪调查,过去的一年

中他们是否患过某流行疾病和性别的相关数据如下表所示:

是否患过某流行疾病

性别合计

患过该疾病未患过该疾病

男。=20ba+b

女C4=50c+d

合计a+c80110

下列说法正确的有()

n(ad-bc)~

参考公式:/2=,其中〃=a+b+c+d.

(a+〃)(c+d)(a+c)S+d)

附表:

a0.10.050.0250.010.001

XU2.7063.8415.0246.63510.828

a+bc+d

B.z2>6.635

C.根据小概率值a=0.01的独立性检验,认为是否患过该流行疾病与性别有关联

D.根据小概率值a=0.01的独立性检验,没有充分的证据推断是否患过该流行疾病与性另J有关联

6.(河北省沧州市泊头市联考2024届高三学期高考模拟考试数学试题)下表是某地从2019年至2023年

能源消费总量近似值),(单位:千万吨标准煤)的数据表:

年份20192020202120222023

年份代号X12345

能源消费总量近似值y(单位:千万吨标准煤)44.244.646.247.850.8

以工为解释变量,)'为响应变量,若以%+4为回归方程,则决定系数用=0.9298,若以

%=%/+/工+。2为回归方程,则R;B().9965,则下面结论中正确的有()

A.变量工和变量y的样本相关系数为正数

B.%=32+~+02比3=&%+%的拟合效果好

C.由回归方程可准确预测2024年的能源消费总量

D.y=3Z?,+a]

7.(FHsxl225yli36)(多选)某学校为了调查学生对“只要学习够努力,成绩一定有奇迹''这句话的认可程

度,随机调杳了90名本校高一、高二的学牛,得到如下列联表.用样本估计总体.则下列说法正确的是

(参考数据:/=--〃吗二反)P(/>6.635)=0.0l0,10.828)=0.001)

(a+b)(c+d)(a+c)(b+d)

()

认可不认可总计

高一202040

高二401050

总计603090

A.高一高二大约有66.7%的学生认可这句话

B.高一高二大约有99%的学生认可这句话

C.依据a=0.01的独立性检给,认为学生对这句话认可与否与年级有关

D.在犯错误的概率不超过0.01的前提下,认为学生对这句话认可与否与年级无关

8.(安徽省芜湖市安徽师范大学附属中学2024届高三第二次模拟考试数学试题)已知由样本数据(4%)

(/=1»2,3,10)组成的一个样本,得到回归直线方程为g=r+3,且1=4.剔除一个偏离直线较大

的异常点(-5,-1)后,得到新的回归直线经过点(6,-4).则下列说法正确的是

A.相关变量x,y具有正相关关系

B.剔除该异常点后,样本相关系数的绝对值变大

C.剔除该异常点后的回归直线方程经过点(5,-1)

D.剔除该异常点后,随x值增加相关变量、,值减小速度变小

9.(湘豫名校联考2024年2月高三第一次模拟考试数学试题)下列说法中,正确的是()

A.设有一个经验回归方程为$,=1-2工,变量x增加1个单位时,,,平均增加2个单位

B.已知随机变量4~N(0,/),若2片>2)=0.2,则P(—2VqK2)=0.6

C.两组样本数据百,%2,J七和凹,)’2,兄,北的方差分别为〈金.若已知七+方=10且为<y(i=123,4),

则S;=

D.已知一系列样本点(七,y)(i=l,2,3,.)的经验回归方程为$,=3x+6,若样本点(见3)与(2,〃)的残差

相等,则3〃?+“=10

10.(河南省部分重点中学2024届高三学期2月质量检测数学试题)已知变量苍N之间的经验回归方程为

),=-入+。,且变量2的数据如下表所示:

X56s1214

J108651

则下列说法正确的是()

A.变量X,),之间负相关B.4=13

C.当x=3时,可估计了的值为11D.当x=8时,残差为-1

11.(吉林省部分学校2024届高三学期高考模拟(三)数学试题)为了解高二学生是否喜爱物理学科与性

别的关联性,某学校随机抽取了200名学生进行统计.得到如图所示的列联表,则下列说法正确的是

()

物理学科

性别

喜爱不喜爱

男6040

女2080

3

A.喜爱物理学科的学生中,男生的频率%

B.女生中喜爱物理学科的频率为,

4

C.依据小概率值a=0.001的独立性检验,可以推断学生是否喜爱物理学科与性别有关

D.在犯错误的概率不超过0.1%的前提下,认为学生是否喜爱物理学科与性别无关

n(ad-be)1

参考公式:z2=其中〃=a+6+c+d.

(a+b)(c+d)(a+c)(b+d)

附表:

a0.100.050.010.0050.001

42.7063.8416.6357.87910.828

12.(云南省三校2024届高三高考备考实用性联考卷(五)数学试题)下列命题正确的是()

A.若样本数据不占,,4的方差为3,则数据2%+1,29+1,,24+1的方差为12

B.以模型去拟合一组数据时,为了求出经验回归方程,设z=lny,求得线性回归方程为

z=2.r+0.5,则c=e0$M=2

C.若某校高三(1)班8位同学身高(单位cm)分别为:[70,168,172,173,174,175,173,

178,则这组数据的下四分位数(即第25百分位数)为170

D.根据变量X与V的样本数据计算得到/=3.627,根据。=0.05的独立性检验($05=3.841),可判

断X与V有关,且犯错误的概率不超过0.05

13.(浙江省宁波市慈溪市2024局高三学期期末测试数学试题)某电商平台为了对某•产品进行合理定

()

A.相关系数r>0B.点(9,80)一定在经验回归直线上

C.a=258.2D.x=9.5时,对应销量的残差为-7.9

14.(广东省揭阳市2024届高三学期期末教学质量测试数学试题)2023年入冬以来,流感高发,某医院统

计了一周中连续5天的流感就诊人数,,与第x(x=l,2,3,4,5)天的数据如表所示.

X12345

y2110。15a90109

根据表中数据可知x,y具有较强的线性相关关系,其经验回归方程为»=20工+10,则()

A.样本相关系数在(0/内B.当*=2时,残差为-2

C.点(3,15〃)一定在经验回归直线上D.第6天到该医院就诊人数的预测值为130

15.(辽宁省沈阳市辽中区第一私立高级中学2023-2024学年高.二学期期末考试数学试题)对两个变量)和

x进行归I归分析,则下列结论正确的为()

A.回归直线至少会经过其中一个样本点(七,H)

B.残差平方和越小的模型,拟合的效果越好

C.建立两个回归模型,模型1的相关系数,0.999,模型2的相关系数4=。876,则模型2的拟合

度更好

D.以y=〃e.模型去拟合某组数据时,为了求出回归方程,设z=lny,将其变换后得到线性方程

z=6x+ln2,贝ij”涉的值分别为2,6

16.(重庆市黔江中学校2024届高三学期8月考试数学试题)下列说法中正确的是()

A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变

B.回归直线»=R+4恒过样本点的中心(只了),且至少过一个样本点

C.用相关指数R2来刻画回归效果时,R2越接近],说明模型的拟合效果越好

D.在2x2列联表中,I,以一反I的值越大,说明两个分类变量之间的关系越弱

三、填空题

17.(广东省广州市2024届普通高中毕业班综合测试(一)数学试卷)某校数学建模兴趣小组收集了一组

恒温动物体重W(单位:克)与脉搏率f(单位:心跳次数/分钟)的对应数据网,£。=1,2,...,8),根据

生物学常识和散点图得出/与W近似满足/=。卬"(c次为参数).令M=lnW,y=lnf,计算得,=8,

7=5,£>”214.由最小二乘法得经验回归方程为广法+7.4,则#的值为;为判断拟合效

/=1

果,通过经验回归方程求得预测值y«=1,2,...,8),若残差平方和之(K-XJ:0.28,则决定系数

R2*________.(参考公式:决定系数R?———)

L(x-y)

i=l

18.(专题04回归分析与独立性检验的应用(四大类型))学习于才干信仰,犹如运动于健康体魄,持之

已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起「'学习强国”的高潮.某老帅很喜

欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:

天数工1234567

一次最多答对题数y12151618212427

参考数据:x=4,卞=19,方片=140,和”2695,y=600,参=2.45,

i=li=lr=l

,r

相关系数,二汩、:“,=%-1.

博一)■博e旨3辱

由表中数据可知该老师每天一次最多答对题数y与天数x之间是正相关,其相关系数,公

(结果保留两位小数).

四、解答题

19.(四川省成都市郸都区2024届高三学期阶段检测(三))数据显示,中国在线直播用户规模及在线直播

购物规模近几年都保持高速增长态势,某线下家电商场为提升人气和提高营业额也开通了在线直播,下表统

计了该商场开通在线直播的第X天的线下顾客人数y(单位:百人)的数据:

X12345

y1012151820

(1)根据第1至第5天的数据分析,计算变量y与x的相关系数「,并用,•判断两个变量y与x相关关系的强

弱(精确到小数点后三位);

(2)根据第1至第5天的数据分析,可用线性回归模型拟合y与的关系,试求出该线性回归方程并估计该

商场开通在线直播的第10人的线下顾客人数.

.

2匕y」附

(参考公式:相关系数,=7/“_,参考数据:V170®13.038

V/=iVi=l

£(七一可(升一刃储身-〃芬

回归方程:§=/十加其中\§=

£(七-可2

/=|

20.(河南省TOP二十名校2024届高三学期质检i数学试题)近年来,短视频作为以视频为载体的聚合平

台,社交属性愈发突出,在用户生活中覆盖面越来越广泛,针对短视频的碎片化缺陷,将短视频剪接成长视

频势必成为一种新的技能.某机构在网上随机对1000人进行了一次市场调研,以决策是否开发将短视频剪

接成长视频的APP,得到如下数据:

青年人中年人老年人

对短视频剪接成长视频的APP有需求2a+4b200a

对短视频剪接成长视频的APP无需求a+b1504b

其中的数据为统计的人数,已知被调研的青年人数为400.

(1)求外〃的值;

(2)根据小概率值。=0.001的独立性检验,分析对短视频剪接成长视频的APP的需求,青年人与中老年人

是否有差异?

2

公,八一2n(ad-bc)_.,,

参考公式:Z=7---大7---不7----\/»>\»其中〃=a+〃+c+d.

(a+b)(c+d)(a+c)(b+d)

临界值.表:

a0.10.050.010.0050.001

%2.7063.8416.6357.87910.828

21.(山西省晋城市第一中学校2024届高三学期第|四次调研考试数学试题)成都笫31届世界大学生熨

季运动会于7月28日开幕,蓬勃向上的青春活力在“大运之城”绽放,多所学校掀起了运动的热潮,为了解

决学生对运动的喜爱程度,某学校从全校学生中随机抽取200名学生进行问卷调查,得到以下信息:

①抽取的学生中,男生占的比例为60%;

②拄取的学生中,不喜欢运动的学生占的比例为40%;

③抽取的学生中,喜欢运动的男生比喜欢运动的女生多40人.

(1)完成2x2列联表,依据小概率值二=0.05的X独立性检验,能否认为是否喜欢运动与性别有关联?

喜欢运动不喜欢运动合计

男生

女生

合计

(2)从随机抽取的这200名学生中随机抽取20人,其中喜欢运动的有11人,不喜欢运动的有9人,现从这

2()人中随机选出2人,设2人中喜欢运动的学生人数为X,求履机变量X的分布列.

世ad-g2

参考公式及数据n=a+b+c+d

(a+b)[c+(J)(a+c)(b+d)

a0.1000.0500.0100.001

勺2.7063.8416.63510.828

22.(河北省张家口市尚义县第一中学等校2024届高三学期开学收心联考数学试题)为了研究体育锻炼对

某年龄段的人患某种慢性病的影响,某人随机走访了200个该年龄段的人,得到的数据如卜.:

慢性病体育锻炼合计

经常不经常

未患病10070170

患病102030

合计11090200

o,未患病0,经常锻愆

(1)定义分类变量X、丫如下:X=,Y=以频率估计概率,求条件概率

L患病1,不经常锻炼

p(x=i|y=o)与p(x=i|y=i)的值;

(2)根据小概率值a=0.01()的独立性检验,分析经常进行体育锻炼是否对患该种慢性病有影响.

附:/=_______Maj"____

(a+b)(c+d)(a+c)(b+d)

a0.10.050.01(1(X)50.001

2.7063.8416.6357.87910.828

23.(江苏省南京市金陵中学2023-2024学年高三学期2月模拟测试数学试题)某高中为了了解高中学生暑

假期间阅读古典名著的时间x(小时/每周)和他们的语文成绩)'(分)的关系,某实验小组做了调查,得到

一些数据(表一).

表一

编号12345

学习时间》247710

语文成绩)'829395108122

(1)谙根据所给数据求出语文成绩y的平均数和方差;

(2)基于上述调查,学校为了确认学生喜欢阅读古典名著与语文成绩的关系,抽样调查了200位学生.按照

是否喜欢阅读古典名著与语文成绩是否优秀统计,得到下列数据,请依据表中数据及小概率值。=0.01的

独立性检验,分析“喜欢阅读古典名著与语文成绩优秀''是否有关.

表二

语文成绩优秀语文成绩不优秀合计

喜欢阅读7525100

不喜欢阅读5545100

合计13070200

n{ad-be)2

附:/

(,+b)(c+d)(a+c)(b+d)

a0.100.050.010

2.7063.8416.635

24.(陕西省2024届高三教学质量检测(一)文科数学试题)我国老龄化时代已经到来,老龄人口比例越

来越大,出现很多社会问题.2015年10月,中国共产党第十八届中央委员会第五次全体会议公报指出:

坚持计划生育基本国策,积极开展应对人口老龄化行动,实施全面二孩政策.随着国家二孩政策的全面放

开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调杳了100

位育龄妇女,结果如下表.

非一线一线总计

愿生40y60

不愿生X2240

总计5842100

⑴求x和y的值.

(2)分析调查数据,是否有95%以上的把握认为“生育意愿与城市级别有关”?

(3)在以上二孩生育意愿中按分层抽样的方法,抽取6名育龄妇女,再选取两名参加育儿知识讲座,求至少

有一名来自一线城市的概率.

n(ad-be)1

参考公式:z2=

(a+b)(c+d)(a+c)(b+d)

尸(/2&)0.0500.0100.001

k3.8416.63510.828

25.(广东省深圳外国语学校、执信中学2023-2024学年高三学期期末校际联考数学试卷)杭川第19届亚

运会,中国代表团共获得201金111银71铜,共383枚奖牌,金牌数超越2010年广州亚运会的199枚,

标志着我国体育运动又有了新的突破.某大学从全校学生中随机抽取了130名学生,对其日常参加体育运动

情况做了调查,其中是否经常参加体育运动的数据统计如下:

经常参加不经常参加

男生6020

女生4010

(1)利用频率估计概率,现从全校女生中随机抽取5人,求其中恰有2人不经常参加体育运动的概率;

(2)依据小概率值。=0.1的/独立性检验,能否认为是否经常参加体育运动与性别有关联.

n(ad-bc)2

参考公式:z2,n=a+b+c+d,

(a+〃)(c+d)(a4c)(Z,+d)

a0.10.050.010.0050.001

%2.7063.8416.6357.87910.828

26.(河北省张家口市2023-2024学年高三学期1月期末考试数学试题)某公司男女职工人数和等,该公司

为了解职工是否接受去外地长时间出差,进行了如下调查:在男女职工中各随机抽取了100人,经调查,

男职工和女职工接受去外地长时间出差的人数分别为40和20.

(1)根据所给数据,完成下面2x2列联表,并依据小概率值。=0.005的独立性检验,能否认为是否接受去外

地长时间出差与性别有关联?

单位:人

性别接受不接受合计

合计

(2)若将频率视为概率,,司样本估计总体,从该公司中随机抽取5人,记其中接受去外地长时间出差的人数

为X,求X的数学期望,

附表:

a0.10.050.010.0050.001

兀2.7063.8416.6357.87910.828

n(ad-bc)1

附:r=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论