十年高考数学真题分类:11 2 成对数据的统计分析_第1页
十年高考数学真题分类:11 2 成对数据的统计分析_第2页
十年高考数学真题分类:11 2 成对数据的统计分析_第3页
十年高考数学真题分类:11 2 成对数据的统计分析_第4页
十年高考数学真题分类:11 2 成对数据的统计分析_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11.2成对数据的统计分析

考点1变量间的相关关系

1.(2024天津,3,5分,易)下列散点图中,样本相关性系数最大的是()

A

3

观察各选项可知,A图中散点分布比较集中,且大体接近一条直线,呈现明显的正相关,线性回归

模型的拟合效果比较好,|r|相比于其他3图更接近1.故选A.

2.(2020课标Ⅱ理,18,12分)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该

地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个

作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:

22

公顷)和这种野生动物的数量,并计算得xi=60,yi=1200,(xi-)=80,(yi-)=

20202020

�=1�=1�=1��=1�

9000,(xi-)(yi-)=800.

20

�=1��

(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数

乘以地块数);

(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);

(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物

数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.

附:相关系数��=,≈1.414.

�=1(��−�)(��−�)�=1(��−�)(��−�)

����

22�222

�=1(��−�)�=1(��−�)�=1(��−�)�=1(��−�)

解析(1)由已知得样本平均数yi=60,从而该地区这种野生动物数量的估计值为60×200=

20

1

�=20�=1

12000.

(2)样本(xi,yi)(i=1,2,…,20)的相关系数

2020≈0.94.

�=1(��−�)(��−�)�=1(��−�)(��−�)80022

20202020

222280×90003

��=���===

(3)�=分1层(�抽−�样):�=根1据(�植−�物)覆盖面�=积1的(�大−�小)对�=1地块(�−分�)层,再对200个地块进行分层抽样.

理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面

积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总

体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.

3.(2015课标Ⅰ,理19,文19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:

千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量

yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

22

(xi-)(wi-)(xi-)(yi-)(wi-)(yi-)

8888

xywxwxywy

46.�=1�=1�=1�=1

5636.8289.81.61469108.8

6

表中

8

��=��,�=1��.

(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售�=1量y关于年宣传费x的回归方程类型?(给出

8

判断即可,不必说明理由)�

(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;

(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:

(i)年宣传费x=49时,年销售量及年利润的预报值是多少?

(ii)年宣传费x为何值时,年利润的预报值最大?

附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为

=�,=-.

^��^^

�=1(�−�)(�−�)

�2����

(��−�)

解析�=(11)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2分)

(2)令w=,先建立y关于w的线性回�归方程.由于

=8==68,

^(��−�)(��−�)

�=1108.8

8

�2

�1.6

�=1(�−�)

=-=563-68×6.8=100.6,

^^

����

所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.(6分)

^^

���

(3)(i)由(2)知,当x=49时,年销售量y的预报值

=100.6+68=576.6,

^

�49

年利润z的预报值=576.6×0.2-49=66.32.(9分)

^

(ii)根据(2)的结果知,年利润z的预报值

=0.2(100.6+68)-x=-x+13.6+20.12.

^

���

所以当==6.8,即x=46.24时,取得最大值.

^

13.6

��

故年宣传费为246.24千元时,年利润的预报值最大.(12分)

4.(2015重庆文,17,13分)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄

存款(年底余额)如下表:

年份20102011201220132014

时间代号t12345

储蓄存款y(千亿元)567810

(1)求y关于t的回归方程=t+;

^^^

���

(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.

附:回归方程=t+中,

^^^

���

=�=-.

^��^^

�=1��−n��

�22,����

��−n�

解析�=1(1)列表计算如下:

itiyitiyi

2

i

115t15

226412

337921

4481632

55102550

153655120

这里n=5,=ti==3,=yi==7.2.

��

115136

��=1��=1

�52�5

又ltt=-n=55-5×3=10,lty=tiyi-n=120-5×3×7.2=12,

��

22

�=1���=1��

从而===1.2,=-=7.2-1.2×3=3.6,

^^^

���12

�����

���10

故所求回归方程为=1.2t+3.6.

^

(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元).

^

5.(2014课标Ⅱ理,19,12分)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下

表:

年份2007200820092010201120122013

年份代号t1234567

人均纯收入y2.93.33.64.44.85.25.9

(1)求y关于t的线性回归方程;

(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地

区2015年农村居民家庭人均纯收入.

附:回归直线的斜率和截距的最小二乘估计公式分别为:

=�,=-.

^��^^

�=1(�−�)(�−�)

�2����

(��−�)

解析�=(11)由所给数据计算得

=×(1+2+3+4+5+6+7)=4,

1

7

=×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,

1

72

(ti-)=9+4+1+0+1+4+9=28,

7

�=1�

(ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,

7

�=1��

=7==0.5,

^(��−�)(��−�)

�=114

7

�2

�28

�=1(�−�)

=-=4.3-0.5×4=2.3,

^^

����

所求回归方程为=0.5t+2.3.

^

(2)由(1)知,=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千

^

元.

将2015年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8,

^

故预测该地区2015年农村居民家庭人均纯收入为6.8千元.

评析本题考查了回归直线方程的求解,注意回归直线恒过点(,)是关键,考查了回归系数的几何意义.

^

���

考查了学生的计算求解能力.

考点2列联表和独立性检验

1.(2024全国甲理,17,12分,易)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两

个车间的产品中随机抽取150件进行检验,数据如下:

优级品合格品不合格品总计

甲车间2624050

乙车间70282100

总计96522150

(1)填写如下列联表:

优级品非优级品

甲车间

乙车间

能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的

优级品率存在差异?

(2)已知升级改造前该工厂产品的优级品率p=0.5.设为升级改造后抽取的n件产品的优级品率,如果

>p+1.65,则认为该工厂产品的优级品率提高p了.根据抽取的150件产品的数据,能否认为生产线

p(1-p)

智p能化升级改造n后,该工厂产品的优级品率提高了?(≈12.247)

附:K2=,150

2

n(ad-bc)

(a+b)(c+d)(a+c)(b+d)

P(K2≥k)0.0500.0100.001

k3.8416.63510.828

.

解析

17

(1)列联表如下:

优级品非优级品

甲车间2624

乙车间7030

K2==4.6875,

2

150×(26×30−24×70)

∵3.84916<×45.46×817005×<65.0635,

∴有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲、乙两车间产

品的优级品率存在差异.

(2)由题知==0.64,

96

150

∵p=0.5,∴pp+1.65=0.5+1.65×

p(1-p)0.5×(1−0.5)

=0.5+≈0.5+n≈0.567,150

1.65×0.51.65×0.5

15012.247

∵>p+1.65,∴可以认为生产线智能化升级改造后,该工厂的优级品率提高了.

p(1-p)

pn

2.(2023全国甲理,19,12分,中)一项试验旨在研究臭氧效应,试验方案如下:选40只小

白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养

在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重

的增加量(单位:g).

(1)设X表示指定的两只小白鼠中分配到对照组的只数,求X的分布列和数学期望;

(2)试验结果如下:

对照组的小白鼠体重的增加量从小到大排序为

15.218.820.221.322.523.225.8

26.527.530.132.634.334.835.6

35.635.836.237.340.543.2

试验组的小白鼠体重的增加量从小到大排序为

7.89.211.412.413.215.516.518.018.819.219.820.221.622.8

23.623.925.128.232.336.5

(i)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的

数据的个数,完成如下列联表:

<m≥m

对照组

试验组

(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环

境中体重的增加量有差异?

附:2,

K=2

�(��−��)

(�+�)(�+�)(�+�)(�+�)P(K2≥k)0.1000.0500.010

k2.7063.8416.635

.

解析(1)依题意得,X的所有可能取值为0,1,2,

则(),

PX=0=02=

C20C2019

2

C4078

(),

PX=1=11=

C20C2020

2

C4039

(),

PX=2=20=

C20C2019

2

∴X的分布C4列0为78

X012

P

192019

∴E(X)=×0+×1+×2=1.783978

192019

783978

(2)(i)依题意可得m==23.4.

23.2+23.6

则对照组样本中小于m的2数据的个数为6,

试验组样本中小于m的数据的个数为14,

则列联表为

<m≥m

对照组614

试验组146

(ii)由(i)中列联表可得

2,

K=2=6.4>3.841

40×(6×6−14×14)

∴有9205×%20的×2把0×握20认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.

3..(2021全国甲理,17,12分)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两

台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:

一级品二级品合计

甲机床15050200

乙机床12080200

合计270130400

(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?

(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?

附:2,

K=2

�(��−��)

(�+�)(�+�)(�+�)(�+�)

P(K2≥k)0.0500.0100.001

k3.8416.63510.828

.

解析(1)因为甲机床生产的200件产品中有150件一级品,所以甲机床生产的产品中一级品的频率为

150

200=

,因为乙机床生产的200件产品中有120件一级品,所以乙机床生产的产品中一级品的频率为.

31203

4200=5

()根据列联表中的数据,得2

22×2K=2

�(��−��)

(�+�)(�+�)(�+�)(�+�)

,因为,所以有的把握认为甲机床的产品质量与乙机床

=2≈10.25610.256>6.63599%

400×(150×80−120×50)400

270×130×200×200=39

的产品质量有差异.

方法总结解决独立性检验问题的一般步骤:

4.(2020新高考Ⅰ,19,12分)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽

3

查了100天空气中的PM2.5和SO2浓度(单位:μg/m),得下表:

SO2

[0,50](50,150](150,475]

PM2.5

[0,35]32184

(35,75]6812

(75,115]3710

(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;

(2)根据所给数据,完成下面的2×2列联表:

SO2

PM2.5

[0,150](150,475]

[0,75]

(75,115]

(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.

附:2,

K=2

�(��−��)

(�+�)(�+�)(�+�)(�+�)

P(K2≥k)0.0500.0100.001

k3.8416.63510.828

.

解析(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为

32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为

=0.64.(4分)

64

(102

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论