2021届高三(新高考)数学大题优练 成对数据的统计分析_第1页
2021届高三(新高考)数学大题优练 成对数据的统计分析_第2页
2021届高三(新高考)数学大题优练 成对数据的统计分析_第3页
2021届高三(新高考)数学大题优练 成对数据的统计分析_第4页
2021届高三(新高考)数学大题优练 成对数据的统计分析_第5页
已阅读5页,还剩11页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

届高成对数据的统计分析优选例题例1.这一年来人类与新型冠状毒战争人们逐渐明白一个道理,人类社会组织模式的差异只是小事情,病毒在地球上存在了三四十年,而人类的文明史不过只有几千年而已,人类无法消灭病毒只能与之共存或者病毒自然消亡,在病毒前,个体自由要服从于集体或者群体生命的价值.在传染病学,通常把从致病刺激物侵入机体内或者对体发生作用起,到机体出现反应或开始呈现该疾病对应的相关状时止的这一阶段称为潜伏期,因此我们该注意做好良好的防护措施和隔离措施.某研究团队统计了某区0000名患者的相关信息,得到如表表:潜伏期(天)

人数

600

1900

3000

2500

1600250150(1)肺炎的潜伏期受诸多素的影响,为研究潜伏期与年龄的关系,通过分层抽样10000名者中抽取200进行研究,完成下面的2×2列联表,并判断能在犯错误的概率不超过0001的下认为潜伏期与患者年龄有关?潜伏期

潜伏期

总计60以上(含60岁

15060以下

30总计

200(2)上述数据,将频率作概率,且每名患者的潜伏期是否超8天独立.为了深入研,该团队在这一地区抽取了名,中潜伏期不超过8天人数最有可能是多少?附:

K

.P

2

0

0150

0100

0050

0.025

0

0

0.001

2072

2

3

5.024

6.635

7.879

828格解析,能名表数据可知,伏期大于8天数为

250

40

人,补充完整的2×2列表,60以上(含60岁

潜伏期130

潜伏期20

总计150

ˆˆ72222260以下ˆˆ722222总计

30160

2040

50200所以

2

40

10.828

,故能在犯错误的概率不超0.001

的前提下认为潜伏期与患者年龄关.(2)区10000名者中潜期不超过8天人数为

8000

名,将频率视为概率,潜伏期不超过8天概率为,5所以抽取的20名者伏期超过8天人数最有可能

名.例2.某种机械设备随着使用年的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把使用价值逐年减少的“换算成费用,称之“费.机械设备的使用年限(位:年)与失效费(位:万元)的统计数据如下表所:使用年限x单位:年)

1

2

3

4

5

6

7失效费

(单位:万元)

290

330

360

440

480

520

590(1)表数据可知,可用线回归模型拟合

y

与的系请关系数加以说明

)(2)关x性回归方程,并估算该种机械设备使10年失费参考公式:相关系数

r

i

(x)ii

.iiii线性回归方程bx斜率和截距最小二乘估计计算公式

iiii

,.i参考数据:

(x)i

i

y14.00,

y,198.2414.10.ii解

0.5

i,7.3

万元.题,知x

3.604.40

xi

28,i

ˆ131313y∴结合参考数据知:rˆ131313y

14.0014.000.99.28因为与x的系数近似,与x的相关程度相当大,从而可以用线性回归模型拟合y的.(2)

iiii

y4.3

.i∴于x的回归方程为

0.5

,将

代入线性回归方程,得

0.52.3

.∴估算该种机械设备使用10失效费为

万元.例3.近年来,明代著名医药学李时珍故乡黄冈市蕲春县大力发展大健康产业,蕲艾产业化种已经成为该县脱贫攻坚的主要产业之一,知蕲艾的株高y单:与一定范围内的温度单:)关,现收集了蕲艾的13组数据,得到下的散点图:现根据散点图利用x

y

建立y关x的归方程,令

x

t

得到如下数据:10.15

109.94

3.04

t0.16

ii

s

tyii

t

2i

s

2

t

2i

2

i

y

i

i

k

i

i13.94

11.670.2121.22且yii

yii

(i1,,3,,13)相关数分别为r,r,r

.(1)关系数说明哪种模型立y回归方程更合适;(2)1)的结果及表中数,建立关x归方程;(3)蕲艾的利润z与、y的系z

,当x为时z的值最大.参考数据和公式:

4562247,

247.637415.7365

nn2ˆ1313ˆnn2ˆ1313ˆ对于一组数据

vii

(i1,2,…,),其回归直线方程v

的斜率和截距的最小二乘法估计别为

viii2ii

,相关系数

r

i

iiiunuiii

.y

x

模型建立

与的归程适

当为20时这种草药的利润最大.题知r,r

13.9413.940.8858,11.67247.6374因为rr12

,所有用

y

x

模型建立

与x回归方程更合适.(2)

tiii2t2i

0.21

ydt0.16111.54

,i所以于x的方程为

.(3)意知

20

1x)x2230.8x)2230.820xx

,所以

,当且仅当

x

20℃

时等号成立,所以当温度为℃这种草药的润最大.

模拟优练1.在新型冠状病毒疫情期间,高中学校实施线上教学,为了解线上教学的效果,随机抽取100学生对线上教学效果进行评(分100分记低于

80

的评分为效”,不低于

80

分为“效较”(1)充完整2联表;通过计算判断,有没有的握认为上教学效果评分效果较好与别有关?效果一般

效果较好

合计男

女合计

(2)()中列联表的数据估全校线上教学的效果,用频率估计概率.从该校学生中任意抽人记所抽取的

人中线上教效果较好”的人数为X,求的列和数学期望.附表及公式:

0.15

0.10

0.05

0.025

0.010

2.072

2.706

3.841

5.024

6.635其中

k

n

.2.如图是M

市旅游局宣传栏中的一幅标题“2012~2019市接待游客人的统计.根据该统计图提供的信息解决下列问题.

nˆnˆ(1)市所统计的这8年待游客人次的平均值和中位数;(2)统计的8年取两,记其中接待游客人次不低于平均数的年份数为,的布和学期望

E

;(3)计图可看出,从2016年始,M市待游客的人次呈直线上升趋势,请你用线性归分析的方法预测2021年M市游客的人次.①参考公式:对于一组数据x,11

y22

ynn

,其回归直线

bx

的斜率和截距的最小二乘法估计分别b

iiiiiix2ii

nxynx

y.i

i②参考数据:x2016

0

1

2

3y

120

90

3303.首届中国国际进口博览会在家会展中心(上海)举行,吸引5个一带一”沿线国家的超过1000多家企业参展,成为共一一路”的又一个重要支撑.某业为了参加这次盛会,提升行业竞争力,加大了

66iˆniniˆn2n科技投入.该企业连续6年技投入x(元)与收益(元)的数据统计如下:66iˆniniˆn2n科技投入x

261012收益并根据数据绘制散点图如图所示

y

56.0...根据散点图的特点,甲认为样本分布在指数曲线

y

2

的周围,据此他对数据进行了一初步处理.如下表:

i

i

iii

i

i

ii

i43.5

4.512730.470其中zyi

i

6zi(1请据表中数据,建

y

关于x的方程(保留一位小数(ⅱ)根据所建立的回归方程,该企业想在下一年收益达2,则科技投入的费用至少要多?(其中5)(2)为样本点分布在二次线y2

的周围,并计算得回归方程为

0.922

,以及该回归模型的相关指数

R2

,试比较甲乙两人所建立的模型谁的拟合效果更好.附:对于一组数据uv

2

,vn

,其回归直线

v

的斜率和截距的最小二乘估计分别为

iii

.相关指数:

2

iiii

.i

55554.重庆十一中某组同学为参加届国青少年机器人竞赛重庆赛区选拔赛,需要从工厂订制件,已知该厂有两条不同生产线和B,学们为保证质量,现从各自生产产品中分别随机抽取20件行品质鉴定,鉴定成绩的茎叶图如下所:该零件的质量评价标准规定:鉴成绩达到为优秀;鉴定成绩达到80,90件,质量等级为良好;鉴定成绩到级合.组数据的频率视为整批产的概率.(1)成下面质量等级与生线产品列联表,并判断能不能在犯错误的概率不超0.05的况下,为产品等级是否达到良好以上与生产品的生产线有关;A产线的品

B生线的产品

合计良好以上合格合计(2)级为优秀的样本中随抽取两件,记为自B生的产品数量写出的布,求的数学期望;(3)确定机器人身上的零个数xi

与使用寿命

i

5

的关系,同时又兼顾灵敏性,同们通过实践研究把xi

i

5

的数据作了初步处理,得到下面散点图及一些统计量的值.

xii

wii

x2i

wii

i

i

i

iiˆ0.461.458iiˆ上表中wwx5ii根据散点图直接判断(不必说明由)

ya

与y

x

哪一个适宜作为y关x的方程类型?并根据表中数据建立y于x的归方程.附:K

2

(ad).()()(a)(0.102.706

0.053.841

0.016.635

0.0057.879对于一组数据1

v22

nn

v

的斜率和截距的最小二乘估计分为

iiii

vnuviiinui

.i

i

25525;33参考答25525;331见解析,9的把握认为分列见解析题,补充后的联表为:效果一般效果较好

合计男

25

2045女合计

2

10020

,因此有99%把认为线上教学效果评分效果较性别有关.0,1,2,3,(2)变量的值可能为由题可知,线上教“果较的频率为5

,则

X

3B3,,5可得

;3

36125

;54C125

27125

.则随机变量的布列为XP

8125

1

2

所以E

93(或EX5

2为

401.25

(万人次,位数为290

(万人分见解析数学期望为

;(3)万人次.均为

180250330

(人次)中位数为

(万人次.(2)于平均数的有3,的能取值为,,,

ˆ662则Pˆ662

CC

2528

1;PX58

2;PX28

.所以X的列为

0

12P

故EX(3)

33

2016330

2017510

2018720

2019960简化变量:

0

1

2

3y

90

330x

,y

iii

14.ii

xiiii

210

y

.i

时,x

,,

630735,以

.即2021年待客约为1365万次3y

0.5x

百万元建立的回归模型合效果更好.x

,令zbxlogc,alog2

,则

.根据最小二乘估计可知

i

iii

0.5,i从而

a4.5

,故回归方程为zx

,即

.(ⅱ)设

2

0.5

,解得x200即x52

,故科技投入的费用至少要百元下年益才能达到.

(2)立的回归模型的残差

i

5.6

6.5

12.027.580.0

i

yi

i

1.6

1.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论