第八章《成对数据的统计分析》章末复习提升与检测(解析版)_第1页
第八章《成对数据的统计分析》章末复习提升与检测(解析版)_第2页
第八章《成对数据的统计分析》章末复习提升与检测(解析版)_第3页
第八章《成对数据的统计分析》章末复习提升与检测(解析版)_第4页
第八章《成对数据的统计分析》章末复习提升与检测(解析版)_第5页
已阅读5页,还剩16页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章《成对数据的统计分析》章末复习提升与检测

知识体系

E(x,-x)(y,-y)

样本相关系数口;E-

成对数据的变量的相关关系:

,统计相关性

一元线性网归模型

一元线性回归模型参数的最小二乘估it:

X4据

,

A残差分析

的一元线性回归_b=------------------

2

Z(x-X)2

计「模型及其应用ZO-y.)

和1建立回归模型决定系数-中------

斗。「刃2

1=1

2x2列联表

图形注,频率分析

q独立性检验)一

研究两个分类变「、匕行高堆积条形图

量之间的关系

算2=Mad-bcy

(fl+Z>)(c+J)(fl+c)(6+6/)

、能力整合

一、线性回归分析

1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本步骤为通过散点图和经

验选择经验回归方程的类型,然后通过一定的规则确定出相应的经验回归方程,通过一定的方法进行检验,

最后应用于实际或对响应变量进行预测.

2.主要培养数学建模和数据分析的素养.

【例1】某村在推进乡村振兴的过程中,把做活乡村产业作为强村富民的重要抓手,因地制宜推进茶叶种

植,成立了茶叶合作社.为了对茶叶在销售旺季进行合理定价,合作社进行了市场调研,得到了销售旺季

时销量)‘(吨)关于售价x(元/公斤)的散点图.

60

40

20

(x)

80

60

40

20。

(1)求)'关于X的线性回归方程;

⑵该合作社2023年茶叶总产量为150吨,如果在销售旺季时售价为250元/公斤,在销售旺季没能售出的,

年底以每公斤10。元的价格卖给批发商,则该合作社2023年的总销售额为多少万元?

za-可3-方

公式及参考数据:了关于x的线性回归方程为$,=九+3其中。=J-----------,a=y-bx;灭=250,

£(七-才

/=!

5=口0,XU-J)(-V/-V)=-5600,^(A;-J)2=7000.

出口1(可一可(),,一方—56004

【解】⑴由已知八一七4一词:一7

r-l

a=y-fe=100-f-1X250=300,

所以了关于x的线性回归方程为?=-14x+300;

4

(2)由(1)得当x=250时,y=--x250+300=100,

即旺季时的销量约为100吨,剩下的约为50吨,

所以该合作社2023年的总销售额(100x250+50x100)x103=30000000(元),

即该合作社2023年的总销售额为3000万元.

【解题技法】解决回归分析问题的一般步骤

(1)画散点图.根据已知数据画出散点图.

(2/]断变量的相关性并求经验回归方程.通过观察散点图,直观感知两个变量是否具有相关关系.在此基

础上,利用最小二乘法求3,at然后写出经验回归方程.

(3)回归分析.画残差图或计算作,进行残差分析.

(4)实际应用.依据求得的经验回归方程解决实际问题.

【跟踪训练】

如驾是某机构统计的某地区2016年至2022年生活垃圾无害化处理量y(单位:万吨)的折线图.

n

n.80

n.60

n.40

20

n.00

)O.80

234567

年份代码,

注:年份代码1-7分别对应年份2016-2022.

求关于,的回归直线方程(系数精确到0.01),并预测2024年该地区生活垃圾无害化处理量.

参考数据:之另=9.32,=40.17,之,-7)2=28,

曰/=1/=!

£(--反)

参考公式:回归方程2命+G中斜率和截距的最小乘估计公式分别为-----------,a=y-bT.

r=1

_,__—I+2+3+4+5+6+7y"1/—

【解】•••/=-----------------=4,Z&-)=28,

71=1

—7)(M—力=£/戊一7歹=40.17_4X9.32=2.89

/-I/-I

AZ(—)()'-)289

得'------------------=-«0.103,

Z(—f28

»=i

9.32八

又5=7^1.331,a=y-bt5;1.331-0.103x4=s0.92,

j关于1的回归方程为9=o.10/+0.92.

.2024-2015=9,将2024对应的1=9代入回归方程得:y=0.10x9+0.92=1.82,

・•・预测2024年该地区生活垃圾无害化处理量将约1.82万吨.

二、独立性检验

1.独立性检验研究的问题是有多大把握认为两个分类变量之间有关系.为此需先列出2X2列联表,从表

格中可以直观地得到两个分类变量是否有关系.另外等高堆积条形图能更直观地反映两个分类变量之间的

情况.独立性检验的思想是可以先假设二者无关系,求随机变量Z2的值,若Z2大于临界值,则拒绝假设,

否则,接受假设.

2.通过计算好的值,进而分析相关性结论的可信程度,提升数学运算、数据分析的素养.

【例2】(2023•甲卷(文))一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中

20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠

饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:

对照组的小白鼠体重的增加量从小到大排序为

25,218.820.221.322.523.225.826.527.530.1

26.634.334.835.635.635.836.237.340.543.2

试验组的小白鼠体重的增加量从小到大排序为

27.89.211.412.413.215.516.518.018.819.2

28.820.221.622.823.623.925.128.232.336.5

(1)计算试验组的样本平均数;

(2)(i)求40只小白鼠体重的增加量的中位数加,再分别统计两样本中小于/〃与不小于机的数据的个

数,完成如下列联表;

<m..in

对照组

试验组

(ii)根据⑴中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增

加量有差异?

no,“2n(ad-be)2

(a+b)(c+d)(a+c)(b+d)

P{K2..k)0.1000.0500.010

k2.7063.8416.635

【解析】(1)根据题意,计算试验组样本平均数为

工总X(7.8+9.2+I1.4+I2.4+I3.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2+21.6+22.8♦-23.6+23.9+25.1+28.2+32.3+36.5)=19.8-

(2)⑴由题意知,这40只小鼠体重的中位数是将两组数据合在一起,从小到大排列后第20位与第21

位数据的平均数,

因为原数据的第11位数据是18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,

23.6•••9

所以第20位为23.2,第21位数据为23.6,

所以这组数据的中位数是m=-x(23.2+23.6)=23.4;

2

填写列联表如下:

<ill..tn合计

对照组61420

试验组14620

合计2D2040

⑼根据列联表中数据,计算乙嘤姬某整=6-

所以有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.

【解题技法】独立性检验的一般步骤

(1)根据样本数据制成2X2列联表.

仁琳■据公式/2=(a+ix;,左程c)S+封计算炉的值.

(3)查表比较/与临界值的大小关系,作出统计判断.

【跟踪训练】

(2022•甲卷)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行

情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:

准点班次数未准点班次

A24020

B21030

(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;

(2)能否有90%的把握认为甲、乙两城之间的长途客车是否梏点与客车所属公司有关?

附:K'=Md-be)

(a+b)(c+d){a+c)(b+d)

P(K\.k)0.1000.0500.010

k2.7063.8416.635

【解析】(1)A公司一共调查了260辆车,其中有240辆准点,故A公司准点的概率为生=口

26013

8公司一共调查了240辆车,其中有21()辆准点,故8公司准点的概率为生=2

2408

(2)由题设数据可知,准点班次数共45。辆,未准点班次数共50辆,A公司共260辆,3公司共24。

辆,

.K2=500X(240X30-210X20)-=32>27061

260x240x450x50

.•.有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.

三,数形结合思想在独立性检验中的应用

1.数形结合思想就是在解决与几何图形有关的问题时,将图形信息转换成代数信息,利用数量特征,将

其转化为代数问题;在进行回归分析时,常利用散点图、残差图等说明线性相关情况或模型的拟合效果.在

独立性检验中,我们常用等高堆积条形图直观地反映数据的情况,从而可以粗略地判断两个分类变量是否

有关系.

2.主要培养数学抽象和数学运算的素养.

【例3】某机构为了了解患色盲是否与性别有关,随机抽取了1000名成年人进行调查,在调查的480名

男性中有38名患色盲,520名女性中有6名患色盲,分别利用图形和独立性检验3=0.001)的方法来判断

患色盲与性别是否有关.

【解】根据题目所给的数据作出如下的列联表:

色盲

性别合计

患色盲未患色盲

男38442480

女6514520

合计449561000

根据列联表作出相应的等高堆积条形图,如图所示.

1.()

09

0.8・患色盲

().7

().6。未患色盲

().5

0.4

0.3

().2

0.1

().0

男女

图中两个深色条的高分别表示男性和女性中患色盲的频率,从图中可以看出,男性中患色盲的频率明显高

于女性中患色盲的频率,因此我蛆可认为患色盲与性别有关.

零假设为“0:患色盲与性别无关.

根据列联表中所给的数据,得

1000X(38X514-442X6)2

480X520X44X956

^27.139>lO.828=xo.ooi,

根据小概率值“=0.001的独立性检验,推断,。不成立,即认为患色盲与性别有关,此推断犯错误的概率

不超过0.001.

【解题技法】解独立性检验的应用问题的关注点

(1)两个明确:①明确两类主体;②明确研究的两个问题.

(2)两个准确:①准确画出2X2列联表;②准确理解足

【跟踪训练】

某电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.如

图所示的是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目

时间不低于4。分钟的观众称为“体育迷”.

⑴根据已知条件完成下面的2X2列联表,依据小概率值“=0.05的独立性检验,能否据此认为“体育迷”

与性别有关?

“体育迷”情况

性别合计

非体育迷体育迷

女1055

合计

⑵将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观

众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X若每次抽取的结果是相互独立的,求X的

分布列,均值£(X)和方差O(X).

附:片=肝炭篝品再,其中〃=。+力+。+/

a0.050.01

Xa3.8416.635

【解】(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2X2列联表如下:

“体育迷”情况

性别合计

非体育迷体育迷

男301545

女451055

合计7525100

零假设为Ho:“体育迷”与性别无关.

将2X2列联表中的数据代入公式计算,得

100X(30X10-45X15)21QQ

75X25X45X55

=3.030<3.841=xo.o5,

根据小概率值a=0.05的独立性检验,没有充分证据推断〃。不成立,即认为“体育迷”与性别无关.

(2)由频率分布直方图,知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”

的概率为:•由题意知X〜虫吟,从而X的分布列为

X0123

272791

P64646464

EC¥)=3x1=1,O(X)=3X;X、=卷

四、转化与化归思想在非线性回归分析中的应用

1.转化与化归思想主要体现在非线性回归分析中.在实际问题中,并非所有的变量关系均满足线性关系,

故要选择适当的函数模型去拟合样本数据,再通过代数变换,把非线性问题线性化.

2.主要培养数学建模和数学运算的素养.

【例4]数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9x9盘面上的已知数字,推理出所有剩

余空格的数字,并满足每一行、每一列、每一个粗线宫(3x3)内的数字均含1.9,不重复.数独爱好者小明打

算报名参加“丝路杯”全国数独大赛初级组的比赛,赛前小明在某数独APP上进行一段时间的训练,每天的

解题平均速度(秒)与训练天数r(天)有关,经统计得到如表的数据;

/天)1234567

y(秒)990990450320300240210

(1)现用),=〃+&作为回归方程模型,请利用表中数据,求出该回归方程;

x

(2)请用第(1)题的结论预测,小明经过100天训练后,每天解题的平均速度)’约为多少秒?

参考数据(其中4=')

Xi

7

/

/-I

18450.370.55

参考公式:对于一组数据(%,匕),(%»),••・,(〃“,匕),其回归直线y=a+4,的斜率和截距的最小二乘

〃——

估计公式分别为:,a=v-pu-

r-l

一I,

【解析】(1)由题意y=-x(990+990+450+320+300+240+210)=500,

令r=设>关于/的线性回归方程为y=/"+。,

18457x0.37x500

贝IJ有力=i=l=1000,

0.55

1=1

贝(L=500-1000X0.37=I30,

所以y=1(X)07+130,

又?」,所以y关于x的回归方程为尸照+130;

XX

(2)当x=100时,.V=I40,

所以经过100天训练后,小明每天解题的平均速度约为140秒.

【解题技法】非线性化的回归分析问题,画出已知数据的散点图,选择跟散点图拟合得效好的函数模型

进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.

【跟踪训练】

中国茶文化博大精深,已知茶水的口感与茶叶类型以及水温有关.经验表明,某种绿茶用85c的水泡制,

再等到茶水温度降至60c时饮用,可以产生最佳口感.某学习研究小组通过测量,得到了下面表格中的数

据(室温是2。℃).

泡制时间x/min01234

水温8579747165

ln(y-20)4.24.14.03.93.8

(1)小组成员根据上面表格中的数据绘制散点图,并根据散点图分布情况,考虑到茶水温度降到室温(即

20C)就不能再降的事实,决定选择函数模型),=依'+20*之0)来刻画.

①令z=ln(y-20),求出z关于,的线性回归方程;

②利用①的结论,求出y=kc'+20(x之0,c>0)中的攵与。.

(2)你认为该品种绿茶用85℃的水大约泡制多久后饮用,可以产生最佳口感?

2

参考数据:log090.6«4.8^-°'0.9,Z66.7,—=0.6.参考公式:

667

AA七(内-可巨-可.

z=hx+a,h=---------,a=z-bx,

t(xT)2

1=1

【解析】(1)①由已知得出X与Z的关系,如下表:

泡制时间min01234

Z4.24.14.03.93.8

设线性回归方程2=良+0,

0+1+2+3+4

由题意,得了==2,

,4.2+4.1+4.0+3.9+3.8/

z=-------------------=4,

5

.•.£(^-J)(Z/.-Z)=(-2)XO.2+(-1)XO.14-1X(-O.1)+2X(-O.2)=-1,

£(4一元)2=(_2),+(_「'+f+2?=10,

1=1

£(西-可(马-可

贝配上J----------=-=-0.1

2(—)210

1=1

a=z-bx=4+0.1x2=4.2,

则z关于x的线性回归方程为z=-0.1x+4.2;

②।由y=kcx+2()(x>0),得y—20=kc\x>0),

两边取对数得,ln(y-20)=ln^+xlnc,

利用①的结论得:lnc=-0』』n&=4.2,

.•.c=e4Z0.9,Z=f2ss66.7;

(3)由(1)得,y=66.7x09+2。(%20),

令}'=60,^x=logoq0.6^d.8.

团该品种绿茶用85°的水泡制4.8min后饮用,口感最佳.

、章末检测

(时间:120分钟,满分:150分)

一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合

题目要求的)

1.为调查中学生近视情况,随机抽取某校男生150名,女生140名,其中,男生中有80名近视,女生中

有70名近视.在检验这些中学生眼睛近视是否与性别有关时,最有说服力的方法是()

A.均值与方差B.排列与组合

C.概率D,独立性检验

【答案】D

【解析】检验两个变量是否相关时,应选择独立性检验,故选D.

2.观察下列散点图,则①正相关,②负相关,③不相关,图中的甲、乙、丙三个散点图按顺序相对应

的是().

yk

•••••••

••••••:•

・・:・・:

・・・・

OxoXOx

甲乙丙

A.①②③B.②①③C.①③②D.③①②

【答案】C

【解析】对于图①,显然是正的线性相关,对于图②,不相关,对于图③,负的线性相关,故选C.

3.对两个变量乂)•进行线性相关性检验,得线性相关系数。=4.9872,对两个变量进行线性相关性检

验,得线性相关系数4=69384,则下列判断正确的是()

A.变量x与变量F正相关,变量〃与变量-负相关,变量x与变量).的线性相关性更强

B.变量x与变量),负相关,变量〃与变量-正相关,变量x与变量),的线性相关性更强

C.变量x与变量).正相关,变量〃与变量弱负相关,变量“与变量V的线性相关性更强

D.变量X与变量》负相关,变量〃与变量-正相关,变量〃与变量V的线性相关性更强

【答案】B

【解析】由线性相关系数/;=-0.9872<。知x与y负相关,

由线性相关系数弓=09384>()知“与卜,正相关,

又用〉|修,所以变量x与变量)'的线性相关性比变量〃与变量V的线性相关性更强,故选B.

4.独立性检验中,假设:变量x与变量y没有关系,则在上述假设成立的情况下,估算概率

P(K226.635)。0.01,表示的意义是

A.变量x与变量y有关系的概率为1%

B.变量X与变量y没有关系的概率为99.9%

C.变量X与变量y没有关系的概率为99%

D.变量X与变量y有关系的概率为99%

【答案】D

【解析】若估算概率P(K2>6.635)。0.01,则犯错概率不超过0.01,即变量X与变量V有关系的概率为99%,

故选D.

5.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查

发现,y与x具有相关关系,回归方程为$,=0.66x+1.562.若某城市居民人均消费水平为7.675(千元),估

计该城市人均消费额占人均工资收入的百分比约为()

A.83%B.72%C.67%D.66%

【答案】A

【解析】当居民人均消费水平为7.675时,

则7,675=0.66x+1.562,即职工人均工资水平x=9.262,

团人均消费额占人均工资收入的百分比为《经xlOO%=83%.,故选A.

9.262

6.某科研机构为了研究中年人秃头是否与患有心脏病有关,随机调查了一些中年人的情况,具体数据如

下表所示:

有心脏病无心脏病

秃发20300

不秃发5450

根据表中数据得K'ZZ黑蒜翳匚6968'由K%。.828断定秃发与患有心脏病有关'那么

这种判断出错的可能性为

附表:

叫)0.100.050.0250.0100.0050.001

k02.7063.8415.0246.6357.87910.828

A.0.1B.0.05

C.0.01D.0.001

【答案】D

【解析】由题意,K2>10.828,根据附表可得判断秃发与患有心脏病有关出错的可能性为01X)1.故选D.

7.相关变量X,)’的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,

得到线性回归方程相关系数为方案二:剔除点(1。,21),根据剩下数据得到线性回归直线

方程:y=b2x+a2t相关系数为5.则()

y、

30

20

10

051015X

A.0<a<4vlB.。<弓v”1

C.-1<彳<4<0D.-1</;<7;<0

【答案】D

【解析】由散点图得负相关,所以小4<0,因为剔除点(10,21)后,剩下点数据更线性相关性更强,则卜|

更接近1,所以故选D.

8.用模型,,=优”拟合一组数据组(.y)(i=l,2,3,・,,7),其中玉+9++七=7,设z=lny,得变换后

的线性回归方程为2=x+4,则X%%=()

A.e70B.e3sC.70D.35

【答案】B

【解析】因为再+9++巧=7,

所以嚏=内+/;+5=],则[=*4=5,

即:(My+ln%++17])=5,

即ln(y%…乃)=35,所以弘刈乃二。",故选B.

二、多项选择题(本大题共3小题,每小题6分,共18分.在每小题给出的四个选项中,有多个选项是符

合题目要求的,全部选对的得6分,选对但不全的得3分,有选错的得。分)

9.下列说法正确的是()

A.在两个变量1与V的列联表中,当lad-灰1越大,两个变量有关联的可能性越大

B.若所有样本点都在经验回归方程5,=励+6上,则变量间的相关系数是T

C.决定系数序越接近1,拟合效果越好

D.独立性检验一定能给出明确的结论

【答案】AC

【解析】A选项:根据独立性检验的公式可知,当1//-庆|越大,两个变量有关的可能性越大,故A正确;

B选项:相关系数r=±1,故B错误;

C选项:决定系数e越接近I,拟合效果越好,故C正确;

D选项:独立性检验与样本的选取有关,不一定正确,故D项错误.

故选:AC

10.已知在最小二乘法原理下,具有相关关系的变量占之间的线性回归方程为.\,=-0.7x+10.3,且变量

x,y之间的相关数据如表所示,则下列说法错误的是()

X681012

y6m32

A.变量XV之间呈正相关关系

B.可以预测,当x=20时,y=3.7

C.可求得表中,〃=4.7

D.由表格数据知,该回归直线必过点(9,4)

【答案】ABC

【解析】对于A,由x与y的线性回归方程可知,回归系数为-0.7,且-0.7<0,

而变量尤丁之间呈负相关关系,故A错误;

对于B,当x=20时,y=-0.7x20+10.3=-3.7,故B错误;

对于C,由表中数据可知£=9,-=6+W+3+2=11+^>由点(只到必在回归直线上,得

111^=-0.7x9+10.3,解得〃z=5,故C错误;

4

对于D,团〃2=5,==同回归直线必过点(9,4),故D正确.

4

故选:ABC.

11.某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每名学生对食堂的

服务给出满意或不满意的评价,得到如下列联表.经计算方=4.762,则可以推断出().

B.该学校男生比女生对食堂服多更满意

C.依据a=0.05的独立性检验,可以认为男、女生对该食堂服务的评价有差异

D.依据a=0.0I的独立性检验,可以认为男、女生对该食堂服务的评价有差异

【答案】AC

【解析】该学校男生对食堂服务满意的概率的估计值为而30%=31,故A正确;

该学校女生对食堂服务满意的概率的估计值为—40=:4>=3,故B错误;

40+1055

因为炉之4.762>3.841,

所以依据。=0.05的独立性检验,可以认为男、女生对该食堂服务的评价有差异,故C正确,D错误,故

选AC.

三、填空题(本大题共3小题,每小题5分,共15分.把答案填在题中横线上)

12.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数

据।如表),由最小二乘法求得经验回归方程f=0.67x+54.9.

零件数V个1020304050

加工时间

62758189

j/min■

现发现表中有一个数据看不清,请你推断出该数据的值为.

【答案】68

【解析】由表格知工'=30,得丁=0.67X30+54.9=75.

设表中的“模糊数字”为

则“+62+75+81+89=75X5,所以。=68.

13.对某台机器购置后的运营年限x(x=1,2,3,…)与当年利润y的统计分析知具备线性相关关系,经验回归

方程为;=10.47—1.3],估计该台机器使用年最合算.

【答案】8

【解析】只要预计利润不为负数,使用该机器就算合算,即所以10.47—1.3x20,解得x《8.05,所

以该台机器使用8年最合算.

14.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:

单位:人

休闲方式

性别合

读书健身

女243155

男82634

合计325789

在犯错误的概率不超过的前提下认为性别与休闲方式有关系.

【答案】0.1

【解析】由列联表中的数据,得

89X(24X26-31X8)2

=3.689>2.706,

55X34X32X57

因此,在犯错误的概率不超过0・1的前提下认为性别与休闲方式有关系.

四,解答题(本大题共5小题,共77分.解答时应写出必要的文字说明、证明过程或演算步骤)

15.(本小题满分13分)冶炼某种金属可以用旧设备或新设备,为了检验用这两种设备生产的产品中所含

杂质的关系,调查结果如表所示.

所含杂质

设备杂质

杂质高

旧设备37121

新设备22202

根据表中数据试判断含杂质的高低与设备新旧有无关系.

【解析】由已知数据得到如下2X2列联表:

所含杂质

设备杂质合计

杂质高

旧设备37121158

新设备22202224

合计59323382

382X(37X—121X22V

/=­'[13.U>lO.828=xo.ooi,根据小概率值a=0.001的独立性检验,故有99.9%

的把握认为含杂质的高低与设备新旧是有关的.

16.(本小题满分15分)在改革开放40年成就展上某地区某农产品近几年的产量统计表:

年份201420152016201720182019

年份代码x123456

年产量(万吨)6.66.777.17.27.4

(1)根据表中数据,建立)‘关于)的线性回归方程去+力.

(2)根据线性回归方程预测2020年该地区该农产品的年产量.

【解析】(1)由题意可知:

-1+2+3+4+5+6

x=------------------=3.5,

6

6.6+6.7+7+7.1+7.2+7.4/

>,=

6

(-2.5尸+(_]5)2+(-0.5)2+0.52+1.52+2.52=17.5,

£”)(一)28

所以三-^―------------------=±±=0J6,

加-刁175

/=|

又。=3?-=7-0.16x3.5-6.44,

故关于x的线性回归方程为y=0.16x+6.44.

⑵由(1)可得,当年份为2020年时,年份代码为x=7,此时y=0.16x7+6.44=7.56.

所以可预测2020年该地区该农产品的年产量约为7.56万吨.

17.(本小题满分15分)电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了

100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频

率分布直方图:

频率

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.

单位:人

是否为体育迷

性别合计

非体育迷体育迷

合计

(1眼据已知条件完成2X2列联表,并据此资料你是否认为“体育迷”与性别有关?

(2度日均收看该体育项目不低于5()分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,

若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.

______,i(ad-bc)2______

附:参考公式:尸=〃=q+0+c+d.

(a+b)(c+d)(a+c)(h+d)'

a0.050.01

Xa3.8416.635

【解析】⑴由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,

从而2X2列联表如下:

单位:人

是否为体育迷

性别体育合计

非体育迷

男301545

女451()55

合计7525100

将2X2列联表中的数据代入公式计算,

得炉=喈比3.030<3.84]=*,)5,根据小概率值a=0.05的独立性检验,没有理

」°°Z3AjA:43A333J

由认为“体育迷”与性别有关.

(2)由频率分布直方图可知,“超级体育迷”为5人,

从而一切可能结果所组成的样本空间为:

(12)t31,03),(。2,。3),31,bl),31,82),(。2,加),(«2,岳),(«3,加),3,力2),仍1,力2)}・其

中“i衰示男性,1=1,23,勿表示女性,7=1,2.

。包

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论