高中数学一轮复习-成对数据的相关关系_第1页
高中数学一轮复习-成对数据的相关关系_第2页
高中数学一轮复习-成对数据的相关关系_第3页
高中数学一轮复习-成对数据的相关关系_第4页
高中数学一轮复习-成对数据的相关关系_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题12.6成对数据的相关关系

1.变量的相关关系

⑴相关关系:两个变量有关系,但又没有确切到可由其中一个去精确地决定另一个的程度,

这种关系称为相关关系.

注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种

确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随

关系.

⑵线性相关、非线性相关

①线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附

近,我们就称这两个变量线性用关.

②非线性相关:般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个

变量非线性相关或曲线相关.

⑶散点图

将样本中的几个数据点(/,%)«=1,2,…,切描在平面直角坐标系中,所得图形叫做散点

图.根据散点图中点的分布可以直观地判断两个变量之间的关系.

①如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,

我们将它称为正相关,如图(1)所示:

②如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,

我们将它称为负相关,如图(2)所示.

y)

(I)(2)

①将收集到的两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样得到的

图叫作散点图;

②散点图具有直观简明的特点,可以根据散点图判断两个变量有没有相关关系.

(4)正相关、负相关

①正相关:从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,

我们就称这两个变量正相关;

②负相关:从整体上看,如果当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,

则称这两个变量负相关.

2.样本相关系数

⑴相关系数r的计算

变量X与变量y的样本相关系数,•的计算公式如下:r=j£3(y一/.

J器式阳-h]器式yf)2

⑵相关系数r的性质

①当r>0时,称成对样不数据正相关;

当rV。时,称成对样本数据负相关;

当r=0时,成对样本数据间没有线性相关关系.

②样本相关系数r的取值范围为[-1,1],当|r|越接近1时,成对样本数据的线性相关程度越

强;当|丁|越接近0时,成对样本数据的线性相关程度越弱.

3.一元线性回归模型

⑴经验回归方程

我们将夕=+«称为y关于X的经验回归方程,也称经验回归函数或经验回归公式,其

图形称为经验回归直线,其中

r_2之式2-•君Si一刃_打

2

器心广无产^=1xj-nx

a=y—bx

⑵利用决定系数IV刻画回归效果

腔=】一髭庠‘卢越大,即拟合效果越好,产越小,模型拟合效果越差.

⑶一元线性回归模型参数的最小二乘估计

①经验回归方程:如果散点图中点的分布从整体上大致在一条直线附近,就称这两个变量

之间具有线性相关关系,我们把这条直线称为经验回归直线(回归直线),借助最小二乘法得到

的直线方程夕=bx+6称为经验回归方程(线性回归方程).

②经验回归方程的性质

i.经验回归直线一定过点(x,y);

ii.y与x正相关的充要条件是的6>0:y与x负相关的充要条件是B<0;

iii.当x增大一个单位时,夕增大B个单位,这就是回归系数6的实际意义.

4.列联表与独立性检验

(1)2x2列联表

如图,给出成对分类变量数据的交叉分类频数的数据统计表称为2x2列联表.

XY合计

Y=0Y=1

x=0aba+b

X=1cdc+d

合计a+cb+dn=a+b+c+d

⑵独立性检验

n(ad-bc)2

①依据上述2x2列联表构造统计量;=

(a+b)(c+d)(c+c)(b+d)'

忽略f的实际分布与该近似分布的误差后,对于任何小概率值a,可以找到相应的正实数

%,

使得P(/2>xa)=a成立.我们称之为a的临界值,这个临界值就可作为判断/大小的标

准.

②基于小概率值a的检验规则是:

当/>之时,我们就推断为不成立,即认为X和Y不独立,该推断犯错误的概率不超过a;

当/<为时,我们没有充分证据推断/不成立,可以认为X和Y独立.

这种利用f的取值推断分类变量X和Y是否独立的方法称为/独立性检验,读作“卡方独

立性检验”,简称独立性检验.

下表给出了/独立性检验中儿个常用的小概率值和相应的临界值

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

【重要结论】

1.线性回归直线一定经过样本点的中心(无刃,据此性质可以解决有关的计算问题、判断结

论的正确性.

2.根据回归方程计算的y值,仅是一个预报值,不是真实发生的值.

3.根据的值可以判断两个分类变量有关的可信程度,若公越大,则两分类变量有关的

把握越大.

阚改编

1.【人教A版选择性必修三习题8.2第1题P120】如果发现散点图中所有的样本点都

落在一条斜率为非0实数的直线上,则下列说法错误的是()

A.解释变量和预报变量是一次函数关系B.决定系数R2=1

B.残差平方和为0D.相关系数r=1

2.1人教A版选择性必修一习题8.3第5题P13S】为了研究高三年级学生的性别和身

高是否大于170cm的关联性,同学甲调查了某中学高三年级所有学生,整理得到列联表1,同

学乙从该校高三学生中获取容量为40的有放回简单随机样本,由样本数据整理得到列联表2.

表1单位:人

身高

性别口11

<170cm>170cm

女811697

男2875103

合计10991200

表2单位:人

身高

性别合计

<170cm>170cm

女15621

男91019

合计241640

(1)利用表1,通过比较不低于170cm的学生在女生和男生中的比率,判断该中学高三年

级学生的性别和身高是否有关联,如果有关联,请解释它们之间如何相互影响;

(H)利用表2,依据a=0.05的独立性检验,推断该中学高三年级学生的性别和身高是否有关

联,并解释所得结论的实际含义:

(III)以上两种方法得出的结论是否一致?如果不一致,你认为哪种方法得出的结论准确,原

因是什么?

„ri(ad-be)2

(y=7----7T7-------K,n=a+b+c+d)

"(Q++dK)T(-a---+---CT)nS+d),

P(X2>心)0.1500.1000.0500.0250.010

ko2.0722.7063.8415.0246.635

I考点归纳

考点一成对数据相关性与相关系数

【方法储备】

判断数据相关关系的方法:

1.散点图:如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.如果所有

的样本点都落在某一函数曲线的附近,变量之间就有相关关系.

2.样本相关系数法:若|r|的值越接近于1,说明变量之间的线性相关程度越高;当〃>0时,

称成对样本数据止相关;当时,称成对样本数据负相关.

3.经验回归方程法:在经验回归方程中,当6>0时,正相关;当方V0时,负相关.

【典例精讲】

例1.(2025・全国•模拟)某工厂为了确定工效进行了5次试验,收集数据如下:

加工零件个数X1020304050

加工时间y(分)6469758290

经检验,这组样本数据的两个变量X与丫具有线性相关关系,那么对于加工零件个数X与

加工时间y这两个变量,下列判断中正确的是()

A.负相关,其回归直线经过点(30,75)B.正相关,其回归直线经过点(30,75)

B.负相关,其回归直线经过点(30,76)D.正相关,其回归直线经过点(30,76)

例2.(2025•山东省•模拟)为了研究儿子身高与父亲身高的关系,某机构调杳了某所高校14

名男大学生的身高及其父亲的身高(单位:cm),得到的数据如表所示.

编号1234567891011121314

父亲身高工174170173169182172180172168166182173164180

儿子身高y176176170170185176178174170168178172165182

父亲身高的平均数记为总儿子身高的平均数记为方根据调查数据,得到儿子身高关于

父亲身高的回归直线方程为y=0.839X+28.957.则下列结论中正确的是()

A.y与x正相关,且相关系数为0.839

B.点叵,歹)不在回归直线上

C.x每增大一个单位,夕增大0.839个单位

D.当%=176时,yx177.所以如果一位父亲的身高为176cm,他儿子长大成人后的身高

一■定是177cm

【拓展提升】

练1・1(.(2025•天津市•期末考试)对四组数据进行统计,获得以下散点图,关于其样本相关

系数的比较,下列结论正确的是()

3535

3030

2525

2020

1515

1010

55

O5O535C

20305101520253035

样本相关系数为乃样本相关系数为Q

35

30

25

20

15

10

5

O

5101520253035101520253035

样本相关系数为/*3样本相关系数为々

A.r2<r4<0<r3<rrB.r2<r4<0<rr<r3C.r4<r2<0<r3<D.

74<r2<0<r1<73

练12(2025•浙江省宁波市模拟)(多选)根据某地3月5日到3月15日的每天最高气温与

最低气温数据(单位:°C)绘制如下折线图,那么下列叙述正确的是()

A.5号到11号的最低气温与日期之间呈线性相关关系且为正相关

B.9号的最高气温与最低气温的差值最大

C.最高气温的众数为27,C

D.5号到15号的最低气温的极差比最高气温的极差大

考点二一元线性回归模型及其应用

【方法储备】

1.求线性回归万程的步骤:

⑴利用散点图或进行相关性检验判定两个变量具有线性相关关系;

⑵列表求出无?二%瞪,2/11;

⑶利用相应公式计算64;

⑷写出线性回归方程.

⑸经验回归方程的拟合效果,可以利用相关系数|r|判断,当|r|越趋近于1时,两变量的

线性相关性越强.或利用决定系数肥判断,R2越大,拟合效果越好.

2.利用回归方程可以进行预测和估计总体,回归方程将部分观测值所反映的规律进行延

伸,是我们对有线性相关关系的两个变量进行分析和控制、依据自变量的取值估计和预报因变

量值的基础和依据.

3.非线性经验回归方程转化为线性经验回归方程的方法

如:①若夕=a+b\[x,设t=yfx,则?=a+bt;②若满足对数式:y=a+blnx,设「二

Znx,则y=6+几;③若满足指数式:y=(:送""两边取对数解]ny=\nc1+c2x,设z=lny,a=

Inq,b=c?,则z=a+bx.

【典例精讲】

例3.(2025•湖南省长沙市模拟)若需要刻画预报变量w和解释变量x的相关关系,且从已

知数据中知道预报变量w随着解释变量%的增大而减小,并且随着解释变量x的增大,预报变

量w大致趋于一个确定的值,为拟合w和%之间的关系,应使用以下回归方程中的(匕>0,e为

自然对数的底数)()

x

A.w=bx+aw=-b\nx+QC.w=­b>T~x+QD.w=be~+a

例4.(2025•江苏省无锡市月考)为了解某地区未成年男性身高与体重的关系,对该地区

12组不同身高项(单位:cm)的未成年男性体重的平均值为(单位:kg)9=l,2,…,12)数据

作了初步处理,得到下面的散点图和一些统计量的值.

70

6C

50

4C

30-.•

2C-..

10-••••・

_____IIIIIIIIIIIIIIIIII

Q10203040506070809010011012013014015016017018CT5:

£)21212

2(芍一%)(%7)W5-%)3-3)

Xy0)

1=1i=l1=1

11524.3582.958143006300286

表中=Iny^i=1,2,…,12),o)=2£四期.

(1)根据散点图判断y=Q%+b和y=哪一个适宜作为该地区未成年男性体重的平

均值y与身高工的回归方程类型?(给出判断即可,不必说明理由).

(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;

(3)如果体重高于相同身高的未成年男性平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么

该地区的一位未成年男性身高为175cm,体重为78的,他的体重是否正常?

uv

附:对于一组数据(%,%),(U2,V2)»......(n/n)»其回归直线U=Q+夕〃的斜率和截

距的最小二乘估计分别为2=渭『),a=v-pu,"2ko.693.

【拓展提升】

练2」.(2025•山东省济南市•模拟题)(多选)一组样本数据(孙力),i6{1,2,3,…,100}.其中

勺>1895,£没看=2x105,£漂%=970,求得其经验回归方程为:?=一0.02%+逼,残

差为即对样本数据进行处理:=InQi-1895),得到新的数据(/〃%),求得其经验回归方

程为:y=-0.42x4-a2,其残差为0.耳,均分布如图所示,且。〜N(0,而),⑪〜N(0,於),

顺)

2

图1图2

A.样本(X0。负相关B.=

C.al<遐D.处理后的决定系?

练2・2.(2025・河南省漂河市•期末考试)某制药公司研发一种新药,需要开展临床用药试

验.随机征集了一部分志愿者作为样本参加试验,并得到一组数据=1,2,…,10),其

中勺,y:表示连续用药i天,相应的临床药效指标值.已知该组数据中y与In%之间具有线性相

关关系,令t=lnx,经计算得到下面一些统计量的值:

X?=iH=385,yi—86>“=15.0,于%*=27.5,勺.—528,S?=i。%=

143.0.

(1)求y关于x的经验回归方程;

(2)该公司要用甲与乙两套设备同时生产该种新药,已知设备甲的生产效率是设备乙的

1.5倍,设备甲生产药品的不合格率为0.008,设备乙生产药品的不合格率为0.006,且设备甲

与乙生产的药品是否合格相互独立.

①从该公司生产的新药中随机抽取一件,求所抽药品为不合格品的概率;

②在该新药产品检验中发现有三件不合格品,求其中恰有二件是设备乙生产的概率.

参考公式:对于一组数据(孙力)(i=L2,…,71),其回归方程9=+6中,斜率和截距的

最小二乘法估计公式分别为:屋矍箸署,底歹-汽

考点三列联表与独立性检验

【方法储备】

独立性检验的一般步骤:

(1)独立性检验原理只能解决两个对象,且每个对象有两类属性的问题,所以对于一个

实际问题,我们首先要确定能否用独立性检验的思想加以解决;

(2)如果确实属于这类问题,要科学地抽取样本,样本容量要适当,不可太小;

(3)根据数据列出2x2列联表;

(4)提出假设%:所研究的两类对象(X,Y)无关;

n(ad-bc)2

(5)根据公式计算X?=的值;

(Q+b)(c+d)(a+c)(b+d)

(6)比较乂2与临界值%,根据小概率原理肯定或者否定假设,即判断x,y是否相关.

【典例精讲】

例5.(2025•山东省枣庄市模拟)根据分类变量%与y的成对样本数据,计算得到才2=6.147.

依据a=0.01的独立性检验(为oi=6.635),结论为()

A.变量x与y不独立

B.变量x与y不独立,这个结论犯错误的概率不超过0.01

C.变量x与y独立

D.变量》与'独立,这个结论犯错误的概率不超过0.01

例6.(2022•湖南省长沙市期中)新能源汽车是指除汽油、柴油发动机之外的所有其他能源

汽车,被认为能减少空气污染和缓解能源短缺的压力.在当今提倡全球环保的前提下,新能源

汽车越来越受到消费者的青睐,新能源汽车产'也也必将成为未来汽车产业发展的导向与目标.

某机构从某地区抽取了500名近期购买新能源汽车的车主,调查他们的年龄情况,其中购买甲

车型的有200人,统计得到如下的频率分布直方图.

(1)将年龄不低于45岁的人称为中年,低于45岁的人称为青年,购买其他车型的车主青

年人数与中年人数之比为3:1,完成下列2x2列联表,依据a=0.005的独立性检验,能否认

为购买甲车型新能源汽车与生龄有关?

青年中年合计

甲车型

其他车型

合计

(2)用分层抽样的方法从购买甲车型的样本中抽取8人,再从中随机抽取4人,记青年有X

人,求X的分布列和数学期望.

附.____n(-c)2______

•A(a+b)(c+d)(a+c)(b+d)

a0.1000.0500.0100.0050.001

xa2.7063.8416.6357.87910.828

【拓展提升】

练3・1(2025•广东省东莞市•期末考试)(多选)根据分类变量%与)/的成对样本数据-,提出

零假设%,并计算得到%2=2.974,则下列说法正确的是()

n(ad-bc')2

(a+b)(c+d)(a+c)(b+d)

a0.10.050.010.0050.001

“a2.7063.8416.6357.87910.828

A.零假设为〃°:分类变量%与y独立

B.根据小概率值a=0.1的f独立性检验,可以认为不与y不独立,这个结论犯错误的概率

不超过0.1

C.根据小概率值a=0.01的22独立性检验,可以认为%与y不独立,这个结论犯错误的概

率不超过0.01

D.若所有样木数据都扩大为原来的10倍,根据小概率值a=0.01的%2独立性检验,可以

认为%与y不独立,这个结论犯错误的概率不超过0.01

练3・2(2025•安徽省合肥市联考)针对“中学生追星问题”,某校团委正在对“性别与中学生

追星是否有关”做相关研究.现从本校随机抽取100名学生进行调查,得到下表:

性别

是否追星合计

男生女生

追星4570

不追星20

合计100

(1)请将上述2X2列联表补充完整,并依据a=0.01的独立性检验,能否认为性别与中

学生追星有关联?

(2)根据是否追星,在样本的女生中,按照分层抽样的方法抽取9人作为研究小组.为了更

详细地了解情况,再从研究小组中随机抽取4人,求抽到追星人数X的分布列及数学期望.

n(ad-bc)2

参考公式:f=n=a+b+c+d

(a+b)(c+d)(a+c)(b+d)'

下表给出了独立性检验中几个常用的小概率值和相应的临界值.

a0.0500.0250.0100.001

%3.84105.0246.63510.828

新题放送

1.(2025•山东省济南市•模拟题)(多选)为了验证牛的毛色(黑色、红色)和角(有角、无角)这

两对相对性状是否相关,某学院进行了一次数据统计,并根据形成的2x2列联表,计算得到

Z2-2.727,根据小概率值为a的独立性检验,贝立)

附:

P(Z2>k)0.1000.0500.010

k2.7063.8416.635

A.若a=0.100,则认为“毛色”和“角”无关

B.若a=0.100,则认为毛色”和“角”有关,此推断犯错误的概率不超过10%

C.若a=0.010,则认刈毛色”和“角”无关

D.若a=0.010,则认为“毛色”和“角”有关,此推断犯错误的概率不超过1%

2.(2025•重庆市市辖区模拟)(多选)小张同学收集了某商品销售收入y(单位:万元)与相应

的广告支出x(单位:万元)共10组数据,绘制出散点图,如下图所示,并利用线性回归模型进

行拟合.她将图中10个点中的人点去掉后再重新进行线性回归分析,则下列说法正确的是()

八销售收入W万元

60・

50-.***

40-.・•

30■•*A

2叱

~OT\.01.52.02.53:03*54.04,.55.05.5支出/万元

A.决定系数炉变大

B.残差平方和变大

C.相关系数r的值变大

D.去掉力点后,若所有散点都在一条直线上,则决定系数炉=1

3.(2025•河北省唐山市・模拟题)某学术平台引入川智能检测系统对所收到的文本进行筛

查.检测系统对川生成文本的识别准确率为98%,对人类撰写文本的识别准确率为96.5%.检测

系统对所收到的文本进行筛查时,会对每篇文本输出一个“4/生成概率”得分y(分).y与文本长

度式字)可以用一元线性回归模型来刻画,其线性回归方程为y+0.95,且±二480,y=

0.35.已知该平台中15%的文本由川生成.

(1)求回归系数B;

(2)从该平台随机选取一篇文本,求该文本被检测系统识别为人类撰写文本的概率(精确

到0.001);

(3)现从平台中随机抽取200篇文本进行统计分析,填写列联表(篇数四舍五入取整数):

检测结果

文本真实性足、11

识别为川生成(篇)识别为人类撰写(篇)

真实川生成(篇)

真实人类撰写(篇)

总计200

依据小概率值a=0.01的%2独立性检验,能否判断“检测结果”与“文本真实性”有差异?

2

参考公式:X2-n(ad-dc)

(a+b)(c+d)(a+c)(b+d)

提示:22独立性检验中常用的小概率值和相应的临界值

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

【答案解析】

L【人教A版选择性必修三习题8.2第1题P120]

解:因为样本点都落在一条斜率为非。实数的直线上,所以相关系数r满足|厂|=1,若直

线的斜率为正,则丁=1;若斜率为负,则厂=一1,故。错误;

直线对应的函数为一次函数,所以解释变量和预报变量是一次函数关系,故A正确;

决定系数和残差平方和都能反映模型的拟合程度,所以决定系数R2=l,残差的平方和为0,

故8,C正确.

故本题选D.

2.1人教A版选择性必修一习题8.3第5题P135]

解:(I)女学生身高低于170c?n,不低于170cm的频率分别为寡«0.835,y0.165,

男学生身高低于170cm,不低于170cm的频率分别为芸方0.272,-^^0.728,

通过比较发现,如果从女生、男生中各随机选取一名学生,女生中身高低于170cm的概率大

于男生中身高低于170c/n的概率,

故高三年级学生的性别和身高有关联,

•T70.835^.―

乂---«3.07,

0.272

故女生中身高低于170cm的频率是男生中身高低于170cm的频率的3倍以上,

所以女生身高更容易低于170cm;

40x(15x10-9x6)2

(H)因为%2=X2.41<3.841,

21X19X24X16

所以依据a=0.05的独立性检验,没有95%的把握认为该中学高三年级学生的性别与身高有

关系;

(IH)不一致,第一种准确,第二种样本容量太少,随机性太大.

例1.解:由表中数据可得y随X的增大而增大,故丫与X正相关.乂H=:x(10+20+30+

40+50)=30,y=1x(64+69+75+82+90)=76,所以样本点的中心为(30,76),而线

性回归直线过样本点的中心,因此其线性回归直线经过点(30,76),故选D

例2.解:A选项,因0.839>0,则y与%正相关,但相关系数不是0.839,故4错误;

B选项,回归方程过定点(无力,故。错误;

C选项,由回归方程可知%每增大一个单位,夕增大0.839个单位,故C正确;

0选项,回归方程得到的?为预测值,不一定满足实际情况,故。错误.

故选:C

练1・1,解:由图知,an都是正相关关系,丁2,口都是负相关关系,

从散点密集程度看,后,为相关性分别比心绝对值大,所以后>4>0>七>□.

故选:D.

练1-2.解:由某地3月5日到3月15日的每天最高气温与最低气温(单位:°C)数据,折线

图,知:

在4中,5号到11号的最低气温与日期之间,在一条直线附近,成上升趋势,即呈线性相关关

系且为正相关,故A正确;

在B中,由图知,6号的最高气温与最低气温的差值最大,故8错误;

在C中,最高气温27。出现2次,次数最多,则众数为27K,故。正确;

在。中,5号到15号的最低气温的极差小于15-3=12,最高气温的极差为27-15=12,故

最高气温的极差大,故。错误

故选:AC.

例3.解:对于4因为y=%在定义域内单调递增且%>0,所以w随着工的增大而增

大,不合题意,故A错误;

对于B:因为y=lnx在定义域内单调递增且b>0,所以w随着x的增大而减小,

当解释变量X—+00,WT-8,不合题意,故8错误;

对于C:因为y=C在定义域内单调递增且匕>0,所以W随着X的增大而减小,

当解释变量XT+8,WT—8,不合题意,故。错误;

对于。:因为y=e-=G尸在定义域内单调递减且b>0,所以W随着工的增大而减

小,

当解释变量Xl+8,WTQ,故。正确;

故选;D.

例4.解:(1)根据散点图,选择模型y=b+d更适宜作为该地区未成年男性体重的平均值

y与身高》的回归方程类型;

(2)对、=两边同时取对数,可得仇y=cx+d,即3=c%+d,

所以。==o.O2,则2=w-cx=2.958-0.02x115=0.658,

14300

所以y_^0.002x4-0.658,

⑶由加2ao.693,可得e0693《2,

令X=175,则y=60-02x175+0,658=^6x0.693=(”.693)6工於二64,

又64X1.2=76.8<78,所以该男生偏胖.

练2・1.解:对于4、由经验回归方程的斜率为负可知样本(孙y。负相关,故A正确;

3

友于8、x=5^1=2x10,y==9.7,

100J100

代入》=-0.02%+Qi得式i=49.7,故B正确;

对于。、由残差图可知,处理前的残差比处理后的残差更分散,所以疗>域,故C错误;

对于0、处理后残差的绝对值更小,

所以处理后的决定系数变大,故。正确,

故选:ABD.

练2.2.解:⑴£=啜=1.5,y=^Z?=i7i=8.6,

rEj=itiyj-101y143.0-10x1.5x8.6_

U-.八"7"=Z=Zn.Oo9

tf-iot27.5-10X1.52

a=y-St=8.6-2.8xl.5=4.4,

所以y关于用勺线性回归方程为:y=2.8t+4.4,

所以y关于x的回归方程为9=2.81nx+4.4;

(2)设事件A随机抽取一件药品来自设备甲生产,

事件B:随机抽取一件药品来自设备乙生产,

事件C:随机抽取一件该公司生产的药品为不合格品,

①因为设备甲的生产效率是设备乙的1.5倍,

所以PQ4)=gP⑻=:,

则P(C|4)=0.008,P(C|B)=0.006,

所以P(C)=p(A)-P(CIA)+P⑻•P(C|B)=-x0.0084--x0.006=0.0072,

55

故所抽药品为不合格品的概率为0.0072:

②回32=①丝=工,

v17P⑹0.00723

即所抽药品为不合格品,该药品来自设备乙生产的概率为%

所以三件不合格品中恰有二件是设备乙生产的概率为P=C在§2X|=:.

例5.解:a=0.01时,*“=6.635,则大于右时相关,不独立,

而产=6.147<Xa=6.635,所以变量%与y独立,

但是这个结论犯错误的概率超过0.01,故A,B,。错误,C正确.

故选C.

例6.解:(1)由直方图可知,购买甲车型的青年人数为200(0.005+0.025+0.0325)x

10=125人,中年人数为200—125=75人,

购买其他车型的青年人数为(500-200)X^-=225人,中年人数为300-225=

75人,

可得2x2列联表:

青年中年合计

甲车型12575200

其他车型22575300

合计350150500

零假设为:购买甲车型新能源汽车与年龄无关.

因为公50°(125X75-225X75),=经右8929>7879

350X150X200X30014

根据小概率值a=0.005的独立性检验,我们推断为不成立,即认为购买甲车型新能源汽

车与年龄有关,此推断犯错误的概率不大于0.005.

(2)用分层抽样的方法从购买甲车型的样本中抽取8人,则青年有8x箫=5人,中年

有8x券=3人,所以X的可能取值为1,2,3,4.

魅空=亘=工服或_30_3

P(X=P(X=2)

747014点~70~7

得分布列:

X1234

1331

147714

所以E(X)=lx^+2x^+3x|+4x^=1.

练3-1.解:选项A:炉独立性检验的零假设仇定义为“分类变量%与丫独立“,符合基本概

念,故A正确;

选项B:当a=0.1时\临界值々,I=2.706,由于计算得到的f=2.974>2.706,

零假设不成立,即认为'与y不独立,旦犯错误的概率不超过a=0.1,故8正确;

选项C:当a=0.01时,临界值%ooi=6.635,由于/=2.974V6.635,

零假设成立,无法认为%与y不独立,故C错误;

选项£>:样本数据扩大10倍时,%2公式中分子九(以/—be)?变为10几x[100(acZ—be)]2=10nx

lOOOO(ad-bc)2,

分母变为104((z+b)(c+d)[a+c)(b+d),因此新]为原f值的io倍(即2.974x10=

29.74),

此时29.74>6.635,零假设不成立,即认为%与y不独立,且犯错误的概率不超过0.01,故。

正确.

故选:ABD.

练3・2.解:(1)列联表补充为

性别

是否追星合计

男生女生

追星452570

不追星102030

合计5545100

零假设“°:性别与中学生追星无关联,

_100x(45x20-25x10)2

X2-«8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论