版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
易错点13统计
易错分析
易错点L看不懂图,分辨不清数据的表示方法
⑴常见的统计图表有柱形图、折线图、扇形图、茎叶图、频数分布直方图、频
率分布直方图等.
⑵频率分布直方图
①作频率分布直方图的步骤
(i)找出最值,计算极差:即一组数据中最大值与最小值的差;
(ii)合理分组,确定区间:根据数据的多少,一般分5〜9组;
(iii)整理数据:
逐个检查原始数据,统计每个区间内数的个数(称为区间对应的频数),并求出频
数与数据个数的比值(称为区间对应的频率),各组均为左闭右开区间,最后一组
是闭区间;
(iv)作出有关图示:
根据上述整理后的数据,可以作出频率分布直方图,如图所示.频率分布直弱的
纵坐标是舞,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等
于这一组数对应的频率,从而可知频率分布直方图中,所有矩形的面积之和为
1,
②频率分布折线图
作图的方法都是:把每个矩形上面一边的中点用线段连接起来.为了方便看空,
折线图都画成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义
的.
不难看出,虽然作频率分布直方图过程中,原有数据被“压缩”了,从这两种图
中也得不到所有原始数据.但是,由这两种图可以清楚地看出数据分布的总体态
势,而且也可以得出有关数字特征的大致情况.比如,估计出平均数、中位数、
百分位数、方差.当然,利用直方图估计出的这些数字特征与利用原始数据求出
的数字特征一般会有差异.
易错点2.数据特征的相关概念没有理解
1.数据的数字特征
⑴最值
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情
况.
⑵平均数
①定义:如果给定的一组数是XI,X2,…,为”则这组数的平均数为旺
X2-l----
这一公式在数学中常简记为7=去,
②性质:一般地,利用平均数的计算公式可知,如果山,X2,…,物的平均数为
x,且〃,〃为常数,则an+/?,axi+b,••,的平均数为
(3)中位数
有奇数个数,且按照从小到人排列后为XI,X2,…,X2〃+l,则称巫士L为这组数的
中位数;如果一组数有偶数个数,且按照从小到大排列后为XI,X2,…,也“,则
称宥这为这组数的中位数.
(4)百分位数
①定义:一组数的〃%(p6(0,100))分位数指的是满足下列条件的一个数值;至
少有〃%的数据不大干该值,目至少有(100—〃)%的数据不小干该值.
②确定方法:设一组数按照从小到大排列后为XI,X2,…,计算i=〃p%的值,
如果i不是整数,设io为大于i的最小整数,取也为〃%分位数;如果,•是整数,
取省里为“%分位数
(5)众数
一组数据中,出现次数量爰的数据称为这组数据的众数.
(6)极差、方差与标准差
①极差:一组数的极差指的是这组数的最大值减去最小值所得的差,描述了这组
数的离散程度.
②方差
定义:如果如,X2,…,X”的平均数为X,则方差可用求和符号表示为/=[以j
二金)2=5£X?一[2.
性质:如果力为常数,则ati+〃,an+b,…,aO+Z?的方差为42s2
③标准差
定义:方差的篁2迂无根称为标准差.一般用$表示,即样本数据刘,X2,…,丸
的标准差为S川脸(XLX)2.
性质:如果4,匕为常数,则O¥l+〃,0X2…,OX”+〃的标准差为141s.
2.用样本的数字特征估计总体的数字特征
一般情况下,如果样本容量恰当,抽样方法合理,在估计总体的数字特征时,只
需直接算出挂主对应的数字特征即可.
易错点3.两个统计模型理解错误
1.变量的相关关系
⑴相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定
另一个的程度,这种关系称为相关关系.
⑵相关关系的分类:正相关和负相关.
(3)线性相关:如果变量x与变量v之间的关系可以近似地用一次函数来刻画,则
称/与y线性相关.
2.相关系数
n__
£(X,-x)y)
(、l),r=-「n—n-
、£(xi-x)2E(j,—j)2
Yi-l<-l
In~n,
A/(Ex?-nx2)(E.y?—ny2)
1=11=1
(2)当厂>()时,成对样本数据正it天;当x()时,成对样本数据负相关.
(3)|/[W1;当]“越接近1时,成对样本数据的线性相关程度越强;当H越接近0
时,成对样本数据的线性相关程度越弱.
3.一元线性回归模型
⑴我们将£=源+£称为y关于x的回归直线方程,其中
rM——H
E(x,—x)(y,—y)E孙一〃„
A_j=l__________________________________i=l"J
“一n——n—9
彳E(x,-x)2E解一〃一
i=li=l
AAA-
<a=y-bx・
(2)残差:观测值减去预测值,称为残差.
4.2X2列联表和/
如果随机事件A与8的样本数据的2X2列联表如下.
4A总计
Baba+b
BCdc+d
总计a~\~cb+do+b+c+d
记〃=a+〃+c+d,则
〃(ad—be)2___________
(〃+Z?)(c+d)(a+c)(b+d)'
5.独立性检验
统计学中,常用的显著性水平。以及对应的分位数%如下表所示.
a=P()r^k)().1().05().010.0050.001
K2.7063.8416.6357.87910.828
要推断“A与8有关系”可按下面的步骤
⑴作2X2列联表.
(2)根据2X2列联表计算士的值.
⑶查对分位数作出判断如果根据样本数据算出%2的值后,发现三》&成立,
就称在犯错误的概率不超过a的前提下,可以认为A与5不独立(也称为A与3
有关);或说有匕心的把握认为A与8有关.若/或成立,就称不能得到前述结
论.这一过程通常称为独立性检验.
错题纠正
I.从某中学甲、乙两班各随机抽取10名同学,测量他们的身高(单位:cm),所得数据用
茎叶图表示如下,由此可估计甲、乙两班同学的身高情况,则下列结论正确的是()
甲班乙班
211813
820171268
65316257
87159
A.甲乙两班同学身高的极差不相等B.甲班同学身高的平均值较大
C.甲班同学身高的中位数较大D.甲班同学身高在175cm以上的人数较多
【答案】A
【详解】对于A,甲班同学身高的极差为182757=25,乙班同学身高的极差为183759=
24,所以甲乙两班同学身高的极差不相等,故A正确;
对于B,甲班同学身高的平均值为
《(181+182+17()+172+178+163+165+166+157+158)=169.2,乙班同学身高的平均值为
^(181+183+1714-172+176+178+162+165+1674-159)=171.4,所以甲班同学身高的平均
值较小,故B错误;
对于C,甲班同学身高的中位数为166:170=]68,乙班同学身高的中位数为"I:-」=
22
171.5,所以甲班同学身高的中位数较小,故C错误;
对于D,甲班同学身高在175cm以上的有3人,乙班同学身高在175cm以上的有4人,所
以甲班同学身高在175cm以上的人数较少,故D错误.
故选:A.
2.2021年某省高考体育百米测试中,成绩全部介于12秒与18秒之间,抽取其中100个样本,
将测试结果按如下方式分成六组:第一组[12,13),第二组[13,14),…,第六组[17,18],得
到如下频率分布直方图.则该100名考生的成绩的平均数和中位数(保留一位小数)分别是
()
频率t
组距
0.30.............1_
0.25.....................——
0.15................
0.10---------
0.05----……——--------------
0^12131415161718//s
A.15.215.3B.15.115.4C.15.115.3D.15.215.3
【答案】C
【详解】100名考生成绩的平均数
x=12.5x0.10+13.5x0.154-14.5x0.15+15.5x0.30+16.5x0.25+17.5x().05=15.1,
因为前三组频率直方图面积和为0.10+0.15+0.15=0.4,前四组频率直方图面积和为
0.10+0.154-0.15+0.30=0.7,
所以中位数位于第四组内,设中位数为“,则(4-15)x0.30=0.1,
解得:
故选:C.
3.某地区今年夏天迎来近5()年来罕见的高温极端天气,当地气象部门统计了八月份每天的
最高气温和最低气温,得到如下图表:
15-----------------------------------------------------------------►
I2345678910H1213141516171819202122232425262728293031日期
—最高气温-一•最低气温
根据图表判断,以下结论正确的是()
A.8月每天最高气温的平均数低于35c
B.8月每天最高气温的中位数高于40c
C.8月前半月每天最高气温的方差大于后半月最高气温的方差
D.8月每天最高气温的方差大于每天最低气温的方差
【答案】D
【详解】由某地区2022年8月份每天最高气温与最低气温的折线图知,
对于A,8月I日至9日的每天最高气温的平均数大于35C,25日至28日的每天最高气温
的平均数大于35℃,
29日至31日每天最高气温大于20℃小于25℃,与35℃相差总和小于45℃,而每天最高气
温不低于40℃的有7天,
大于37℃小于40C的有8天,它们与35c相差总和超过45℃,因此8月每天最高气温的平
均数不低于35℃,A不正确;
对于B,8月每天最高气温不低于40c的数据有7个,其它都低于4()℃,把31个数据由小
到大排列,中位数必小于40,
因此8月每天最高气温的中位数低于40C,B不正确;
对于C,8月前半月每天最高气温的数据极差小,波动较小,后半月每天最高气温的极差大,
数据波动很大,
因此8月前半月每天最高气温的方差小于后半月最高气温的方差,C不正确;
对于D,8月每天最高气温的数据极差大,每天最低气温的数据极差较小,
每天最高气温的数据波动也比每天最低气温的数据波动大,因此8月每天最高气温的方差大
于每天最低气温的方差,D正确.
故选:D
4.两个具有线性相关关系的变量的一组数据(孙yj(%,必),…,(工,%),下列说法错
误的是()
A.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
B.相关系数M越接近1,变量%,相关性越强
C.相关指数N越小,残差平方和越大,即模型的拟合效果越差
D.若尤表示女大学生的身高,表示体重,则R:。0.65表示女大学生的身高解释了&%的
体重变化
【答案】A
【详解】对丁A:回归直线方程拟合效果的强弱是由相关指数R2或相关系数卜|判定,故不
正确:
对于B:根据相关系数卜|越接近I,变量相关性越强,故正确:
对于C:相关指数/?2越小,残差平方和越大,效果越差,故正确;
对『D:根据R2的实际意义可得,65表示女大学生的身高解释了65%的体重变化,
故正确;
故选:A.
5.下列说法正确的序号是()
①在回归直线方程S=0.8t-12中,当解释变量/每增加一个单位时,预报变量5平均漕加
0.8个单位:
②利用最小二乘法求回归直线方程,就是使得£(%-/»,-〃尸最小的原理;
n
③已知x,y是两个分类变量,若它们的随机变量六的观测值k越大,则“X与y有关系”
的把握程度越小:
④在一组样本数据(为,%),(*2,/),…,(玉,工)(〃22,々,…,4不全相等)的
散点图中,若所有样本a,£)(i=l,2,…〃)都在直线),=-gx+l上,则这组样本数据的线性
相关系数为
A.①③B.①②C.②@D.③④
【答案】B
【详解】对「•①,在回归直线方程y=0.8x-12中,当解释变量x每增加一个单位时,预
报变量§,平均增加0.8个单位,故①正确;
对于②,用离差的平方和,即:<2=力(%-汨2=力(%一。一姐)2作为总离差,并使之达到最
小;这样回归直线就是所有直线中Q取最小值的那•条。由于平方又叫二乘方,所以这种使
“离差平方和为最小”的方法叫做最小二乘法;所以利用最小二乘法求回归直线方程,就是使
得它(£-灰厂")2最小的原理;故②正确;
n
对于③,对分类变量X与y,对它们的随机变量K?的观测值k来说,々越小,则“X
与丫有关系”的把握程度越小,故③错误;
对于④,相关系数反映的是两变量之间线性相关程度的强弱,与回归直线斜率无关,题中样
本数据的线性相关系数为T,故④错误.
故选:B.
1.为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单
位:kPa)的分组区间为分2,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别
编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第
则第三组中有疗效的人数为:)
D.18
【答案】B
20
【详解】志愿者的总人数为(0.24+0.16)x1—
所以第三组人数为50x0.36=18,
有疗效的人数为18—6=12.
故选:B.
2.分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:
甲乙
61
8530
7532
642156666
428
10.I
则卜.列结论中错误的是()
A.甲同学周课外体育运动时长的样本中位数为7.4
B.乙同学周课外体育运动时长的样本平均数大于8
C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4
D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6
【答案】C
【详解】对于A选项,甲同学周课外体育运动时长的样本中位数为7上3+行75=7.4,A选项
结论正确.
对于B选项,乙同学课外体育运动时长的样本平均数为:
6.3+7.4+7.6+8.1+8.2+8.2+8.5+8.6+8.6+8.6+8.6+9.0+9.2+9.3+9.8+10.1。…。
--------------------------------------------------------------------------------------------------------------------=X.50625>X
16
B选项结论正确.
对于C选项,甲同学周课外体育运动时长大于8的概率的估计值二二0・375<0.4,
16
C选项结论错误.
13
对于D选项,乙同学周课外体育运动时长大于8的概率的估计值匕=0.8125>0.6,
16
D选项结论正确.
故选:C
3.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至
2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折
线图,下列结论错误的是()
月接待游客量(万人)
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期人致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
【答案】A
【详解】对于选项A,由绍易知月接待游客量每年7,8月份明显高于12月份,故A错:
对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;
对于选项C,观察折线图,各年的月接待游客量高峰期大致在7,8月份,故C正确;
对于D选项,观察折线图,各年1月至6月的月接待游客量相对7月至12月,波动性更小,
变化比较平稳,故D正确.
故选:A
4.设(xi,yi),(X2,yz),…,(xn,yn)是变量x和y的n个样本点,直线1是由这些样
本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是
B.x和y的相关系数为直线1的斜率
C.x和y的相关系数在0到1之间
D.当n为偶数时,分布在1两侧的样本点的个数一定相同
【答案】A
【详解】试题分析:回归直线一定过这组数据的样本中心点,两个变量的相关系数不是直线
的斜率,两个变量的相关系数的绝对值是小于1的,是在-1与1之间,所有的样本点集中
在回归直线附近,没有特殊的限制.
解:回归直线一定过这组数据的样本中心点,故A正确,
两个变量的相关系数不是直线的斜率,而是需要用公式做出,故B不正确,
两个变量的相关系数可能为负,故C不正确,
所有的样本点集中在回归直线附近,不一定两侧一样多,故D不正确,
故选A.
5.在一组样本数据(xi,yi),(X2,y2),…,(xn»yn)(n>2,xi,X2,…,Xn不全相等)的散点
图中,若所有样本点(对,平)(i=l,2,…,n)都在直线y=gx+l上,则这组样本数据的样本相
关系数为()
A.-IB.0C.gD.1
【答案】D
【详解】由题设知,所有样本点(七,yi)(i=l,2,...»n)都在直线y=;x+l上,
・•・这组样本数据完全正相关,故其相关系数为1,故选D.
根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.
易错题通关
一、单选题
1.2022年2月4日至2月20日春节期间,第24届冬奥会在北京市和张家口市联合举行.
共有3个冬奥村供运动员和代表队官员入住,其中北京冬奥村的容量约为225()人,延庆冬奥
村的容量约1440人,张家I」冬奥村的容量约2610人.为了解各冬奥村服务质量,现共准备了
140份调查问卷,采用分层抽样的方法,则需在延庆冬奥村投放的问卷数量是()
A.58份B.50份C.32份D.19份
【答案】C
1440
【详解】在延庆冬奥村投放的问卷数量是140X-二:“s=32份.
2250+1440+2610
故选:C.
2.某校举办抗击新冠疫情科普知识演讲活动,如图是七位评委为某选手打出的分数的茎叶
图,去掉一个最高分和一个最低分后,剩下数据的平均数是()
79
844647
93
A.87B.86C.85D.84
【答案】C
【详解】去掉•个最高分93和一个最低分79后,剩下数据的平均数是
84+84+86+84+87__
-------------=oo5
5
故选:C.
3.变量MV之间有如下对应数据:
X
34567
y
13111087
已知变量丁与x呈线性相关关系,且回归方程为»=T.5x+*则。的值是()A.23
B.2.5C.17.1D.17.3
【答案】D
.IHz-vr1-3+4+5+6+7—13+11+10+8+7
【洋解】由题意可知,A=-------------=5,y=---------------=9.8,
则样本点的中心(5,9.8),代入5,=-1.5彳+。,即9.8=(-1.5)x5+。,解得a=17.3.
所以。的值是17.3.
故选:D.
4.某学校举行诗歌朗诵比赛,10位评委对甲、乙两位同学的表现打分,满分为10分,将
两位同学的得分制成如卜.茎叶图,其中茎叶图茎部分是得分的个位数,叶部分是得分的小数,
则下列说法错误的是()
甲乙
885575888
432008003355
99
A.甲同学的平均分大于乙同学的平均分
B.甲、乙两位同学得分的极差分别为2.4和1
C.甲、乙两位同学得分的中位数相同
D.甲同学得分的方差更小
【答案】D
【详解】对于甲,X.P=—(7.8+7.8+7.5+7.5+8.0+8.0+8.2+8.3+8.4+9.9)=8.14
10
-1
X寸「乙,牝=正(7.5+7.8+7.8+7.8+8.0+8.0+8.3+8.3+8.5+8.5)=8.05
故A正确.
中的极差9.9-7.5=2.4,乙的极差8.5-7.5=1
故8正确.
QIQQ1Q
甲得分的中位数1=8,乙得分的中位数1=8,
22
故C正确.
对于甲,
端=>!-[(7.5-8.14>+(7.5-8.14)2+(7.8-8.14>+(7.8—8.14)2+(8-8.14)2+(8-8.14)2
(8.2-8.14)2+(8.3-8.14)2+(8.4-8.14)2+(9.9-8.14)2]=0.39().
对于乙,
4=—[(7.5-8.05)2+(7.8-8.05)2+(7.8-8.05)2+(7.8-8.05)2+(8-8.05)2+(8-8.05)2
(8.3-8.05)2+(8.3-8.05)2+(8.5-8.05)2+(8.5-8.05)2]=0.103
故。错误.
故选。.
5.如图是一组实验数据的散点图,拟合方程),=§+c(x>。)‘令'=:,则),关于'的回归
直线过点(2,5),(12,25),则当),w(L0LL02)时,x的取值范围是()
y
6.
4
2・・・・・・
••••
~o^510X
-2
A.(0.01,0.02)B.(50,100)C.(0.02,0.04)D.(100,200)
【答案】D
【详解】根据题意可得尸初+c(/>0),
由)'关于/的回归直线过点(2,5),(12,25)可得:
5=2。+c
所以。=2,c=l,
25=\2b+c
所以y=2/+l,
由ye(L01,1.02)可得1.01<2/+1<1.02,
所以。005</<0.01,
所以0.005V,<0.01,所以100vx〈200,
x
故选:D
6.雨滴在卜.落过程中,受到的阻力随速度增大而增大,当速度增大到一定程度时,阻力与
重力达到平衡,雨滴开始匀速下落,此时雨滴的下落速度称为“末速度”.某学习小组通过实
验,得到了雨滴的末速度u(单位:m/s)与直径d(单位:mm)的一组数据,并绘制成如
图所示的散点图,则在该实验条件下,下面四个回归方程类型中最适宜作为雨滴的末速度v
与直径4的回归方程类型的是().
v(m/s)
io-
8-・
6-•…
・
4-:
■
2-•
•d(nim)
IIIII
~1~2~3""45
A.v=a+b\[dB.v=a+bd
C.v-a-^-bd1D.v=a+加"
【答案】A
【详解】由一次函数,二次函数及指数函数的性质可知,BCD不符合散点的变化趋势,
由散点图分布可知,散点图分布在一个幕函数的图像附近,
因此,最适宜作为雨滴的木速度y与直径〃的1可归方程类型的是卜,=。十〃47.
故选:A.
7.下列命题中正确的是•)
A.数据1,2,3,3,4,5的众数大于中位数
B.对一组数据必,=1,2,3,…⑺,如果将它们变为大+C(i=123,…,〃),其中CwO,则平
均数和标准差均发生改变
C.有甲、乙、丙三种个体按3:I:2的比例分层抽样调查,如果抽取的甲个体数为9,则样
本容量为30
D.一般可用相关指数配来比较两个模型的拟合效果,2越大,模型拟合效果越好
【答案】D
【详解】对于A,数据1,2,3,3,4,5的众数是3,中位数是岑=3,众数等于中位数,
故A错误;
对于B,数据若(i=l,2,3,…,〃),如果将它们变为%+C(i=123,…㈤,其中CwO,则平均
数增加C,标准差不变,故B错误;
对于C,有甲、乙、丙三种个体按3:1:2的比例分层抽样调查,如果抽取的甲个体数为9,则
9
样本容量为§x(3+l+2)=18,故C错误;
为「D,由相关指数的性质可得可以通过比较相关指数片的大小比较两个模型的拟合效果,
且正越大,模型拟合效果越好,故D正确.
故选:D.
8.在发生某公共卫生事小期间,有专业机构认为该事件在一段事件内没有发生大规模群体
感染的标志是“连续10日,每天新增疑似病例不超过7人”.过去10日,甲、乙、丙、丁四地
新增疑似病例数据信息如F:
甲地:总体平均数为3,中位数为4;
乙地:总体平均数为1,总体方差大于0:
丙地:中位数为2,众数为3;
丁地:总体平均数为2,总体方差为3.
则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是()
A.甲地B.乙地C.丙地D.丁地
【答案】D
【详解】对于甲地,若连续10口的数据为0,0,0,0,4,4,4,4,4,10,则满足平均数为地中位数
为4,但不符合没有发生大规模群体感染的标志,A错误;
对于乙地,若连续10日的数据为0,0,0,0,0,0,0,。,。,10,则满足平均数为1,方差大于0,但
不符合没有发生大规模群体感染的标志,B错误;
对于丙地,若连续地日的数据为0,0,1,1,223,3,3,10,则满足中位数为2,众数为3,但不
符合没有发生大规模群体感染的标志,C错误;
对于丁地,若总体平均数为2,假设有•天数据为8人,则方差$2>9(8-2)2=4.5>3,不
O
可能总体方差为3,则不可能有•天数据超过7人,符合没有发生大规模群体感染的标志,
D正确.
故选:D.
二、多选题
9.2021年某市教育部门组织该市高中教师在暑假期间进行集中培训,培训后统一举行测
试.现随机抽取100名教师的测试成绩进行统计,得到如图所示的频率分布折线图,已知这
100名教师的成绩都在区间[75,100]内,则下列说法正确的是()
A.这100名教师的测试成绩的极差是20分
B.这100名教师的测试成绩的众数是87.5
C.这100名教师中测试成绩不低于90分的人数约占30%
D.这100名教师的测试成绩的中位数是85分
【答案】BC
【详解】这100名教师的测试成绩的最高分和最低分都无法确定,
则极差不确定,故A错误;
由图可知,这100名教师的测试的众数为87.5分,故B正确;
这100名教师中测试分数不低于90分的人数占(0.03+0.03)x5xl00%=30%,故C正确.
设这100名教师测试成绩的中位数为。,
贝I」(0.02+0.04)X5+(“-85)x0.08=0.5,
解得。=87.5,故D错误;
故选:BC.
10.已知由样本数据点集合{(为,=2,…,川,求得的回归直线方程为>1.5工+0.5,
且工=3,现发现两个数据点(1.3,2.1)和(4.7,7.9)误差较大,去除后重新求得的回归
直线,的斜率为1.2,则()
A.变量K与y具有正相关关系B.去除后的回归方程为9=1.2X+1.6
C.去除后y的估计值增加速度变慢D.去除后相应于样本点(2,3.75)的残差为0.05
【答案】AC
【详解】因为重新求得的回归方程/的斜率为1.2,故变量%与y具有正相关关系,故选项A
正确;
将T=3代入回归直线方程为y=L5x+0.5,解得歹=5,
则样本中心为(3,5),去掉两个数据点(132.1)和(4779)后,
由于L3:4.7=3,2.1:7.9=5,故样本中心还是(3,5),
22
又因为去除后重新求得的回归直线/的斜率为1.2,
所以5=3xl.2+a,解得a=L4,
所以去除后的回归方程为f=1.2x+1.4,故选项B不正确;
因为所以去除后丁的估计值增加速度变慢,故选项C正确;
因为21.2x2+1.4=3.8,
所以y-f=3.75—3.8=-O.O5,故选项D不正确.
故选:AC.
三、解答题
11.某地区对高一年级学生进行体质健康测试(简称体测),现随机抽取J'900名学生的体
测结果等级(“良好及以下”或“优秀”)进行分析,得到如下列联表:
良好及以下优秀合计
男450200650
女150100250
合计600300900
(1)计算并判断是否有99%的把握认为本次体测结果等级9性别有关系?
(2)将频率视为概率,用样本估计总体.若从该地区高一所有学生中,采取随机抽样的方法
每次抽取I名学生成绩进行具体指标分析,连续抽取3次,且各次抽取的结果相互独立,记
被抽取到的3名学生的体则等级为“优秀”的人数为求J的分布列和数学期望E(J).
附表及公式:
pg%、)0.150.1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/Z 41283.3-2026声学声景观第3部分:数据分析
- GB/T 17315-2026玉米种子生产技术规程
- 2026年从零到精通私人生产安全培训内容
- 2026年机场安全培训课堂内容实操要点
- 2026年康复安全培训课件内容知识体系
- 植树节的心得体会15篇
- 2026年GMP安全培训内容全流程拆解
- 2026年煤矿作业安全培训内容完整指南
- 丹东市振兴区2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 黔东南苗族侗族自治州丹寨县2025-2026学年第二学期四年级语文期中考试卷(部编版含答案)
- 华为销售培训课件
- 2025年中级消防设施操作员理论知识考试真题(后附专业答案和解析)
- 学前教育原理(第2版) 课件 第一章 学前教育导论
- 新生儿电解质紊乱与护理
- 保安公司现场安保信息管理制度
- 生物分离工程教学课件
- (高清版)DG∕TJ 08-2312-2019 城市工程测量标准
- 人工智能项目产业投资基金设立流程
- GB/T 3405-2025石油苯
- DB1331T 063-2023雄安新区地埋管地源热泵系统工程技术规程
- 标准图集-L22G310-钢筋混凝土结构构造
评论
0/150
提交评论