版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
方法技巧专题25回归分析与独立性检验
解析篇
一、回归分析与独立性检验知识框架
回归分析与独立性检验
二、回归分析与独立性检验题型分析
(1)求回归直线方程的一般步骤如下:
①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算元其2d,%;y的值:③计
/=11=1
算回归系数&A;④写出回归直线方程为£=族十2。
(2)回归直线过样本点中心伉»).
(3)可以利用回归直线方程y=。+去预报在工取某个值时)的估计值.
1.例题
类型一:线性问题
【例1】广告投入对商品的销售额有较大影响,某电商对连续5个年度的广告费x和销售额y进行统计,得
到统计数据如下表(单位:万元;
广告费X23456
销售额),2941505971
由上表可得回归方程为£-10.2入-十日,据此模型,预测广告费为10万元时销售额约为()
A.118.2万元B.111.2万元C.108.8万元D.101.2万元
【答案】B
【解析】由表格中数据可得,*=4,》=50,
,\50=4x10.2+«,解得9.2,
,回归方程为9=10.2x+9.2,
・••当x=10时,>'=10.2x10+9.2=111.2,
即预测广告费为10万元时销售额约为111.2,故选B.
【例2】随着我国中医学的发展,药用昆虫的使用相应愈来愈多.每年春暖以后至寒冬前,是昆虫大量活动
与繁殖季节,易于采集各种药用昆虫.已知•只药用昆虫的产卵数y与一定范围内的温度工有关,于是科研人
员在3月份的31天中随机挑选了5天进行研究,现收集了该种药用昆虫的5组观测数据如下表:
日期2日7日15日22日30日
温度%/℃101113128
产卵数y/个2325302616
(1)从这5天中任选2天,记这两天药用昆虫的产卵分别为m.n,求事件“m,n均不小于25”的概率;
(2)科研人员确定的研究方案是:先从这五组数据中任选2组,用剩下的3组数据建立y关于x的线性回
归方程,再对被选取的2组数据进行检验.
(i)若选取的是3月2日与30日的两组数据,请根据3月7日、15日和22日这三天的数据,求出y关
于工的线性回归方程:
(ii)若由线性回归方程得到的估计数据与选出的检验数据的误差均不超过2个,则认为得到的线性回归
方程是可靠的,试问(i)中所得的线性回归方程是否可靠?
A£(%-可(》-刃卜A
附:回归直线的斜率和截距的最小二乘估计公式分别为b=J------------,a=y-bx.
f-l
【解析】(1)依题意得,TH、n的所有情况有:{23,25}、{23,30}、{23,26}、{23,」6}、{25,30}、
{25,26}、{25,26}、{30,26}、{30,16}、{26,16},共有10个;
设“1、九均不小了25”为事件力,则事件力包含的基本事件有{25,30}、{25,26}、{30,26},
所以P(4)=*故事件4的概率为*
(2)(i)由数据得5=12,9=27,
2
£(%-元)(y-)=5,X(XZ-X)=2,
i=l
AZU-^)(Z-y)5
b=;=T,
£(七一不『
i=l
A55
a=y--x=27--x\2=-3.
22
所以y关丁”的线性回归方程为£=1x-3.
(ii)由(i)知,y关于%的线性回归方程为£=9%-3.
当%=10时,y=1xl0-3=22,|22-23|<2,
当%=8时,y=|x8-3=17,|17-16|<2.
所以,所得到的线性回归方程£=|x—3是可靠的.
【例3】经调查,3个成年人中就有一个高血压,那么什么是高血压?血压多少是正常的?经国际卫生组织
对大量不同年龄的人群进行血压调查,得出随年龄变化,收缩压的正常值变化情况如下表:
年龄X2832384248525862
收缩压y(单位mmHg)114118122127129135140147
〃.三88
其中:------------,a=y-bx.Z*=17232,=47384
^x--n-x2,B1"
1=1
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程5,=必+3(/花的值精确
到0.01)
(3)若规定,一个人的收缩压为标准值的0.9〜1.06倍,则为血压正常人群:收缩压为标准值的
1.06〜1.12倍,则为轻度高血压人群・;收缩压为标准值的1.12~1.20倍,则为中度高血压人群;收缩
压为标准值的1.20倍及以上,则为高度高血压人群.一位收缩压为的70岁的老人,属于哪
类人群?
【解析】
(2)x=--------------:-------------------------------------=45,
8
,114+1184-122+127+129+135+140+147…
y=----------------------------------------------------------------=129.
,£47384-8x45x129118…
..h=---------------=-----------------------;—=——工0.91.
yX2-8.X217232-8X45?129
a=y-^x=129-0.91x45=88.05.
.•・回归直线方程为夕=0.9Lr+88.05.
(3)根据回归直线方程的预测,年龄为7。岁的老人标准收缩压约为
0.91x70+88.05=151.75(制胆g),
180
•.•百天*1.19.・•・收缩小为180〃〃〃弦的70岁老人为中度高血压人群.
2.巩固提升综合练习
【练习1]如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
~
曲
青
©
梳
M
食
凫
争
甘
注:年份代码1-7分别对应年份2008-2014.
(I)由折线图看出,可用线性回归模型拟合y与/的关系,请用相关系数加以说明;
(II)建立y关于/的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
77p
附注:参考数据:Z»=9.32,Z'J=40.17,也(必一切2=().55,g-2.646.
f=li=\Vr=l
£9-7)(丫一份
参考公式:相关系数,二1声------------------
、性(―茂(力-“
V仁1M
回归方程y=a+bt中斜率和截距的最小二乘估计公式分别为:
X(c-o(x-y)
h=—--------------,a=y-bT.
i=l
【解析】(I)由折线图,中数据和附注中参考数据得
7=4,Z(-8,Z(y,")2=().55,
i=\Vi=l
X&-拉y—亍)=火=40.17-4x9.32=2.89,
i=li=\i=l
2.89
«0.99.
0.55x2x2.646
因为1y与f的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟
合),与,的关系.
7__
_932-E&T)(y一)')289
(II)由y=3才1.331及(I)得。=-----------=—«0.103,
7ZM28
i=l
3=a—痴=1331-0.103x4=0.92.所以,y关于/的回归方程为:y=0.92+0.10/.
将2016年对应的f=9代入回归方程得:y=0.92+0.10x9=1.82.
所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.
【练习2】“团购,已经渗透到我们每个人的生活,这离不开快递行业的发展,下表是2013-2017年全国快
递业务量(x亿件:精确到0.1)及其增长速度(),%)的数据
(1)试计算2012年的快递业务量;
(2)分别将2013年,2014年,…,2017年记成年的序号1,2,3,4,5;现已知y与r具有线
性相关关系,试建立y关于/的回归直线方程/=hx-^-a;
(3)根据(2)向中所建立的回归直线方程,估算2019年的快递业务量
X^-nxy
附:回归直线的斜率和截距地最小二乘法估计公式分别为:、吟---------,a=y-hx
£x;一,比2
1=1
【解析】(1)设2012年的快递业务量为〃,则------=61%,解得
a
(2)
ti2345
y6152485128
5=487=3
b=^--------=-6.7,a=y-bT=6SA,/.y=-6.7/+68.1
:一〃L
(3)令,=6,预测2018年比上半年增长e=—6.7x6+68.1=27.9(%),
・•.2018年快递业务增长量为399.9x(l+27.9%)«511.5(亿件)
令,=7,预测2019年比上半年增长y=-6.7x7+68.1=21.2(%),
...2019年快递业务增长量为511.5x(1+21.2%)之619.9(亿件).
类型二:非线性问题
【例4】下列四个命题:①在回归模型中,预报变量),的值不能由解释变量大唯一确定;②若
变量K),满足关系>=-01x+l,且变量),与z正相关,则x与z也正相关;③在残差图中,
残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;④以模型),=c*.去拟合一组
数据时,为了求出回归方程,设z=ln),,将其变换后得到线性方程Z=0.3N+4,则C:",
Z=0.3.
其中真命题的个数为()
A.1个B.2个C.3个D.4个
【答窠】C
【解析】
【分析】
直接利用回归直线的方程的应用,相关的变量关系的应用,残差图的应用分析结果.
【详解】
下列四个命题:
①在回归模型中,预报变量),的值不能由解释变量X唯一确定;根据回归模型中的变量关系,
正确.
②若变量x,y满足关系),=THx+l,且变量),与z正相关,则x与z也正相关;应该是负相
关.故错误.
③在残差图中,残差点分布的带状一区域的宽度越狭窄,具模型拟合的精度越高;即越接近于
回归直线的距离越小,故正确.
④以模型>=。*去拟合一组数据时,为了求出回归方程,设z=lny,将其变换后得到线性方
程z=0.3x+4,则c=/,2=0.3.故正确.
故选:C.
【例5】已知某种细菌的适宜生长温度为12℃-27℃,为了研究该种细菌的繁殖数量N(单位:
个)随温度x(单位:℃)变化的规律,收集数据如下:
温度x/C14161820222426
繁殖数量y/个2530385066120218
对数据进行初步处理后,得到了一些统计量的值,如表所示:
y7
xJ2£(七-元)(乂-方
XkZ(/-)Z(七-可化-7)
1=1/=1/=11=1
20784.11123.8159020.5
其中(=lny,I=
'I=I
(1)请绘出),关于x的散点图,并根据散点图判断>=法+。与),=比必哪一个更适合-作为该
种细菌的繁殖数量y关于温度工的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表格数据,建立》关于x的回归方程(结果精确到o.i):
(3)当温度为27℃时,该种细菌的繁殖数量的预报值为多少?
参考公式:对于一组数据(%,匕)《=1,2,3,…,〃),其回归直线y例的斜率和截距的最小二
X(w,-w)(vf-v)
成估计分别为£-----------,。=万一阿,参考数据:/5=245.
【解析】
【分析】
(1)由散点图即可得到答案;
7_
2(3-可化-7)
(2)把》=。*两边取自然对数,得lny=公+lnc,由d=i计算得到,再将
(获)代入l”=dr+lnc可得Inc,最终求得Iny=0.2%+0.1,即y=*V必;
(3)将x=27代入),=•萨,中计算即可.
【详解】
解:(1)绘出V关于%的散点图,如图所示:
由散点图可知,),=〜公更适合作为该种细菌的繁殖数量关于x的回归方程类型;
(2)把),=。*两边取自然对数,得ln),=dr+lnc,
即人=心IInc»
7_
ZGTd)205
由1=上--------:——二m"。.183=0.2
112
lnc=4.1-0.2x20«0.1.
/.lny=0.2x+0.1,
则y关于X的回归方程为y=冷•滑2,;
(3)当工=27时,计算可得,,二«。」,/4=笛5^245;
即温度为27℃时,该种细菌的繁殖数量的预报值为245.
【点睛】
本题考查求非线性回归方程及其应用的问题,考查学生数据处理能力及运算能力,是一道中
档题.
【例6】自从新型冠状病毒爆发以来,全国范围内采取了积极的措施进行防控,并及时通报各
项数据以便公众了解情况,做好防护.以下是湖南省2020年1月23日.31日这9天的新增确诊
人数.
日期232425262728293031
时间工123456789
新增确诊人数)'151926314378565557
经过医学研究,发现新型冠状病毒极易传染,一个病毒的携带者在病情发作之前通常有长达
14天的潜伏期,这个期间如果不采取防护措施,则感染者与一位健康者接触时间超过15秒,
就有可能传染病毒.
(1)将1月23日作为第1天,连续9天的时间作为变量x,每天新增确诊人数作为变量y,
通过回归分析,得到模型?=+4用于对疫情进行分析.对上表的数据作初步处理,得到下
面的一些统计量的值(部分数据已作近似处理):
x=5,y=42.2,1Jinx,.=142^(x.-x)(y/-y)=384,J(lnxz-y)=100.86,
9/=1/=1i=l
£(%-可2=6()$(1呻-帚勾2=4.1,1"()=2.3.根据相关数据,求该模型的回归方程(结果精
r=l/=1
确到0.1),并依据该模型预测第10天新增确诊人数.
(2)如果一位新型冠状病毒的感染者传染给他人的概率为0.3,在一次12人的家庭聚餐中,
只有一位感染者参加了聚餐,记余下的人员中被感染的人数为X,求X=Z最有可能(即概
率最大)的值是多少.
附:对于一组数据(%,匕),(的,口)…,(”〃,匕),其回归直线u=a+的的斜率和截距的最小二
£(%)(匕-万)
乘估计分别为3=J--------------,d=v-^u.
i=]
【解析】
【分析】⑴由模型沁沁工+3根据提供公式,结合数据呻-百可凹一方=100.86,
/=1
9__,__
-Inx)=4.1,求出利用(Inx,y)在回归方程上求出〃,将x=10代入回归方程,即
r=l
可估算结论;
(2)根据已知可得余下的人员中被感染的人数为X,服从二项分布X5(11,0.3),
\P(X=k)>P{X=k-\)
由DV,LDv7;,且1"k5°次即可求出X=Z最有可能(即概率最大)的
P(X=k)>P(X=k+i)
值.
【详解】
*246,
(1)•/y=b\nx-¥ii,/.b=
——\2
Xi-Inxl
a=y-24.6xlnx=42.2-24.6x1.42«7.3,
回归方程为9=24.6Inx+7.3,
当x=10时,y=24.6xlnl0+7.3=24.6x2.3+7.3=63.88«64,
・M古计第10天新增确诊人数为64人;
(2)设余下11人中被感染的人数为X,则X8(11,0.3),
・•.P(X=k)=C,\0,3<0.7,,-\要使P(X=k)最大,
P(X=k)>P(X=k-l)
P(X=k)NP(X=k+T)
.G:0-360.7"-”>GT0.3J07X
.C10.3"0.7g>。俨0.3"z0.7g
0.3>0.7
0.7=0.3
(k+l)!(10_Q!
3.6—0.30).72
0.7%+0.723.3-0.3出
得2.6W上<3.6,keN,:.k=3,
所以X=Z最有可能(即概率最大)的值为2=3.
【点睛】
本题考查回归方程及其应用、二项分布的随机变量概率最大值,考查计算求解能力,属于中
档题.
2.巩固提升综合练习
【练习3]习近平总书记在十九大报告中指出,必须树立和践行“绿水青山就是金山银山”的生
态文明发展理念,某城市选用某种植物进行绿化,设其中一株幼苗从观察之日起,第x天的
高度为ytm,测得一些数据图如下表所示:
第尤/p>
高度y/cm0479111213
作出这组数的散点图如下
⑴请根据散点图判断,),=磔+〃与y=c4+,/中哪一个更适宜作为幼苗高度),关于时间x的
回归方程类型?(给出判断即可,不必说明理由)
⑵根据(1)的判断结果及表中数据,建立),关于x的回归方程,并预测第144天这株幼苗的高
度(结果保留1位小数).
附:6=弋--------,a=y-bx
»;一2〃尸—>
;=1
参考数据:
7
ty.Z(我州)
r»l|>|
1402856283
【解析】
【分析】(1)根据散点图,可直接判断出结果;
(2)先令〃二五,根据题中数据,得到y与〃的数据对,根据新的数据对,求出"=4,y=8,
再由最小二乘法求出工,2,即可得出回归方程,从而可求出预测值.
【详解】
解:(1)根据散点图,y=c«+d更适宜作为幼苗高度y关于时间x的回归方程类型;
(2)令〃=«,则),=c«+c/构造新的成对数据•,如下表所示:
/p>
1234567
y0479111213
容易计算,*=4,y=8.
通过上表计算可得:
舟一西
283-7x4x859
因此?=i=l
140-7x16-28
f)一疗
j-1
•・•回归直线$=c〃+”过点(",9),
/.J=y-c/7=-1,
故丁关于〃的回归直线方程为
2o7
59/-3
从血可得:y关十x的回归方程为y=—Jx--
174
令人=144,则y=——-24.9,
所以预测第144天幼苗的高度大约为24.9cm.
【点睛】本题主要考查非线性回归方程,先将问题转化为线性回归方程,根据最小二乘法求
出参数的估计值,即可得出结果,属于常考题型.
【练习4】近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间
的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付,某线路公交
车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示
每天使用扫码支付的人次(单位:十人次),绘制了如图所示的散点图:
(I)根据散点图判断在推广期内,尸a+b?与),=「*(c,d为为大于零的常数)哪一个适
宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明
理由)
(H)根据(I)的判断结果求y关于x的回归方程,并预测活动推出第8天使用扫码支付的
人次.
参考数据:
7%
yV10°54
i=li=l
4621.54253550.121403.47
|7
其中匕=igy,v=-^vz
>/=!
附:对于一组数据(%,4),(〃2,彩),…,D其回归直线6=4+成的斜率和截距的最小
-nuv
二乘估计分别为:BT--------,a=v-pii.
%2_疝2
M
【解析】
【分析1(I)通过散点图,判断y=适宜作为扫码支付的人数y关于活动推出天数x的
回归方程类型(II)通过对数运算法则,利用回归直线方程相关系数,求出回归宜线方程,
然后求解第8天使用扫码支付的人次.
【详解】
(1)根据散点图判断,y=适宜作为扫码支付的人数y关于活动推出天数x的回归方程
类型.
(H)因为),=cd,两边取常用对数得:lgy=lg(cd)=lgc+lgd-x,
iglgy=v,v=lgc+lgJ-x
7
J=4,V=1.55,^^2=140,
r=l
7
>xv-7x~
I50.12-7x4xl.547....
/.\ga=-H----------=------------------=——=0.25,
『2-_2140-7x4228
/=1
把样本数据中心点(4,1.54)代入y=1gc卜1g〃“得:lgc=0.54,
/.v=0.54+0.25x,
则lgy=0.54+0.25x
所以y关于x的回归方程为亍=10°如°孙,
把x=8代入上式得:5,=10。*。曲8=347,
故活动推出第8天使用扫码支付的人次为347.
【点睛】
本题主要考查了线性回归方程的求法及应用,数学期望的应用,考查计算能力,是中档题.
【练习5】某企业生产一种产品,从流水线上随机抽取100件产品,统计其质量指标值并绘制
频率分布直方图(如图1):规定产品的质量指标值在[65,85)的为劣质品,在[85,105)的为优
等品,在[105,115]的为特优品,销售时劣质品每件亏损0.8元,优等品每件盈利4元,特优品
每件盈利6元,以这100件产品的质量指标值位于各区间的频率代替产品的质量指标值位于该
区间的概率.
(1)求每件产品的平均销售利润;
(2)该企业主管部门为了解企业年营销费用x(单位:万元)对年销售量V(单位:万件)
的影响,对该企业近5年的年营销费用药和年销售量(i=L2,3,4,5)数据做了初步处理,得
到的散点图(如图2)及一些统计量的值.
55
五)2
2%z匕
f=lr=l<=ii=l
16.3523.40.541.62
[5|5
表中%=lnx,,v,.=InJ;,w,v=-^v,..
3/=i〉f=i
根据散点图判断,可以作为年销售量y(万件)关于年营销费用X(万元)的回归方
程.
①求)'关于X的回归方程;
②用所求的回归方程估计该企业每年应投入多少营销费,才能使得该企业的年收益的预报值
达到最大?(收益=销售利润-营销费用,取*59=36)
附:对于一组数据(%,耳),(孙匕),,口,匕),其回归直线。=6+瓦的斜率和截距的最小
次(%-五)(一)
二乘估计分别为/----------,a=v-pu.
1=1
【解析】
【分析】
(I)每件产品的销售利润为X,由已知可得X的取值,由频率分布直方图可得劣质品、优
等品、特优品的概率,从而可得X的概率分布列,依期望公式计算出期望即为平均销售利润;
(2)①对y=〃•一取自然对数,得ln),=ln(Gd)=ln〃+Z?lnx,
令w=lnx,v=lny,c=\na,则y=c+E,这就是线性回归方程,由所给公式数据计算出系
数,得线性回归方程,从而可求得〉,=〃♦/;
②求出收益z=3y-彳=3x36)_才=1081-x,可设f=)换元后用导数求出最大值.
【详解】
解:(1)设每件产品的销售利润为X,则X的可能取值为-0.8,4,6.由频•率分布直方图
可得产品为劣质品、优等品、特优品的概率分别为0.25、0.65、0.1.
所以P(X=-0.8)=0.25;P(X=4)=0.65;P(X=6)=0.1.所以X的分布列为
X-0.846
p0.250.650.1
所以E(X)=(-0.8)x0.25+4x0.65+6x0.1=3(元).
即每件产品的平均销售利润为3元.
(2)①由》=〃•一,得Iny=ln(a-f)=ln〃+Z?lnx,
令w=lnx,v=Iny,c=\na,贝iJu=c+0〃,
.Z")(D0541
由表中数据可得b=------------
C一丫1,623
f=l
EI*-£-23.4116.35
则c=v-bu=------x-----=4.68-1.09=3.59,
535
i1(
所以£=3.59+上〃,即ln]=3.59+Tnx=ln廿的.炉,
33(,
因为取/59=36,所以夕=36),故所求的回归方程为y=36:.
②设年收益为z万元,则z=3y-x=3x36%-x=108)-x
令/=%>0,则z=108/-/,zz=108-3r2=-3(r-36),当0vrv6时,z'>0,
当,>6时,?<0,所以当7=6,即x=216时,z有最大值432.
即该企业每年应该投入216万元营销费,能使得该企业的年收益的预报值达到最大,最大收益
为432万元.
【点睛】
本题考查频率分布直方图,考查随机变量概率分布列与期望,考查求线性回归直线方程,及
回归方程的应用.在求指数型回归方程时,可通过取对数的方法转化为求线性回归直线方程,
然后再求出指数型回归方程.
【二】独立性检验
独立性检验
独立性检验是用来考察两个分类变量是否有关系,计算随机变量的观测值昭,烂越大,说明两个
分类变量有关系的可能性越大.
假设有两个分类变量X和匕它们的取值分别为{川,及}和{)",”},其样本频数列联表(称为2X2
列联表)为
yi总计
XIaba+b
X2cdc+d
总计a+cb+da+/?+c+c/
(a+b+c+d)(ad-bc)2
则K2=g+b)(c+d)(a+c)(b+d),
若K2>3.84l,则有95%的把握说两个事件有关;
若K2>6.635,则有99%的把握说两个事件有关;
若K2V2.706,则没有充分理由认为两个事件有关.
1.例题
【例1】某学校研究性学习小组对该校高三学生视力情况进行调查,在高三的全体1000名学生中随机抽
取了100名学生的体检表,并得到如图的频率分布直方图.
级排名
1-50951-1000
是否近小\
近视4530
不近视520
(1)若直方图中后四组的频数成等差数列,试估计全年级视力在4.8以下的人数;
(2)学习小组成员发现,学习成绩突出的学生,近视的比较多,为了研究学生的视力与学习成绩是否有关
系,对年级名次1〜50名和951〜1000名的学生进行了调查,得到上表中数据,根据表中的数据,能否在
犯借的概率不超过0.05的前提下认为视力与学习成绩有关系?
附:
P(K,)0.10.050.0250.0100.005
k2.7063.8415.0246.6357.879
n(ad-be)2
一(Q+b)(c+d)(Q+c)(b+d)
【解析】⑴设各组的频率为£(j=
由图可知,第一组有3人,第二组7人,第三组27人,
因为后四组的频数成等差数列,
所以后四组频数依次为27,24,21,18,
所以视力在4.8以下的频数为3+7+27+24=61A.
故全年级视力在4.8以下的人数约为1000x品=610A.
n(ad-bc)2100x(45x20-5x30)2
(2)由已知得,(2==12>3.841,
(a+d)(c+d)(a+c)(b+d)50X50X75X25
因此在犯错误的概率不超过0.05的前提下认为视力与学习成绩有关系.
【例2】2014年12月19H,2014年中国数学奥林匹克竞赛(第30届全国中学生数学冬令营)在重庆市
巴蜀中学举行.参加本届中国数学奥林匹克竞赛共有来自各省、市(自治区、直辖市)、香港地区、澳
门地区,以及俄罗斯、新加坡等国的30余支代表队,共317名选手.竞赛为期2天,每天3道题,限
时4个半小时完成.部分优胜者将参加为国际数学奥林匹克竞赛而组建的中国国家集训队.中国数学奥
林匹克竞赛(全国中学生数学冬令营)是在全国高中数学联赛基础上进行的■次较高层次的数学竞赛,
该项活动也是中国中学生级别最高、规模最大、最有影响的全国性数学竞赛.2020年第29届全国中学
生生物学竞赛也将在重庆巴蜀中学举行.巴蜀中学校本选修果“数学建模”兴趣小组调查了2019年参加
全国生物竞赛的200名学生(其中男生、女生各100人)的成绩,得到这200名学生成绩的中位数为
78.这200名学生成绩均在50与110之间,且成绩在[90,100)内的人数为30,这200名学生成绩的高
于平均数的男生有62名,女生有38名.并根据调查结果画出如图所示的频率分布直方图.
(1)求工,y的值;
(2)填写下表,能否有99.9%的把握认为学生成绩是否高于平均数与性别有关系?
男生女生总计
成绩不高于平均数
成绩高于平均数
总计
n(ad-be)1
参考公式及数据:K2=其中〃=a+Z?+c+4.
(a+b)(c+d)(a+c)(b+d)
2
P(K>k())0.050.0100.0050.001
k。3.8416.6357.87910.828
【解析】(1)•・•成绩在[90,100)内的人数为30,
30
・•・成绩在[90,100)内的频率为—=().15.
200
由频率分布直方图得(0.。1+了+工+工+。005)又10+0.15=1,
化简得y+2x=0.07,①
由中位数可得0.01x10+10),+(78-70)x=0.5,
化简得5y+4x=0.2,②
由①②解得x=0.025,y=0.02.
(2)20()名学生成绩的高于平均数的男生有62名,女生有38名,
因男、女生各10()名,所以可得成绩不高于平均数的男生有38名,女生有62名,
根据题意得到列联表:
男生女生总计
成绩不高于平均数3862100
成绩高于平均数623810()
总计100100200
200x(38x38-62x62)2
K?的观测值攵==11.52>10,828,
100x100x100x100
・••有99.9%的把握认为学牛.成绩是否高于平均数与性别有关系.
2.巩固提升综合练习
【练习1】某市一中毕业生有3000名,二中毕业生有2000名.为了研究语文高考成绩是否与学校有关,
现采用分层抽样的方法,从中抽取100名学生,先统计了他们的成绩(折合成百分制),然后按“一中”、“二
中”分为两组,再将成绩分为5组,[50,60),[60,70),[70,80),[80,90),[90,100],分别加以统计,得到
如图所示的频率分布直方图:
•中成绩二中成绩
(1)从成绩在90分(含90分)以上的学生中随机抽取2人,问至少抽到一名学生是“一中”的概率;
(2)规定成绩在70分以下为“成绩不理想”,请根据已知条件构造2X2列联表,并判断能否在犯错误的概
率不超过0.1的.前提下认为“成绩理想不理想与所在学校有关”?
,,2n(ad-bc)2.,..,
附:K=7~—~~———-7—r,n
(a+b)(c+d)(a+c)(b+d)=a+b+c+d.
P(K2>k。)0.1000.0500.0100.001
k02.7063.8416.63510.828
【解析】(1)由分层抽样抽取的100名学生中,一中有60名,二中有40名,
所以成绩在90分以上的人中,一中有60x0.005x10=3人;
二中有40x0.005x10=2人,
故至少抽到一名学生是“一中”的概率为p=1-看=看
(2)2x2列联表如下:
成绩不理想成绩理想合计
一中154560
二中142640
合计2971100
将列联表中的数据代入公式,可得:
Q=房鬻"=R蒜甘=-656<2.706.
所以不能在犯错误的概率不超过0.1的前提卜认为“成绩理想不理想与所在学校有关
【练习2】某社会机构为了调查对手机游戏的兴趣与年龄的关系,通过问卷调查,整理数据得如下2x2列
联表:
40岁以下40岁以上合计
很有兴趣301545
无兴趣203555
合计5050100
(1)根据列联表,能否有999%的把握认为对手机游戏的兴趣程度与年龄有关?
(2)若已经从4()岁以下的被调查者中用分层抽样的方式抽取了5名,现从这5名被调查者中随机选取
3名,求这3名被调查者中恰有1名对手机游戏无兴趣的概率.
n(ad-be)1
参考公式及数据:其中〃=a+〃+c+d.
(a+Z?)(c+d)(a+c)(b+d)
P(Kfko)0.050.0100.001
不3.8416.63510.828
【解析】⑴由题可得K?的观测值女二小虫笆二迎匚二竺2<]0.828,
50x50x45x5511
・・・没有99.9%的把握认为手机游戏的兴趣程度与年龄有关.
(2)由题得40岁以卜的被谎查者中用分层抽样的方式抽取的5名人员中有3名对手机游戏很有兴趣,
设为。、b、c:有2名对手机游戏无兴趣,设为d、e,
仄。、b、c、d,e中随机选取3名的基本事件有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年幼儿园大型中秋节活动方案设计
- 2026年演唱会活动策划方案
- 2026年服装行业经营风险分析
- 2026年幼儿园安全自查报告
- 2026年土鸡销售营销方案策划书
- 2026年云南民族大学附属中学中考英语模拟试卷(含详细答案解析)
- 2026年国庆节小班教育活动设计
- 2026年小学数学教学专题研究报告
- 二手车买卖协议书无效
- 互联网借款协议书范本
- 光伏组件热斑效应课件
- 2025年浙能集团甘肃有限公司新能源项目招聘22人笔试历年参考题库附带答案详解
- 幼儿园教师资格综合素质模块一
- 基于ARMA模型猪肉价格预测实证分析
- DBJT 13-508-2025 城市道路项目安全性评价标准
- 2025版CSCO尿路上皮癌诊疗指南
- 2025广东广州市黄埔区文冲街招聘垃圾分类督导员和垃圾分类专管员3人备考练习题库及答案解析
- DB3711∕T 118-2022 毛竹栽培技术规程
- 激光3D打印人形机器人关节结构拓扑优化研究
- 2025年八年级生物会考真题
- 地勘单位面试题库及答案
评论
0/150
提交评论