题组层级快练72-变量间的相关关系及独立性检验_第1页
题组层级快练72-变量间的相关关系及独立性检验_第2页
题组层级快练72-变量间的相关关系及独立性检验_第3页
题组层级快练72-变量间的相关关系及独立性检验_第4页
题组层级快练72-变量间的相关关系及独立性检验_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、题组层级快练(七十二)1(2014·湖北理)根据如下样本数据x345678y4.02.50.50.52.03.0得到的回归方程为bxa,则()Aa>0,b>0Ba>0,b<0Ca<0,b >0 Da<0,b<0答案B解析根据题中表内数据画出散点图(图略),由散点图可知b<0,a>0,选B.2下列有关样本相关系数的说法不正确的是()A相关系数用来衡量变量x与y之间的线性相关程度B|r|1,且|r|越接近于1,相关程度越大C|r|1,且|r|越接近0,相关程度越小D|r|1,且|r|越接近1,相关程度越小答案D3甲、乙、丙、丁四

2、位同学各自对A,B两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲乙丙丁r0.820.780.690.85m115106124103则哪位同学的试验结果体现A,B两变量更强的线性相关性?()A甲 B乙C丙 D丁答案D解析r0且丁最接近1,残差平方和越小,相关性越高,故选D.4设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm

3、,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案D解析D选项中,若该大学某女生身高为170 cm,则可断定其体重约为0.85×17085.7158.79 kg.故D不正确5下面是一个2×2列联表y1y2总计x1a2173x2222547合计b46120其中a,b处填的值分别为()A9472 B5250C5274 D7452答案C解析由a2173,得a52,a22b,得b74.故选C.6在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A若K2的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在

4、100个吸烟的人中必有99个患有肺病B由独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病C若统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D以上三种说法都不正确答案C7下列说法:将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;设有一个回归方程35x,变量x增加一个单位时,y平均增加5个单位;线性回归方程x必过(,);在一个2×2列联表中,由计算得K2的观测值k13.079,则在犯错误的概率不超过0.001的前提下认为这两个变量间有关系其中错误的个数是()A0 B1C2 D3本题可以参考独

5、立性检验临界值表P(K2k)0.50.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828答案B解析只有错误,应该是y平均减少5个单位8为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:理科文科合计男131023女72027合计203050已知P(K23.841)0.05,P(K25.024)0.025.根据表中数据,得到K2的观测值k4.844,则认为选修文科与性别有关系出错的可能性约为_答案5%解析由K2的观测值k

6、4.844>3.841,故认为选修文科与性别有关系出错的可能性约为5%.9某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验根据收集到的数据(如下表),由最小二乘法求得回归方程 0.67x54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据模糊看不清,请你推断出该数据的值为_答案68解析由已知可计算求出30,而线性回归方程必过点(,),则0.67×3054.975,设模糊数字为a,则75,计算得a68.10(2014·安徽文)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为

7、调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12,估计该校学生每周平均体育运动时间超过4小时的概率(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.P(K2k0)0.100.050.010

8、0.005k02.7063.8416.6357.879附:K2.答案(1)90(2)0.75(3)有95%的把握思路(1)根据抽样比计算分层抽样中应抽取的人数;(2)利用对立事件或互斥事件的概率公式求运动时间超过4小时的概率;(3)根据K2的计算公式求解解析(1)300×90,所以应收集90位女生的样本数据(2)由频率分布直方图得12×(0.0250.100)0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有300×0.75225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小

9、时又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得K24.762>3.841.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”11(2013·重庆文)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i80,i20,iyi184,720.(1)求家庭的月储蓄y对月收入x的线性回

10、归方程ybxa;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:线性回归方程ybxa中,b,ab,其中,为样本平均值,线性回归方程也可写为x.答案(1)0.3x0.4(2)x与y正相关(3)约为1.7千元解析(1)由题意知n10,i8,i2,又n272010×8280,iyin 18410×8×224,由此得b0.3,ab20.3×80.4,故所求回归方程为0.3x0.4.(2)由于变量y的值随x的值增加而增加(b0.3>0),故x与y之间是正相关(3)将x7代入回归方程可以预测该家庭的月储蓄

11、约为y0.3×70.41.7千元12(2015·河北邯郸一模)为了解心肺疾病是否与年龄相关,现随机抽取了40名市民,得到数据如下表:患心肺疾病不患心肺疾病合计大于40岁16小于等于40岁12合计40已知在全部的40人中随机抽取1人,抽到不患心肺疾病的概率为.(1)请将2×2列联表补充完整;(2)能否在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关?下面的临界值表供参考:P(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828(参考公式:K2,其中nabcd)答

12、案(1)略(2)能判定解析(1)患心肺疾病不患心肺疾病合计大于40岁16420小于等于40岁81220合计241640(2)K26.667>6.735,所以在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关13(2014·江南十校)某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人陈老师采用A,B两种不同的教学方式分别在甲、乙两个班进行教改实验为了了解教学效果,期末考试后,陈老师对甲、乙两个班级的学生成绩进行统计分析,画出频率分布直方图(如下图)记成绩不低于90分者为“成绩优秀”根据频率分布直方图填写下面2×2列联表,并判断能否在犯错误的

13、概率不超过0.05的前提下认为:“成绩优秀”与教学方式有关.甲班(A方式)乙班(B方式)总计成绩优秀成绩不优秀总计附:K2.P(K2k)0.250.150.100.050.025k1.3232.0722.7063.8415.024答案能判定解析由频率分布直方图可得,甲班成绩优秀、成绩不优秀的人数分别为12,38,乙班成绩优秀、成绩不优秀的人数分别为4,46.甲班(A方式)乙班(B方式)总计成绩优秀12416成绩不优秀384684总计5050100根据列联表中数据,K2的观测值k4.762.由于4.762>3.841,所以在犯错误的概率不超过0.05的前提下认为:“成绩优秀”与教学方式有关

14、1设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有()Ab与r的符号相同Ba与r的符号相同Cb与r的符号相反 Da与r的符号相反答案A2(2014·石家庄市二模)2013年国内物价持续上涨,某著名纺织集团为了降低生产成本继续走高的压力,计划提高某种产品的价格,为此销售部在10月1日至10月5日连续五天对某个大型批发市场中该产品一天的销售量及其价格进行了调查,其中该产品的价格x(元)与销售量y(万件)之间的数据如下表所示:日期10月1日10月2日10月3日10月4日10月5日价格x(元)99.51010.511销售量y(万件)

15、1110865已知销售量y与价格x之间具有线性相关关系,其回归直线方程为:3.2xa,若该集团提高价格后该批发市场的日销售量为7.36万件,则该产品的价格为()A14.2元B10.8元C14.8元 D10.2元答案D解析依题意×(99.51010.511)10,×(1110865)8.因为线性回归直线必过样本中心点(,),所以83.2×10a,解得a40.所以回归直线方程为3.2x40.令7.36,则7.363.2x40,解得x10.2.所以该产品的价格为10.2元3某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数

16、x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程bxa,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?(注:b,ab )答案(1)略(2)0.7x1.05(3)8.05小时解析(1)散点图如图(2)由表中数据得xiyi52.5,3.5,3.5,x54.b0.7,a1.05.0.7x1.05.回归直线图略(3)将x10代入回归直线方程,得0.7×101.058.05(小时)预测加工10个零件需要8.05小时4实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y

17、与x之间的回归直线方程为()A.x1B.x2C.2x1 D.x1答案A解析画出散点图,四点都在直线x1.5两个相关变量满足如下关系:x1015202530y1 0031 0051 0101 0111 014则两变量的回归方程为()A.0.56x997.4 B.0.63x231.2C.0.56x501.4 D.60.4x400.7答案A解析回归直线经过样本中心点(20,1 008.6),经检验只有选项A符合题意6变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3)

18、,(12.5,2),(13,1)r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()Ar2<r1<0 B0<r2<r1Cr2<0<r1 Dr2r1答案C解析对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0,所以有r2<0<r1.故选C.7(2014·沧州七校联考)某单位为了制定节能减排的计划,随机统计了某4天的用电量y(单位:度)与当天气温x(单位:),并制作了对照表(如表所示)由表中数据,得线性回归方程2xa

19、,当某天的气温为5时,预测当天的用电量约为_度.x1813101y24343864答案70解析气温的平均值×(1813101)10,用电量的平均值×(24343864)40,因为回归直线必经过点(,),将其代入线性回归方程得402×10a,解得a60,故回归方程为2x60.当x5时,2×(5)6070.所以当某天的气温为5时,预测当天的用电量约为70度8(2013·福建文)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月

20、的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如下图所示的频率分布直方图(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P(K2k)0.1000.0500.0100.001k2.7063.8416.63510.8

21、28附:K2.答案(1)(2)没有90%的把握认为“生产能手与工人所在的年龄组有关”解析(1)由已知,得样本中有25周岁以上组工人60名,25周岁以下组工人40名所以样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.053人,记为A1,A2,A3;25周岁以下组工人有40×0.052人,记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)故所求的概率P.(2)由频率分布直方图,可知在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.2515人,“25周岁以下组”中的生产能手有40×0.37515人,据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得K21.79.因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论