付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、暑假作业8 成对数据的统计分析一、单选题1在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A若的观测值为,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误C从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病D以上三种说法都不正确2对四组数据进行统计,获得以下散点图,关于其线性相关系数比较,正确的是( )ABCD3某调查者在调查中获知某公司近年来科研费用支出(万元)与公司所获得利润(万元)的统计资料如下表:序号
2、科研费用支出利润合计则利润关于科研费用支出的经验回归方程为( )参考公式:,ABCD4某公司年月至月空调销售完成情况如图所示,其中为月份,为销售量,下面四个回归方程类型中,最适合作为销售量和月份的回归方程类型的是( )ABCD5有两个分类变量X,Y,其列联表如下所示,a其中a,均为大于5的整数,若在犯错误的概率不超过的前提下认为X,Y有关,则a的值为( )A8B9C8或9D6或86下列有关线性回归分析的六个命题:在回归直线方程中,当解释变量x增加1个单位时,预报变量平均减少个单位回归直线就是散点图中经过样本数据点最多的那条直线当相关性系数时,两个变量正相关如果两个变量的相关性越强,则相关性系数
3、r就越接近于1残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高甲、乙两个模型的相关指数分别约为和,则模型乙的拟合效果更好其中真命题的个数为( )A1个B2个C3个D4个7已知变量y关于x的非线性经验回归方程为,其一组数据如下表所示:x1234ye若,则预测y的值可能为( )ABCD二、多选题8下列结论正确的是( )A函数关系是一种确定性关系B相关关系是一种非确定性关系C在研究身高与年龄的关系时,散点图中可用横轴表示年龄,纵轴表示身高D散点图能准确反映变量间的关系9设某大学的女生体重(单位:kg)与身高(单位:cm)具有线性相关关系,根据一组样本数据,用最小二乘法建立的回归直线方
4、程为,则下列结论中正确的是( )A与具有正的线性相关关系B若该大学女生的平均身高为,则平均体重约为C若该大学某女生身高增加,则其体重约增加D若该大学某女生身高为,则可断定其体重必为10下列说法,其中正确的是( )A对于独立性检验,的值越大,说明两事件相关程度越大B以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则c,k的值分别是和C某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则高一学生被抽到的概率最大D通过回归直线及回归系数可以精确反映变量的取值和变化趋势11为了增强学生的身体素质,提高适应自然环境、
5、克服困难的能力,某校在课外活动中新增了一项登山活动,并对“学生喜欢登山和性别是否有关”做了一次调查,得到如图所示的等高条形统计图,则下列说法中正确的有( )A被调查的学生中喜欢登山的男生人数比不喜欢登山的女生人数多B被调查的男生中喜欢登山的人数比不喜欢登山的人数多C是否有99%的把握认为喜欢登山和性别有关不会受到被调查的男女生人数影响D是否有99%的把握认为喜欢登山和性别有关会受到被调查的男女生人数影响12在检验A与B是否有关的过程中,根据所得数据算得的值,则下列说法不正确的是( )A若,则认为A与B独立,该推断犯错误的概率不超过B若,则认为A与B独立,该推断犯错误的概率不超过C若,则认为A与
6、B不独立,该推断犯错误的概率不超过D若,则认为A与B不独立,该推断犯错误的概率不超过三、解答题13某社区对居民参加体育活动进行随机调查,参与调查的60岁以下和60岁以上的(含60岁)人数如下表:60岁以下60岁以上(含60岁)男性居民3040女性居民5020(1)判断能否有的把握认为参加体育活动与性别有关;(2)用分层抽样方法,在60岁以下的居民中抽取8人,再从这8人中随机抽取3人,记抽到的男性居民数为随机变量X,求X的分布列和数学期望附:k,其中14近期新冠病毒奥密克戎毒株全球蔓延,传染性更强、潜伏期更短、防控难度更大为落实动态清零政策下的常态化防疫,某高中学校开展了每周的核酸抽检工作:周一
7、至周五,每天中午13:00开始,当天安排450位师生核酸检测,五天时间全员覆盖(1)该校教职工有410人,高二学生有620人,高三学生有610人,用分层抽样的方法,求高一学生每天抽检人数;高一年级共15个班,该年级每天抽检的学生有两种安排方案,方案一:集中来自部分班级;方案二:分散来自所有班级你认为哪种方案更合理,并给出理由(2)学校开展核酸抽检的第一周,周一至周五核酸抽检用时记录如下:第天12345用时(小时)计算变量和的相关系数(精确到),并说明两变量线性相关的强弱;根据中的计算结果,判定变量和是正相关,还是负相关,并给出可能的原因参考数据和公式:,相关系数15A,B是河道分布密集、水患严
8、重的西部两邻县,从2015年开始,沿海C市对A县对口整治河道,C市2015年对A县河道整治投入40亿元,以后河道整治投入逐年减少亿元(a是常数,)B县则由当地市级机关下派第一书记,单位承包到镇(乡)河道,实行河长负责,市民承包到河段的责任制,下表是从2015年到2019年,对B县以年为单位的河道整治投入额:投入年份20152016201720182019年分代号t12345年河道整治投入额y(亿元)3024221816(1)用最小二乘法求对B县的河道整治投入额y与投入年份代号t的回归方程;(2)A,B两县人口分别为58万和42万,请比较对A,B两县从2015年至2020年这6年人均河道整治投入
9、的大小(对B县2020年的河道整治投入取回归方程的估计值)统计得出两县2020年河道整治是否达标与人均河道整治投入额分布列联表(人数单位:万人):未达标达标合计6年的人均河道整治投入不低于3亿元/万人2038586年的人均河道整治投入低于3亿元/万人241842合计4456100结合此表,是否有把握认为河道整治达标与对当地市民的河道整治投入有关?参考公式及数据:,检验临界值表:16随着科技进步,近年来,我国新能源汽车产业迅速发展以下是中国汽车工业协会2022年2月公布的近六年我国新能源乘用车的年销售量数据:年份201620172018201920202021年份代码x123456新能源乘用车年
10、销售量y(万辆)5078126121137352(1)根据表中数据,求出y关于x的线性回归方程;(结果保留整数)(2)若用模型拟合y与x的关系,可得回归方程为,经计算该模型和第(1)问中模型的(为相关指数)分别为和,请分别利用这两个模型,求2022年我国新能源乘用车的年销售量的预测值;(3)你认为(2)中用哪个模型得到的预测值更可靠?请说明理由参考数据:设,其中144841380528参考公式:对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为,答案与解析一、单选题1【答案】B【解析】对于A,的观测值时,有的把握认为吸烟与患肺病有关系,不是指“在100个吸烟的人中必
11、有99人患有肺病”,故A错误;对于B,根据独立性原理知,从统计量中求出有的把握认为吸烟与患肺病有关系,是指有的可能性使得判断出现错误,B正确;对于C,从独立性检验可知有的把握认为吸烟与患肺病有关系时,不能说某人吸烟,那么他有的可能性患有肺病,C错误,故选B2【答案】B【解析】由题中的散点图可以看出,图1和图3是正相关,相关系数大于0,则,图2和图4是负相关,相关系数小于0,则,图3和图4的点相对于图1和图2更加集中,所以相关性较强,所以更接近于1,更接近于,由此可得,故选B3【答案】A【解析】由表格数据知:,所求经验回归方程为,故选A4【答案】B【解析】对于A,散点显然不符合一次函数的大致图象
12、,A错误;对于B,散点的增长幅度符合二次函数的图象特征,B正确;对于C,以和月份为例,无法有一个固定的常数,使得对应的值与散点对应的值相符,即散点图不符合指数函数模型,C错误;对于D,散点的增长幅度不符合对数函数的大致图象,D错误,故选B5【答案】C【解析】因为且,所以或7或8或9,根据公式,得,即,当时,;当时,;当时,;当时,即当或9时满足题意,故选C6【答案】B【解析】对于,根据回归系数的含义,可得回归直线方程中,当解释变量x增加1个单位时,预报变量平均减少个单位,故正确;对于,回归直线就是散点图中经过样本数据点最多的那条直线,不正确回归直线也可能不过任何一个点;故不正确;对于,当相关性
13、系数时,两个变量正相关,故正确;对于,如果两个变量的相关性越强,则相关性系数的绝对值就越接近于,故不正确;对于,残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越低,故不正确;对于,甲、乙两个模型的分别约为和,则模型甲的拟合效果更好,故不正确,则正确的个数为2,故选B7【答案】C【解析】由题意,将两边同时取对数,得,设,则12341345,由,得,解得,所以,所以当时,故选C二、多选题8【答案】ABC【解析】对于A:因为函数关系是确定关系,所以A正确;对于B:因为相关关系是非确定性关系,所以B正确;对于C:两个变量转换成数据后,一个对应点的横坐标,一个对应点的纵坐标,所以C正确;对
14、于D:散点图只能大致反映变量间的关系,所以D错误,故选ABC9【答案】ABC【解析】根据与的线性回归方程为,其中,说明与具有正的线性相关关系,A正确;回归直线过样本点的中心,由,B正确;由回归方程知,若该大学某女生身高增加,则其体重约增加,故C正确;若该大学某女生身高为,则可预测其体重约为,不可断定其体重必为,D错误,故选ABC10【答案】AB【解析】由独立性检验得A说法是正确的;B中模型两边取对数得,由线性方程得,知c,k的值分别是,故B说法正确;根据简单随机抽样,每个个体被抽到的概率相同,故C错误;回归直线及回归系数是预测变量的取值和变化趋势,并不是精确反映,故D错误,故选AB11【答案】
15、BD【解析】因为不知道被调查的学生中,男生与女生的人数,所以不能确定喜欢登山的男生人数比不喜欢登山的女生人数多,因此选项A不正确;由统计图中可以确定被调查的男生中喜欢登山的人数的百分比为,所以被调查的男生中喜欢登山的人数比不喜欢登山的人数多,因此选项B正确;因为不知道被调查的学生中,男生与女生的人数,所以不能由卡方公式进行计算判断,所以选项C不正确,选项D正确,故选BD12【答案】ABC【解析】当时,我们认为A与B不独立,该推断犯错误的概率不超过,只有D说法正确,故选ABC三、解答题13【答案】(1)有的把握认为;(2)分布列见解析,期望为【解析】(1)由题意可得,故有把握认为参加体育活动与性
16、别有关(2)以下居民共人,其中男性人,女性人,用分层抽样的方法从中抽人,则男性有人,女性有人,从这位男性和位女性中随机抽取3人,抽到的男性居民数可能有,故X的所有可能取值为,的分布列如下:14【答案】(1)人;方案二,理由见解析;(2),线性相关性很强;负相关,理由见解析【解析】(1)解:高一学生每天抽检人数为(人)方案二更合理,因为新冠病毒奥密克戎毒株传染性更强、潜伏期更短,分散抽检可以全面检测年级中每班学生的状况,更有利于防控筛查工作(2)解:,所以,变量和的相关系数为,因为,可知两变量线性相关性很强由可知变量和是负相关,可能的原因:随着抽检工作的开展,学校相关管理协调工作效率提高,因此用时缩短15【答案】(1);(2)对A县的人均河道整治投入大于对B县的人均河道整治投入;有的把握【解析】(1)由表可知,所以,所求回归方程为(2)由条件可知,对A县的河道整治总投入(亿元),这6年对A县人均河道整治投入为(亿元/万人)对B县2020年的河道整治投入为(亿元),对B县的河道整治总投入为(亿元),这6年对B县人均河道整治投入为(亿元/万人)所以,对A县的人均河道整治投入大于对B县的人均河道整治投入由列联表知,所以,有的把握认为河道整治达标与当地市民的河道整治投入有关16【答案】(1);(2)当回归方程为时,2022年我国新能源乘用车的年销售量的预测值是万辆;当回归方程为时,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 妇科常用中成药的合理使用
- DB36∕T 1485-2025“赣出精 品”品牌建设通 用要求
- 银联企业服务(上海)有限公司2026年度招聘备考题库及1套参考答案详解
- 中国气象局在京单位2026年度招聘岗位备考题库附答案详解
- 2025年农村水利基础设施建设项目可行性研究报告
- 城乡规划合同范本
- 拆房建房合同范本
- 搬厂运输合同范本
- 拆装玻璃合同范本
- 培训课程协议合同
- 2025年大学康复治疗学(运动疗法学)试题及答案
- 胎膜早破的诊断与处理指南
- 被压迫者的教育学
- 2025年科研伦理与学术规范期末考试试题及参考答案
- 2025年纪检监察知识试题库(含答案)
- CJT 288-2017 预制双层不锈钢烟道及烟囱
- 2024年西安市政道桥建设集团有限公司招聘笔试参考题库含答案解析
- 《普通心理学课程论文3600字(论文)》
- GB/T 5209-1985色漆和清漆耐水性的测定浸水法
- GB/T 14388-2010木工硬质合金圆锯片
- 大三上学期-免疫学第11章
评论
0/150
提交评论