版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三讲成对数据的统计分析2025年高考一轮总复习第八章
统计与统计分析1.回归分析
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系叫做相关关系.与函数关系不同,相关关系是一种非确定性关系.
(2)散点图可以直观地判断两变量的关系是否可以用线性关系表示.若这些散点有y随x增大而增大的趋势,则称两个变量正相关;若这些散点有y随x增大而减小的趋势,则称两个变量负相关.(4)样本相关系数:
它主要用于对成对样本数据的相关程度进行定量分析,以衡量它们之间的线性相关程度.当r>0时表示两个变量正相关,当r<0时表示两个变量负相关.|r|越接近1,表明两个变量的线性相关性越强;当|r|接近0时,表明两个变量间几乎不存在相关关系,相关性越弱.
(5)残差 ①残差:对于响应变量Y,通过观测得到的数据称为观测值,差.越接近1,表示回归的效果越好.XY合计y1y2x1aba+bx2cdc+d合计a+cb+da+b+c+d2.独立性检验(1)2×2列联表设X,Y为两个分类变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:(2)独立性检验+d为样本容量)来判断“两个分类变量是否独立”的方法称为独立性检验.(3)独立性检验的一般步骤①提出零假设H0:X和Y相互独立,并给出在问题中的解释;②根据样本数据列出2×2列联表;③计算随机变量χ2的值,查表确定临界值xα;④当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.【名师点睛】
(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性分布时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.散点图大致呈曲线分布时,应选取合适的回归模型,再通过换元转化为线性回归. (2)独立性检验是对两个变量的关系的可信程度的判断.根据χ2的值可以判断两个分类变量有关的可信程度,并用来指导科研和实际生活.
考点一相关关系的判断1.对4组样本数据进行统计,获得如图8-3-1所示的散点图,关于其相关系数的比较,正确的是(
样本相关系数为r1
(1)
)样本相关系数为r2
(2)
样本相关系数为r3
(3)A.r2<r4<0<r3<r1C.r4<r2<0<r3<r1
样本相关系数为r4
(4)图8-3-1 B.r4<r2<0<r1<r3
D.r2<r4<0<r1<r3
解析:由散点图知图(1)与图(3)是正相关,故r1>0,r3>0,图(2)与图(4)是负相关,故r2<0,r4<0,且图(1)与图(2)的样本点集中在一条直线附近,因此r2<r4<0<r3<r1.故选A.答案:A
2.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图8-3-2所示的人体脂肪含量与年龄)关系的散点图.根据该图,下列结论中正确的是(
图8-3-2A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%解析:观察题图,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%.故选B.答案:B【题后反思】判定两个变量正、负相关的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,两个变量正相关;r<0时,两个变量负相关.量负相关.售价x/元99.51010.511销售量y/件1110865考点二线性回归分析
[例1](1)(多选题)2024年3月15日,某市物价部门对5家商场的某种商品一天的销售量及其价格进行调查,5家商场的售价x(单位:元)和销售量y(单位:件)之间的一组数据如表所示:数|r|=0.986,则下列说法正确的有()A.变量x,y线性负相关且相关性较强B.a=40C.当x=8.5时,y的估计值为12.8D.相应于点(10.5,6)的残差约为0.4^答案:ABCx2025303540y167160150143130
(2)某研究机构为调查人的最大可视距离y(单位:米)和年龄x(单位:岁)之间的关系,对不同年龄的志愿者进行了研究,收集数据得到下表:
②根据①中求出的线性回归方程,估计年龄为50岁的人的最大可视距离.解:①由题意可得,【题后反思】回归分析问题的类型及解题方法(1)求经验回归方程①根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关.
(2)利用经验回归方程进行预测时,可把经验回归方程看作一次函数求函数值.线性经验回归方程的图象一定过点(x,y). (3)利用经验回归方程判断正、负相关时,决定是正相关还是负相关的是系数b.(4)判断经验回归方程的拟合效果,可以利用样本相关系数判断,|r|越趋近于1,两变量的线性相关性越强.^年份x20192020202120222023储蓄存款y/千亿元567810时间代号t12345z01235【变式训练】随着经济的发展,某地居民收入逐年增长.该地某银行连续五年的储蓄存款(年底余额)如下表:为了研究计算的方便,工作人员将上表的数据进行了处理,令t=x-2018,z=y-5,得到下表:
(1)求z关于t的线性回归方程; (2)通过(1)中的方程,求出y关于x的回归方程; (3)用所求回归方程预测到2025年的年底,该银行储蓄存款额可达多少?考点三独立性检验
[例2](2023年全国甲卷文科)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.218.820.221.322.523.225.826.527.530.132.634.334.835.635.635.836.237.340.543.2试验组的小白鼠体重的增加量从小到大排序为7.89.211.412.413.215.516.518.018.819.219.8
20.221.622.823.623.925.128.232.336.5组别小于m不小于m对照组试验组(1)计算试验组的样本平均数;
(2)①求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表;P(χ2≥k)0.1000.0500.010k2.7063.8416.635
②根据①中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?
n(ad-bc)2附:χ2= (a+b)(c+d)(a+c)(b+d),解:(1)根据题意,试验组的样本平均数为18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)=19.8.组别小于m不小于m对照组614试验组146
(2)①由题意知,这40只小白鼠体重增加量的中位数是将两组数据合在一起,从小到大排列后第20位与第21位数据的平均数.因为第20位数据为23.2,第21位数据为23.6,填写列联表如下:
②零假设为H0:小鼠体重的增加量与是否饲养在高浓度臭氧环境中无关.根据列联表中数据,计算得到χ2=40×(6×6-14×14)2
=6.4>3.841. 20×20×20×20
根据小概率值α=0.050的独立性检验,我们推断H0
不成立.
所以有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.计算χ2
的值.【题后反思】独立性检验的一般步骤(1)根据样本数据制成2×2列联表,提出零假设H0.(2)根据公式χ2=
n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(3)比较χ2
与临界值的大小关系,然后得出结论.创业意向男生人数女生人数有自主创业打算16m无自主创业打算64n【变式训练】(2023年威海市期末)某大学在一次调查学生是否有自主创业打算的活动中,获得了如下数据:(1)若m=24,n=36,根据调查数据判断,是否有99%的把握认为该校学生有无自主创业打算与性别有关?P(χ2≥k)0.100.050.010.0050.001k2.7063.8416.6357.87910.828
(2)若m=15,n=60,从这些学生中随机抽取一人. ①若已知抽到的人有自主创业打算,求该学生是男生的概率;
②判断“抽到的人无自主创业打算”与“抽到的人是男生”是否独立.
n(ad-bc)2附:χ2= (a+b)(c+d)(a+c)(b+d).
解:(1)零假设为H0:该校学生有无自主创业打算与性别无关.根据列联表中的数据,经计算得到χ2=
140×(16×36-24×64)2
=6.72>6.635.(16+24)×(64+36)×(16+64)×(24+36)
根据小概率值α=0.01的χ2
独立性检验,我们推断H0
不成立.所以有99%的把握认为该校学生有无自主创业打算与性别有关.
(2)记A为“抽到的人有自主创业打算”,B为“抽到的人是男生”.所以“抽到的人无自主创业打算”与“抽到的人是男生”独立.月份x123456净利润y/万元510265096195⊙非线性回归的应用问题[例3](2023年宁波市期末)某企业对2023年上半年的月利润情况进行调查统计,得到数据如下:根据以上数据,绘制了如图8-3-3所示的散点图.图8-3-3
(1)根据散点图判断,y=c·edx与y=a+bx(a,b,c,d均为大于零的常数)哪一个更适宜作为描述y与x关系的回归方程?(给出判断即可,不必说明理由)(2)根据(1)的判断结果求出y关于x的回归方程.
(3)已知该企业的产品合格率为90%,现随机抽取9件产品进行检测,则这9件产品中合格的件数最有可能是多少?参考数据:
其中ω=lny.解:(1)由散点图可知,y与x之间是非线性相关关系,所以y=c·edx
更适宜作为描述y与x关系的回归方程类型.
(3)设抽到的产品中有X件合格品,则X~B(9,0.9).所以当k=8或k=9时P(X=k)最大.
所以这9件产品中合格的件数最有可能是8件或9件.
【反思感悟】有些非线
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年邵阳职业技术学院单招职业适应性考试备考题库及答案解析
- 2026年南京铁道职业技术学院单招职业适应性测试模拟试题及答案解析
- 2026年广西水利电力职业技术学院单招职业适应性测试模拟试题及答案解析
- 2026年广州体育职业技术学院单招职业适应性考试参考题库及答案解析
- 2026年沈阳北软信息职业技术学院单招职业适应性考试备考试题及答案解析
- 期末学习总结的范文
- 2026年江苏卫生健康职业学院单招职业适应性考试参考题库及答案解析
- 期末工作总结(集合13篇)
- 2026年河北交通职业技术学院单招职业适应性考试备考试题及答案解析
- 期末数学教研组工作总结
- 2025年秋人教版(新教材)初中数学七年级上册期末综合测试卷及答案
- 施工升降机操作培训试题及答案
- 企业档案基础知识课件
- 医院购买物业 保洁服务项目方案投标文件(技术方案)
- 设备技术员年终工作总结
- 智慧树知道网课《生物统计学(海南大学)》课后章节测试答案
- 沥青拌合站模块化设计与建设技术路线
- 出血性中风课件
- 2025年山东省政府采购评审专家考试题库附含答案
- 腹壁整形课件
- 冻土地区桩基工程应用-洞察及研究
评论
0/150
提交评论