大题考法精研(一)-统计与成对数据的统计分析_第1页
大题考法精研(一)-统计与成对数据的统计分析_第2页
大题考法精研(一)-统计与成对数据的统计分析_第3页
大题考法精研(一)-统计与成对数据的统计分析_第4页
大题考法精研(一)-统计与成对数据的统计分析_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大题考法精研(一)——统计与成对数据的统计分析12目录3题型一用样本估计总体题型二线性回归分析

题型三非线性回归分析4题型四独立性检验[例1]

(2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:题型一用样本估计总体试验序号i12345678910伸缩率xi545533551522575544541568596548伸缩率yi536527543530560533522550576536(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高[解]

(1)由题意,求出zi的值如表所示,试验序号i12345678910zi968-8151119182012[思维建模]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[针对训练]1.(2023·泉州模拟)随着老年人消费需求从“生存型”向“发展型”转变.消费层次不断提升,“银发经济”成为社会热门话题之一,被各企业持续关注.某企业为了解该地老年人消费能力情况,对该地年龄在[60,80)的老年人的年收入按老年人的年收入按年龄[60,70),[70,80)分成两组进行分层随机抽样调查,已知抽取了年龄在[60,70)的老年人500人.年龄在[70,80)的老年人300人.现作出年龄在[60,70)的老年人年收入的频率分布直方图(如图所示).(1)根据频率分布直方图,估计该地年龄在[60,70)的老年人年收入的平均数及第95百分位数;(2)已知年龄在[60,70)的老年人年收入的方差为3,年龄在[70,80)的老年人年收入的平均数和方差分别为3.75和1.4,试估计年龄在[60,80)的老年人年收入的方差.解:(1)频率分布直方图中,该地年龄在[60,70)的老年人年收入的平均数约为0.04×2+0.08×3+0.18×4+0.26×5+0.20×6+0.15×7+0.05×8+0.04×9=5.35.由频率分布直方图,年收入在8.5万元以下的老年人所占比例为1-0.04×1=0.96,年收入在7.5万元以下的老年人所占比例为1-(0.05×1+0.04×1)=0.91,因此,第[例2]某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:

题型二线性回归分析样本号i12345678910平均值根部横截面积xi0.040.060.040.080.080.05abc0.070.06材积量yi0.250.410.220.540.530.340.350.390.430.440.39(1)求b的值;(2)若选取前6个样本号对应数据,判断这种树木的根部横截面积与材积量是否具有很强的线性相关性,并求该林区这种树木的根部横截面积与材积量的经验回归方程(若0.25≤|r|≤0.75,则认为两个变量的线性相关性一般;若|r|>0.75,则认为两个变量的线性相关性很强);(3)根据经验回归方程估计a,c的值(精确到0.01).[解]

(1)由a,b,c为等差数列,得2b=a+c,由表格得该树木根部横截面积的平均值为0.06,可得a+b+c=0.06×10-(0.04+0.06+0.04+0.08+0.08+0.05+0.07)=0.18,故3b=0.18,解得b=0.06.(3)由表格数据可得,根部横截面积为a,c时对应的材积量分别为0.35,0.43,代入经验回归方程分别得0.35=6.75a-0.0095,0.43=6.75c-0.0095,解得a≈0.05,c≈0.07.[思维建模]求经验回归方程的解题模型第一步:确认数据是否全部知道,如果全部已知可以直接利用公式求解,如果数据未全部已知,要特别注意题目所给的参考公式和数据,[针对训练]2.据统计,某城市居民年收入(所有居民在一年内收入的总和,单位:亿元)与某类商品销售额(单位:亿元)的10年数据如下表所示:第n年12345678910居民年收入x32.231.132.935.737.138.039.043.044.646.0商品销售额y25.030.034.037.039.041.042.044.048.051.0依据表格数据,得到下面一些统计量的值.(1)根据表中数据,得到样本相关系数r≈0.95.以此推断,y与x的线性相关程度是否很强?(2)根据统计量的值与样本相关系数r≈0.95,建立y关于x的经验回归方程(系数精确到0.01);

解:(1)根据样本相关系数r≈0.95,可以推断线性相关程度很强.(3)第一个样本点(32.2,25.0)的残差为25.0-(1.44×32.2-15.56)=-5.808≈-5.81,[例3]

(2023·河北统考模拟预测)为了研究某种细菌随天数x变化的繁殖个数y,设z=lny,收集数据如下:

题型三非线性回归分析天数x123456繁殖个数y612254995190表(Ⅰ)表(Ⅱ)(2)根据(1)中的判断结果和表(Ⅱ)中的数据,建立y关于x的经验回归方程(结果保留2位小数).[解]

(1)由题意作出散点图如图所示.

由散点图可知,样本点是沿指数型曲线分布,不是分布在某直线附近,[思维建模]有些非线性回归分析问题用适当的变量进行变换,把问题转化为线性回归分析问题,使之得到解决.其一般步骤:[针对训练](1)根据以上数据,从样本相关系数的角度,判断y=ax2+b与y=ecx+d哪个适宜作为年销售额y关于种植面积x的回归方程类型(样本相关系数精确到0.01);(2)根据(1)的判断结果及相关数据,建立y关于x的回归方程(系数精确到0.01);(3)该乡镇计划年销售额不低于10亿元,请预测种植面积至少为多少亩.解:(1)若用y=ax2+b作为年销售额y关于种植面积x的回归方程类型,则设v=x2,则y=av+b.设v与y的样本相关系数为r1,若用y=ecx+d作为年销售额y关于种植面积x的回归方程类型,则lny=cx+d.设w=lny,则w=cx+d.设x与w的样本相关系数为r2,因为r1>r2,所以y=ax2+b适宜作为年销售额y关于种植面积x的回归方程类型.(3)由题意可知1.84x2+8.41≥100.整理,得x2≥49.78,解得x≥7.06或x≤-7.06(舍去),故种植面积至少为706亩.[例4]近期,孩子刷短视频上瘾成了家长们头疼的新问题.某市多所中学针对此问题展开的一项调查发现,近九成学生有使用短视频平台的习惯,近一半家长表示孩子或多或少存在沉迷短视频的现象,超半数家长认为短视频成瘾对青少年成长存在严重影响.某校为调查学生成绩下降与“短视频成瘾”之间是否有关随机调查了200名学生的开学考试成绩,其中“短视频成瘾”的学生中成绩未下降的有35名学生(将总排名下降5%视为成绩下降,将刷短视频一天超过两小时规定为“短视频成瘾”).

题型四独立性检验(1)若样本中“短视频成瘾”且成绩未下降的女生有15名,并在被认为“短视频成瘾”且成绩未下降的对象中按性别采用分层随机抽样抽取7人,再从中随机抽取2人,求抽到的两人均为女生的概率;(2)填写下面的2×2列联表,试根据小概率值α=0.001的独立性检验,能否认为成绩下降与“短视频成瘾”有关?项目“短视频成瘾”没有“短视频成瘾”合计学习成绩下降

100学习成绩未下降

合计96

α0.150.100.050.0250.0100.001xα2.0722.7063.8415.0246.63510.828(2)零假设为H0:成绩下降与“短视频成瘾”无关.“短视频成瘾”的学生中成绩未下降的有35名学生,根据统计数据得到2×2列联表:项目“短视频成瘾”没有“短视频成瘾”合计学习成绩下降6139100学习成绩未下降3565100合计96104200根据小概率值α=0.001的χ2独立性检验,推断H0不成立,因此可以认为成绩下降与“短视频成瘾”有关.[思维建模]独立性检验问题的解题模型(1)根据样本数据制成2×2列联表.(3)比较χ2与临界值的大小关系,再利用小概率值α以及对应的临界值来判断有多大的把握认为两个事件有关.[针对训练]4.(2023·石家庄模拟)某兴趣小组为研究一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,设A=“患有地方性疾病”,B=“卫生习惯良好”.据临床统计显示,(1)求P(A)和P(A|B);(2)为进一步验证(1)中的判断,该兴趣小组用分层随机抽样的方法在该地抽取了一个容量为m(m∈N*)的样本,利用独立性检验,计算得χ2=2.640.为提高检验结论的可靠性,现将样本容量调整为原来的k

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论