高中数学 复习课(一) 统计案例教学案 新人教a版选修1-2_第1页
高中数学 复习课(一) 统计案例教学案 新人教a版选修1-2_第2页
高中数学 复习课(一) 统计案例教学案 新人教a版选修1-2_第3页
高中数学 复习课(一) 统计案例教学案 新人教a版选修1-2_第4页
高中数学 复习课(一) 统计案例教学案 新人教a版选修1-2_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

复习课(一)统计案例回归分析(1)变量间的相关关系是高考解答题命题的一个,主要考查变量间相关关系的判断,求解回归方程并进行预报估计,题型多为解答题,有时也有小题出现(2)掌握回归分析的步骤的是解答此类问题的关键,另外要掌握将两种非线性回归模型转化为线性回归分析求解问题 1一个重要方程对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其线性回归直线方程为x其中,2重要参数相关指数R2是用来刻画回归模型的回归效果的,其值越大,残差平方和越小,模型的拟合效果越好3两种重要图形(1)散点图:散点图是进行线性回归分析的主要手段,其作用如下:一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,则可以断定两个变量有较好的线性相关关系;二是判断样本中是否存在异常(2)残差图:残差图可以用来判断模型的拟合效果,其作用如下:一是判断模型的精度,残差点所分布的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高二是确认样本点在采集中是否有人为的错误典例(全国卷)如图是我国2008年到2014年生活垃圾无害化处理量(单位:亿吨)的折线图(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到001),预测2016年我国生活垃圾无害化处理量附注:参考数据:i932,iyi4017, 055,2646参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式分别为:,解(1)由折线图中数据和附注中参考数据得4,(ti)228, 055,(ti)(yi)iyii40174932289,r099因为y与t的相关系数近似为099,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系(2)由1331及(1)得0103,133101034092所以y关于t的回归方程为092010t将2016年对应的t9代入回归方程得0920109182所以预测2016年我国生活垃圾无害化处理量将约为182亿吨类题通法回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤是先画出散点图,并对样本点进行相关性检验,在此基础上选择适合的函数模型去拟合样本数据,从而建立较好的回归方程,并且用该方程对变量值进行分析;有时回归模型可能会有多种选择(如非线性回归模型),此时可通过残差分析或利用相关指数R2来检查模型的拟合效果,从而得到最佳模型1变量X与Y相对应的一组数据为(10,1),(113,2),(118,3),(125,4),(13,5);变量U与V相对应的一组数据为(10,5),(113,4),(118,3),(125,2),(13,1)r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()Ar2r10B0r2r1Cr200,U与V是负相关,相关系数r26635,说明该假设不合理的程度约为99%,即“两个分类变量有关系” 这一结论成立的可信程度约为99%在实际问题中常用的几个数值(1)K26635表示认为“X与Y有关系”犯错误的概率不超过001(2)K23841表示认为“X与Y有关系”犯错误的概率不超过005(3)K22706表示认为“X与Y有关系”犯错误的概率不超过01典例某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食为肉类为主)(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯(2)根据以上数据完成如表所示的22列联表主食蔬菜主食肉类总计50岁以下50岁以上总计(3)在犯错误的概率不超过001的前提下,是否能认为“其亲属的饮食习惯与年龄有关”?解(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉类为主(2)22列联表如表所示:主食蔬菜主食肉类总计50岁以下481250岁以上16218总计201030(3)随机变量K2的观测值k106635,故在犯错误的概率不超过001的前提下认为“其亲属的饮食习惯与年龄有关”类题通法独立性检验问题的求解策略(1)等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地判断两个变量的相关性(2)K2统计量法:通过公式K2先计算观测值k,再与临界值表作比较,最后得出结论1下表是某地区的一种传染病与饮用水的调查表:得病不得病总计干净水52466518不干净水94218312总计146684830(1)能否在犯错误概率不超过001的前提下认为这种传染病与饮用水的卫生程度有关,请说明理由(2)若饮用干净水得病的有5人,不得病的有50人,饮用不干净水得病的有9人,不得病的有22人按此样本数据分析能否在犯错误概率不超过0025的前提下认为这种疾病与饮用水有关解:(1)把表中的数据代入公式得K2的观测值k542154216635,所以在犯错误的概率不超过001的前提下,认为该地区这种传染病与饮用水不干净有关(2)依题意得22列联表:得病不得病总计干净水55055不干净水92231总计147286此时,K2的观测值k5785因为57855024,所以能在犯错误概率不超过0025的前提下认为该种疾病与饮用水不干净有关22016年第三十一届奥运会在巴西首都里约热内卢举行,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了60人,结果如下:是否愿意提供志愿者服务性别愿意不愿意男生2010女生1020(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人, 其中男生抽取多少人?(2)在(1)中抽取的6人中任选2人, 求恰有一名女生的概率(3)你能否在犯错误的概率不超过001的前提下认为该校高中生是否愿意提供志愿者服务与性别有关?下面的临界值表供参考:P(K2k0)0150100050025001000050001k020722706384150246635787910828独立性检验统计量K2,其中nabcd解:(1)由题意,男生抽取64(人),女生抽取62(人)(2)在(1)中抽取的6人中任选2人,恰有一名女生的概率P(3)K26667,由于66676635,所以能在犯错误的概率不超过001的前提下认为该校高中生是否愿意提供志愿者服务与性别有关1在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施()优、良、中差总计实验班48250对比班381250总计8614100A有关B无关C关系不明确 D以上都不正确解析:选A随机变量K2的观测值k83066635,则有99%的把握认为“实验效果与教学措施有关”2下列说法中正确的有:()若r0,则x增大时,y也相应增大;若r0,表示两个相关变量正相关,x增大时,y也相应增大,故正确rb,a Bb,aCa Db,a解析:选C过(1,0)和(2,2)的直线方程为y2x2,画出六点的散点图,回归直线的大概位置如图所示,显然a 故选C6收集一只棉铃虫的产卵数y与温度x的几组数据后发现两个变量有相关关系,并按不同的曲线来拟合y与x之间的回归方程,并算出了对应相关指数R2如下表:拟合曲线直线指数曲线抛物线二次曲线y与x回归方程198x4637e027x3840367x2202相关指数R20746099609020002则这组数据模型的回归方程的最好选择应是()A198x4637 Be027x384C0367x2202 D解析:选B用相关指数R2来刻画回归效果,R2的值越大,说明模型的拟合效果越好7某学校对课程人与自然的选修情况进行了统计,得到如下数据:选未选总计男40545450女230220450总计635265900那么,认为选修人与自然与性别有关的把握是_解析:K216379410828,即有999%的把握认为选修人与自然与性别有关答案:999%8某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验根据收集到的数据(如下表),由最小二乘法求得回归方程067x549零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据模糊看不清,请你推断出该数据的值为_解析:由表知30,设模糊不清的数据为m,则(62m758189),因为067549,即06730549,解得m68答案:689变量U与V相对应的一组样本数据为(1,14),(2,22),(3,3),(4,38),由上述样本数据得到U与V的线性回归分析,R2表示解释变量对于预报变量变化的贡献率,则R2_解析:在线性回归中,相关指数R2等于相关系数,由x11,x22,x33,x44得:25,y114,y222,y33,y438得:26,所以相关系数r1故R21答案:110高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”下表是一次针对高三文科学生的调查所得的数据,试问:文科学生总成绩不好与数学成绩不好有关系吗?总成绩情况数学成绩情况总成绩好总成绩不好总计数学成绩好47812490数学成绩不好39924423总计87736913解:根据题意,计算随机变量的观测值:K262335024,因此有975%的把握认为“文科学生总成绩不好与数学成绩不好有关系”11某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如表所示:积极参加班级工作不太主动参加班级工作总计学习积极性高18学习积极性一般19总计50(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是,请完成上面的22列联表(2)在(1)的条件下,试运用独立性检验的思想方法分析:在犯错误概率不超过01%的情况下判断学生的学习积极性与对待班级工作的态度是否有关?并说明理由P(K2k0)001000050001k06635787910828解:(1)如果随机抽查这个班的一名学生,抽到积极参加班级工作的学生的概率是,所以积极参加班级工作的学生有24人,由此可以算出学习积极性一般且积极参加班级工作的人数为6,不太主动参加班级工作的人数为26,学习积极性高但不太主动参加班级工作的人数为7,学习积极性高的人数为25,学习积极性一般的人数为25,得到:积极参加班级工作不太主动参加班级工作总计学习积极性高18725学习积极性一般61925总计242650(2)K211538,因为1153810828,所以在犯错误的概率不超过0001的前提下可以认为学习积极性与对待班级工作的态度有关系12电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性(1)根据已知条件完成下面的22列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷总计男女1055总计(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率附:K2P(K2k0)005001k038416635解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而22列联表如下:非体育迷体育迷总计男301545女451055总计7525100将22列联表中的数据代入公式计算,得K23030因为30303841,所以没有理由认为“体育迷”与性别有关(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件空间为(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论