02024年高二数学专项练习2回归分析的基本思想及其初步应用_第1页
02024年高二数学专项练习2回归分析的基本思想及其初步应用_第2页
02024年高二数学专项练习2回归分析的基本思想及其初步应用_第3页
02024年高二数学专项练习2回归分析的基本思想及其初步应用_第4页
02024年高二数学专项练习2回归分析的基本思想及其初步应用_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024年高二数学专项练习回归分析的基本思想及其初步应用知识讲解研究两个变量的相关关系:回归分析的基本步骤:画散点图求回归方程预报、决策对于一组具有线性相关关系的数据回归方程为其中的最小二乘法估计公式分别为: 典型例题例1从某大学中随机选取8名女大学生,其身高和体重的数据如下:编号12345678身高(cm)165165157170175165155170体重(kg)4857505464614359求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.例2某市居民1996~2003年货币收入x(单位:亿元)与购买商品支出y(单位:亿元)的统计资料如下:年份19961997199819992000200120022003收入3637384042444750支出30.031.032.033.234.836.539.041.6试对x与y的关系进行相关性检验,如x与y具有线性相关关系,求出y对x的回归直线方程(结果保留3位小数)例3.一只红铃虫的产卵数和温度有关,先收集7组观察数据如下,建立与之间的回归方程温度x(℃)21232527293235产卵数y(个)711212466115325用样本估计总体知识引入一、回顾用样本来估计总体,是研究统计问题的一个基本思想方法某市100个家庭某年月均用水量(单位:t)3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2知识讲解二、总体分布的估计总体取值的概率分布规律通常称为总体分布.样本的频率分布的常见表示:1.频率分布表2.频率分布直方图3.茎叶图1.频率分布表:某校高一年级100名同学的身高频率分布表分组频数频数累计频率[150.5,153.5)440.04[153.5,156.5)8120.08[156.5,159.5)8200.08[159.5,162.5)11310.11[162.5,165.5)22530.22[165.5,168.5)19720.19[168.5,171.5)14860.14[171.5,174.5)7930.07[174.5,177.5)4970.04[177.5,180.5]31000.03合计10012.频率分布直方图:横轴为个体取值,纵轴为频率/组距.用矩形框的面积表示相应的频率.面积之和为1画频率分布直方图的基本步骤(1)计算极差(2)确定组距与组数(3)将数据分组(4)列出频率分布表(5)画出频率分布直方图某市100个家庭某年月均用水量(单位:t)3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2(1)计算极差(2)确定组距与组数(3)将数据分组(4)列出频率分布表(5)画出频率分布直方图频率分布折线图总体密度曲线典型例题例1对某批电子元件进行寿命调查,情况如下:寿命(h)100~200200~300300~400400~500500~600个数2030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100h~400h以内的概率;(4)估计电子元件寿命在400h以上的概率.解析:3.茎叶图:某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454,品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430,A

B9735

8736353714838356923912445775040011367542410256733142240043055344

4145

优点:1.体现数据分布状况2.保留原始数据3.数据可随时补充和修改三、总体数字特征的估计样本的数字特征:平均数:,刻画样本数据的平均水平样本方差:,样本标准差:,刻画样本数据的离散水平常用的表示平均水平的数值还有:中位数、众数表示数据集中程度(波动状况)的数值还有:极差典型例题例2甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从中抽测10个,它们的尺寸分别如下(单位:mm)甲机床:10.210.110.09.89.910.39.710.09.910.1乙机床:10.310.49.69.910.110.98.99.710.210.0分别计算上面两个样本的平均数和方差.如图纸规定零件的尺寸为10mm,从计算的结果来看哪台机床加工这种零件较合适?解析:例3随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差.解析:变量的相关性知识讲解一、变量间的相关关系变量之间存在着两种关系:一类是确定的函数关系;一类是非确定的关系,有随机性正相关两个变量的总体变化趋势一致相关关系知识和能力相关关系收入水平与其科技文化素质风险与利润负相关两个变量的总体变化趋势相反儿童的铅指标与智商家庭用于消费的资金与储蓄的资金数量散点图直观描述两个变量之间是否具有相关关系的图形某地10户家庭的年收入与年饮食支出表(单位:万元)收入24466677810支出0.91.41.62.02.11.91.82.12.22.3二、两个变量的线性相关相关关系线性相关散点图中的点大致分布在一条直线附近相关关系非线性相关人的脂肪含量与年龄之间的关系1.回归直线“最贴近”这些已知的数据点的直线记直线为,其中表示计算值(估计值).当时得到观测值(实际值)为.方程称为y对x的回归直线方程,b叫做回归系数.2.回归直线的求解如何用数学语言来刻画“与这些个点最贴近”?上式中最后两项与a,b无关,当且仅当前两项均为0时取最小值,即其中a,b上方加“”表示时由观测值按最小二乘法求得的估计值3.回归直线模型的应用(1)预测,内插预测和外推预测(2)控制,典型例题例1.对变量x,y有观测数据()(i=1,2,…,10),得散点图1;对变量u,v有观测数据()(i=1,2,…,10),得散点图2.由这两个散点图可以判断图1图2A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关答案:例2.给出了随机抽取的10位男性的收缩血压.年龄x(岁)收缩压y(毫米汞柱)年龄x(岁)收缩压y(毫米汞柱)3711050146351

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论