版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
章末复习课
要点回顾形成体系
K网络构建1
成回归
对分析
数残差图
据
的残无平方和
统决定系数不
泞
分
析
K核心归纳』
一、两个基本思想
1.回归分析的基本思想
回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以
通过变量代换转化为线性回归分析,因此,回归分析的思想主要是指线性回归分
析的思想.
注意理解以下几点:
(1)确定线性相关关系
线性相关关系有两层含义:一是具有相关关系,如广告费用与销售量的关系等在
一定条件下具有相关关系,而气球的体积与半径的关系是函数关系,而不是相关
关系;二是具有线性相关关系.
判断是否线性相关的依据是观察样本点的散点图.
⑵引起预报误差的因素
对于线性回归模型引起响应变量£的误差的因素有两个:一个是解
释变量-另一个是随机误差e.
(3)回归方程的预报精度
判断回归方程的预报精度是通过计算残差平方和来进行的,残差平方和越小,方
程的预报精度越高.
简单来说,线性回归分析就是通过建立回归直线方程对变量进行预报,用回归方
程预报时,需对函数值明确理解,它表示当X取值时,真实值在函数值附近或平
均值在函数值附近,不能认为就是真实值.
(4)回归模型的拟合效果
判断回归模型的拟合效果的过程也叫残差分析,残差分析的方法有两种,一是通
过残差图直观判断,二是通过计算决定系数R2的大小判断.
2.独立性检验的基本思想
独立性检验的基本思想类似于反证法.要确认两个分类变量有关系的可信程度,
先假设两个分类变量没有关系,再计算随机变量/的值,最后由z2的值很大在
一定程度上说明两个分类变量有关系.
进行独立性检验要注意理解以下三个问题:
(1)独立性检验适用于两个分类变量.
(2)两个分类变量是否有关系的直观判断:
一是根据2X2列联表计算一历|,值越大关系越强;
二是观察等高堆积条形图,两个深色条的高度相差越大关系越强;
⑶独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有
关系的判断.独立性检验的结论只能是有多大的把握确认两个分类变量有关系,
而不能是两个分类变量一定有关系或没有关系.
二、两个重要参数
1.决定系数R2
决定系数R2是用来刻画回归模型的回归效果的,其值越大,残差平方和越小,
模型的拟合效果越好.
2.随机变量/
随机变量z2是用来判断两个分类变量在多大程度上相关的变量.独立性检睑即
计算Z2的值,并与教材中所给表格中的数值进行比较,从而得到两个分类变量
在多大程度上相关.
三、两种重要图形
1.散点图
散点图是进行线性回归分析的主要手段,其作用如下:
一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,则可以断定
两个变量有较好的线性相关关系;
二是判断样本中是否存在异常.
2.残差图
残差图可以用来判断模型的拟合效果,其作用如下:
一是判断模型的精度,残差点所分布的带状区域越窄,说明模型的拟合精度越高,
回归方程的预报精度越高.
二是确认样本点在采集中是否有人为的错误.
要点聚焦分类突破
要点一独立性检验
独立性检验研究的问题是有多大把握认为两个分类变量之间有关系.为此需先列
出2X2列联表,从表格中可以直观地得到两个分类变量是否有关系.另外等高
条形图能更直观地反映两个分类变量之间的情况,独立性检验的思想是:可以先
假设二者无关系,求随机变量/的值,若炉大于临界值,则拒绝假设,否则,
接受假设.
K例口考察小麦种子灭菌与否跟发生黑穗病的关系,经试验观察,得到数据
如下表:
种子灭菌种子未灭菌合计
黑穗病26184210
无黑穗病50200250
合计76384460
试分析种子灭菌与小麦发生黑穗病是否有关?
解零假设为”0:认为种子灭菌与否与小麦发生黑穗病无关系.
由列联表的数据可求得
460X(26X200-184X50)2
-^4.804.
76X384X210X250
而4.804>3.841=xo.o5,
根据小概率值。=0.05的炉独立性检验,我们推断从不成立,即认为种子是否
灭菌与小麦发生黑穗病有关系,此推断犯错误的限率不超过0.05.
K训练12在研究某种新措施对猪白痢的防治效果问题时,得到以下数据:
存活数死亡数合计
对照11436150
新措施13218150
合计24654300
试问新措施对防治猪白痢是否有效?
解零假设为M):新措施对防治猪白痢无效,
由列联表可求得
,300(114X18—132X36)2
L150X150X246X54^7.317>6,635=XO.OI,
根据小概率值。=0.01的/独立性检验,我们推断从不成立,即认为新措施对
防治猪白痢有效,此推断犯错误的概率不超过0.01.
要点二回归分析
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本步
骤为:通过散点图和经验选择回归方程的类型,然后通过一定的规则确定出相应
的回归方程,通过一定的方法进行检验,最后应用丁实际或对预报变量进行预测.
K例23某地搜集到的新房屋的销售价格),(单位:万元)和房屋面积M单位:
m?)的数据如下表:
房屋面积x/n?11511080135105
销售价格W万
24.821.618.429.222
元
(1)画出数据对应的散点图;
(2)求回归直线方程;
(3)根据(2)的结果,估计当房屋面积为150m2时的销售价格.
解(1)设x轴表示房屋的面积,y轴表示销售价格,数据对应的散点图如图.
)/万元
3()
25
20
15
,
°709()110130150x/m2
(2)由⑴知),与x具有线性相关关系,可设其回归方程为£=源+2依据题中的
数据,应用科学可算器,可得出
1=;^刘=109,
5~
苫(XLX)2=1570,
1
>=5部5=23.2,
5-
苫(XL%),-y)=308,
5--
E(X/—x)(y/-y)
Ai=1308
:.b=-----7---------------=丁而产0.1962,
5一、1570
L(X/-X)2
Z=1
a=y-hx^23.2-0.1962X109=1.8142.
故所求的回归直线方程为f=0.1962x+1.8142.
(3)由(2)知当x=15()时,销售价格的估计值为£=().1962X150+1.8142=31.244
2(万元).
故当房屋面积为150m之时,估计销售价格是31.2442万元.
K训练2X在一段时间内,分5次测得某种商品的价格x(万元)和需求量y⑴之
间的一组数据为
12345
价格方1.41.61.822.2
播求量y1210753
55c
已知苫砂=62,苫xr=16.6.
(1)画出散点图;
(2)求出),关于x的线性回归方程;
(3)如果价格定为1.9万元,预测需求量大约是多少?
解(1)散点图如下图所示:
v/l
16
12・・
B・
4
°123万元
样本点分布在一条直线附近,y与x具有线性相关关系.
(2)因为x=]x9=1.8,>=1义37=7.4,
55
N砂=62,XyXi=16.6,
5一一
丁砂一5-62-5X1.8X7.4
所以"含第一5:=I6.6—5XL82=_11$’
八一八一
〃=厂法=7.4+11.5X1.8=28.1,
故y关于x的线性回归方程为£=28.1—11.5乂
⑶£=28.1-11.5X1.9=6.25(t).
故价格定为1.9万元,预测需求量大约为6.25t.
要点三数形结合思想
数形结合思想就是在解决与几何图形有关的问题时,将图形信息转换成代数信息,
利用数量特征,将其转化为代数问题;在解决与数量有关的问题时,根据数量的
结构特征,构造出相应的几何图形,即化为几何问题,从而利用数形的辩证统一
和各自的优势尽快得到解决途径,这对提高分析和解决问题的能力有极大的帮
助.数形结合的主要途径:
(1)形转化为数,即用代数方法研究几何问题,这是解决几何问题的基本方法;
(2)数转化为形,即根据给出的“数”的结构特点,构造出与之相应的几何图形,
用几何方法解决代数问题;
⑶数形结合,即用形研究数,用数研究形,相互结合,使问题变得直观、简捷.
在进行回归分析时,常利用散点图、残差图等说明线性相关情况或模型的拟合效
果.
在独立性检验中,我们常用等高堆积条形图直观地反映数据的情况,从而可以粗
略地判断两个分类变量是否有关系.
K例33电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随
机抽取了100名观众进行调查.如图所示的是根据调查结果绘制的观众日均收看
该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于4()分钟
的观众称为“体育迷”.
(1)根据已知条件完成下面的2义2列联表,据此资料你是否认为“体育迷”与性
别有关?
非体育迷体育迷合计
男
女1055
合计
(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机
抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人
数为X.若每次抽取的结果是相互独立的,求X的分布列,期望£(X)和方差Q(X).
..,____________〃(ad-be)2_______________
附:丈=(〃+b)(c+d)(〃+c)(〃+d)
a0.050.01
Xa3.8416.635
解(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而
2X2列联表如下:
非体育迷体育迷合计
男301545
女451055
合计7525100
将2X2列联表中的数据代入公式计算,得:
,_________〃(ad-be)2_____________
(a+b)(c+d)(a+c)(8+d)
100X(30X10-45X15)2100
=------------------------------------=—(W)
75X25X45X5533
因为3.O3()v3.841=xoa,所以没有理由认为“体育迷”与性别有关.
⑵由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观
众中抽取一名“体育迷”的概率为点由题意知X〜43,从而X的分布列为:
X0123
27279
P1
64646464
13
--
4-4
139
Q(X)=3qx『而
K训练32PM2.5(细颗粒物)是指空气中直径小于或等于2.5微米的颗粒物(也
称可入肺颗粒物).为了探究车流量与PM2.5的质量分数是否相关,现采集到某
城市周一至周五某一时间段车流量与PM2.5的数据如下表:
时间周一周二周三周四周五
车流量用万辆5051545758
PM2.5的质量分数
6970
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年锦州市凌河区事业单位人员招聘考试备考题库及答案详解
- 2026年无锡市南长区事业单位人员招聘考试参考试题及答案详解
- 2026年咸阳市杨陵区事业单位人员招聘考试备考题库及答案详解
- 2026北京急救中心第四批招聘6人笔试参考试题及答案详解
- 2026年江苏省苏州市事业单位人员招聘笔试模拟试题及答案详解
- 威远县弘毅建筑工程有限公司2026年面向社会公开招聘工作人员的考试参考题库及答案详解
- 2026年七台河市新兴区事业单位人员招聘考试备考题库及答案详解
- 2026年武汉市新洲区事业单位人员招聘考试参考试题及答案详解
- 2026年沈阳市和平区事业单位人员招聘考试备考题库及答案详解
- 2026年武汉市江夏区事业单位人员招聘考试备考题库及答案详解
- 眼袋培训课件
- 广东省广州市越秀区荔湾区联考2025年高一物理第二学期期末学业水平测试试题含解析
- 2025非遗融入现代生活互联网平台助力非遗传播与消费专题报告-以抖音为例
- 老龄化社会的代际契约-洞察及研究
- 《肺结节规范化诊治专家共识(2024)》解读 课件
- 《碳中和概论》课件 第2章 碳捕集利用与封存
- T/CNFAGS 3-2021三聚氰胺单位产品消耗限额
- 消防器材供货方案
- 中药方剂学临床案例分析
- 加油站消防安全应急预案演练计划
- 半导体物理SEMICONDUCTORPHYSICS课件
评论
0/150
提交评论