版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第7课时变量间的相关关系、统计案例
考纲1.变量间的相关关系.
索引2.统计案例.
1.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方
课标
程.
要求
2.了解独立性检验(只要求2X2列联表)的基本总想、方法及其简单应用.
【知识梳理】
1.相关关系的分类
从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将
它称为;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称
为.
2.线性相关
从散点图上看•,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有
线性相关关系,这条直线叫.
3.回归方程
(1)最小二乘法:使得样本数据的点到回归直线的最小的方法叫最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:
(Xi),(l2,出)「•,(]”,/),其回归方程为歹=加+。,
”X(xi-x)(yi-y)Xxiyi-nxy,
-------=——......—
则-S(x,-X)2SJTLnx2
i=1i=1
4—-—
4.样本相关系数
2(乃一])(,一y)
J斗工斗y
⑴当rX)时,表明两个变量________;
⑵当r<0时,表明两个变量________;
(3)1•的绝对值越接近1,表明两个变量的线性相关性;T的绝对值越接近于0,表明两
个变量之间几乎不存在线性相关关系.通常当"/为.75时,认为两个变量有很强的线性相关
关系.
5.线性回归模型
⑴产"也气中,a"称为模型的未知参数;e称为随机误差.
(2)相关指数
i—W
S(y—y)?
用相关指数〃来刻画回归的效果,其计算公式是:川刁-Hl,〃的值越大,说明残
差平方和越小,也就是说模型的拟合效果.在线性回归模型中,R表示解释变量对预
报变量变化的贡献率,川越接近于I,表示回归效果越好.
6.独立性检验
(1)用变量的不同“值”表不个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,
宗教信仰,国籍等.
(2)列出的两个分类变量的频数表,称为列联表.
(3)一般地,假设有两个分类变量X和K它们的值域分别为和,其样本频数列联表(称为2X2
列联表)为:
2X2列联表
息计
X\aba+b
Xzcdc+d
总计a+cb+da+b+c+d
K2________-be)2________________
(a+b)(a+c)(c+cl)Cb+d)(其中〃二且也也打为样本容量),可利用独立性
检验判断表来判断“X与F的关系”.这种利用随机变量片'来确定在多大程度上可以认为“两
个分类变量有关系”的方法称为两个分类变量的独立性检验.
基础自测
1.下面哪些变量是相关关系().
A.出租车车费与行驶的里程
B.房屋面积与房屋价格
C.身而与体重
D.铁块的大小与质量
2.某商品销售量y(件)与销售价格双元/(牛)负相关,则其回归方程可能是().
A.1=-21+100B.a=21+100
C.&=一2]—100D.5=2彳-100
3.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数〃如下,其中
拟合效果最好的模型是().
A.模型1的相关指数"为().98B.模型2的相关指数〃为().80
C.模型3的相关指数〃为0.50D.模型4的相关指数〃为0.25
4.在一项打鼾与患心脏病的调查中,其调查了1671人,经过计算片的观测值人27.63,根据
这一数据分析,我们有理由认为打鼾与患心脏病是的.(填“有关”“无关”)
5.人的身高与手的扎长存在相关关系,且满足&=0・303X-31.364”,为身高,产为
扎长,单位:cm),则当扎长为24.8cm时,身高约为.
指点迷津
♦两种关系
函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机
变量的关系,而相关关系是非随机变量与随机变量的关系.
♦常用的三个标准
当*23.841时,则有95%的把握说事件A与6有关;当*26.635时,则有99%的把握说事件
A与8有关;当/W2.706时,则认为事件A与B无关.
考点透析
考向一线性相关关系的判断
例1(2014•湖州联考)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计两科
成绩得到如图所示的散点图(两坐标轴单位长度相同),用回归直线"近似的刻
画其相关关系,根据图形,以下结论最有可能成立的是().
),(英语成绩)
x(语文成物
A.线性相关关系较强,/并勺值为1.25
B.线性相关关系较强,。的值为0.83
C.线性相关关系较强,6的值为87
D.线性相关关系太弱,无研究价值
【审题视点】本题主要考查散点图,线性相关关系.
变式训练
1.(2013•镇江联考)如图所示,有5组5,力数据,去掉组数据后,剩下的4组数据
具有较强的线性相关关系.
y
£(10.12)
D(3,IO)
Q4.5)
.•危4)
4(1,3)
(r---------------------------F
(第1题)
考向二线性回归方程
例2(2014•九江模拟)已知x,y的取值如下表所示,如果y与x线性相关,且线性回归方程
_17
为22,则下表中的所
X234
y5a6
【审题视点】本题主要考杏线性回归直线的性质.
【方法总结】解决本题的关键是回归直线一定过样本中心点,因此求解时要求出变量的均
值,在代入直线的方程.
变式训练
2.(2014・济宁模拟)已知具有线性相关的两个变量x,y之间的一组数据如下:
x01234
y2.24.34.54.86.7
且回归方程是5+3・6,则当才与时,旷的预测值为().
A.8.46B.6.8
C.6.3D.5.76
考向三独立性检验
例3(2014•马鞍山质检)为了判断高中学生的文理科选修是否与性别有关系,随机调查了
50名学生,得到如下2X2列联表:
理科文科
男1310
女720
已知尸(片23.841)10.05,尸(片25.024)10.025.
叱,50(13X20-10X7)2。一
K-=----------------------------------*4844
根据表中数据,得到23X27X20X30,.则认为选修文科与性
别有关系的可能性不低于.
【审题视点】本题考查独立.性检验,列联表,简单题.
【方法总结】利用统计量片进行独立性检验的步骤
第一步根据数据列出2X2列联表;
第二步根据公式计算1的观测值k
第三步比较观测值A与临界值表中相应的检验水平,作出统计推断.
|变式训练
3.(2014•深圳调研)某企业通过调杳问卷(满分50分)的形式对本企业900名员工的工作满
意度进行调查,并随机抽取了其中30名员工(16名女员工,14名男员工)的得分,如表所示:
女47363248344443474641434250433549
男3735344346363840393248334034
(1)根据以上数据,估计该企业得分大于45分的员工人数;
(2)现用计算器求得这30名员工的平均得分为40.5分,若规定大于平均得分为“满意”,否
则为“不满意”,请完成下列表格:
“满意”的人数“不满意”的人数合计
女16
男14
合
30
计
(3)根据上述表中数据,利用独立性检验的方法判断,能否在犯错误的概率不超过1%的前提
下,认为该企业员工“性别”与“工作是否满意”有关?
参考数据:
产(片24)0.100.0500.025C.0100.001
k2.7063.8415.024£.63510.828
经典考题
典例某地最近十年粮食需求量逐年上升,如表是部分统计数据:
年份20022004200620082010
需求量8吨236246257276286
A
(1)利用所给数据求年需求量与年份之间的回归直线方程
(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.
【解题指南】将数据进行处理,把数据同时减去一个数代入公式计算;利用公式求回归直线
方程,并进行预测.
【解】(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求I口I归直线方程,
先将数据预处理如下:
年份一2006-4-2024
需求量一257-21-1101929
对预处理的数据,容易算得“="'-v=3・
,(-4)X(—2D+(—2)X(—11)+2X19+4X29260
(-4)2+(-2)2+22+4240
=6.5,
a=7=3.2.由上述计算结果•知所求回归直线方程为
§—257=0(7—2006)+«=6.5(—2006)+3.2.
即歹=6.5(i—2006)+260.2.
(2)利用所求得的直线方程,可预测2012年的粮食需求量为
6.5X(2012-2006)+260.2=6.5X6+260.2=299.2(万
吨).
真题体验
1.(2014•湖北)根据如下样本数据
x345678
y4.02.5-0.50.5-2.0-3.0
■
得到的回归方程为、='"+",则().
A.Z?<0B.<?//(),b^OC.a<0,。①D.力为
2.(2014•江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,
随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量
是().
表1
成绩性别不及格及格总计
男61420
女102232
总计163652
表2
视力性别好差总计
男41620
女122032
总计163652
表3
智商性别偏高正常总计
男81220
女82432
总计163652
表4
阅读量性
丰富不丰富总计
别
男14620
女23032
总计163652
A.成绩B.视力C.智商D.阅读量
3.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单
位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木
中,有株树木的底部周长小丁100cm.
(第3题)
4.(2014•全国新课标/)从某企业生产的某种产品中抽取】()0件,测量这些产品的一项质量
指标值,由测量结果得如下频数分布表:
[75,85[85,95[95,105
质量指标值分组[105,115)[115,125)
)))
频数62638228
(1)作出这些数据的频率分布直方图:
Hit
oo.
oo.
o
o.
oo.
o.
o.
o。
oo.
.o
.O
0
o.8595105115125质量指标值
O.
(第4题)
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代
表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的
产品至少要占全部产品的80%”的规定?
参考答案与解析
知识梳理
1.正相关负相关2.回归直线3.距离平方和
4.正相关负相关越强5.越好
基础自测
1.C2.A3.A4.有关5.185.4cm
【感悟考点透析】
[例1]B解析:根据散点图知各点大致在一直线的附近,则得两者的线性相关关系较强,
比较直线的倾斜位置情况可知的值为((),1)之间的数,结合选项知选项B满足.
—2+3+4—5+6+u
x=------------=3,y=-------------
【例2】4解析:由题意得33,代入回归直线
方程得a=A.
【例3】95%解析:因为旅仁4.844)3.841,
所以P(片23.841)弋0.05,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是
否选修文科与性别之间有关系”成立,选修文科与性别有关系的可能性不低于95%.
变式训练
1.D解析:A.B,C,E大致在一条直线上,而D较远.
2.C解析:通过计算,得1=2,工=4.5,即样本点中心为(2,4.5),代入
线性回归方程,得4.5=24+3.6,求得。=0.45,所以回归方程为》=
0.45才+3.6•当E=6时,3=0.45X6+3.6=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三零平安创建工作制度
- 不执行大小周工作制度
- 丘北县林长制工作制度
- 两站两员培训工作制度
- 严格考勤完善工作制度
- 个体西医诊所工作制度
- 中医西医结合工作制度
- 中国政府参事工作制度
- 中学处室人员工作制度
- 中学责任督学工作制度
- 产教融合实训基地项目运营管理方案
- 雨课堂学堂在线学堂云安全科学原理(中南大学)单元测试考核答案
- 2026年黑龙江省公务员考试《行测》试题题库(答案+解析)
- 航空货运自查制度规范
- 统编版(2024)七年级上册历史第2课 原始农业与史前社会 素养提升教案
- 喉癌课件讲解
- 金属非金属矿山重大事故隐患判定标准
- 金华人工浮岛施工方案
- 十年(2016-2025)高考化学真题分类汇编:专题50 有机推断综合题-结构半知型+信息(原卷版)
- 人形图护理查房制作流程
- 黄山团建活动方案
评论
0/150
提交评论