




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、【考纲下载考纲下载】1. 会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系系2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程性回归方程3了解独立性检验了解独立性检验(只要求只要求22列联表列联表)的基本思想、方法及其简单应的基本思想、方法及其简单应用用4了解假设检验的基本思想、方法及其简单应用了解假设检验的基本思想、方法及其简单应用.第第3 3讲讲 变量间的相关关系、回归分析及独立性检验变量间的相关关系、回归分析及独立性检验(1)在散点图
2、中,点散布在从在散点图中,点散布在从 到到 的区域对于两个的区域对于两个 变量的这种相关关系,我们将它称为正相关如果在散点图变量的这种相关关系,我们将它称为正相关如果在散点图 中,点散布在从中,点散布在从 到到 的区域,两个变量的这种相关的区域,两个变量的这种相关 关系称为负相关关系称为负相关左下角左下角右上角右上角左上角左上角 右下角右下角1两个变量的线性相关两个变量的线性相关(2)线性相关关系、回归直线线性相关关系、回归直线如果散点图中点的分布从整体上看大致在如果散点图中点的分布从整体上看大致在 ,就称这两,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线个变量之间具有线性相关关系
3、,这条直线叫做回归直线一条直线附近一条直线附近【思考思考】 相关关系与函数关系有什么异同点?相关关系与函数关系有什么异同点?答案:答案:相同点:两者均是指两个变量的关系相同点:两者均是指两个变量的关系不同点:不同点:函数关系是一种确定的关系,相关关系是一种非确定的关函数关系是一种确定的关系,相关关系是一种非确定的关系,事实上,函数关系是两个非随机变量的关系而相关关系是非随系,事实上,函数关系是两个非随机变量的关系而相关关系是非随机变量与随机变量的关系机变量与随机变量的关系函数关系是一种因果关系,而相关关系函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系不一定是因果关系,也可
4、能是伴随关系(1)最小二乘法最小二乘法求回归直线使得样本数据的点到回归直线的求回归直线使得样本数据的点到回归直线的 的的方法叫做最小二乘法方法叫做最小二乘法(2)回归方程回归方程方程方程 bxa是两个具有线性相关关系的变量的一组数据是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中的回归方程,其中a,b是待定参数是待定参数2回归方程回归方程距离的平方和最小距离的平方和最小(3)相关系数相关系数r当当r0时,表明两个变量时,表明两个变量 ;当当r0时,表明两个变量时,表明两个变量 r的绝对值越接近于的绝对值越接近于1,表明两个变量的线性相关性,表
5、明两个变量的线性相关性 r的绝对值越接近于的绝对值越接近于0时,表明两个变量之间时,表明两个变量之间 通常通常|r|大于大于 时,认时,认为为两个变量有很强的线性相关性两个变量有很强的线性相关性正相关正相关负相关负相关越强越强几乎不存在线性相关关系几乎不存在线性相关关系0.75(1)分类变量:变量的不同分类变量:变量的不同“值值”表示个体所属的表示个体所属的 ,像这类变量,像这类变量称为分类变量称为分类变量(2)列联表:列出两个分类变量的列联表:列出两个分类变量的 ,称为列联表假设有两个分类,称为列联表假设有两个分类变量变量X和和Y,它们的可能取值分别为,它们的可能取值分别为x1,x2和和y1
6、,y2,其样本频数列联,其样本频数列联表表(称为称为22列联表列联表)为为22列联表列联表不同类别不同类别频数表频数表3独立性检验独立性检验构造一个随机变量构造一个随机变量K2 ,其中其中n为样本容量为样本容量 abcd(3)独立性检验独立性检验利用随机变量利用随机变量 来确定是否能以一定把握认为来确定是否能以一定把握认为“两个分类变量两个分类变量 ”的方法称为两个分类变量的独立性检验的方法称为两个分类变量的独立性检验【思考思考】 在独立性检验中经常由在独立性检验中经常由K2得到观测值得到观测值k k,则,则k k 吗?吗?答案:答案:K2与与k k的关系并不是的关系并不是k k ,k k是是
7、K2的观测值,或者说的观测值,或者说K2是一个随机是一个随机变量,它在变量,它在a,b,c,d 取不同值时,取不同值时,K2可能不同,而可能不同,而k k是取定一组数是取定一组数a,b,c,d后的一个确定的值后的一个确定的值K2有关系有关系学生的学习态度与学习成绩之间的关系;学生的学习态度与学习成绩之间的关系;教师的执教水平与学生的学习成绩之间的关系;教师的执教水平与学生的学习成绩之间的关系;学生的身高与学生的学习成绩之间的关系;学生的身高与学生的学习成绩之间的关系;家庭的经济条件与学生的学习成绩之间的关系家庭的经济条件与学生的学习成绩之间的关系A B C D1下列关系中,是相关关系的为下列关
8、系中,是相关关系的为() 解析:解析:学生的学习态度与学习成绩之间不是因果关系,学生的学习态度与学习成绩之间不是因果关系,是相关关系是相关关系教师的执教水平与学生的学习成绩之间的教师的执教水平与学生的学习成绩之间的关系是关关系关系是关关系都不具备相关关系都不具备相关关系答案:答案:A2(2009宁夏、海南宁夏、海南)对变量对变量x,y有观测数据有观测数据(xi,yi)(i1,2,10),得,得散散 点图点图(1);对变量;对变量u、v有观测数据有观测数据(ui,vi)(i1,2,10),得散点图,得散点图 (2)由这两个散点图可以判断由这两个散点图可以判断()A变量变量x与与y正相关,正相关,
9、u与与v正相关正相关B变量变量x与与y正相关,正相关,u与与v负相关负相关C变量变量x与与y负相关,负相关,u与与v正相关正相关D变量变量x与与y负相关,负相关,u与与v负相关负相关解析:解析:由图由图1可知,各点整体呈递减趋势,可知,各点整体呈递减趋势,x与与y负相关,由图负相关,由图2可知,可知,各点整体呈递增趋势,各点整体呈递增趋势,u与与v正相关正相关答案:答案:C3对有线性相关关系的两个变量建立的回归直线方程对有线性相关关系的两个变量建立的回归直线方程 中,中, 回归系数回归系数 () A可能小于可能小于0 B小于小于0 C能等于能等于0 D只能等于只能等于0 解析:解析: 0时,得
10、时,得r0,这时不具有线性相关关系,但,这时不具有线性相关关系,但 能大于能大于0, 也能小于也能小于0. 答案:答案:A4在一项打鼾与患心脏病的调查中,共调查了在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算人,经过计算 K227.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是,根据这一数据分析,我们有理由认为打鼾与患心脏病是 _的的(有关,无关有关,无关) 解析:解析:K227.636.635, 有有99%的把握认为的把握认为“打鼾与患心脏病有关打鼾与患心脏病有关”答案:答案:有关有关判断两个变量正相关还是负相关,有三种方法:判断两个变量正相关还是负相关,有三种方法:1
11、利用散点图;利用散点图;2利用相关系数利用相关系数r的符号;当的符号;当r0时,正相关;时,正相关;r0时,负相关;时,负相关;3在已知两变量线性相关时,也可以利用回归方程在已知两变量线性相关时,也可以利用回归方程 abx.当当b0时,时, abx是增函数,两变量是正相关,是增函数,两变量是正相关,当当b0时,时, abx是减函数,是减函数, 两变量是负相关两变量是负相关 【例例1】 山东鲁洁棉业公司的科研人员在山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量验田上对某棉花新品种进行施化肥量x对产量对产量y影响的试验,得到如影响的试
12、验,得到如下表所示的一组数据下表所示的一组数据(单位:单位:kg).(1)画出散点图;画出散点图;(2)判断是否具有相关关系判断是否具有相关关系思维点拨:思维点拨:用用施化肥量施化肥量x作为横轴,产量作为横轴,产量y为纵轴可作出散点图,由散为纵轴可作出散点图,由散点图即可分析是否具有线性相关关系点图即可分析是否具有线性相关关系解:解:(1)散散点图如右图所示,点图如右图所示,(2)由散点图知,各组数据对应点大致都在一条直线由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量附近,所以施化肥量x与产量与产量y具有线性相关关系具有线性相关关系.对具有相关关系的两个变量进行统计分析时,首先要
13、作出散点图,然后进对具有相关关系的两个变量进行统计分析时,首先要作出散点图,然后进行相关性检验,在确认具有线性相关关系后,再求其回归直线行相关性检验,在确认具有线性相关关系后,再求其回归直线【例例2】 一台机器使用时间较长,但还可以使用它按不同的转速生产一台机器使用时间较长,但还可以使用它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:多少,随机器运转的速度而变化,下表为抽样试验结果:(1)对变量对变量y与与x进行相关性检验;进行相关性检验;(2)如果如果y与与x有线性
14、相关关系,求回归直线方程;有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,个,那么,机器的运转速度应控制在什么范围内?机器的运转速度应控制在什么范围内?思维点拨:思维点拨:利用相关系数利用相关系数r进行线性相关检验进行线性相关检验(也可利用散点图也可利用散点图)如果线性相如果线性相关,再求回归直线方程并加以判断关,再求回归直线方程并加以判断因为因为r0.5,所以,所以y与与x有很强的线性相关关系有很强的线性相关关系(2) 0.728 6x0.857 1.(3)要使要使 100.728 6x0
15、.857 110,所以所以x14.901 3.所以机器的转速应控制在所以机器的转速应控制在14.901 3转转/秒以下秒以下变式变式2:假设关于某设备的使用年限假设关于某设备的使用年限x和所支出的维修费用和所支出的维修费用y(万元万元), 有如下的统计资料:有如下的统计资料:(1)y与与x间是否有线性相关关系?若有,求出线性回归方程;间是否有线性相关关系?若有,求出线性回归方程;(2)估计使用年限为估计使用年限为10年时的维修费用年时的维修费用解:解:(1)作散点图,如右图作散点图,如右图由散点图可知,由散点图可知,y y与与x呈线性相关关系,呈线性相关关系,1.23所以回归直线方程为所以回归
16、直线方程为 =1.23x+0.08.(2)当当x=10时,时, =1.2310+0.08=12.3+0.08=12.38(万元万元),即估计使用,即估计使用10年时,维修费用是年时,维修费用是12.38万元万元. 所谓独立性检验,就是根据采集样本的数据,先利用三维柱形图和二所谓独立性检验,就是根据采集样本的数据,先利用三维柱形图和二维条形图粗略判断两个分类变量是否有关系,再利用公式计算维条形图粗略判断两个分类变量是否有关系,再利用公式计算K2的值,比的值,比较它与临界值的大小关系,来判断事件较它与临界值的大小关系,来判断事件X与与Y是否有关的问题是否有关的问题【例例3】 (2009辽宁辽宁)某
17、企业有两个分厂生产某种零件,按规定内径尺寸某企业有两个分厂生产某种零件,按规定内径尺寸 (单位:单位:mm)的值落在的值落在29.94,30.06)的零件为优质品从两个分的零件为优质品从两个分 厂生产的零件中各抽出了厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:件,量其内径尺寸,得结果如下表:(1)试分别估计两个分厂生产的零件的优质品率;试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面由以上统计数据填下面22列联表,并问是否有列联表,并问是否有99%的把握认为的把握认为“两个分厂生产的零件的质量有差异两个分厂生产的零件的质量有差异”.解:解:(1)甲厂抽查的产品
18、中有甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品件优质品,从而甲厂生产的零件的优质品率估计为率估计为 72%;乙厂抽查的产品中有乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计件优质品,从而乙厂生产的零件的优质品率估计为为 64%.(2)所以有所以有99%的把握认为的把握认为“两个分厂生产的零件的质量有差异两个分厂生产的零件的质量有差异”变式变式3:在对人们休闲方式的一次调查中,共调查了在对人们休闲方式的一次调查中,共调查了124人,其中女性人,其中女性70人,男性人,男性54人女性中有人女性中有43人主要的休闲方式是看电视,另外人主要的休闲方式是看电视,另外
19、27人人的休闲方式是运动;男性中有的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外人主要的休闲方式是看电视,另外33人主要的休闲方式是运动人主要的休闲方式是运动 (1)根据以上数据建立一个根据以上数据建立一个22列联表;列联表; (2)画出二维条形图;画出二维条形图;(3)检验休闲方式是否与性别有关,可靠性有多大检验休闲方式是否与性别有关,可靠性有多大 解:解:(1)22列联表如图列联表如图:(2)二维条形图如图:二维条形图如图:(3)假设休闲方式与性别无关,则假设休闲方式与性别无关,则K2 6.2015.024,所以有理,所以有理由认为休闲方式与性别无关是不合理的,即我们有由认为
20、休闲方式与性别无关是不合理的,即我们有97.5%的把握认为的把握认为 休闲方式与性别有关休闲方式与性别有关.【方法规律方法规律】1求回归方程,关键在于正确求出系数求回归方程,关键在于正确求出系数a,b,由于,由于a,b的计算量大,计算时应仔的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误细谨慎,分层进行,避免因计算而产生错误(注意回归直线方程中一次项系注意回归直线方程中一次项系数为数为b,常数项为,常数项为a,这与一次函数的习惯表示不同,这与一次函数的习惯表示不同)2回归分析是处理变量相关关系的一种数学方法主要解决:回归分析是处理变量相关关系的一种数学方法主要解决:确定特定量之间确
21、定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;是否有相关关系,如果有就找出它们之间贴近的数学表达式;根据一组观察根据一组观察值,预测变量的取值及判断变量取值的变化趋势;值,预测变量的取值及判断变量取值的变化趋势;求出回归直线方程求出回归直线方程 3独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的随机变量,对假设的正确性进行判断随机变量,对假设的正确性进行判断.【规范解答规范解答】从而从而 ,所以物理成绩更稳定,所以物理成绩更稳定(2)由于由于x与与y之间具有线性相关关系,根据回归系数公式得到之间具有线性相关关系,根据回归系数公式得到b 0.5,a1000.510050,线性回归方程为线性回归方程为 0.5x50.当当y115时,时,x130.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高物理成绩的进一步提高 为了分析某个高三学生的学习状态,对其下一阶段的学习提供
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年网络管理员考试的复习大纲探讨试题及答案
- 主管工作总结的结果评估计划
- 法学概论中常见法律术语解读试题及答案
- 财务课程学习的重要性计划
- 自信面对2025年法学概论考试试题及答案
- 2024年南昌航空大学辅导员考试真题
- 2024年乌什县人民医院招聘笔试真题
- 法学教育的现状与未来试题及答案
- 2024年湖北省生态环境厅下属事业单位真题
- 法学概论法律教育政策的研究进展试题及答案
- 当代中国外交(外交学院)知到智慧树章节测试课后答案2024年秋外交学院
- 舆情监测平台解决方案
- 初中地理七年级第二学期期末试卷及答案-沪教版-2024-2025学年
- 防汛抢险人员安全培训
- 《香菱形象分析》课件
- 风电螺栓更换施工方案
- 含两级混合运算(同步练习) 二年级下册数学人教版
- 2024年彩钢房钢构出售合同范本
- 声光电采购合同范例
- 2024年七月医疗器械质量管理制度
- 檩条施工方案
评论
0/150
提交评论