




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、§ 2.3变量的相关性2.3.1变量之间的相关关系教学目标:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观熟悉变量间的相关关系.教学重点:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观熟悉变量间的相关关系.教学过程:案例分析:一般说来,一个人的身高越高,他的人就越大,相应地,他的右手一拃长就越长, 因此, 人的身高与右手一拃长之间存在着一定的关系. 为了对这个问题进行调查,我们收集了北京 市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表.性别身高/cm右手一拃长/cm女15218.5女15316.0女15616.0女15720
2、.0女15817.3女15920.0女16015.0女16016.0女16017.5女16017.5女16019.0女16019.0女16019.0女16019.5性别身高/cm右手一拃长/cm女16116.1女16118.0女16218.2女16218.5女16320.0女16321.5女16417.0女16418.5女16419.0女16420.0女16515.0女16516.0女16517.5女16519.5女16619.0女16719.0女16719.0女16816.0女16819.0女16819.5女17021.0女17021.0女17021.0女17119.0女17120.0女17
3、121.5女17218.5第7页共15页性别身高/cm右手一拃长/cm女17318.0女17322.0男16219.0男16419.0男16521.0男16818.0男16819.0男16917.0男16920.0男17020.0男17021.0男17021.5男17022.0男17121.5男17121.5男17122.3男17221.5男17223.0男17320.0男17320.0男17320.0男17320.0男17321.0男17422.0男17422.0男17516.0男17520.0性别身高/cm右手一拃长/cm男17521.0男17521.2男17522.0男17616.0男1
4、7619.0男17620.0男17622.0男17622.0男17721.0男17821.0男17821.0男17822.5男17824.0男17921.5男17921.5男17923.0男18022.5男18121.1男18121.5男18123.0男18218.5男18221.5男18224.0男18321.2男18525.0男18622.0男19121.0性别身高/cm右手一拃长/cm男19123.0(1) 根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似 关系吗?(2) 如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3 )如果一个学生的身高是
5、188cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下.从散点图上可以发现, 身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),( 191, 23)二点确定一条直线.同学2:在图中放上一根细绳,使得上面和下面点的个数相同或根本相同.同学3 :多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:我从左端点开始,取两条直线,如以下图.再取这两条直线的“中间位置作一条直线.252015101501551601
6、65170175180185190195同学5:我先求出相同身高同学右手一拃长的平均值,画出散点图,如以下图,再画出近 似的直线,使得在直线两侧的点数尽可能一样多.3025201510150155160165170175180185190195同学6:我先将所有的点分成两局部,一局部是身高在170 cm以下的,一局部是身高在170 cm以上的;然后,每局部的点求一个“平均点一一身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即164,19, 177,21;最后,将这两点连接成一条直线.同学7:我先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点根据同学 3的
7、方法求一个“平均点,最小的点为161.3,18.2,中间的点为170.5,20.1,最大的点为179.2,21.3.求出这三个点的“平均点为 170.3,19.9.我再用 直尺连接最大点与最小点,然后平行地推,画出过点170.3,19.9 的直线.21.521右手一拃长/cm(179.2,21.3)20.52019.5(170.5,20.1)*第8页共15页19同学&取一条直线,使得在它附近的点比拟多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长.这是十分有意义的
8、.课堂练习:第77页,练习A,练习B小结:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观熟悉变量间的相关关系.课后作业:第84页,习题2-3A第1(1)、2(1)题,2.3.2两个变量的线性相关教学目标:经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.教学重点:经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.教学过程:1 回忆上节课的案例分析给出如下概念:(1) 回归直线方程(2) 回归系数2. 最小二乘法3. 直线回归万程的应用1描述
9、两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系2利用回归方程进行预测;把预报因子即自变量x代入回归方程对预报量 即因变量Y 进行估计,即可得到个体 Y值的容许区间.3利用回归方程进行统计限制规定制的目标.如已经得到了空气中通过限制汽车流量来限制空气中4. 应用直线回归的考前须知1做回归分析要有实际意义;2回归分析前,最好先作出散点图;3回归直线不要外延.5. 实例分析:Y值的变化,通过限制 x的范围来实现统计控N02的浓度和汽车流量间的回归方程,即可NO?的浓度.某调查者从调查中获知某公司近年来科研费用支出Xi 与公司所获得利润Yi 的统计资料如下表:科研费用支出X
10、i 与利润丫i 统计表单位:万元年份科研费用支出利润1998531199911402000430200153420023252003220合计30180要求估计利润Y 对科研费用支出Xi的线性回归模型. 解:设线性回归模型直线方程为:£ = ?Xi第20页共15页-Z Xi 30瓦丫 180X5Y30由于:n6n6根据资料列表计算如下表:年份XiYXiY2XiXj -X丫-丫(Xi X)2区X)(Y Y)1998531155250100199911404401216103660200043012016-101020015341702504002002325759-2-54102003
11、220404-3-10930合计3018010002000050100现利用公式I 、n、川求解参数一0、一1的估计值:?n瓦X"瓦X正Yin' Xi -(、Xi)26 1000-30 1806 200-3026000 - 5400-1200 -900_ 600_300=2Y-l?X=30-2 5-20?0 莎- ?iX?' XiY - nXY1'Xi2- n(X)2_ 1000-6 5 30一 2200 - 6 52100_ 50=21?0 莎?迟(Xi -X)(Y -Y)'1、(Xi -X)2况=Y-f?x=30-2 5=20?0 二丫- ?1X=
12、30-2 5=20100_ 50=2所以:利润Y对科研费用支出Xi的线性回归模型直线方程为:Y -20 2Xi6、求直线回归方程, 相关系数和作图,这些EXCEL可以方便地做到. 仍以上题的数据为例.于EXCEL表中的空白区,选用插入"菜单命令中的"图表,选中XY散点图类型,在弹 出的图表向导中按向导的要求一步一步地操作,如有错误可以返回去重来或在以后修改.适当修饰 图的大小、纵横比例、字体大小、和图符的大小等,使图美观,最后得到图1,图中有直线称为趋势线,还有直线方程和相关系数.图中的每一个部份如坐标、标题、图例 等都可以分别修饰,这里主要介绍趋势线和直线方程.+ 系列1
13、线性系列1y = 2x + 20 R2 = 0.8264图1散点图鼠标右键点击图中的数据点,出现一个对话框,选添加趋势线",图中自动画上一条直线,再以鼠标右击此线,出现趋势线格式对话框,选择线条的粗细和颜色,在选项中选取显示公式和显示 R平方值,确定后即在图中显示回归方程和相关系数.课堂练习:第83页,练习A,练习B小结:经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.课后作业:第84页,习题2-3A第1、2题,2.3.3实习作业教学目标:会用随机抽样的根本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对
14、数据的分析为合理的决策提供一些依据,熟悉统计的作用,体会统计思维与确定性思维的差异.教学重点:会用随机抽样的根本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,熟悉统计的作用,体会统计思维与确定性思维的差异.教学过程:1课本86页案例设计一个题目2尝试解决下面的问题.1下面是关于吸烟情况的 20个国家的统计数字, 其中第一行是国名,第二行是男性吸烟成员的百分数,第三行是女性吸烟成员的百分数.韩国拉脱维亚俄罗斯多米尼加汤加土耳其中国泰国斐济日本68.267.067.066.365.063.061.060.059.359.06.312.030.013.
15、614.024.07.015.030.614.8美国巴基芬兰土库曼尼日巴拉圭巴林新西兰瑞典巴哈马斯坦利亚28.127.427.026.624.424.124.024.020.019.323.54.419.01.56.75.56.022.024.03.8根据以上数据,试研究这些国家吸烟状况的类似程度.问题的分析:要根据数据研究这些国家吸烟状况的类似程度,我们可以仅讨论男性的吸烟情况,首先确定一个划分类似的标准,不妨取1%,即当两个国家男性吸烟人数百分比之差小于1%时,将 这两个国家称为类似的那么可分成下面九组:1韩国;2拉脱维亚,俄罗斯和多米尼加; 3汤加;4 土耳其;5中国, 泰国,斐济和日本
16、;6美国;7巴基斯坦,芬兰和土库曼;8尼日利亚,巴拉圭,巴 林和新西兰;9瑞典和巴哈马.对于女性吸烟的情况也可做类似的分析.如果我们要整体地讨论吸烟情况,我们应当怎样做呢? 一个直接的想法就是考虑下面的 平面图:以女性吸烟者的百分数为横轴,男性吸烟者的百分数为纵轴.如以下图所示7060口呼»5040男吸烟?履巴3020203040从图中可以看出,根本上分成下面四组:1巴哈马,巴基斯坦,巴拉圭,巴林,尼日利亚和土库曼斯坦;2芬兰,新西兰,瑞典和美国;3中国,日本,泰国,韩国,拉脱维亚,多米尼加和汤加;4 土耳其,斐济和俄罗斯.这个过程叫做聚类分析,它的根本思想是:在一批样本数据中,定义
17、能度量样本数据或类别间相近程度的统计量,在此根底上计算出个样本数据或类别之间的相近程度度量值;再按相近程度的大小,把样本逐一归类,关系密切的聚集到一个小的分类单位,关系疏远的聚集到一个大的分类单位,直到所有的样本数据都聚集完毕;最后把不同的类别一一划分出来,形成一个关系密疏图, 并用以直观地显示分类对象的差异和联系.上例向我们展示了对数据进行的聚类分析的过程,一般来说,进行聚类分析需要解决两个问题:一是如何确定度量两个数据的接近程度的方法;二是究竟分成多少类适宜.这两个问题都需要根据实际问题的背景和数据本身的意义来确定.统计上对此提出了一套程序化的方法:1选择一种确定接近程度的方法,最直接的就
18、是点之间的距离,我们上面的分析即是基于此;不同的方法将得到不同的分类结果2 设要分类的对象有 n个;我们以这n个对象分成n类开始,按所选择的方法确定这n个对象两两的接近程度度量值,将最接近的两个对象合并为一类,如此我们得到了至多n-1 类;3确定类与类之间接近程度的方法;4对n-1类重复步骤2,如此下去到完全归为一类止.至于究竟分成多少类适宜,需要分析者根据所讨论的问题来决定.在实际问题中,往往需要对几种分类方案进行比拟后,再加以选择.2为了研究某种新药的副作用如恶心等,给50位患者服用此新药,另外 50位患者服用抚慰剂,得到以下实验数据:药物副作用有无合计新药153550抚慰剂44650合计
19、1981100请问服用新药是否可产生副作用?问题的分析:假定服用新药与产生副作用没有关联那么,首先要给“没有关联下一个“能够操作的定义.根据直观的经验,在服用新药与产生副作用的情形下,这个定义可以是这样的:如 果服用新药与产生副作用没有关联,就意味着,无论服用新药与否, 产生副作用的概率都是一样的.就此例题而言:1915P全体实验者产生副作用=0.19. P服用新药产生副作用二一二0.3,10050二者相差较大.由此可以推断,开始的假设是不成立的.也就是说,服用新药与产生副作用 是有关联的.由统计的常识知道,要求等号成立是非常苛刻的条件,实际上一般也是办不到的,我们所能追求的是在概率意义下的可靠性.对于上面的独立性问题, 类比在聚类分析讨论中的想法,我们应当寻找一个适当的统计量,用它的大小来说明独立性是否成立.在统计中,我们 引入下面的量"副作.用 B药物A有副作用Bi无副作用B2合计新药Aiaba + b抚慰剂A 2cdc + d合计a +cb +dn = a + b在前面的例子中a= 15,b= 35, c= 4, d = 46.注意到独立性要求
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商业合作诚信守秘保证承诺书3篇范文
- 科技创新及知识产权维护承诺函4篇
- 2025辽宁能源控股集团所属阜矿集团招聘90人模拟试卷附答案详解(完整版)
- 2025金华市八达供电服务有限公司招聘60人模拟试卷附答案详解(突破训练)
- 2025年河北沧州南皮县中医医院公开招聘工作人员16名模拟试卷完整答案详解
- 合同管理模板法律风险防控版
- 2025届春季中建八局总承包公司校园招聘正式启动考前自测高频考点模拟试题及答案详解(有一套)
- 项目货款按时回笼保证承诺书9篇
- 2025内蒙古气象部门(第二批)招聘70人模拟试卷及答案详解(考点梳理)
- 2025江苏南京市建邺区平安联盟工作辅助人员招聘42人(二)模拟试卷及完整答案详解一套
- 2024年光伏电站运行专业知识题库
- 医疗器设计变更
- “夜经济”背景下喀什古城旅游发展策略
- 《机械制图(多学时)》中职全套教学课件
- 初级会计基础知识必背单选题100道及答案解析
- 模拟电子技术基础 第4版黄丽亚课后参考答案
- 2023年高教版中职新版教科书《语文》(基础模块)上册教案全册编制
- 新建2MW用户侧并网光伏发电金太阳示范工程项目可行性研究报告
- 英语日常交际用语200句
- DL∕T 1056-2019 发电厂热工仪表及控制系统技术监督导则
- 耐久跑教案-高二上学期体育与健康人教版
评论
0/150
提交评论