已阅读5页,还剩49页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章统计案例 1回归分析 肺癌是严重威胁人类生命的一种疾病 吸烟与肺癌有关系吗 肥胖是影响人类健康的一个重要因素 标准的身高和体重之间是否存在线性相关关系 为解决这些我们生活中经常会遇到的问题 就必须要明确它们所涉及的对象是什么 用怎样的量描述问题 并确定获取变量值 数据 的方法 然后用适当的统计方法分析数据 以得到最可靠的结论 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法 在必修课中 我们学习了用最小二乘法求变量间的线性回归方程 并用回归直线方程进行预报 接下来我们进一步学习回归分析的基本思想及其应用 1 掌握散点图的画法 线性回归方程的求解方法 重点 2 会利用相关系数来判断变量之间的相关程度 重点 3 了解非线性模型通过变换转化为线性回归模型的方法 难点 探究点1回归分析 1 求和符号与平均值符号表示对n个数据x1 x2 xn n个数据x1 x2 xn的平均值用表示 即 求和 2 线性回归方程中系数a b的计算公式在线性回归方程中 其中 思考1回归分析中 利用线性回归方程求出的函数值一定是真实值吗 提示 不一定是真实值 利用线性回归方程求得的值 在很多时候是个估计值 思考2回归方程中系数a b的意义是什么 提示 a表示回归直线在y轴上的截距 b表示的是回归直线的斜率 始祖鸟是一种已经灭绝的动物 在一次考古活动中 科学家发现了6个始祖鸟的化石标本 其中5个同时保有股骨和肱骨 这5个标本股骨和肱骨的长度如下 1 求出肱骨长度y对股骨长度x的线性回归方程 2 还有1个化石标本不完整 它只有股骨 而肱骨不见了 现测得股骨长50cm 请预测其肱骨长度 分析 假设样本点为 设线性回归方程为 需要求 使得这个点与直线的 距离 平方之和最小 即使得达到最小 此时 将题目数据列表如下 由此可得 进而可以求得 于是 y对x的线性回归方程为 斜率b 1 197的意思是 对于这次发现的始祖鸟化石标本来说 股骨长度每增加1cm 肱骨长度就平均增加1 197cm 2 由线性回归方程知 当时 肱骨长度的估计值为 假定小麦基本苗数x与成熟期有效穗数y之间存在相关关系 今测得5组数据如下 1 求出有效穗数y对基本苗数x的线性回归方程 2 预测基本苗数为56 7时有效穗数是多少 变式练习 解 1 由题意知 散点图中 样本点呈条状分布 有较好的线性相关关系 可以用线性回归方程刻画 则可得 故所求的线性回归方程为 2 当x 56 7时 所以 估计成熟期有效穗数为51 143 线性回归方程的求解步骤 1 画散点图 通过图形来判断是否线性相关 2 求回归系数 3 写出线性回归方程 提升总结 任何数据都可以求线性回归方程 求之前通常先判断变量的线性相关关系 作出散点图 但有时从图中也不易判断出线性关系 另外 如果数据量较大时 不易画图 需另想办法 为解决这个问题 我们可通过计算线性相关系数r 来判断变量间线性相关程度的大小 计算公式为 探究点2相关系数 的最小值为 根据前面的分析 回归方程的系数使得误差 由知 即 值越大 误差越小 变量之间的线性相关程度就越高 值越接近0 越大 变量之间的线性相关程度就越低 当时 两变量的值总体上呈现同时增减的趋势 则称两变量正相关 当时 一变量增加 另一变量有减少的趋势 则称两变量负相关 当时 则称两变量线性不相关 相关系数r的性质 思考1 对于探究点1中给出的例题 变量的线性相关系数r如何求 可得 由数据表 经过计算 可知 想一想 从计算得出的结果能说明什么问题 提示 通常当r 0 75时认为两个变量有很强的线性相关关系 由r 0 9941说明肱骨长度y和股骨长度x有较强的线性相关程度 思考2 计算下表变量的线性相关系数r 并观察 通过计算可以发现什么 由表可知 通过计算所得结果你发现什么了 提示 r 0 则变量间并不存在线性相关关系 即此时建立线性回归方程是没有意义的 实际上 从散点图上我们也可以验证这一点 易看出 几个样本点都落在同一个半圆上 而不是条状分布 此时建立线性回归方程无任何意义 这与相关系数r的计算结果相一致 样本点的分布如何 x y 1 判断变量之间的线性相关关系 一般用散点图 但在作图中 由于存在误差 有时很难判断这些点是否分布在一条直线的附近 从而就很难判断两个变量之间是否具有线性相关关系 此时就必须利用线性相关系数来判断 2 相关系数r越大 变量间的线性关系就越强 用直线拟合的效果就越好 相关系数r可以定量地反映出变量间的相关程度 明确地给出有无必要建立两变量间的线性回归方程 提升总结 下表是随机抽取的8对母女的身高数据 试根据这些数据探讨y与x之间的关系 解 画出散点图 变式练习 列表 计算相关系数 因为r 0 963接近1 所以x与y具有较强的线性相关关系 下表按年份给出了1981 2001年我国出口贸易量 亿美元 的数据 根据此表你能预测2008年我国的出口贸易量吗 探究点3可线性化的回归分析 从散点图中观察 数据与直线的拟合性不好 若用直线来预测 误差将会很大 而图像近似指数函数 呈现出非线性相关性 分析 考虑函数来拟合数据的变化关系 将其转化成线性函数 两边取对数 即线性回归方程 记1981年为x 1 1982年为x 2 变换后的数据如下表 设 则上式变为 对上表数据求线性回归方程得 即 x u 由此可得 曲线如图 这样一来 预测2008年的出口贸易量就容易多了 即 出口贸易量 亿美元 年份 总结 常见的非线性回归模型转化为线性回归模型 作变换 得线性函数 1 幂函数曲线 x y b 1 0 1 1 0 1 1 2 指数曲线 o o 3 倒指数曲线 作怎样的变换 得到线性函数的方程如何 作变换 得线性函数 4 对数曲线 作怎样的变换 得到线性函数的方程如何 得线性函数 作变换 o o x b 0 b 0 1 1 x y y 思考 对于任意一组数据 x1 y1 x2 y2 xn yn 都可以求出线性回归方程y a bx吗 提示 可以 根据给出的数据以及相关的计算公式 可以求出线性回归方程y a bx 但是 求出的方程并不一定能够恰当地反应变量之间的关系 还取决于这两个变量之间的线性相关程度 为了研究某种细菌随时间x的变化繁殖个数y的变化 收集数据如下 1 作出这些数据的散点图 2 求y与x之间的回归方程 分析 作出数据的散点图 选择合适的函数模型转化为线性模型 变式练习 解析 1 散点图如图所示 2 由散点图看出样本点分布在一条指数函数图像的周围 于是令z lny 则 由计算器算得z 0 7x 1 08 则有y e0 7x 1 08 非线性回归问题一般应先画出已知数据的散点图 把它与所学过的各种函数图像作比较 挑选一种跟这些散点图拟合得最好的函数 采用适当的变量置换 把问题化为线性回归分析问题 使问题得以解决 提升总结 1 为了解儿子身高与其父亲身高的关系 随机抽取5对父子的身高数据如下 c 2 对四对变量y和x进行线性相关检验 已知n是观测值组数 r是相关系数 且已知 n 7 r 0 9533 n 15 r 0 3012 n 17 r 0 4991 n 3 r 0 9950 则变量y和x线性相关程度最高的两组是 a 和 b 和 c 和 d 和 解析 相关系数r的绝对值越大 变量x y的线性相关程度越高 故选b b 3 下列数据x y符合哪一种函数模型 解析 选项a中当x 8 9 10时 函数值与所给数值偏差较大 不合题意 选项b中当x 10时 y 2 e10 远远大于4 3 不合题意 选项c中的函数在 0 上为减函数 不合题意 故选d d 4 调查了某地若干户家庭的年收入x 单位 万元 和年饮食支出y 单位 万元 调查显示年收入x与年饮食支出y具有线性相关关系 并由调查数据得到y对x的线性回归方程 y 0 254x 0 321 由线性回归方程可知 家庭年收入每增加1万元 年饮食支出平均增加 万元 解析 以x 1代替x 得y 0 254 x 1 0 321与y 0 254x 0 321相减可得 家庭年收入每增加1万元 年饮食支出平均增加0 254万元 0 254 5 某厂的生产原料耗费x 单位 百万元 与销售额y 单位 百万元 之间
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 预防医学科疫苗接种指导原则规范指南
- 立足本职岗位践行爱国奋斗精神
- 大学生自我生涯规划
- 2025年高级会计师之高级会计实务题库附答案(典型题)
- 关于成立项目部应急管理领导小组的通知范文
- 重庆市建筑施工企业安全员c3证考试题库
- 2025合作共赢合同模板
- 2025【经纪人公司与歌手签约合同范本】
- 2025数据处理与保密协议合同书
- 耳廓肿物手术后护理方案
- 语义计算中的本体论构建方法
- DB32T3748-2020 35kV及以下客户端变电所建设标准
- 中华民族共同体概论课件专家版6第六讲 五胡入华与中华民族大交融(魏晋南北朝)
- 职业暴露应急预案及处理流程
- 鄂尔多斯市普通住小区物业管理服务等级标准和收费指导价格
- 植保无人机培训课件
- 胆总管结石伴急性化脓性梗阻性胆管炎的护理查房
- 六年级数学上册第一单元测试卷及答案
- 软件系统 培训课件
- 人工智能在教育中的安全与隐私问题
- 附录C.1 陆上风电、光伏建设项目质量验收范围划分1
评论
0/150
提交评论