




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3讲 回归分析与独立性检验 1 变量间的关系 1 常见的两变量之间的关系有两类 一类是函数关系 另一类是 与函数关系不同 是一种非确 定性关系 相关关系 相关关系 2 将样本中n个数据点 xi yi i 1 2 n 描在平面直角坐标系中 表示两个变量关系的一组数据的图形叫做散点图 3 正相关 负相关 在散点图中 点散布在从 到 的区域 对于两个变量的这种相关关系称为正相关 在散点图中 点散布在从 到 的区域 两个变量的这种相关关系称为负相关 左下角 右上角 左上角 右下角 2 回归分析 1 定义 对具有 的两个变量进行统计分析的一种常用方法 2 线性相关关系 相关关系 回归直线 观察散点图的特征 如果散点图中点的分布从整体上看大致在一条直线附近 我们就称这两个变量之间具有线性相关关系 这条直线叫做 3 回归直线的求法对于一组具有线性相关关系的数据 x1 y1 x2 y2 xn yn 通过求 的最小值而得到回归直线 的方法 即求回归直线 使得样本数据的点到它的距离的平方和 这一方法叫做最小二乘法 则回归直线方程 最小 样本点的中心 4 线性相关强度的检验 叫做y与x的相关系数 简称 相关系数 当r 0时 表明两个变量 当r 0时 表明两个变量 r的绝对值越接近于1 表明两个变量的线性相关性 r的绝对值越接近于0 表明两个变量之间 通常 r 大于 时 认为两个 变量有很强的线性相关性 负相关 越强 线性相关关系 0 75 正相关 几乎不存在 5 相关指数 越小 越好 r2的值越大 说明残差平方和 也就是说模型的拟合效果 在线性回归模型中 r2表示解释变量对于预报变量变化的贡献率 r2越接近于1 表示回归的效果越好 3 独立性检验 不同类别 频数表 1 分类变量 变量的不同 值 表示个体所属的 像这类变量称为分类变量 2 列联表 列出两个分类变量的 称为列联表 假设有两个分类变量x和y 它们的可能取值分别为 x1 x2 和 y1 y2 其样本频数列联表 称为2 2列联表 为2 2列联表 a b c d 构造一个随机变量k2 其中n 为样本容量 3 独立性检验 利用随机变量 来判断 两个分类变量 的方 法称为独立性检验 k2 有关系 1 有关线性回归的说法 不正确的是 d a 相关关系的两个变量是非确定关系b 散点图能直观地反映数据的相关程度c 回归直线最能代表线性相关的两个变量之间的关系d 散点图中的点越集中 两个变量的相关性越强 2 2013年湖北 四名同学根据各自的样本数据研究变量x y之间的相关关系 并求得回归直线方程 分别得到以下四个结论 其中一定不正确的结论的序号是 d a b c d 3 通过随机询问110名性别不同的大学生是否爱好某项运动 得到如下的列联表 附表 参照附表 得到的正确结论是 a a 有99 以上的把握认为 爱好该项运动与性别有关 b 有99 以上的把握认为 爱好该项运动与性别无关 c 在犯错误的概率不超过0 1 的前提下 认为 爱好该项运动与性别有关 d 在犯错误的概率不超过0 1 的前提下 认为 爱好该项运动与性别无关 4 2013年广东江门一模 某产品的广告费用x与销售额y的统计数据如下表 报广告费用为6万元时销售额为 万元 65 5 5 某高校 统计初步 课程的教师随机调查了选该课的一些学生情况 具体数据如下表 以判定主修统计专业与性别有关系 那么这种判断出错的可能 性为 5 为了判断主修统计专业是否与性别有关系 根据表中的数 考点1线性回归分析 例1 某种产品的宣传费支出x与销售额y 单位 万元 之 间有如下对应数据 1 画出散点图 2 求线性回归方程 3 试预测宣传费支出为10万元时 销售额多大 解 1 根据表中所列数据可得散点图如图d42 图d42 即这种产品的销售额大约为82 5万元 方法与技巧 回归分析是处理变量相关关系的一种数学 方法 它主要解决三个问题 确定两个变量之间是否有相关关系 如果有 就找出它 们之间贴近的数学表达式 根据一组观察值 预测变量的取值及判断变量取值的变 化趋势 求出线性回归方程 解决上述问题时需注意 的计算量大 计算时应仔细谨慎 分层进行 避免因计算而产 这与一次函数的习惯表示不同 利用线性回归方程可以对总体进行预测估计 依据自变量的取值估计和预报因变量的值 根据回归方程进行预报 仅是一个预报值 而不是真实发生的值 互动探究 1 2012年湖南 设某大学的女生体重y 单位 kg 与身高x 单位 cm 具有线性相关关系 根据一组样本数据 xi yi i 则下列结论中不正确的是 d a y与x具有正的线性相关关系c 若该大学某女生身高增加1cm 则其体重约增加0 85kgd 若该大学某女生身高为170cm 则可断定其体重必为58 79kg 2 2013年福建 已知x与y之间的几组数据如下表 b x a 则以下结论正确的是 某同学根据上表中前两组数据 1 0 和 2 2 求得的直线方程为y 而两组数据 1 0 和 2 2 组成的直线方程为y 2x 2 即b 2 a 2 故选c 答案 c 考点2独立性检验 例2 冶炼某种金属可以用旧设备和改造后的新设备 为了检验用这两种设备生产的产品中所含杂质的关系 调查结果如下表所示 根据以上数据试判断含杂质的高低与设备改造有无关系 解 由已知数据得到如下2 2列联表 由于13 11 10 828 故有99 9 的把握认为含杂质的高低与设备是否改造是有关系的 方法与技巧 两个分类变量x y是否有关系的独立性 检验的步骤 根据题意 列出2 2列联表 利用公式 由观测数据 求出k2的观测值k 作判断 如果k k0 就以 1 p k2 k0 100 的把握认为 x和y有关系 否则就说样本数据没有提供充分的证据说明 x和y有关系 互动探究 3 2012年广东茂名模拟测试 对人们的休闲方式的一次调查中 共调查了100人 其中女性60人 男性40人 女性中有38人主要的休闲方式是看电视 另外22人主要的休闲方式是运动 男性中有15人主要的休闲方式是看电视 另外25人主要的休闲方式是运动 1 根据以上数据建立一个2 2列联表 2 判断性别与休闲方式是否有关 参考数据 60 40 53 47 5978400 620 620 384400 384400 59784 6 4298 解 1 2 2列联表如下 因为k 5 024 所以有理由认为假设 休闲方式与性别无关 是不合理的 即有97 5 的把握认为 休闲方式与性别有关 2 假设 休闲方式与性别无关 考点3回归分析的综合运用 例3 某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系 他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数 得到如下资料 该兴趣小组确定的研究方案是 先从这六组数据中选取2组 用剩下的4组数据求线性回归方程 再用被选取的2组数据进行检验 1 求选取的2组数据恰好是相邻两个月的概率 2 若选取的是1月与6月的两组数据 请根据2至5月份 3 若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人 则认为得到的线性回归方程是理想的 试问该小组所得线性回归方程是否理想 解 将6组数据按月份顺序编号为1 2 3 4 5 6 从中任取两组数据 基本事件构成的集合为 1 2 1 3 1 4 1 5 1 6 2 3 2 4 2 5 2 6 3 4 3 5 3 6 4 5 4 6 5 6 共15个基本事件 设抽到相邻两个月的事件为a 则a 1 2 2 3 3 4 4 5 5 6 共5个基本事件 p a 所以该小组所得线性回归方程是理想的 方法与技巧 利用线性回归方程可以对总体进行预测估计 线性回归方程将部分观测值所反映的规律进行延伸 是我们对有线性相关关系的两个变量进行分析和控制的依据 互动探究 4 已知x y之间的一组数据如下表 对于表中数据 甲 乙两同学给出的拟合直线分别为l1 y 直线是 填l1或l2 答案 l2 易错 易混 易漏 对回归分析的理解 例题 一台机器使用时间较长 但还可以使用 它按不同的转速生产出来的某机械零件有一些会有缺点 每小时生产有缺点零件的多少 随机器运转的速度而变化 下表为抽样试验结果 1 对变量y与x进行相关性检验 2 如果y与x有线性相关关系 求线性回归方程 3 若实际生产中 允许每小时的产品中有缺点的零件最多为10个 那么 机器的运转速度应控制在什么范围内 结果保留整数 审题关键点 1 对变量y与x进行相关性检验 2 在确定具有线性相关性的前提下 求线性回归方程 3 利用线性回归方程进行相关分析
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 想变成狗的猫绘本课件
- 2026届山西省翼城中学化学高二第一学期期末学业水平测试试题含答案
- 患者搬运法课件
- 恐龙课件文案
- 塔吊保养考试题及答案
- 机电矿长考试题及答案
- 护士小组面试题及答案
- 中航西飞招聘考试试题及答案
- 停车起步考试题及答案
- 小学剪纸试题及答案
- 2025年度运输业安全生产知识竞赛试题(附答案)
- 光伏居间的合同8篇
- 从业人员培训管理制度
- 医疗风险防控培训课件
- 酒店前台礼貌礼节培训
- 诊疗规范培训课件
- 幸福心理学-(彭凯平)
- 2025年中邮保险招聘笔试参考题库含答案解析
- 《中国老年糖尿病诊疗指南(2024版)》解读课件
- 《中国女性乳腺癌患者糖尿病和糖尿病前期管理专家共识》 (2024版)
- 特种设备安全检查与巡查制度
评论
0/150
提交评论