




已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 建立实际回归模型的过程 实际问题设置指标变量解释变量的重要性 不相关性 用相近的变量代替或几个指标复合 个数适当 这个过程需反复试算收集整理数据时间序列数据 随机误差项的序列相关 如人们的消费习惯横截面数据 随机误差项的异方差性 如居民收入与消费样本容量的个数应比解释变量个数多缺失值 异常值处理构造理论模型绘制yi与xi的样本散点图 如生产函数 投资函数 需求函数估计模型参数 最小二乘 偏最小二乘 主成分回归等 依靠软件 模型检验 统计检验和模型经济意义检验 从设置指标变量修改模型运用经济因素分析 经济变量控制 经济决策预测 2 线性回归实例选讲 牙膏的销售量 1 问题 建立牙膏销售量与价格 广告投入之间的模型 预测在不同价格和广告费用下的牙膏销售量 收集了30个销售周期本公司牙膏销售量 价格 广告费用 及同期其他厂家同类牙膏的平均售价 3 明确问题一牙膏的销售量 确定关系 牙膏销售量 价格 广告投入内部规律复杂 数据统计分析常用模型 回归模型 数学原理 软件30个销售周期数据 销售量 价格 广告费用 同类产品均价 4 2 基本模型 y 公司牙膏销售量x1 其它厂家与本公司价格差x2 公司广告费用 解释变量 回归变量 自变量 被解释变量 因变量 多元回归模型 5 Matlab统计分析 rcoplot r rint 残差及其置信区间作图MATLAB7 0版本s增加一个统计量 剩余方差s2 statisticstoolbox 解释变量 矩阵 显著性水平 0 05 系数 估计值 置信区间 残差向量y xb 置信区间 被解释变量 列 检验统计量 R2 F p x 3 模型求解 由数据y x1 x2估计 x ones size x1 x1 x2 x2 2 b bint r rint stats regress y x 程序 6 4 结果分析 故x22项显著 但可将x2保留在模型中 即 y的90 54 可由模型确定 F远超过F检验的临界值 p远小于 0 05 显著性 整体显著 x2 2置信区间包含零点 但右端点距零点很近 x2对因变量y的影响不太显著 3显著 7 控制价格差x1 0 2元 投入广告费x2 6 5百万元 销售量预测区间为 7 8230 8 7636 置信度95 上限用作库存管理的目标值 下限用来把握公司的现金流 若估计x3 3 9 设定x4 3 7 百万支 销售量预测 价差x1 它厂价x3 公司价x4 估计x3 调整x4 控制x1 预测y 得 则可以95 的把握知道销售额在7 8320 3 7 29 百万元 以上 8 5 模型改进 x1和x2对y的影响独立 比较 置信区间 R2 9 比较 两模型销售量预测 控制价格差x1 0 2元 投入广告费x2 6 5百万元 百万支 区间 7 8230 8 7636 区间 7 8953 8 7592 百万支 预测区间长度更短 略有增加 10 x2 6 5 x1 0 2 x1 x1 x2 x2 6 比较 两模型与x1 x2的关系 11 讨论 交互作用影响 价格差x1 0 1价格差x1 0 3 广告投入 y x2大于6百万元 价格差较小时增加的速率更大 x2 价格优势 y 价格差较小 广告作用大 x1 x2 12 多元二项式回归 命令 rstool x y model alpha 13 完全二次多项式模型 MATLAB中有命令rstool直接求解 从输出Export可得 鼠标移动十字线 或下方窗口输入 可改变x1 x2 左边窗口显示预测值及预测区间 Rstool x y model alpha xname yname 14 牙膏的销售量 建立统计回归模型的基本步骤 根据已知数据从常识和经验分析 辅之以作图 决定回归变量及函数形式 先取尽量简单的形式 用软件 如MATLAB统计工具箱 求解 对结果作统计分析 R2 F p s2是对模型整体评价 回归系数置信区间是否含零点检验其影响的显著性 模型改进 如增添二次项 交互项等 对因变量进行预测 15 非线性回归实例选讲 酶促反应 问题 研究酶促反应 酶催化反应 中 嘌呤霉素 处理与否 对反应速度与底物 反应物 浓度之间关系的影响 酶促反应由酶作为催化剂催化进行的化学反应生物体内的化学反应绝大多数属于酶促反应酶促反应中酶作为高效催化剂使得反应以极快的速度 103 1017倍 或在一般情况下无法反应的条件下进行酶是生物体内进行各种化学反应最重要的因素 16 建立数学模型 反映该酶促反应的速度与底物浓度以及经嘌呤霉素处理与否之间的关系设计了两个实验酶经过嘌呤霉素处理酶未经嘌呤霉素处理实验数据 方案 17 分析 酶促反应的基本性质底物浓度较小时 反应速度大致与浓度成正比 底物浓度很大 渐进饱和时 反应速度趋于固定值 数据分析 18 解决方案一 线性化模型 经嘌呤霉素处理后实验数据的估计结果 对 1 2非线性 19 线性化模型结果分析 x较大时 y有较大偏差 1 x较小时有很好的线性趋势 1 x较大时出现很大的起落 线性化 参数估计时x较小 1 x很大 的数据控制了回归参数的确定改进 非线性模型 20 beta的置信区间 回归分析 非线性 statisticstoolbox 解释变量 矩阵 模型的函数M文件名 参数估计值 残差 参数初值 被解释变量 列 估计预测误差的Jacobi矩阵 解决方案二 非线性化模型 MATLAB统计工具箱 21 beta R J nlinfit x y model beta0 beta的置信区间 MATLAB统计工具箱 functiony f1 beta x y beta 1 x beta 2 x x y beta0 195 80270 04841 beta R J nlinfit x y f1 beta0 betaci nlparci beta R J beta betaci beta0 线性化模型估计结果 Matlab程序 22 半速度点 达到最终速度一半时的底物浓度x值 为 o 原始数据 拟合结果 非线性模型结果分析 其他输出 命令nlintool给出交互画面 最终反应速度为 给出交互画面拖动画面的十字线 得y的预测值和预测区间画面左下方的Export输出其它统计结果 剩余标准差s 10 9337 23 在同一模型中考虑嘌呤霉素处理的影响 用未经嘌呤霉素处理的模型附加增量的方法 混合反应模型 x2示性变量 x2 1表示经过处理 x2 0表示未经处理 24 用nlinfit和nlintool命令参数初值 基于对数据的分析 o 原始数据 拟合结果 估计结果和预测 剩余标准差s 10 4000 2置信区间包含零点 表明 2对因变量y的影响不显著 混合模型求解 25 简化的混合模型 估计结果和预测 简化的混合模型形式简单参数置信区间不含零点 剩余标准差s 10 5851 比一般混合模型略大 26 简化混合模型的预测区间较短 更为实用 有效 预测区间为预测值 一般混合模型与简化混合模型预测比较 结果分析 27 酶促反应 评注 注 非线性模型拟合程度的评价无法直接利用线性模型的方法 但R2与s仍然有效 反应速度与底物浓度的关系 非线性关系 求解线性模型 求解非线性模型 嘌呤霉素处理与否对反应速度与底物浓度关系的影响 混合模型 简化模型 28 先用线性模型来简化参数估计 但由于变量的代换已经隐含了误差扰动项的变换 因此 除非变换后的误差项仍具有常数方差 一般情况下我们还需要采用原始数据做非线性回归 而把线性化模型的参数估计结果作为非线性模型参数估计的迭代初值 29 模型三软件开发人员的薪金 薪金 资历 岗位 学历建立模型 分析人事策略的合理性 作为新聘用人员薪金的参考 资历 从事专业工作的年数 管理 1 管理人员 0 非管理人员 教育 1 中学 2 大学 3 更高程度 46名软件开发人员的档案资料 30 模型假设 假设 y 薪金 x1 资历 年 x2 1 管理人员 0 非管理人员 1 中学2 大学3 更高 假设 资历每加一年薪金的增长是常数 管理 教育 资历之间无交互作用 教育 模型 线性回归 回归系数随机误差 31 模型求解 x1 资历 年 x2 1 管理 0 非管理中学 x3 1 x4 0 大学 x3 0 x4 1 更高 x3 0 x4 0 Matlab程序 xinjindata mxinjin m xinjindata m 序号 工资y 资历x1 管理x2 学历 x3 x4 xx xinjin m M dlmread xinjindata m x1 M 3 x2 M 4 x3 M 6 x4 M 7 y M 2 x ones size x1 x1x2x3x4 b bi r ri s regress y x 32 R2 F p 模型整体上可用资历增加1年薪金增长546管理人员薪金多6883中学程度薪金比更高的少2994大学程度薪金比更高的多148a4置信区间包含零点 解释不可靠 结果 33 结果分析 残差分析法 残差 与资历x1的关系 残差大概分成3个水平6种管理 教育组合混在一起 未正确反映 34 与管理x2 教育x3 x4的关系 残差全为正 或全为负 管理 教育组合处理不当 应在模型中增加管理x2与教育x3 x4的交互项 残差分析 35 模型改进 增加管理x2与教育x3 x4的交互项 R2 F有改进回归系数置信区间 不含零点模型可用 Matlab xinjin3 m 36 消除了不正常现象异常数据 33号 去掉 残差分析 e x1 e 组合 37 去掉异常数据后的结果 模型改进 R2 0 957 0 999 0 9998F 226 554 36701置信区间长度更短 38 残差分析 残差图正常模型的结果 可以应用 x1 组合 39 模型应用 制订基础薪金资历为0 x1 0管理 教育组合 6种 大学程度管理人员比更高程度管理人员的薪金高 大学程度非管理人员比更高程度非管理人员的薪金略低 教育1中学 x3 1 x4 02大学 x3 0 x4 13更高 x3 0 x4 0 40 评注 对定性因素 如管理 教育可以引入0 1变量处理0 1变量的个数应比定性因素的水平少1残差分析 可以发现模型的缺陷引入交互作用项常常能够改善模型剔除 异常数据有助于得到更好的结果另 可以直接对6种管理 教育组合引入5个0 1变量 41 随机过程是研究随机动态系统演变过程规律性的学科广泛地应用于通信 控制 生物 地质 经济 管理 能源 气象等许多领域 马氏链 MarkovChain 模型 时间 状态均为离散的随机转移过程系统在每个时期所处的状态是随机的从一时期到下时期的状态按一定概率转移下时期状态只取决于本时期状态和转移概率已知现在 将来与过去无关 无后效性 42 模型一健康与疾病 人的健康状态随着时间的推移会随机地发生转变保险公司要对投保人未来的健康状态作出估计 以制订保险金和理赔金的数额 人的健康状况分为健康和疾病两种状态设对特定年龄段的人今年健康 明年保持健康状态的概率为0 8今年患病 明年转为健康状态的概率为0 7若某人投保时健康 问10年后他仍处于健康状态的概率 问题1 43 在一个离散时间集合T 0 1 2 和一个有限或可列无穷的状态空间S 1 2 上 一个随机过程在任一时刻从一个状态以一定的概率向其他状态转移 或保持原状态不变 记Xn为时刻n时时刻过程所处的状态 n 1 2 假定 在时刻0 过程所处的状态X0是S上的一个随机变量 在任一时刻n 给定X0 Xn 1 Xn时 Xn 1的条件分布只与Xn有关 而与X0 Xn 1无关 满足上述条件的随机过程为马尔可夫链 简称马氏链 马氏链 44 醉鬼在路中央 向前一步的概率为p 向后退一步的概率为1 p 他的运动是一种随机走动 是一种马尔可夫链 状态空间S 0 1 2 无限状态马氏链 一只荷兰猪在一个分成四个房间的笼子里随机运动 当它在任一时刻 处于任一房间是地 在下一时刻的概率为1 3 是一种马尔可夫链 状态空间S 1 2 3 4 45 状态与状态转移 模型 给定a 0 预测a n n 1 2 状态 转移 转移方程 今年健康 明年保持健康状态的概率为0 8今年患病 明年转为健康状态的概率为0 7 p11 0 8 p12 0 2p21 0 7 p22 0 3 1 健康2 疾病 46 状态 符号分析 已知 状态概率 转移概率 转移方程 可见 Xn 1只取决于Xn和pij 与Xn 1 无关状态转移具有无后效性 47 n input n A zeros 2 n 1 A 1 1 input a01 A 2 1 1 A 1 1 fori 1 nA 1 i 1 0 8 A 1 i 0 7 A 2 i A 2 i 1 0 2 A 1 i 0 3 A 2 i endA 数值分析 p11 0 8 p12 0 2p21 0 7 p22 0 3 1 健康2 疾病 48 n 时 状态概率趋于稳定值稳定值与初始状态无关 结果 49 状态健康和疾病 Xn 1 健康 Xn 2 疾病第3种状态 死亡 Xn 3已知 p11 0 8 p12 0 18 p13 0 02p21 0 65 p22 0 25 p23 0 1p31 0 p32 0 p33 1若某人投保时健康 问n年后各状态的概率 问题2 50 状态与状态转移 模型 状态 转移 转移方程 51 n input n A zeros 3 n 1 A 1 1 input a01 A 2 1 input a02 A 3 1 1 A 1 1 A 2 1 fori 1 nA 1 i 1 0 8 A 1 i 0 65 A 2 i 0 A 3 i A 2 i 1 0 18 A 1 i 0 25 A 2 i 0 A 3 i A 3 i 1 0 02 A 1 i 0 1 A 2 i 1 A 3 i endA 52 设投保时处于健康状态 预测a n n 1 2 分析 初始状态 最终都要转到状态3一旦a1 k a2 k 0 a3 k 1 n k a1 n 0 a2 n 0 a3 n 1从状态3不会转移到其它状态 53 理论 状态 基本方程 马氏链的基本方程 状态概率 转移概率 54 1 正则链 马氏链的两个重要类型 任一状态出发经有限次转移 以正概率到达另外任一状态 w 稳态概率 例1 特征向量 定义对于马氏链 若存在一正整数N 使其转移矩阵的N次幂MN 0 每一分量均大于0 则称此马尔链为一正则 regular 链 55 存在吸收状态一旦到达就不会离开的状态且从任一非吸收状态出发经有限次转移能以正概率到达吸收状态 2 吸收链 有非零元素 yi 从第i个非吸收状态出发 被某个吸收状态吸收前的平均转移次数 转移矩阵 n r个非吸收状态 有r个吸收状态 56 模型二钢琴销售的存贮策略 钢琴销售售量很小商店的库存量不大以免积压资金一家商店根据经验估计 平均每周的钢琴需求为1架存贮策略每周末检查库存量仅当库存量为零时 才订购3架供下周销售否则 不订购 问题 估计在这种策略下失去销售机会的可能性有多大 以及每周的平均销售量是多少 背景与问题 57 分析与假设 需求 顾客的到达相互独立需求量近似服从波松分布 其参数由需求均值为每周1架确定 计算不同的需求概率失去销售机会 需求超过库存 动态过程 概率存贮策略 周末库存量为零时订购3架 周初到货 否则 不订购周末的库存量 0 1 2 3周初的库存量 1 2 3共三种状态用马氏链描述不同需求导致的周初库存状态的变化以每周初的库存量作为状态变量状态转移具有无后效性在稳态情况下 时间充分长以后计算该存贮策略失去销售机会的概率 每周的平均销售量 动态过程中每周销售量不同 失去销售机会 需求超过库存 的概率不同 58 状态转移规律 模型 Dn 第n周需求量 泊松分布 状态变量 Sn 第n周初库存量 均值为1 需求量 需求量 进货量 状态转移矩阵 59 则 计算 Dn 第n周需求量 均值为1的泊松分布 Sn 第n周初库存量 状态变量 状态转移规律 60 状态概率 马氏链的基本方程 已知初始状态 可预测第n周初库存量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专升本每日一练试卷(原创题)附答案详解
- 中级银行从业资格之中级银行业法律法规与综合能力通关检测卷带答案详解(突破训练)
- 自考专业(汉语言文学)练习题【综合题】附答案详解
- 重难点解析河南省邓州市中考数学真题分类(平行线的证明)汇编同步训练试卷(含答案详解)
- 自考专业(教育管理)模拟试题附完整答案详解【考点梳理】
- 自考专业(护理)模拟题库附参考答案详解(黄金题型)
- 中级银行从业资格之中级银行业法律法规与综合能力能力检测试卷及答案详解(全优)
- 企业营销自动化工具开发方案
- 自考专业(金融)考前冲刺测试卷【典优】附答案详解
- 航运物流集装箱管理优化策略
- 梁的弯曲振动-振动力学课件
- 说专业-物流管理专业
- 用友U8全产品功能介绍
- 医院突发公共卫生事件应急预案
- 建筑工程安全生产责任书
- GMAT数学概念单词
- 三基考试题库3
- 化工安全与环保PPT
- 流体力学的课件
- 《城市管理综合执法问题研究国内外文献综述》4800字
- 新录用公务员取消录用审批表
评论
0/150
提交评论