随机性模型及MATLAB统计工具箱在建模中应用_第1页
随机性模型及MATLAB统计工具箱在建模中应用_第2页
随机性模型及MATLAB统计工具箱在建模中应用_第3页
随机性模型及MATLAB统计工具箱在建模中应用_第4页
随机性模型及MATLAB统计工具箱在建模中应用_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、确定性模型和随机性模型随机因素可以忽略随机因素影响可以简单地以平均值的作用出现随机因素影响必须考虑概率模型统计回归模型马氏链模型确定性模型随机性模型概 率 模 型例: 报童的利润为了获得最大的利润,报童每天应购进多少份报纸? 162天报纸需求量的调查 报童早上购进报纸零售,晚上将未卖掉的报纸退回。 购进价b(=0.8元)零售价a (=1元)退回价c(=0.75元)售出一份赚 a-b退回一份赔 b-c 136 214 195 219 224 197 213 187 187 230 172 227 157 114 156 问题分析购进太多卖不完退回赔钱购进太少不够销售赚钱少应根据需求确定购进量每天

2、需求量是随机的目标函数应是长期的日平均利润每天收入是随机的存在一个合适的购进量= 每天收入的期望值随机性优化模型需求量的随机规律由162天报纸需求量的调查得到 每天需求量为 r 的概率 f(r), r=0,1,2模型建立 设每天购进 n 份,日平均收入为 G(n)求 n 使 G(n) 最大 已知售出一份赚 a-b;退回一份赔 b-cr视为连续变量模型建立模型建立由(1)或(2)得到的n是每天平均利润最大的最佳购进量。结果解释nP1P2取n使 a-b 售出一份赚的钱 b-c 退回一份赔的钱0rpMATLAB 统计工具箱常用命令(一)命令名称输入输出n,y=hist(x,k)频数表x: 原始数据行

3、向量k:等分区间数n: 频数行向量y: 区间中点行向量hist(x,k)直方图同上直方图m=mean(x)均值x: 原始数据行向量均值ms=std(x)标准差同上标准差s功能概率密度分布函数逆概率分布均值与方差随机数生成字符pdfcdfinvstatrnd分布均匀分布指数分布正态分布2分布t分布F分布二项分布泊松分布字符 unifexpnormchi2 t fbinopoissMATLAB 统计工具箱常用命令(一)y=normpdf(1.5,1,2) 正态分布x=1.5的概率密度 (=1, =2) y=fcdf(1,10, 50) F分布x= 1的分布函数 (自由度n1=10, n2=50)y

4、 =tinv(0.9,10) 概率=0.9的逆t分布 (分位数, 自由度n=10) 由 计算 n用MATLAB 统计工具箱求解报童模型 根据数据确定需求量的概率分布 p(x)baotongdata.mbaotong1.m回 归 模 型拟合问题实例 给药方案 1. 在快速静脉注射的给药方式下,研究血药浓度(单位体积血液中的药物含量)的变化规律。问题2. 给定药物的最小有效浓度和最大治疗浓度,设计给药方案 (每次注射剂量, 间隔时间) 。分析 t (h) 0.25 0.5 1 1.5 2 3 4 6 8c (g/ml) 19.21 18.15 15.36 14.10 12.89 9.32 7.45

5、 5.24 3.01实验:血药浓度数据 c(t) (t=0注射300mg)半对数坐标系(semilogy)下c(t)的图形 理论:用一室模型研究血药浓度变化规律负指数规律拟合问题实例 给药方案 实验数据tcc00 xueyao1.m实验数据作图3.血液容积v, t=0注射剂量d, 血药浓度立即为d/v2.药物排除速率与血药浓度成正比,比例系数k(0)模型假设1.机体看作一个房室,室内血药浓度均匀一室模型模型建立由假设2由假设3给药方案 设计 设每次注射剂量D, 间隔时间 血药浓度c(t) 应c1 c(t) c2 初次剂量D0 应加大给药方案记作给定c1=10, c2=25,为确定 只需确定参数

6、 k,vcc2c10t参数估计由实验数据拟合曲线c(t)以估计k,v参数线性化用实验数据作线性最小二乘拟合xueyao2.m思考:取对数化为线性最小二乘, 对结果有影响吗?c1=10, c2=25给药方案 设计直线拟合:a=polyfit(x,y,1),b=polyfit(x,z,1),同一条直线 y=0.33x+0.96(z=0.33x+0.96)从拟合到回归x= 0 1 2 3 4 , y= 1.0 1.3 1.5 2.0 2.3 ( + 号)x= 0 1 2 3 4 , z= 0.6 1.95 0.9 2.85 1.8 (*号)问题:你相信哪个拟合结果?怎样给以定量评价?得到a= 0.3

7、3 0.96b= 0.33 0.96收集一组包含因变量和自变量的数据;选定因变量与自变量之间的模型,利用数据按照最小二乘准则计算模型中的系数;利用统计分析方法对不同的模型进行比较,找出与数据拟合得最好的模型;判断得到的模型是否适合于这组数据, 诊断有无不适合回归模型的异常数据;利用模型对因变量作出预测或解释。回归分析的主要步骤2004 B题 电力市场的输电阻塞管理确定各线路上潮流关于各发电机组出力的近似表达式 当前时段各发电机组出力 p1(0), , pn(0), 线路潮流 uj(0)a0 答卷中的问题:没有常数项 a0;没有统计检验p(0)+p0ua0=0 例1: 血压与年龄、体重指数、吸烟

8、习惯 序号 血压年龄体重指数吸烟习惯 序号 血压年龄体重指数吸烟习惯11443924.20211363625.0022154731.11221425026.2131384522.60231203923.50101545619.30301756927.41体重指数 = 体重(kg) / 身高(m) 的平方 吸烟习惯: 0表示不吸烟,1表示吸烟 建立血压与年龄、体重指数、吸烟习惯之间的回归模型模型建立血压y,年龄x1,体重指数x2,吸烟习惯x3 y与x1的散点图y与x2的散点图线性回归模型回归系数0, 1, 2, 3 由数据估计, 是随机误差 MATLAB 统计工具箱常用命令(二) b=regre

9、ss(y,X) b,bint,r,rint,s=regress(y,X,alpha)输入: y因变量(列向量), X1与自变量组成的矩阵,Alpha显著性水平(缺省时设定为0.05)s: 3个统计量:决定系数R2,F值, F(1,n-2)分布大于F值的概率p,p时回归模型有效. 输出:b=(),bint: b的置信区间,r:残差(列向量),rint: r的置信区间rcoplot(r,rint)残差及其置信区间作图MATLAB7.0版本 s增加一个统计量: 剩余方差s2.回归系数回归系数估计值回归系数置信区间045.36363.5537 87.173610.3604-0.0758 0.7965

10、23.09061.0530 5.1281311.8246-0.1482 23.7973R2= 0.6855 F= 18.8906 p0.0001 s2 =169.7917模型求解回归系数回归系数估计值回归系数置信区间058.510129.9064 87.113810.43030.1273 0.733222.34490.8509 3.8389310.30653.3878 17.2253R2= 0.8462 F= 44.0087 p0.0001 s2 =53.6604剔除异常点(第2点和第10点)后xueya01.m例2 软件开发人员的薪金资历 从事专业工作的年数;管理 1=管理人员,0=非管理人

11、员;教育 1=中学,2=大学,3=更高程度建立模型研究薪金与资历、管理责任、教育程度的关系分析人事策略的合理性,作为新聘用人员薪金的参考 编号薪金资历管理教育01138761110211608103031870111304112831020511767103编号薪金资历管理教育422783716124318838160244174831601451920717024619346200146名软件开发人员的档案资料 分析与假设 y 薪金,x1 资历(年)x2 = 1 管理人员,x2 = 0 非管理人员1=中学2=大学3=更高资历每加一年薪金的增长是常数;管理、教育、资历之间无交互作用 教育线性回

12、归模型 a0, a1, , a4是待估计的回归系数,是随机误差 中学:x3=1, x4=0 ;大学:x3=0, x4=1; 更高:x3=0, x4=0 模型求解参数参数估计值置信区间a011032 10258 11807 a1546 484 608 a26883 6248 7517 a3-2994 -3826 -2162 a4148 -636 931 R2=0.957 F=226 p=0.000R2,F, p 模型整体上可用资历增加1年薪金增长546 管理人员薪金多6883 中学程度薪金比更高的少2994 大学程度薪金比更高的多148 a4置信区间包含零点,解释不可靠!中学:x3=1, x4=

13、0;大学:x3=0, x4=1; 更高:x3=0, x4=0. x2 = 1 管理,x2 = 0 非管理x1资历(年)xinjindata.m xinjin.m 残差分析方法 结果分析残差e 与资历x1的关系 e与管理教育组合的关系 残差全为正,或全为负,管理教育组合处理不当 残差大概分成3个水平, 6种管理教育组合混在一起,未正确反映 应在模型中增加管理x2与教育x3, x4的交互项 组合123456管理010101教育112233管理与教育的组合进一步的模型增加管理x2与教育x3, x4的交互项参数参数估计值置信区间a01120411044 11363a1497486 508a270486

14、841 7255a3-1727-1939 -1514a4-348-545 152a5-3071-3372 -2769a618361571 2101R2=0.999 F=554 p=0.000R2,F有改进,所有回归系数置信区间都不含零点,模型完全可用 消除了不正常现象 异常数据(33号)应去掉 e x1 e 组合去掉异常数据后的结果参数参数估计值置信区间a01120011139 11261a1498494 503a270416962 7120a3-1737-1818 -1656a4-356-431 281a5-3056-3171 2942a619971894 2100R2= 0.9998 F=

15、36701 p=0.0000e x1 e 组合R2: 0.957 0.999 0.9998F: 226 554 36701 置信区间长度更短残差图十分正常最终模型的结果可以应用xinjindata2.m xinjin1.m 模型应用 制订6种管理教育组合人员的“基础”薪金(资历为0)组合管理教育系数“基础”薪金101a0+a39463211a0+a2+a3+a513448302a0+a410844412a0+a2+a4+a619882503a011200613a0+a218241中学:x3=1, x4=0 ;大学:x3=0, x4=1; 更高:x3=0, x4=0 x1= 0; x2 = 1

16、管理,x2 = 0 非管理大学程度管理人员比更高程度管理人员的薪金高 大学程度非管理人员比更高程度非管理人员的薪金略低 例3 商品销售量与价格 x1 (元)120140190130155175125145180150 x2 (元)10011090150210150250270300250y (个)10210012077469326696585某厂生产的一种电器的销售量y与竞争对手的价格x1及本厂的价格x2有关, 该商品在10个城市的销售记录如下 根据数据建立y与x1和x2的模型, 对得到的模型和系数进行检验。 若某市本厂产品售价160(元),竞争对手售价170(元),预测该市的销售量. 将(x

17、1,y),(x2,y)各10个点分别画图y与x2有较明显的线性关系,y与x1之间的关系难以确定需要对模型y=f(x1,x2)作几种尝试,用统计分析决定优劣。例3 商品销售量与价格 b,bint,r,rint,stats=regress(Y,X,alpha)例3 商品销售量与价格 一次函数的回归模型 回归系数回归系数估计值回归系数置信区间066.5176-32.5060 165.5411 10.4139-0.2018 1.0296 2-0.2698-0.4611 -0.0785 R2= 0.6527 F=6.5786 p= 0.0247 s2= 307.1639结果不是太好: =0.05时模型有

18、效,但 =0.01时模型不能用; R2 较小; 1的置信区间包含零点。 shangpin.mMATLAB 统计工具箱常用命令(三)rstool (x,y, model,alpha)xnm矩阵, n是数据容量, yn维列向量,alpha显著性水平多元二项式回归model从以下4个模型中选取: (设m=2)例3 商品销售量与价格 x1=; x2=; x=x1 x2; y=;rstool(x,y, quadratic)Export向工作区传送参数:beta-回归系数,rmse-剩余标准差s,residuals-残差(向量);以剩余标准差 rmse 最小为标准,比较4种模型Model: linear

19、purequadratic interaction quadratic rmse: 18.7362 16.6436 19.1626 18.6064 =(-312.5871 7.2701 -1.7337 -0.0228 0.0037)例3 商品销售量与价格 变量选择影响因变量的因素: 自变量x1, x2, xm及其简单函数, 如 将所有影响显著的因素都纳入回归模型; 最终的模型尽量简单, 即包含尽量少的因素。 变量选择的标准 从候选集合S=x1,xk中选出一子集S1 (含pk个自变量)与因变量y构造回归模型, 其优劣由s2度量. 影响显著的自变量进入模型时,Q明显下降,s减小; 影响很小的自变量进入模型时,Q下降不大,p的增加 会使s变大.变量选择与逐步回归 逐步回归 从候选集合中确定一初始子集; 从子集外(候选集合内)中引入一个对y影响显著的;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论