模型13:统计模型_第1页
模型13:统计模型_第2页
模型13:统计模型_第3页
模型13:统计模型_第4页
模型13:统计模型_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Email:sunyl@

数学建模第十三讲统计模型数学实验与模型一牙膏的销售量确定关系:牙膏销售量——价格、广告投入内部规律复杂

数据统计分析常用模型

回归模型

×

数学原理

软件30个销售周期数据:销售量、价格、广告费用、同类产品均价销售周期公司价(元)它厂价(元)广告(百万元)价差(元)销售量(百万支)13.853.805.50-0.057.3823.754.006.750.258.51………………293.803.855.800.057.93303.704.256.800.559.26分析y~公司牙膏销售量x1~其它厂家与本公司价格差x2~公司广告费用解释变量(回归变量,自变量)被解释变量(因变量)

y与x1y与x2t1.mt2.mt5.mMatlab统计分析MATLAB7.0版本s增加一个统计量:剩余方差s2[b,bint,r,rint,stats]=regress(y,X,alpha)3、回归分析statisticstoolbox解释变量:矩阵显著性水平:0.05

系数估计值

置信区间

残差

置信区间

被解释变量:列检验统计量:R2,F,p随机误差:正态分布均值为零回归系数rcoplot(r,rint)残差及其置信区间作图于是考察y与x1y与x2有结果t4.m多元回归模型模型MATLABt3.mt1x=[ones(size(x1)),x1,x2,x2.^2];[b,bint,r,rint,stats]=regress(y,x)程序模型改进x1和x2对y的影响有交互作用交互项参数估计值置信区间估计值置信区间

017.32445.728228.920629.113313.701344.5252

11.30700.68291.931111.13421.977820.2906

2-3.6956-7.49890.1077-7.6080-12.6932-2.5228

30.34860.03790.65940.67120.25381.0887

4-1.4777-2.8518-0.1037R2=0.9054F=82.9409p=0.0000R2=0.9209F=72.7771p=0.0000t6.m比较:置信区间、R2控制价格差x1=0.2元,投入广告费x2=6.5百万元比较:销售量预测(百万支)区间[7.8230,8.7636]区间[7.8953,8.7592](百万支)预测区间长度更短

略有增加

x2=6.5比较:两模型y与x1,x2关系x1=0.2x1x1x2x2讨论:交互作用影响价格差x1=0.1价格差x1=0.3广告投入y

(x2大于6百万元)价格差较小时增加的速率更大x2价格优势y

价格差较小

广告作用大x1x2完全二次多项式模型

MATLAB相应面分析Rstool(x,y,’model’,alpha,’xname’,’yname’)linearinteractionquadraticpurequadratic线性项常数项、线性项、交叉项交叉项、平方项常数项、线性项、平方项相应面分析rstool(x(:,2:3),y)x1x2Export:all:betarmseresiduals系数均方差残差评注回归模型数据、经验、图形回归变量、函数形式Matlab求解统计分析:R2、F、p回归系数置信区间包含0点改进添加二次项、交叉项……模型二软件开发人员的薪金薪金——资历、岗位、学历建立模型:分析人事策略的合理性,作为新聘用人员薪金的参考资历~从事专业工作的年数;管理~1=管理人员,0=非管理人员;教育~1=中学,2=大学,3=更高程度46名软件开发人员的档案资料

编号薪金资历管理教育01138761110211608103……………4519207170246193462001模型假设假设:y~薪金,x1~资历(年)x2=1~管理人员,0~非管理人员1~中学2~大学3~更高?假设:资历每加一年薪金的增长是常数;管理、教育、资历之间无交互作用教育=模型:线性回归回归系数随机误差中学:x3=1,x4=0;大学:x3=0,x4=1;更高:x3=0,x4=0模型求解

x1~资历(年)

x2=

1~管理,0~非管理中学:x3=1,x4=0;大学:x3=0,x4=1;更高:x3=0,x4=0Matlab程序:xinjindata.mxinjin.m

xinjindata.m:

序号、工资y、资历x1、管理x2、学历、x3、x4、xx

xinjin.m:M=dlmread('xinjindata.m');x1=M(:,3);x2=M(:,4);x3=M(:,6);x4=M(:,7);y=M(:,2);x=[ones(size(x1))x1x2x3x4][b,bi,r,ri,s]=regress(y,x)R2,F,p

模型整体上可用资历增加1年薪金增长546管理人员薪金多6883中学程度薪金比更高的少2994大学程度薪金比更高的多148

a4置信区间包含零点

解释不可靠!结果参数估计值置信区间a011032[1025811807]a1546[484608]a26883[62487517]a3-2994[-3826-2162]a4148[-636931]R2=0.957F=226p=0.000结果分析残差分析法残差

与资历x1的关系残差大概分成3个水平6种管理—教育组合混在一起,未正确反映Matlab:xinjin2.m

与管理x2—教育x3、x4的关系残差全为正,或全为负,管理—教育组合处理不当应在模型中增加管理x2与教育x3,x4的交互项组合123456管理010101教育112233管理与教育的组合残差分析模型改进增加管理x2与教育x3,x4的交互项R2,F有改进回归系数置信区间

不含零点模型可用参数估计值置信区间a011204[1104411363]a1497[486508]a27048[68417255]a3-1727[-1939-1514]a4-348[-545–152]a5-3071[-3372-2769]a61836[15712101]R2=0.999F=554p=0.000Matlab:xinjin3.m消除了不正常现象异常数据(33号)

去掉残差分析e~x1

e~组合Matlab:xinjin4.m去掉异常数据后的结果模型改进R2:0.957

0.999

0.9998F:226

554

36701置信区间长度更短xinjindata2.mxinjin1.m参数估计值置信区间a011200[1113911261]a1498[494503]a27041[69627120]a3-1737[-1818-1656]a4-356[-431–281]a5-3056[-3171–2942]a61997[18942100]R2=0.9998F=36701p=0.0000残差分析残差图正常模型的结果

可以应用

~x1

~组合xinjin2.m模型应用制订基础薪金资历为0:x1=

0管理—教育组合:6种大学程度管理人员比更高程度管理人员的薪金高大学程度非管理人员比更高程度非管理人员的薪金略低组合管理教育系数基础薪金101非管理+中学a0+a39463211管理+中学a0+a2+a3+a513448302非管理+大学a0+a410844412管理+大学a0+a2+a4+a619882503非管理+更高a011200613管理+更高a0+a218241教育1中学:x3=1,x4=02大学:x3=0,x4=13更高:x3=0,x4=0评注对定性因素:如管理、教育可以引入0-1变量处理0-1变量的个数应比定性因素的水平少1残差分析:可以发现模型的缺陷引入交互作用项常常能够改善模型剔除:异常数据有助于得到更好的结果另:可以直接对6种管理—教育组合引入5个0-1变量模型三酶促反应酶促反应由酶作为催化剂催化进行的化学反应生物体内的化学反应绝大多数属于酶促反应酶促反应中酶作为高效催化剂使得反应以极快的速度(103~1017倍)或在一般情况下无法反应的条件下进行酶是生物体内进行各种化学反应最重要的因素酶促反应动力学问题:研究酶促反应中——嘌呤霉素——对反应速度与底物(反应物)浓度之间关系的影响方案建立数学模型,反映该酶促反应的速度与底物浓度以及经嘌呤霉素处理与否之间的关系设计了两个实验酶经过嘌呤霉素处理酶未经嘌呤霉素处理实验数据:底物浓度(ppm)0.020.060.11反应速度处理764797107123139未处理6751848698115底物浓度(ppm)0.220.561.10反应速度处处理131124144158160/酶促反应的基本性质底物浓度较小时,反应速度大致与浓度成正比;底物浓度很大、渐进饱和时,反应速度趋于固定值分析Michaelis-Menten模型待定系数

=(

1

,2)基本模型酶促反应的速度底物浓度数据分析实验数据:散点图y~酶促反应速度x~底物浓度

xy0

1经嘌呤霉素处理xy未经嘌呤霉素处理xy模型mei.mmei1.m线性化模型经嘌呤霉素处理后实验数据的估计结果参数估计值(×10-3)置信区间(×10-3)参数估计值

15.107[3.5396.676]β1=1/

1195.8027

20.247[0.1760.319]β2=

2/

10.04841R2=0.8557F=59.2975p=0.0000对

1

,2非线性

1,

2线性

mei3.m结果分析mei4.m

x较大时,y有较大偏差1/x较小时有很好的线性趋势,1/x较大时出现很大的起落线性化:参数估计时x较小(1/x很大)的数据控制了回归参数的确定改进:非线性模型1/y1/xxyMatlab统计分析beta的置信区间[beta,R,J]=nlinfit(x,y,’model’,beta0)

3、回归分析:非线性statisticstoolbox解释变量:矩阵模型函数参数估计值残差参数初值被解释变量:列预测误差的Jacobi矩阵betaci=nlparci(beta,R,J)Matlab程序functiony=f1(beta,x)y=beta(1)*x./(beta(2)+x);x=…………;y=…………;beta0=[195.80270.04841];[beta,R,J]=nlinfit(x,y,’f1’,beta0);betaci=nlparci(beta,R,J);beta,betacif1.m

mei5.m

212.6819[197.2029228.1609]0.0641[0.04570.0826]结果分析最终反应速度为半速度点(达到最终速度一半时的x值)为效果参数估计值置信区间

1212.6819[197.2029228.1609]

20.0641[0.04570.0826]o-原始数据+-拟合结果mei6.m

其它输出给出交互画面拖动画面的十字线,得y的预测值和预测区间画面左下方的Export输出其它统计结果。剩余标准差s=10.9337nlintool(x,y,’model’,beta)mei7.m

在同一模型中考虑嘌呤霉素处理的影响混合反应模型底物浓度示性变量x2示性变量:x2=1表示经过处理,x2=0表示未经处理未经处理的最终反应速度经处理后最终反应速度增长值未经处理的反应的半速度点经处理后反应的半速度点增长值用nlinfit和nlintool命令参数初值:基于对数据的分析Matlab程序o~原始数据+~拟合结果参数估计值置信区间

1160.2802[145.8466174.7137]

20.0477[0.03040.0650]

152.4035[32.413072.3941]

20.0164[-0.00750.0403]经嘌呤霉素处理的作用不影响半速度点参数未经处理经处理估计结果和预测置信区间包含零点,对因变量影

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论