数学建模方法之概率统计分析法.ppt_第1页
数学建模方法之概率统计分析法.ppt_第2页
数学建模方法之概率统计分析法.ppt_第3页
数学建模方法之概率统计分析法.ppt_第4页
数学建模方法之概率统计分析法.ppt_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学建模方法,之概率统计分析法,主成分分析 因子模型 马氏链模型 统计回归模型 排队论模型 概率模型,第一篇 主成分分析,在实际经济工作中,我们经常碰到多变量或多指标问题,例如,企业经济效益的评价,地区经济发展情况比较。由于变量或指标较多,且变量或指标之间存在一定的相关性,人们自然希望用较少的变量或指标代替原来较多的变量或指标,而且可尽量保存原有信息,利用这种降维的思想产生了主成分分析方法,主成分分析法:就是设法将原来的具有一定相关性的变量或者指标,重新组成一组新的相互无关的少数几个综合变量或指标,以此代替原来的变量或指标。简单的说就是降维。 应用:综合评价(系统评估),例:对我国上市公司的经济效益进行综合评判。,主成分分析步骤: 1.将数据标准化,标准化后的数据矩阵仍记X阵。 2.求矩阵X的相关系数阵 3.求R的全部特征根i及相应的特征向量()。 4.根据前k个主分量累计贡献率大小(),确定主成分(因子)个数。 根据具体指标内容和指标变量系数大小解释主成分含义。 用每个主成分的贡献率作权数,给出多指标综合评价值。,Eigenvalues of the Correlation Matrix Eigenvalue Difference Proportion Cumulative 1 4.04767016 3.03734802 0.6746 0.6746 2 1.01032214 0.30248369 0.1684 0.8430 3 0.70783845 0.55300190 0.1180 0.9610 4 0.15483655 0.10037328 0.0258 0.9868 5 0.05446327 0.02959385 0.0091 0.9959 6 0.02486942 0.0041 1.0000,Obs Prin1 Prin2 Prin3 Prin4 Prin5 Prin6 1 -0.38118 -0.32367 -0.04450 0.30363 0.00430 0.06437 2 0.57795 -0.35416 0.49279 0.55119 -0.18726 0.17414 3 0.69219 -0.21588 0.40557 0.40041 -0.10461 0.05393 4 0.22635 -0.39419 0.27521 0.63296 0.13851 -0.06481 5 -0.82981 -0.40293 0.47330 -0.42964 -0.55401 -0.35020 6 -1.19410 -0.40627 -0.36848 0.14000 0.02221 0.01063 7 -1.63568 -0.26394 -0.67179 -0.15189 0.01702 -0.03769 8 0.95195 -0.46156 1.61851 -0.92520 0.08394 0.25530 9 0.46501 -0.14888 0.19070 0.16273 -0.30327 0.20883 10 -1.45693 -0.18670 -0.55658 -0.17088 -0.10267 -0.00922 11 -0.29401 3.71727 -0.02727 -0.02382 -0.06419 0.03517 12 0.08041 0.22542 1.71694 0.12718 0.45539 -0.26668 13 -2.11628 -0.16312 -0.90179 -0.16784 0.14422 -0.03334 14 -0.94513 -0.31477 -0.39513 0.09760 0.11375 -0.03132 15 6.74015 -0.06989 -1.12895 -0.16618 0.04080 -0.11394 16 -0.88090 -0.23673 -1.07853 -0.38025 0.29589 0.10482,用于系统评估的方法:关键问题是如何科学的客观地将一个多指标问题转化为单指标问题,第一种方法:用第一主成分得分y=F1. 必须要求:所有系数均为正 第二种方法:将主成分F1,F2, Fm进行线性组合,系数为方差贡献率,yi di yi zhu cheng fen pai xv 13:30 Saturday, July 17, 1999 35 name Prin1 x1 x2 x3 x4 x5 x6 laigang -2.11628 2.17 5.70 -2.11 -2.57 1.34 3.21 cengxin -1.63568 3.63 5.79 -1.09 -1.29 1.17 4.71 xinbai -1.45693 4.27 5.35 -0.71 -0.83 1.38 5.68 shuiyun -1.19410 3.74 6.47 0.33 0.39 0.98 5.24 guangsha -0.94513 4.65 7.80 0.53 0.65 1.18 5.82 chanhong -0.88090 5.65 10.63 -0.92 -1.19 1.08 8.84 yanzhong -0.82981 8.97 1.43 1.73 1.18 1.10 5.22 Qinghua -0.38118 5.41 8.05 2.09 2.43 1.30 7.51 guoji -0.29401 8.07 8.69 0.73 0.89 10.75 10.16 zonghang 0.08041 9.66 6.27 6.69 2.63 3.05 1.64 xinya 0.22635 6.31 9.97 3.63 4.59 1.29 7.21 pudong 0.46501 8.18 8.20 3.41 4.01 1.75 12.13 beida 0.57795 7.21 8.54 4.51 5.26 1.43 10.44 hualian 0.69219 8.38 9.52 4.27 5.07 1.70 10.49 qingshan 0.95195 14.47 5.97 7.62 1.37 1.20 10.56 xiaxin 6.74015 25.95 33.52 6.96 15.38 1.51 36.89,统计软件SAS(关于主成分分析),数据的输入(介绍两种方法) data 数据名(haimen); input name$ x1 x2 x3 x4 x5 x6; card; qinghua 50122 run; 外部文件转化为SAS数据集: 已知c盘根目录下文件名test.dat为的数据文件 张三 男 82 95 64 78 data 数据名(chengji); infile c:test.dat; input name$sex$ chinese maths english chemisty; run;,主成分分析,Proc princomp n=6 out=out1; var x1-x6; run; proc print data=out1; var prin1-prin6; run;,数据预处理,一致性处理:越大越差、越大越好 归一化处理(去量纲): (x-max(xi)/极差,x/max(xi), 标准化处理 (x-均值)/方差,第二篇 因子模型,因子分析是统计中一种重要的分析方法,他的主要特点在于能探索不易观测或不能观察的潜在因素。它在社会调查、气象、地质等方面有广泛应用。,若有n个学生,每个学生考五门课,考试成绩反映了学生的素质和能力,理解能力,逻辑能力,记忆能力,对文字符号概念的反应速度,能否从学生的学习成绩去寻找出反映这些能力的量。,因子模型为:,其中: 为原指标 , 称为 的公共因子或潜因子, 为 的特殊因子 可将上式写成矩阵表示形式: 称为因子载荷阵,因子分析步骤: 前四步骤与主成分步骤相同,在此略。 5.求初始因子载荷阵A。 6.若公因子的含义不清楚,不便于实际解释时,将初始因子阵作旋转处理,直到达到要求。 7.根据因子载荷大小说明因子具体含义。 将因子表示成原指标变量线性组合,估计因子得分。 用每个因子的贡献率作权数,给出多指标综合评价值。,因子载荷阵 的统计意义 模型中载荷矩阵 中的元素 称为因子载荷。因子载荷 是 与 的协方差,也是 与 的相关系数,它表示 依赖 的程度。可将 看作第i个变量在第j个公共因子上的权, 的绝对值越大,表明 与 的相依程度越大,或称公共因子对于的载荷量越大。为了得到因子分析结果的经济解释,因子载荷矩阵A中有两个统计量十分重要,即变量共同度和公共因子的方差贡献。,变量共同度 因子载荷矩阵中第i行元素之平方和记为 ,即 ,称为变量 的共同度。它是全部公共因子对 的方差所做出的贡献,反映了全部公共因子对变量 的影响。 越大表明 对于F的每一分量 的共同依赖程度大。,公共因子 的方差贡献 将因子载荷矩阵的第j列的各元素的平方和记为 ,即 ,称为公共因子 对x的方差贡献。 就表示第j个公共因子 对于的每一分量 所提供方差的总和,它是衡量公共因子相对重要性的指标。 越大,表明公共因子 对x的贡献越大,如果将因子载荷矩阵的所有 都计算出来,使其按照大小排序,就可以依此提炼出最有影响力的公共因子。,因子载荷阵A(主成分法),一般设 为样本相关阵R的特征根, 为对应的标准正交化特征向量。则因子载荷阵A的一个解为:,因子旋转,建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个公共因子的意义,以便对实际问题进行分析。如果求出主因子解后,各个主因子的典型代表变量不很突出,我们就可以利用因子载荷阵的不唯一性这一特点对得到的因子模型进行旋转使得变换后的公共因子和载荷阵有明显的实际意义。 最常用的方法是最大方差正交旋转法(Varimax)。进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使大的载荷更大,小的载荷更小。接近于1的表明公因子与的相关性很强,在很大的程度上解释了的变化;接近于0的表明与的相关性很弱。,例:对我国上市公司的经济效益进行因子分析,Proc factor method=principal n=2 rotate=varinmax all; Var x1-x6; Run;,Factor1=0.95056x1+0.89158x2+0.75108x3+0.9565x4 +0.24829x5+0.9247x6 Factor2=0.0091x1-0.30529x2+0.49587x3- 0 .01446x4+0.89379x5-0.34281x6,马氏链模型:,系统在每个时期所处的状态是随机的,且这个时期到下个时期的状态按照一定的概率进行转移,并且下个时期的状态只取决于这个时期的状态和转移概率,与以前无关,此称为马氏性或无后效性。具有此种性质的随机序列称为马氏链。 马氏链模型在经济学、社会学、生态学、遗传学等许多领域有着广泛地应用。,设随机序列X(n),n=0,1,2,的离散状态空间E为1,2,,下面定义马尔科夫链。 定义1 设随机序列X(n),n=0,1,2,的离散状态空间为E,若对于任意m个非负整数和任意自然数k,以及任意,满足 = 则称X(n),n=0,1,2,为马尔科夫链。,第一节马氏链模型数学表述,马氏链:设随机变量序列 ,其状态空间 ,若 则随机变量序列称为马氏链 转移概率(比例频率)时齐的齐次的,第二节:钢琴销售的存储策略,一家商店根据以往的经验,知道平均每周只能售出1架钢琴,先在经理制定的存储策略为:每周末检查库存量,仅当库存量为零时,才定购三架钢琴以供下周销售;否则,不定购。试估计在这种策略下失去销售机会的可能性有多大,以及每周的平均销售量是多少?,第三节 基因遗传,生物的外部表征是由生物体内相应的基因决定,基因分优势基因和劣势基因两种,分别用d和r表示,则有三种基因类型,即 D(dd) H(dr) R(rr) 优种 混种 劣种,生物繁殖时,一个后代随机的继承父亲两个基因中的一个,母亲两个基因中的一个,形成自己的基因 所以父母的基因类型就以一定的概率决定了每一后代的基因类型。,随机交配、近亲繁殖,假设在某一生物群体中雄性与雌性的比例是相等的,且在雄性中D,H,R的比例与在雌性中D,H,R的比例相等。,随机交配:对每一个雌性(或雄性)个体,都以D,H,R的数量比例为概率,与一个雄性(或雌性)个体交配,后代按照前述规则形成他的基因类型 设D(dd) :H(dr): R(rr)=a:2b:c 且 a+2b+c=1 记p=a+b, q=b+c,则群体中优势基因d与劣势基因r的数量比例为d:r=p:q 且p+q=1,转移矩阵,第四节 等级结构,在社会系统中常常按照人们的职务或地位划出许多等级。例如:大学教师分为教授、讲师、助教。 我们希望建立一个模型来描述等级结构的变化状况,并根据已知条件和当前的结构预报未来的结构,以及寻求为了达到某个理想的等级结构而应采取的措施。 引起等级结构变化的因素有两种:系统内部等级间的转移提升或降级;系统内外的交流,即调入或

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论