环境统计学环境因子分析_第1页
环境统计学环境因子分析_第2页
环境统计学环境因子分析_第3页
环境统计学环境因子分析_第4页
环境统计学环境因子分析_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

环境统计学Presentation(EnvironmentalStatistics)1精选ppt环境统计学第1章绪论第2章概率统计基础第3章环境一元线性回归分析第4章环境多元线性回归分析第5章环境系统聚类分析第6章环境判别分析第7章环境主成分分析第8章人工神经网络基本概念基本原理常用的统计学术语随机事件概率数学特征概率分布统计推断回归模型最小二乘法显著性检验回归模型最小二乘法SPSS求解显著性检验环境应用聚类要素的数据处理距离的计算聚类分析常用方法SPSS求解环境应用距离判别法Fisher判别法Bayes判别法主成分分析概述主成分分析计算原理主成分分析性质SPSS求解和环境应用2精选ppt环境因子分析3精选ppt环境因子分析因子分析概述因子分析模型及求解因子旋转与得分环境应用及SPSS求解4精选ppt一般认为因子分析是从CharlesSpearman在1904年发表的文章《对智力测验得分进行统计分析》开始,他提出这种方法用来解决智力测验得分的统计方法。目前因子分析在心理学、社会学、经济学等学科中都取得了成功的应用,是多元统计分析中典型方法之一。

因子分析(factoranalysis)也是一种降维、简化数据的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。这几个抽象的变量被称作“因子”,能反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而因子一般是不可观测的潜在变量。1

概述5精选ppt1

概述考试的例子物理数学化学语文地理历史理科文科6精选ppt1

概述商店形象员工人数商品种类资产规模广告投入年营业额净利润......商店的环境商店的服务商品的价格因子分析就是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。7精选ppt

通过因子分析,这15个方面可以归结为应聘者的外露能力、讨人喜欢的程度、经验、专业能力和外貌这五个因子。

公司老板对48名应聘者进行面试,并给出他们在15个方面所得的分数,这15个方面是:1

概述8精选ppt1

概述中国大学100强排名出炉排名校名总得分人才培养科学研究分省

排名得分研究生培养本科生培养得分自然科学研究社会科学研究1清华大学190.2177.5554.8022.75112.6694.3218.34京12北京大学189.4378.6353.9024.73110.8073.1437.65京23浙江大学189.2876.2653.7622.50113.0397.7515.27浙14上海交通大学153.6361.8043.4218.3891.8484.207.63沪15复旦大学122.1450.9135.2115.7071.2349.9821.25沪26南京大学111.1446.7131.0015.7164.4344.3320.10苏17武汉大学103.9549.5830.0619.5354.3734.7119.66鄂18华中科技大学101.1348.7530.0518.7052.3844.358.03鄂29中山大学96.8942.8727.8914.9854.0239.9814.04粤110四川大学96.4646.9428.2318.7149.5240.319.21川111哈尔滨工业大学94.2443.2927.9815.3150.9549.161.79黑112吉林大学89.5145.5527.1118.4443.9633.8210.15吉113中国科学技术大学84.3834.9924.2310.7649.3947.332.06皖114西安交通大学83.3639.0423.6315.4144.3235.269.06陕115山东大学83.0842.0922.9619.1340.9830.7210.26鲁116南开大学72.9033.2420.7112.5339.6622.3217.34津117中南大学72.3135.6121.1914.4236.7033.293.41湘118东南大学67.4632.7218.4914.2334.7530.364.39苏219中国人民大学65.7132.3317.8614.4733.381.6231.76京320北京师范大学65.2930.4418.2912.1534.8516.0418.81京49精选ppt1

概述10精选ppt1

概述-基本思想于是,原始观测的随机变量X可分解为不可观测(或未做观测)的两个随机向量的线性组合:一是对整个X有影响的公共因素——公因子;二是只对各个对应分量有影响的特殊因素——特殊因子对于直接可观测的随机变量,根据其相关性大小,使得同组内的变量之间相关性较高,不同组的变量相关性较低。每组变量代表一个基本结构,用一个不可观测的综合变量表示,这个基本结构称为公因子11精选ppt1

概述-基本任务建立因子载荷矩阵给出各公共因子的合理解释及命名若有必要(当难以招到合理解释的公共因子)时,进一步作因子旋转因子分析的基本任务12精选ppt1

概述-分类因子分析R型因子分析Q型因子分析R型的因子分析是对变量作因子分析Q型因子分析是对样品作因子分析13精选ppt

主成分分析:原始变量的线性组合表示新的综合变量,即主成分;···n个指标或变量n个综合指标或变量y1y2y3yn···计算y1…yn的贡献大小,进行取舍14精选ppt与主成分分析比较主成分分析的一般目的:

定义主成分分析:是一种通过降维技术把多个变量化为少数几个主成分(即综合变量)的统计分析方法变量的降维主成分的解释17个变量国民经济指标3个变量雇主补贴纯公共支出股息生产指数利息净增库存消费资料外贸盈余人口总收入F1总收入变化率F2经济发展趋势F3国民经济指标主成分分析15精选ppt主成分分析例子样本x1x2CODBODSS浊度pH色度氨氮16精选ppt因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。···n个指标或变量

因子分析的目的是,用几个不可观测的隐变量来解释原始变量间的协方差关系。17精选ppt

因子分析与回归分析不同,因子分析中的因子是一个比较抽象的概念,而回归因子有非常明确的实际意义;回归分析:一个结果(变量)与多个变量的关系水域SSBODCOD因子分析:一个变量与多个假定的因子(变量)的关系抽象的概念与回归分析比较18精选ppt与回归分析比较回归分析因子分析由因索果执果析因因果19精选ppt

这十项全能项目为:100米跑,跳远,铅球,跳高,400米跑,110米跨栏,铁饼,撑杆跳远,标枪,1500米。对经标准化后所作的因子分析表明,十项得分基本上可归结于他们的短跑速度,爆发性臂力、爆发性腿力和耐力,每一方面都称为一个因子。例1

林登(Linden)根据他收集的来自139名运动员的比赛数据,对第二次世界大战以来奥林匹克十项全能比赛的得分作了因子分析研究。20精选ppt十项全能例因子模型因子得分计算公式21精选ppt

十项得分与这四个因子之间的关系可以描述为如下的因子模型:

其中表示四个因子,称为公共因子(commonfactor),称为在因子上的因子载荷(loading),是的均值,是不能被四个因子解释的部分,称之为特殊因子。22精选ppt公共因子因子载荷特殊因子均值原始观测的随机变量可分解成不可观测的两个随机向量的线性组合23精选ppt2

因子分析模型及求解城市环境质量评价指标有:COD、BOD5、NH3、TSP、SO2和NOX,现有100个样本,用来表示。COD、BOD5、NH3、TSP、SO2、NOXCOD、BOD5、NH3、TSP、SO2、NOX水环境因素大气环境因素COD指标第指标24精选ppt第指标25精选ppt通常先对X作标准化处理,使标准化得到的新变量均值为0,方差为1.这样就有则称X为具有k个公共因子的因子模型2

因子分析模型及求解26精选ppt

如果满足(1)fi的均数为0,方差为1;(2)i的均数为0,方差为δi;(3)fi与i相互独立.

(4)fi与fj相互独立(i≠j)则称该因子模型为正交因子模型。

E(F)=0,Cov(F)=IkCov(F,U)=027精选ppt正交因子模型的统计意义:X的方差可表示为设(1)hi2是k个公共因子对第i个变量的贡献,称为第i个共同度(communality)或共性方差,公因子方差(commonvariance)(2)δi称为特殊方差(specificvariance),是不能由公共因子解释的部分28精选ppt29精选ppt估计因子载荷求原始变量相关矩阵;求相关矩阵的特征根(因子的贡献),并排序计算所有特征根对应的所有线形无关的特征向量;特征向量转置,乘以特征根的平方根,即得到因子载荷。30精选ppt31精选ppt因子载荷(负荷)aij是随机变量xi与公共因子fj的相关系数。设

称gj2为公共因子fj对X的“贡献”,是衡量公共因子fj重要性的一个指标。32精选ppt共同度贡献度33精选ppt确定因子个数一般原则:累积贡献率(累积方差)达到70~85%;特征根≥1。34精选ppt解释潜在因子的实际意义解释潜在因子的实际意义,一般以因子载荷的大小为依据。因子载荷大的指标变量受潜在因子支配的作用大。如何判别因子载荷的大小?当因子载荷大于或等于0.5时,可认为该因子f支配对应的指标X。35精选pptx1方差中的80.5%被潜在因子f所解释;x2方差中的92%被潜在因子f所解释;x3方差中的64.5%被潜在因子f所解释。36精选ppt2

因子分析模型的求解

设随机向量的均值为

,协方差为

,

为的特征根,为对应的标准化特征向量,则主成分分析法37精选ppt

上式给出的

表达式是精确的,然而,它实际上是毫无价值的,因为我们的目的是寻求用少数几个公共因子解释,故略去后面的p-m项的贡献,有3838精选ppt上式有一个假定,模型中的特殊因子是不重要的,因而从的分解中忽略了特殊因子的方差。

3939精选ppt数据标准化计算协方差矩阵求协方差矩阵特征值和特征向量判别主要因子个数及因子载荷因子旋转因子分析五步走40精选ppt3

因子旋转及得分因子旋转的目的建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个因子的意义,以便对实际问题进行分析如果求出的主因子解后,各个主因子的典型变量不很突出,还需要进行因子旋转。因子旋转的目的是使因子载荷两极分化,因子载荷的平方根要么接近于0,要么接近于1。通过适当的旋转得到比较满意的因子。41精选ppt3

因子旋转及得分因子旋转方法正交旋转斜交旋转正交旋转法基本思想以使各因子载荷值的方差达到最大作为因子载荷矩阵简化的准则,且保持原公因子的正交性和变量共同度hi2不变,此时公因子的方差贡献则不再与原来相同。可使每个因子上的具有最大载荷的变量数最小,因此可以简化对因子的解释42精选ppt3

因子旋转及得分43精选ppt(1)3

因子旋转及得分44精选ppt(2)3

因子旋转及得分45精选ppt3

因子旋转及得分46精选ppt3

因子旋转及得分47精选ppt3

因子旋转及得分48精选ppt当m>2时,我们可以逐次对每两个公共因子和进行上述旋转。对公因子Fl和Fk进行旋转,就是对A的第l和k两列进行正交变换,使这两列元素平方的相对方差之和达到最大,而其余各列不变,其正交变换矩阵为3

因子旋转及得分49精选ppt3

因子旋转及得分50精选ppt3

因子旋转及得分51精选ppt3

因子旋转及得分正交旋转及正交点投影52精选ppt3

因子旋转及得分53精选ppt3

因子旋转及得分54精选ppt3

因子旋转及得分55精选ppt3

因子旋转及得分56精选ppt3

因子旋转及得分57精选ppt因子分析的步骤输入原始数据xn*p,计算样本均值和方差,进行标准化计算(处理);求样本相关系数矩阵R=(rij)p*p;求相关系数矩阵的特征根λi

(λ1,λ2,…,λp>0)和相应的标准正交的特征向量li;确定公共因子数;计算公共因子的共性方差hi2;对载荷矩阵进行旋转,以求能更好地解释公共因子;对公共因子作出专业性的解释。58精选ppt4环境应用及SPSS求解例1.

某地区对城市大气颗粒物进行监测。得到16个样本,样本颗粒中各类物质的含量见下表.请对该监测数据进行因子分析并给出结论。样本中大气颗粒物成分分析结果表序号BrKBaRbScFeZnNiVWAs1180110008205818.0220009501102745.9602977800650399.616000930441006.310031208600490458.214000820451073.37242007400390319.51300015005518310.0755295400250335.61000017030883.2256429100490436.11400037017932.539760120005205410.021000780451294.3498388700430418.21600068037964.95691105400250304.673008603912.75310384900174203.5670048036503.139111007100360295.51100096022285.32512604200130152.1440084017243.92513155800240275.51100065025494.94014178000260355.11200037020483.5301519870290385.81400080026406.12516134600020203.7720037014443.72559精选ppt1.8650.1472.2661.9502.9491.9460.7133.1912.7760.6900.6250.443-0.1701.4280.3480.7100.7200.6510.3300.2250.9032.4290.837-0.0910.6390.8540.3370.3120.3090.3740.328-0.6901.1662.208-0.2100.147-0.3270.6830.1072.4240.8071.4422.8681.302-0.722-0.408-0.543-0.158-0.357-0.506-1.712-0.2760.049-0.744-0.952-0.499-0.0410.6390.685-0.2230.312-1.090-0.8400.123-1.115-0.321-0.1910.2460.7871.6130.8161.7420.1850.3740.651-0.1590.130-0.568-0.0810.3440.5160.3370.720-0.1260.0270.1670.1590.4450.666-0.408-0.543-0.411-0.623-1.0570.4330.114-1.226-1.0090.310-0.568-0.457-0.918-1.254-0.916-1.180-0.748-0.016-0.508-0.797-0.3210.495-0.239-0.001-0.495-0.383-0.3010.744-0.623-0.8300.372-0.952-0.191-0.527-1.135-1.676-1.290-1.6500.371-0.840-0.889-0.372-0.952-0.962-0.368-0.593-0.664-0.383-0.301-0.220-0.493-0.5220.159-0.276-0.927-0.150-0.4940.011-0.490-0.097-1.090-0.710-0.537-0.584-0.727-0.893-0.857-0.3460.263-0.3030.3120.247-0.450-0.6540.797-0.952-0.9963.614-1.677-1.254-0.863-1.078-1.090-0.970-0.596-0.478-0.952解:1.数据标准化-标准差标准化X=2.求X的协方差矩阵R1.0000-0.15991.00000.5886-0.25801.00000.3407-0.14420.87071.00000.6494-0.04890.89910.83091.00000.3480-0.09660.88010.94750.87901.00000.8095-0.25730.39170.14540.42820.26551.00000.7441-0.12220.75390.63900.91320.65290.47541.00000.65520.01580.77320.69800.92360.75650.37960.86621.00000.5776-0.11950.32510.12420.46220.34880.79170.40420.49571.00000.6333-0.13120.66970.43100.58550.47920.56400.55420.51720.44601.0000R=60精选ppt3.求R的特征值和特征向量[V,Lambda]=eig(R)-0.34360.0055-0.38830.07220.4218-0.36020.2926-0.33430.08600.34880.30300.0599-0.1013-0.0050-0.0941-0.0409-0.2238-0.2219-0.07160.9178-0.1534-0.07190.2011-0.29030.1040-0.74760.2604-0.0950-0.1495-0.1085-0.1803-0.18470.35770.4864-0.0924-0.32200.47130.0280-0.3521-0.13230.0934-0.1479-0.40250.30700.05570.8291-0.1247-0.2406-0.19040.06270.12600.05920.1081-0.15400.3756-0.7317-0.10210.14710.0931-0.1207-0.1464-0.26040.3307-0.0584-0.31540.32840.20000.06770.53070.0692-0.2495-0.4881-0.08990.1001-0.03060.53980.24090.0083-0.4080-0.0784-0.0109-0.62810.18880.4794-0.19200.0945-0.02720.34740.1078-0.02190.49520.29490.48520.38240.28610.09320.2247-0.10460.34950.1038-0.1582-0.4053-0.08080.04620.3082-0.18240.62310.14030.45110.2270-0.02040.0508-0.01480.1998-0.08180.3829-0.6234-0.5530-0.02630.17000.2820V=特征向量特征值由小到大0.00520.00360.03500.06740.11600.26120.53810.57581.04481.81806.5348e3e2e161精选ppt4.求因子载荷矩阵A0.08600.34880.30300.9178-0.1534-0.0719-0.1803-0.18470.3577-0.1479-0.40250.30700.1081-0.15400.3756-0.0584-0.31540.3284-0.03060.53980.24090.0945-0.02720.34740.2247-0.10460.34950.14030.45110.2270-0.02630.17000.2820e3e2e11.0221545871.3483322.55632562精选pptSPSS计算方法63精选ppt4环境应用及SPSS求解例1.

某地区对城市大气颗粒物进行监测。得到16个样本,样本颗粒中各类物质的含量见下表.请对该监测数据进行因子分析并给出结论。序号BrKBaRbScFeZnNiVWAs1180110008205818.0220009501102745.9602977800650399.616000930441006.310031208600490458.214000820451073.37242007400390319.51300

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论