版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
得分评阅人多元统计分析及R语言建模考试试卷课程名称:多元统计分析课程类别教授课教师:王斌会必修[]选修[]师考试时间:_年月日考试方式填开卷[]闭卷[]写试卷类别(A、B)[A]共8页考学院(校)专业班(级)生填学号写题号—二三四五六七八九十总分得分一、简答题(共5小题,每小题6分,共30分)常用的多元统计分析方法有哪些?1)多元正态分布检验2)多元方差-协方差分析3)聚类分析(4)判别分析(5)主成分分析(6)因子分析(7)对应分析(8)典型相关性分析(9)定性数据建模分析(10)路径分析(又称多重回归、联立方程)(11)结构方程模型(12)联合分析13)多变量图表示法14)多维标度法简单相关分析、复相关分析和典型相关分析有何不同?并举例说明之。简单相关分析:简单相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。例如,以X、Y分别记小学生的数学与语文成绩,感兴趣的是二者的关系如何,而不在于由X去预测Y。复相关分析;研究一个变量xO与另一组变量(x1,x2,...,xn)之间的相关程度。例如,职业声望同时受到一系列因素(收入、文化、权力……)的影响,那么这一系列因素的总和与职业声望之间的关系,就是复相关。复相关系数R0.12…n的测定,可先求出xO对一组变量xl,x2,…,xn的回归直线,再计算xO与用回归直线估计值悯之间的简单直线回归。复相关系数为R0.12...n的取值围为0<R0.12^n<1。复相关系数值愈大,变量间的关系愈密切。典型相关分析就是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。试说明主成分分析和因子分析不同点和相同之处。主成分分析和因子分析的相同之处都可以降维、分析多个变量的基本结构因子分析是主成分分析的进一步推广。主成分分析可被视为一种固定效应的因子分析,是因子分析的特列都是利用变量之间的相关性将它们进行分类主成分分析中,各个主成分之间互不相关;因子分析中,公因子之间不相关、特殊因子之间不相关、公因子与特殊因子之间不相关主成分分析和因子分析的区别1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。3主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specificfactor)之间也不相关,共同因子和特殊因子之间也不相关。4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。判别分析以及Fisher判别和Bayes判别的基本思想是什么?判别分析:根据判别中的组数,可以分为两组判别分析和多组判别分析;根据判别函数的形式,可以分为线性判别和非线性判别;根据判别式处理变量的方法不同,可以分为逐步判别、序贯判别等;根据判别标准不同,可以分为距离判别、Fisher判别、Bayes判别法等Fisher判别法;通过将多维数据投影到某一方向上,使得投影之后类与类之间尽可能分开,然后再寻找合适的判别准则。Bayes判别法:假设已知对象的先验概率和“先验条件概率”,而后得到后验概率,由后验概率作出判别。指出综合评价中指标的标准化方法及其优缺点和有哪些综合评价方法。标准化方法主成分分析法。主成分分析是多元统计分析的一个分支。是将其分量相关的原随机向量,借助于一个正交变换,转化成其分量不相关的新随机向量,并以方差作为信息量的测度,对新随机向量进行降维处理。再通过构造适当的价值函数,进一步做系统转化。⑵数据包络分析法。它是创建人以其名字命名的DEA模型一一CR模型。DEA法不仅可对同一类型各决策单元的相对有效性做出评价与排序,而且还可进一步分析各决策单元非DE有效的原因及其改进方向,从而为决策者提供重要的管理决策信息。(3)模糊评价法。模糊评价法奠基于模糊数学。它不仅可对评价对象按综合分值的大小进行评价和排序,而且还可根据模糊评价集上的值按最大隶属度原则去评定对象的等级。综合评价方法1、计分法2、综合指数法3、Topsis法4秩和比(RSR)法5、层次分析(AHP)法ll=1I=16、模糊评价方法7、多元统计分析方法8、灰色系统评价方法得分评阅人得分评阅人二证明题(共1小题,共20分)设y=a1x1+a2x2+_+apxpax,其中a=(a1,a2ap)x=(xx=(x1,x2,_,xp),求主成分就是寻找x的线性函数ax使相应的方差达到最大,即Varax)=aa达到最大,且aa=1,此处为x的协方差阵。设的特征根为人...人“试证明下面性质:(1)y=Ux,UU=I,这里U为x的协方差阵的特征向■(单位化的)组成的正交阵。y的各分量之间是互不相关的。y的p个分■是按方差大小、由大到小排列的。y的协方差阵为对角阵。(5)%工一这里=(ii)pp
(6)川"…厂八)二卞山汀肿门—1-2••…”证明(1)(2)(3):设的特征向量为U二(ui,u2,…,uj,则UU=I,即U为一正交阵,且=Udiag(九,九,,九)U=YXu-u.i2pi11i=i因此aa=Y九aii=1u因此aa=Y九aii=1u.u..a=Y九(ai=i屮(au.)=Y九(ai=i于是aa<xlLii=1(au.)2二九(aU)(a|iUUa=九aiu-=u九u-=九TOC\o"1-5"\h\z11i1i故y1=ux就是第一主成分,其方差最大,VaRyJ=Var(u1x)=片同理,Var(y.)=Var(u.x)=九11i九ju.=九ju.另外,Cov(yi,y.)=Cov(u九ju.=九ju.因此,有上述可得变量x的主成分是以的特征向量为系数的线性组合,且主成分y之间互不相关,y的p个分量是按方差大小、由大到小排列的。性质(1)(2)(3)得证。性质(4)可有(1)(2)(3)得到。证明性质(5):由U=(uu,u),则有i2px1x1于是YJ.=tr()=tr(UAU)=tr(AUU)=tr(A)=Y九iiii=li=1证明性质(6)•(6)二yXs」/"」/—i・2…卩由前面的证明得知Jvar(y)=jX,Jvar(x)=令e.=(0,,0,1,0,,0)为单位向量,则x=e.x,y.=u.xjjii••••••Ui=〜ejUi=Xi所以,Cov(y.,xp二Cov(u.x,qx)=Ui=〜ejUi=XiuijCov(y,x)ua(y,x)=:j=f1J<var(y)var(x)性质(6)得证得分评阅人得分评阅人三、运算题(共3小题,共20分)下面左表为五个观察值,两个变量的数据,右表为用欧氏距离计算的距离矩阵,x1x27-*1—65157p5-427124x43323-4652-:'3—56611111|2345671.(10分)写出用R语言分析的命令请将数据x1和x2写入R向量中:x1=c(5,7,3,6,6);x1x2=c(7,1,2,5,6);x2写出绘制上面散点图的R命令:x1=c(5,7,3,6,6);x1x2=c(7,1,2,5,6);x2plot(x1,x2)写出绘制系统聚类图的R命令:X=data.frame(x1,x2);XD=dist(X,diag=TRUE,upper=TRUE);Dhc=hclust(D,'complete');hcplot(hc)2.(5分)(1)写出计算下面绝对距离阵的R命令:x1=c(5,7,3,6,6)x2=c(7,1,2,5,6)X=data.frame(x1,x2);XD=dist(X,diag=TRUE,upper=TRUE,p=1);D12345108732280556375067435601526710(2)试在图中标出这些距离3.(5分)试用最长距离法对其进行聚类分析,画出聚类图,并按二类、三类进行分类第一步:计算距离阵X=data.frame(x1,x2);XD=dist(X,diag=TRUE,upper=TRUE);D第二步:进行系统聚类(最长距离法)hc=hclust(D,'complete');hc第三步:画出聚类图(1)按二类进行分类plot(hc);rect.hclust(hc,2)22ClusterDendrogramthgieHthgieH2)按三类进行分类D2)按三类进行分类D
hclust(*,"complete")plot(hc);rect.hclust(hc,3)ClusterDendrogramthgieH654thgieH654DD
hclust(*,"complete")得分评阅人得分评阅人四、案例分析题(共2小题,共30分)我们知道,财政收入与国民生产总值和税收等经济指标有密切的依存关系。今收集了我国改革开放以来财政收入(:百亿元),国民生产总值(X1:百亿元),税收(X2:百亿元),进出口贸易总额(x3:百亿元),经济活动人口(x4:百万人)的部分数据,见下表所示,分析财政收入和国民生产总值、税收、进出口贸易总额、经济活动人口之间的关系。表1财政收入多因素分析数据yX1x2x3x4199131.4948216.62529.901772.258660.91199234.8337266.51932.969191.667.82199343.4895345.60542.553112.710674.68199452.1810466.70051.2688203.819681.35199562.4220574.94960.3804234.999688.55199674.0799668.50569.0982241.338697.65199786.5114731.42782.3404269.672708.00199898.7595769.67292.628268.577720.871999114.440805.794106.825298.963727.91
88125.8152000.9523882.2811392.742739.92153.0132001.8604943.4648421.933744.321203.32176.3642002.036475513.782753.60217.1521358.22200.1732003581704.835760.75263.9641598.78241.6562004738955.391768.23316.4921832.17287.78520059441169.218778.77387.6022119.23348.04320060551409.714782.44513.2172495.29456.21920078971667.402786.45613.3033006.70542.1961778.89820085023790.481.基本统计分析和R语言命令(15分)(1)如果将该数据存入到一个文本文件reg.txt中,写出将该文本数据读入数据框数据框dat中的R命令:dat=read.table("reg.txt",,header=T)(1分)如果将该数据拷贝到剪切板中,写出将该数据读入数据框dat中的R命令:dat二read.table("clipboard",header二T)(1分)TOC\o"1-5"\h\z写出提取2000年数据的R命令:dat[10,](1分)写出提取税收(x2)数据的R命令:dat[,5](1分)写出提取2001年至2008年经济活动人口(x4)数据的R命令:dat[11:18,5](1分)写出计算财政收入统计量的R命令:summary(y)(2分)Min.1stQu.MedianMean3rdQu.Max.31.4965.34124.20188.70252.30613.30写出计算下面相关阵R命令:cor(dat)(2分)yx1x2x3x4y1.00000.99240.99990.98740.8736x10.99241.00000.99380.98830.9126x20.99990.99381.00000.98810.8811x30.98740.98830.98811.00000.8807x40.87360.91260.88110.88071.0000写出计算下面回归系数的R命令:fm=lm(y〜x1+x2+x3+x4,data二dat);fm(2分)Coefficients:(Intercept)x1x2x3x484.620300.002071.16908-0.00305-0.13391x2x21.167680.00385303.331<2e-16***⑺写出计算下面检验的R命令:summary(fm)(2分)Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)84.6203012.744426.641.6e-05***x10.002070.004910.420.68x21.169080.0211355.32<2e-16***x3-0.003050.00367-0.830.42x4-0.133910.01969-6.801.3e-05***0.1‘'10.998Signif.codes:0‘***'0.001‘**'0.01‘*'0.050.1‘'10.998Residualstandarderror:1.18on13degreesoffreedomMultipleR-squared:0.999,AdjustedR-squared:F-statistic:8.87e+04on4and13DF,p-value:<2e-16⑻写出计算下面检验的R命令:fm1=lm(y〜x2+x4,data二dat);fm1summary(fml)(2分)Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)82.103619.044429.0781.76e-07***x4x4-0.129450.01318-9.8186.36e-08***Signif.codes:0‘***'0.001‘**'0.01‘*'0.05‘.'0.1‘'1Residualstandarderror:1.on15degreesoffreedomMultipleR-s
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司电脑外包合同
- 农机外包合同
- 制剂业务外包合同
- 动画外包合同
- 北京IT外包合同
- 单次餐饮外包合同
- 厂棚搭建外包合同
- 台运外包合同
- 员工餐厅外包合同
- 商演外包合同
- 2023年北京邮电大学招聘笔试真题
- 0718西溪风情澄宫最后
- 部编三年级语文下册《中国古代寓言》整本书阅读
- 2024年高考真题-政治(湖南卷) 含答案
- JTS-180-3-2018海伦航道通航标准
- 九宫数独200题(附答案全)
- 第11课-东欧社会主义国家的改革和演变
- 部编版语文三年级下册第六单元大单元整体教学设计(新课标)
- 关于《幼儿园园长专业标准(试行)》的分析与解读
- 一期6万ta氯化法钛白粉工程项目的可行性研究报告
- 新人教版高中物理必修二第八章《机械能守恒定律》测试题(含答案解析)
评论
0/150
提交评论