版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、-. z.- - - z -多元统计分析及R语言建模考试试卷教师填写课程名称:_多元统计分析_授课教师:_王斌会_ 考试时间:_ _年_月_日课程类别必修 选修 考试方式开卷 闭卷 试卷类别(A、B) A 共 8 页考生填写学院(校) 专业班(级)*题号一二三四五六七八九十总分得分得分评阅人一、简答题共5小题,每题6分,共30分1. 常用的多元统计分析方法有哪些?1多元正态分布检验2多元方差-协方差分析3聚类分析4判别分析5主成分分析6因子分析7对应分析8典型相关性分析 9定性数据建模分析10路径分析又称多重回归、联立方程11构造方程模型12联合分析13多变量图表示法14多维标度法2. 简单相
2、关分析、复相关分析和典型相关分析有何不同?并举例说明之。简单相关分析:简单相关分析是研究现象之间是否存在*种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。例如,以*、Y分别记小学生的数学与语文成绩,感兴趣的是二者的关系如何,而不在于由*去预测Y。复相关分析;研究一个变量 *0与另一组变量 (*1,*2,,*n)之间的相关程度。例如,职业声望同时受到一系列因素收入、文化、权力的影响,则这一系列因素的总和与职业声望之间的关系,就是复相关。复相关系数R0.12n的测定,可先求出 *0对一组变量*1,*2,*n的回归直线,再计算*0与用回归直
3、线估计值悯之间的简单直线回归。复相关系数为R0.12n的取值围为0R0.12n1。复相关系数值愈大,变量间的关系愈密切。典型相关分析就是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的根本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量U1和V1分别为两个变量组中各变量的线性组合,利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。3. 试说明主成分分析和因子分析不同点和一样之处。主成分分析和因子分析的一样之处1.都可以降维、分析多个变量的根本构造2.因子分析是主成分分析的进一步推广。主成分分析可被视为一种
4、固定效应的因子分析,是因子分析的特列3.都是利用变量之间的相关性将它们进展分类4.主成分分析中,各个主成分之间互不相关;因子分析中,公因子之间不相关、特殊因子之间不相关、公因子与特殊因子之间不相关主成分分析和因子分析的区别1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子specificfactor之间也不相关,共同因子和特殊因子
5、之间也不相关。4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。4. 判别分析以及Fisher判别和Bayes判别的根本思想是什么?判别分析:根据判别中的组数,可以分为两组判别分析和多组判别分析;根据判别函数的形式,可以分为线性判别和非线性判别;根据判别式处理变量的方法不同,可以分为逐步判别、序贯判别等;根据判别标准不同,可以分为距离判别、Fisher判别、Bayes判别法等Fisher判别法;通过将多维数
6、据投影到*一方向上,使得投影之后类与类之间尽可能分开,然后再寻找适宜的判别准则。Bayes判别法:假设对象的先验概率和先验条件概率,而后得到后验概率,由后验概率作出判别。5. 指出综合评价中指标的标准化方法及其优缺点和有哪些综合评价方法。标准化方法(1)主成分分析法。主成分分析是多元统计分析的一个分支。是将其分量相关的原随机向量,借助于一个正交变换,转化成其分量不相关的新随机向量,并以方差作为信息量的测度,对新随机向量进展降维处理。再通过构造适当的价值函数,进一步做系统转化。(2)数据包络分析法。它是创立人以其名字命名的DEA模型CR模型。DEA法不仅可对同一类型各决策单元的相对有效性做出评价
7、与排序,而且还可进一步分析各决策单元非DE有效的原因及其改良方向,从而为决策者提供重要的管理决策信息。(3)模糊评价法。模糊评价法奠基于模糊数学。它不仅可对评价对象按综合分值的大小进展评价和排序,而且还可根据模糊评价集上的值按最大隶属度原则去评定对象的等级。综合评价方法1、计分法2、综合指数法3、Topsis法 4、秩和比(RSR)法5、层次分析(AHP)法6、模糊评价方法7、多元统计分析方法8、灰色系统评价方法得分评阅人二、证明题共1小题,共20分设y= a1*1+ a2*2 +ap*pa *,其中a =(a1,a2,ap),* =(*1,*2,*p),求主成分就是寻找*的线性函数a *使相
8、应的方差到达最大,即Var(a *) = a a 到达最大,且a a =1,此处为*的协方差阵。设的特征根为。试证明下面性质:1y=U*,UU=I,这里U为*的协方差阵的特征向量单位化的组成的正交阵。2y的各分量之间是互不相关的。3y的p个分量是按方差大小、由大到小排列的。4y的协方差阵为对角阵。5,这里 = (ii)pp6证明123:设的特征向量为U= (u1,u2,up),则UU=I,即U为一正交阵,且= UU= U diag()U=uiui因此a a=a uiui a=(a ui) (aui)=(a ui)2于是a a(a ui)2=(a U) (a U)=a UUa=a a=应取时,u
9、1u1= u1u1=故y1= u *就是第一主成分,其方差最大,Var(y1) = Var(u1 *) =同理,Var(yi) = Var(ui *) =另外,Cov(yi, yj)= Cov(ui *, uj *)= uiuj= uiuj= ui uj=0,i因此,有上述可得变量*的主成分是以的特征向量为系数的线性组合,且主成分y之间互不相关,y的p个分量是按方差大小、由大到小排列的。性质123得证。性质4可有123得到。证明性质5:由U=,则有= UU于是=tr()=tr(UU)= tr(UU)= tr()=证明性质6:6由前面的证明得知令ej=()为单位向量,则*j= ej*,yi= u
10、i *所以,Cov(yi, *j)= Cov(ui *, ej*)= ejD(*) ui= ej ui= ej ui= uij故性质6得证得分评阅人三、运算题共3小题,共20分下面左表为五个观察值,两个变量的数据,右表为用欧氏距离计算的距离矩阵,*1*21572713324655661. 10分写出用R语言分析的命令 (1) 请将数据*1和*2写入R向量中:*1=c(5,7,3,6,6);*1*2=c(7,1,2,5,6);*2 (2) 写出绘制上面散点图的R命令:*1=c(5,7,3,6,6);*1*2=c(7,1,2,5,6);*2plot(*1,*2) (3) 写出绘制系统聚类图的R命令
11、:*=data.frame(*1,*2);*D=dist(*,diag=TRUE,upper=TRUE);Dhc=hclust(D,plete);hcplot(hc)25分 (1) 写出计算下面绝对距离阵的R命令:*1=c(5,7,3,6,6)*2=c(7,1,2,5,6)*=data.frame(*1,*2);*D=dist(*,diag=TRUE,upper=TRUE,p=1);D1 2 3 4 51 0 8 7 3 22 8 0 5 5 63 7 5 0 6 74 3 5 6 0 15 2 6 7 1 02试在图中标出这些距离3.5分试用最长距离法对其进展聚类分析,画出聚类图,并按二类、
12、三类进展分类第一步:计算距离阵*=data.frame(*1,*2);*D=dist(*,diag=TRUE,upper=TRUE);D第二步:进展系统聚类最长距离法hc=hclust(D,plete);hc第三步:画出聚类图1按二类进展分类plot(hc);rect.hclust(hc,2)2按三类进展分类plot(hc);rect.hclust(hc,3)得分评阅人四、案例分析题共2小题,共30分我们知道,财政收入与国民生产总值和税收等经济指标有密切的依存关系。今收集了我国改革开放以来财政收入(y:百亿元),国民生产总值 (*1:百亿元),税收(*2:百亿元),进出口贸易总额(*3:百亿元
13、),经济活动人口(*4:百万人)的局部数据,见下表所示,分析财政收入和国民生产总值、税收、进出口贸易总额、经济活动人口之间的关系。表1 财政收入多因素分析数据y*1*2*3*4199131.4948216.62529.901772.258660.91199234.8337266.51932.969191.196667.82199343.4895345.60542.553112.710674.68199452.1810466.70051.2688203.819681.35199562.4220574.94960.3804234.999688.55199674.0799668.50569.0982
14、241.338697.65199786.5114731.42782.3404269.672708.00199898.7595769.67292.628268.577720.871999114.4408805.794106.8258298.963727.912000133.9523882.281125.8151392.742739.922001163.8604943.464153.0138421.933744.322002189.03641203.327176.3645513.782753.602003217.15251358.228200.1731704.835760.752004263.96
15、471598.783241.6568955.391768.232005316.49291832.174287.78541169.218778.772006387.60202119.235348.04351409.714782.442007513.21782495.299456.21971667.402786.452008613.30353006.700542.19621778.8983790.481. 根本统计分析和R语言命令15分(1) 如果将该数据存入到一个文本文件reg.t*t中,写出将该文本数据读入数据框dat中的R命令:dat=read.table(reg.t*t,header=T)
16、 (1分)(2) 如果将该数据拷贝到剪切板中,写出将该数据读入数据框dat中的R命令:dat=read.table(clipboard,header=T) (1分)(3) 写出提取2000年数据的R命令:dat10, (1分)写出提取税收(*2)数据的R命令:dat,5 (1分)写出提取2001年至2008年经济活动人口(*4)数据的R命令:dat11:18,5 (1分)(4) 写出计算财政收入统计量的R命令:summary(y) (2分) Min. 1st Qu. Median Mean 3rd Qu. Ma*. 31.49 65.34 124.20 188.70 252.30 613.30
17、(5) 写出计算下面相关阵R命令:cor(dat) (2分) y *1 *2 *3 *4y 1.0000 0.9924 0.9999 0.9874 0.8736*1 0.9924 1.0000 0.9938 0.9883 0.9126 *2 0.9999 0.9938 1.0000 0.9881 0.8811*3 0.9874 0.9883 0.9881 1.0000 0.8807*4 0.8736 0.9126 0.8811 0.8807 1.0000(6) 写出计算下面回归系数的R命令:fm=lm(y*1+*2+*3+*4,data=dat);fm(2分)Coefficients:(Int
18、ercept) *1 *2 *3 *4 84.62030 0.00207 1.16908 -0.00305 -0.13391(7) 写出计算下面检验的R命令: summary(fm) (2分)Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) 84.62030 12.74442 6.64 1.6e-05 *1 0.00207 0.00491 0.42 0.68 *2 1.16908 0.02113 55.32 2e-16 *3 -0.00305 0.00367 -0.83 0.42 *4 -0.13391 0.01969
19、-6.80 1.3e-05 *-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 1.18 on 13 degrees of freedomMultiple R-squared: 0.999, Adjusted R-squared: 0.998 F-statistic: 8.87e+04 on 4 and 13 DF, p-value: |t|) (Intercept) 82.10361 9.04442 9.078 1.76e-07 *2 1.16768 0.00385 303.331 2e-16 *4 -0.12945 0.01318 -9.818 6.36e-08 *-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 1.126 on 15 degrees of freedomMultiple R-squared: 1, Adjusted R-squared: 1 F-statistic: 1.94
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 外研八下英语Unit 4 Starting out-Understanding ideas《合作探究二》课件
- 人教 八年级 语文 下册 第1单元《1.社戏 第2课时》课件
- 2026年外包油漆合同(1篇)
- 2025 高中信息技术数据结构在社交网络社群发现与演化分析课件
- 2026年买车抵押合同(1篇)
- 矿山智能频率表项目可行性研究报告
- 2026届浙江宁波十校高三下学期二模历史试题+答案
- 心包疾病的诊断和处理
- 2026届浙江宁波十校高三下学期二模物理试题+答案
- 四川省宜宾市普通高中2023级第二次诊断性测试语文+答案
- 二方审核管理办法
- 工厂能耗管理办法
- 2025年城市燃气项目立项申请报告模板
- 北京政务云管理办法
- 残疾等级评定培训课件
- 瑜伽康复墙培训课件
- 学堂在线 雨课堂 学堂云 工程伦理2.0 章节测试答案
- 2025年高中生物学知识竞赛试题及答案
- T/CIE 115-2021电子元器件失效机理、模式及影响分析(FMMEA)通用方法和程序
- 《水遇冷以后》说课(附反思板书)(课件)四年级下册科学苏教版
- 2025年衡阳市商品房买卖合同(正式版本)
评论
0/150
提交评论