2015试卷统计方法与软件应用.doc_第1页
2015试卷统计方法与软件应用.doc_第2页
2015试卷统计方法与软件应用.doc_第3页
2015试卷统计方法与软件应用.doc_第4页
2015试卷统计方法与软件应用.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

杭州电子科技大学研究生考试卷第 8 页 共 8 页考试课程统计方法与软件应用考试日期2015年6月8日成 绩学 院管理学院学 号姓 名一、(本题30分)现收集了财政收入(Y)与工业总产值(X1)、建筑业总产值(X2)19781990年数据,经分析回归方程为(使用普通最小二乘估计法): Y=524.536+0.05265X1+0.454X2 t值 (7.518) (2.695)(3.214)R2 =0.990 F=246.2401 对该回归方程的拟合效果进行评价。 R2称为(样本)可决系数,它是最常用的回归直线拟合优度的度量,表示由回归模型做出解释的变差在总变差中所占的比重。R2的取值范围是0到1,越接近1表示回归方程的拟合效果越好。由于R2 =0.990已经非常接近1,所以其拟合效果较好。t检验自由度=13-2-1=10,=0.05,/2=0.025。t0.025(10)=2.228。由于|t0|=|7.518|,|t1|=|2.695|,|t2|=|3.214|均大于t0.025(10)=2.228,所以系数1,2, 3的拟合效果均显著。 F检验自由度=13-2-1=10。=0.05, F0.05(2,10)=4.1。 F=246.2404.1,所以该回归方程的拟合效果显著。 2 有人认为:因为X2的回归系数大于X1的回归系数,所以建筑业总产值对财政收入的贡献大于工业总产值对财政收入的贡献,该说法是否正确,为什么? 不对。应该剔除因变量y和自变量x1,x2所取单位的影响。所以应该使用标准回归系数。 其计算公式为:若假定回归方程的形式如下:Y = b0 + b1X1 + b2X2 + + bjXj + +bJXJ (Y是估计值)其中,回归参数b0,b1,bJ通过最小二乘法求得。则标准化回归系数 bj = bj*(Xj的标准差/Y的标准差)3 若Y与X1,X2的偏相关系数分别为ry1;2=0.64916,ry2;1=0.71188。这说明了什么?可能用到的有关临界值: F0.05(2,10)=4.1, F0.05(2,13)=3.8, t0.05(10)=1.812,t0.025(10)=2.228。偏相关系数:在多元回归分析中,在消除其他变量影响的条件下,所计算的某两变量之间的相关系数。ry1;2=0.64916,在值域0.5,0.8)之间,所以剔除x2的影响,y和x1的中等正相关。ry2;1=0.71188,在值域0.5,0.8)之间,所以剔除x1的影响,y和x2的中等正相关。又,ry1;2=0.64916表示在其他变量不变的情况下,X1与Y的关系为:X1增加一倍,Y增加0.64916倍,ry2;1=0.71188表示,在其他变量不变的情况下,X2与Y的关系为:X2增加一倍,Y增加0.71188倍。由于ry2;1=0.71188ry1;2=0.64916说明Y与X2的相关性比Y与X1的相关性更强。二、(本题30分)为了研究小学高年级学生的“学习焦虑”问题,有人使用SPSS的General Linear Model进行了统计分析,软件的默认输出结果如下。要求:(1)对该输出结果进行解释;(2)提出进一步的统计分析建议。(1) 上表给出了有交互因子的方差分析结果。根据概率值p与显著性水平的比较来判断,这里,性别、年级、性别*年级的P值分别为0.000、0.001、0.000,均小于显著性水平0.01,所以可以推断:性别因子、年级因子、以及性别和年级的交互作用对学习焦虑这个因变量都有高度显著的影响。(2) 通过这些步骤,只能判断两个控制变量以及它们的交互因素是否对观察变量产生了显著影响。如果要进一步了解不同性别的焦虑程度、不同年级的焦虑程度,以及男生在不同年级、女生在不同年级的焦虑程度有什么不同,就需要在多个样本均数间两两比较。可以用LSD法和S-N-K法进行多重比较,看他们之间具体存在什么差别。3、 (本题40分)用SPSS软件对重庆市40县区2001年的经济发展数据进行统计分析,请写出必要的过程及相应结论。摘 要:对2001年重庆40县区的9个经济发展指标(GDP、工业总产值、农业总产值、水陆货物周转量、邮电通讯总量、固定资产投资、地方财政预算内收入、城乡居民储蓄存款余额、社会消费品零售总额),应用 SPSS统计软件对此进行了相关分析与因子分析。关键词:经济发展水平; 因子分析; 重庆1.变量间的相关性分析利用SPSS软件对原始数据做标准化处理,然后计算得出各指标之间的相关系数矩阵,其结果见图1。图1 相关系数矩阵由图1不难得出,原始变量数据中,X1(GDP)和X6(固定资产投资),X1(GDP)和X7(地方财政预算内收入),X6(固定资产投资)和X7(地方财政预算内收入),X1(GDP)和X9(社会消费品季售总额), X5(邮电通讯总量)和X9(社会消费品季售总额), X7(地方财政预算内收入)和X9(社会消费品季售总额),X8(城乡居民储蓄存款余额)和X9(社会消费品季售总额)的pearson相关系数均大于0.8,均存在着较大的正相关。 故,有必要进行因子分析。2 因子分析 过程展示如以下截图: 结果分析:结果一:公因子方差(图2)由此表看出,各个变量的共同度都比较大,说明变量空间转化为因子空间时,保留了比较多的信息,因此,因子分析的效果是显著的。结果二:解释的总方差(图3)从此表看出,前3个因子的累积贡献率已达到89.031%。结果三:碎石图(图4)碎石图中,特征值大于1的因素有3个,因此本题选择3个公共因子。结果四:旋转因子成分矩阵(图5)从此表看出,旋转因子后,第一主因子主要由GDP、水陆货物周转量、邮电通讯总量、固定资产投资、地方财政预算内收入、城乡居民储蓄存款余额、社会消费品零售总额这7个变量决定;第二主因子主要由农业总产值决定;第三主因子主要由工业总产值决定。结果五:成份得分系数矩阵(图6)由成份得分系数矩阵,我们可以计算相互各个因子的得分情况。Factor_1=0.150X1+0.047X2+0.004X3+0.130X4+0.178X5+0.141X6+0.164X7+0.161X8+0.175X9Factor_2=0.209X1-0.111X2+0.887X3-0.081X4-0.087X5+0.113X6+0.070X7-0.065X8-0.113X9Factor_3=0.127X1+0.733X2-0.063X3+0.117X4-0.540X5+0.192X6 -0.045 X7-0.157X8-0.171X9计算每个县市的综合得分。用每个成分提取的方差占比作权数乘以每个因子的得分。综合得分依次计算出各县市的综合得分。并按照综合得分对其排名。表1 第一、第二、第三主成分得分及综合得分前三名与后三名的地区排名成分第一主成分(rfact1_1)第二主成分(rfact2_1)第三主成分(rfact3_1)综合(rf)1渝中区 江津市 九龙坡 渝中区 2万州区 合川市 沙坪坝 九龙坡 3九龙坡 开县 南岸区 万州区 38巫溪县双桥区万州区巫溪县39双桥区江北区忠县城口县40城口县渝中区渝中区双桥区如果一个区域在某一主成分上的得分为正,则意味着这一区域的该主成分在平均发展水平之上;反之,得分为负则表明在平均水平以下。综合主成分得分反映了经济综合发展水平。回顾对三种主成分的分析:第一主因子主要由GDP、水陆货物周转量、邮电通讯总量、固定资产投资、地方财政预算内收入、城乡居民储蓄存款余额、社会消费品零售总额这7个变量决定;第二主因子主要由农业总产值决定;第三主因子主要由工业总产值决定。从表1中可知,渝中区、九龙坡、万州区综合经济发展水平最高,巫溪县、城口县、双桥区综合经济发展水平最低。第1、 第二和第三主成分得分排名上的差异,综合反映了9个经济发展状况的评价指标在区域结合上的差异。江津市、合川市、开县的农业产值最高,双桥区、江北区、渝中区的农业产值最低。九龙

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论