




已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实 验 报 告2013-2014学年第2学期科目名称:管理统计学-基于SPSS软件应用指导老师: 谢 卓 班 级: 信息管理 1201班 学 号: 12415400120 姓 名: 何婷 成 绩: 湖南工业大学 财经学院实 验 一【实验名称】:数据的整理和显示【实验时间】:201年4月4 日【实验目的】:1. 熟练数据整理方法2. 了解数据整理后展示方式【实验内容及要求】:用SPSS软件对某航空公司38名职员性别和工资情况的调查数据进行频次模块分析等。【实验过程及结果】:(1) 将数据文件按income和gender排名次。(2)对gender和salary进行频次模块分析。统计量gendersalaryN有效3838缺失00gender频率百分比有效百分比累积百分比有效F1334.234.234.2M2565.865.8100.0合计38100.0100.0salary频率百分比有效百分比累积百分比有效$16,95012.62.62.6$21,15012.62.65.3$21,45012.62.67.9$21,75012.62.610.5$21,90025.35.315.8$24,00025.35.321.1$26,25012.62.623.7$27,30012.62.626.3$27,75012.62.628.9$27,90012.62.631.6$28,35012.62.634.2$29,10012.62.636.8$30,30012.62.639.5$31,05012.62.642.1$31,20012.62.644.7$31,35025.35.350.0$32,10012.62.652.6$32,55012.62.655.3$35,10012.62.657.9$36,00012.62.660.5$36,15012.62.663.2$38,85012.62.665.8$40,20012.62.668.4$40,80012.62.671.1$42,00012.62.673.7$42,30012.62.676.3$45,00012.62.678.9$46,00012.62.681.6$57,00012.62.684.2$60,37512.62.686.8$81,25012.62.689.5$92,00012.62.692.1$103,75012.62.694.7$110,62512.62.697.4$135,00012.62.6100.0合计38100.0100.0(3)画出salary/100(取整后)茎叶图【结果分析、体会和收获】:通过本次的学习,对SPSS有了初步的了解、对一些数据的导入、变量的设置以及简单的数据分析等基本操作已经熟练掌握;但还有很多不足,对于一些复杂的分析不能完全理解。不过我会慢慢的学习,是自己可以理解的透彻,并熟练的掌握。实 验 二【实验名称】:某年全国31个省、市、自治区的GDP数据分析 大学生月平均生活费支出的调查数据【实验时间】:2014.04.11【实验目的】:求数据平均值、中位数、标准差、峰度、偏度、排序和检验置信区间【实验内容及要求】:1、求出GDP的平均值、人均GDP的平均值、中位数、标准差、峰度、偏度、前五位及后五位的省份,并作出茎叶图、检验人均GDP的95%的置信区间,根据得到的特征值对该年中国GDP和人均GDP情况作出简要分析陈述。2、根据95的置信水平估计:全校本科学生平均月生活费支出的置信区间。得到求的均值为3547.09682、 人均GDP的平均值定义新变量人均GDP计算变量: 人均GDP=GDP值/人口3、 求人均GDP的平均值、中位数、标准差、峰度和偏度 在分析-描述统计-描述里面在选项里面选中均值、标准差、峰度和偏度,点继续、确定所以中位数为0.64824、 求出人均GDP前五位及后五位的省份即对所有省份人均GDP进行排序点击确定,得到前五位的省份是后五位的省份是5、 并作出茎叶图、检验人均GDP的95%的置信区间在分析-描述统计-探索里面在统计量里人居GDP的茎叶图6根据得到的特征值对该年中国GDP和人均GDP情况作出简要分析陈述。GDP的值的高低并不决定人均GDP的高低,因为人均GDP等于GDP值除以人数,GDP受人均GDP和人数共同作用。所以一个地区的GDP值很高 也不能说明该地的人均GDP很高。2、 大学生日常生活费支出及生活费来源状况1根据95的置信水平估计:全校本科学生平均月生活费支出的置信区间。在分析-描述统计-探索里面 ,得到【结果分析、体会和收获】:通过本次学习,在SPSS软件中认识到了求均值、中位数、平均数等一系列的应用,通过两次操作,更加深层了解SPSS软件。 实验三一、实验目的与要求1.熟练掌握T检验的SPSS操作2.学会利用T检验方法解决身边的实际问题 二、实验原理1.假设检验的基本原理三、实验演示内容与步骤 1某项分析希望通过随机调查收集到的26家保险公司人员构成的数据(见数据文件:保险公司人员工程情况.sav),对保险公司从业人员受高等教育的程度和年轻化的程度进行推断。该分析的两个原假设为:(1)保险公司具有高等教育水平的员工比例的平均值不低于0.8,即H0:0.01,表明样本与正态分布没有显著差异2. 为检验某种新的训练方法是否有助于提高跳远运动员的成绩(见训练成绩.SAV),收集到10名跳远运动员在使用新训练方法前后的跳远最好成绩。这样得到了两个配对样本,在对总体分布不作任何假设的条件下,推断新方法训练前后是否存在显著差异。 检验统计量b训练后成绩 - 训练前成绩Z-1.599a渐近显著性(双侧).110a. 基于负秩。b. Wilcoxon 带符号秩检验两个方法的p值都大于0.05,所以没有显著差异3.从甲乙两种不同工艺生产出来的产品中随机选取若干个观测数据(见产品使用寿命.SAV),分析两种工艺产品的使用寿命是否存在显著差异?两个显著性概率p不都大于0.05,所以存在显著差异实验五1、 某企业在制定某商品的广告策略时,对不同广告形式在不同地区的广告效果(销售额)进行了评估,(见数据文件:广告城市与销售额.SAV)。试以商品销售额为观测变量,广告形式和地区为控制变量,利用单因素方差分析分别对广告形式、地区对销售额的影响进行分析。读入数据后:(1) 点击分析,比较均值,单因素分析; (2)得出结果:ANOVA销售额平方和df均方F显著性组间5866.08331955.36113.483.000组内20303.222140145.023总数26169.306143有以上结果可知:广告形式对于销售额是存在影响的。(4) 选择左框中的变量“销售额”,用箭头送入右边的因变量列表中,选择左框中的变量“广告形式”,用箭头送入右边的因子列表中;(5) 得出结论:ANOVA销售额平方和df均方F显著性组间9265.30617545.0184.062.000组内16904.000126134.159总数26169.306143地区对于销售额也是有影响的。对上题进行双因素分析(包括无重复和有重复)无重复双因素分析:操作如下:(1)点击分析,一般线性模型,单变量; (2)将销售额移入因变量,广告形式移入固定因子,地区移入随机因子;(3)点击模型,弹出窗口后点击设定来自定义,选择类型为交互,将广告形式、地区移入右边;(4)得出结果:主体间效应的检验因变量:销售额源III 型平方和df均方FSig.截距假设642936.6941642936.6941179.661.000误差9265.30617545.018a广告形式假设5866.08331955.36121.789.000误差11037.91712389.739b地区假设9265.30617545.0186.073.000误差11037.91712389.739ba. MS(地区)b. MS(错误)3、某补习机构为研究一个班3组不同性别的同学(分别接受了3种不同的教学方法)在数学成绩上是否有显著差异,需要研究不同教学方法和不同性别对数学成绩的影响。数据如表所示。表三组不同性别学生的数学成绩人名数学组别性别Hxh990MaleYaju880FemaleYu990MaleShizg890MaleHah940FemaleS900MaleWatet792MaleJess562FemaleWish892Male2-new1992Male2-new2702Female2-new3892Male2-new4551Female2-new5501Male2-new6671Female2-new7671Male2-new8561Female2-new9561Male试进行方差分析性别和教学方法是否对数学成绩影响显著,说明过程及理由。(4)得出结论:主体间效应的检验因变量:数学源III 型平方和df均方FSig.截距假设99641.101199641.101306.037.038误差321.132.986325.585a组别假设3290.33321645.16718.516.000误差1243.9271488.852b性别假设319.7401319.7403.599.079误差1243.9271488.852ba. 1.025 MS(性别) - .025 MS(错误)b. MS(错误)有结果可知:第六列表示的是F统计量的显著性水平。由此可知,性别对成绩的影响是显著的,组别对成绩的影响是不显著的。实 验 六【实验名称】:普通相关分析【实验时间】:2013年5月20日【实验目的】:1.熟练掌握普通相关分析的SPSS操作2.学会利用普通相关分析方法解决身边的实际问题 【实验内容及要求】:1.某班级学生高等数学和统计学期末考试成绩如表所示,现要研究该班学生的高等数学和统计学成绩之间是否具有相关性,根据数据散点图及相关分析运算结果进行分析。2.某专家先后对一个工程的多个项目加以评分,两次评分分别记为变量“分值1”和“分值2”,如下表所示。问两次评分的等级相关有多大,是否达到显著水平作出分析。3.某农业实验场通过试验取得小麦产量与单位虫害值和平均温度的数据,如下表所示。求单位虫害值对产量的偏相关(剔除温度变量的影响),作简要分析。【实验过程及结果】:一数据散点图及相关分析运算结果进行分析。相关性高等数学统计学高等数学Pearson 相关性1.775*显著性(双侧).000N1818统计学Pearson 相关性.775*1显著性(双侧).000N1818*. 在 .01 水平(双侧)上显著相关。t统计量的值的显著性概率p=0.0000.05,说明剔除温度色影响后,单位害虫值对产量没有显著性关系。【结果分析、体会和收获】:通过本次试验熟练掌握了用spps对两个或多个随机变量的线性相关关系,我们可以先通过散点图对关系进行简单判断,然后再通过数据的具体分析作出进一步判断。 实验七【实验名称】:用SPSS处理经典回归问题【实验时间】:2014年5月 16日【实验目的】:学习如何运用SPSS处理经典回归问题【实验内容及要求】:用SPSS处理经典回归问题来考察中国城镇居民2011年人均可支配收入与消费支出之间的关系【实验过程及结果】:(1)画散点图(2)判断人均可支配收入与消费支出之间是否大致呈线性关系输入移去的变量b模型输入的变量移去的变量方法1消费支出Ya.输入a. 已输入所有请求的变量。b. 因变量: 可支配收入X模型汇总模型RR 方调整 R 方标准 估计的误差1.986a.971.970413.04952a. 预测变量: (常量), 消费支出Y。Anovab模型平方和df均方FSig.1回归1.675E811.675E8981.703.000a残差4947687.22329170609.904总计1.724E830a. 预测变量: (常量), 消费支出Y。b. 因变量: 可支配收入X系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)256.469270.434.948.351消费支出Y.717.023.98631.332.000a. 因变量: 可支配收入X结果分析表1中显示的是拟合过程中变量输入/移去模型的情况记录,由于只引入了一个自变量,所以只出现一个模型1,该模型中“消费支出Y”为进入的变量,没有移除的变量,具体的输入/移去方法为输入。表2是模型拟合概述, 列出了模型的R、R2 、调整R2 及估计标准误。R2 值越大所反映的两变量的共变量比率越高,模型与数据的拟合程度越好。本题所用数据拟合结果显示:R(所考察的自变量和因变量之间的相关系数)= 0.986 ,R2(拟合线性回归的决定系数)= 0.971 ,经调整后的R2=0.970,标准误的估计= 413.04952 。表3方差分析表, 列出了变异源、自由度、均方、F值及对F的显著性检验。本题中回归方程显著性检验结果表明:回归平方和为1.675E8,残差平方和为 4964787.223 ,总平方和为 1.724E8 ,对应的F统计量的值为 981.703 , Sig=0.0000.05,可以认为所建立的回归方程有效,所以COD与BOD5之间成线性关系。表4回归系数表,列出了常数及非标准化回归系数的值及标准化的回归系数,同时对其进行显著性检验。本题中非标准化的回归系数B的估计值为 0.717 ,标准误为0.023,标准化的回归系数为0.986,回归系数显著性检验t统计量的值为 0.948 ,对应显著性水平Sig.= 0.351 0.05,可以偏回归系数与0有显著性差异,被解释的变量和解释的变量的线性关系是显著的,因此,本题回归分析得到的回归方程为:y=-0.492x-5.360 。对方程的方差分析及对回归系数的显著性检验均发现,所建立的回归方程显著。综上所述,人均可支配收入与消费支出之间大致呈线性关系3)用最小二乘估计求回归方程 由公式(为人均可支配收入,y为消费支出)4)决定系数表2是模型拟合概述, 列出了模型的R、R2 、调整R2 及估计标准误。R2 值越大所反映的两变量的共变量比率越高,模型与数据的拟合程度越好。本题所用数据拟合结果显示:R(所考察的自变量和因变量之间的相关系数)= 0.986 ,R2(拟合线性回归的决定系数)= 0.971 1) 给出置信水平为95%的预测区间。【实验过程及结果】:描述性统计量均值标准 偏差N满意度23.00003.3636736Z156.72225.0348036Z254.61115.9679036Z359.72227.4204836Z453.52786.9754136Z553.36115.9240636Z654.30566.2051636Z71.1186.1866736Z814.357811.7214936相关性满意度Z1Z2Z3Z4Z5Z6Z7Z8Pearson 相关性满意度1.000.413.118.326.427-.076.245-.302.486Z1.4131.000.186.386.315.043.213-.223.304Z2.118.1861.000-.006.241.373.045-.127-.144Z3.326.386-.0061.000.217.200.454-.002.270Z4.427.315.241.2171.000.353.322-.606.234Z5-.076.043.373.200.3531.000.330-.066-.004Z6.245.213.045.454.322.3301.000-.164.172Z7-.302-.223-.127-.002-.606-.066-.1641.000-.034Z8.486.304-.144.270.234-.004.172-.0341.000Sig. (单侧)满意度.006.246.026.005.330.075.037.001Z1.006.139.010.031.402.106.096.036Z2.246.139.485.078.012.397.230.200Z3.026.010.485.102.121.003.495.055Z4.005.031.078.102.017.028.000.084Z5.330.402.012.121.017.025.352.491Z6.075.106.397.003.028.025.170.157Z7.037.096.230.495.000.352.170.421Z8.001.036.200.055.084.491.157.421.N满意度363636363636363636Z1363636363636363636Z2363636363636363636Z3363636363636363636Z4363636363636363636Z5363636363636363636Z6363636363636363636Z7363636363636363636Z8363636363636363636输入移去的变量a模型输入的变量移去的变量方法1Z8.步进(准则: F-to-enter 的概率 = .100)。2Z4.步进(准则: F-to-enter 的概率 = .100)。a. 因变量: 满意度模型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.486a.236.2132.98315.23610.499134.0032.583b.340.3002.81436.1045.201133.029a. 预测变量: (常量), Z8。b. 预测变量: (常量), Z8, Z4。Anovac模型平方和df均方FSig.1回归93.428193.42810.499.003a残差302.572348.899总计396.000352回归134.620267.3108.498.001b残差261.380337.921总计396.00035a. 预测变量: (常量), Z8。b. 预测变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论