




已阅读5页,还剩18页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
经济管理专业软件实训A报告系部名称:工商管理系专业名称: 工商管理班 级: 1101姓名: 李振宇经济管理专业软件实训A报告实验名称 SPSS统计分析指导教师王忠福、何宁系别 工商管理系专业班级工商管理1101学号01114007姓名 李振宇实验成果实验报告实验截止时间2012.04.05实验目的熟悉SPSS相关知识以及简单运用实验内容第一章 实验一:统计描述1均值1均值标准误差1中位数1众数1全距:1方差1标准差1四分位数:1十分位数:1频数1峰度1偏度1第二章 实验二:均值比较和T检验1均值比较1单一样本T检验1两独立样本T检验1两配对样本T检验1第三章 实验三:相关分析1实验理论概述1二元定距变量的相关分析2二元定序变量的相关分析2偏相关分析2距离相关分析2第四章 回归分析一元线性回归3多元线性回归分析4第五章 分析报告4第六章 本次软件实训的体会及有可能报告正文:第一章 实验一 统计描述第一节 均值、均值标准误差、中位数、众数、全距姓名 数学成绩A199A288A379A459A554A689A779A856A989A1099A1123A1289A1370A1450A1567A1678A1789A18561、 均值:某个变量所有取值的集中趋势或平均水平。2、 均值标准误差:描述这些样本均值与总体均值之间平均差异程度的统计量。统计量数学成绩N有效18缺失0均值72.94均值的标准误4.751 由以上结果可以看出该班数学的平均成绩为72.944分,均值的标准误差为4.75097.3、 中位数:将总体数据的各个数值按大小顺序排列,居于中间位置的变量。统计量数学成绩N有效18缺失0中值78.50 由上图可以看出该班数学成绩的中位数是78.5分。4、 众数:总体数据中出现次数最多的变量。统计量数学成绩N有效18缺失0众数89由以上结果可以看出该班级数学成绩中成绩为89分的人最多。5、 全距:又称范围,是数据的最大值与最小值之间的绝对差,借以表明总体标志最大可能的差异范围。统计量数学成绩N有效18缺失0全距76由以上结果可以看出该班学生成绩的全距为76分(即99-23=76)。第二节方差、标准差、四分位数、十分位数、频数、峰度、偏度1、 方差:总体所有变量值与其算术平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。2、 标准差:方差的平方根,它表示了一组数据关于平均数的平均离散称度。描述统计量N均值标准差方差数学成绩1872.9420.157406.291有效的 N (列表状态)18 由以上结果可以看出,该班级学生数学成绩的方差为406.291,标准差为20.15666,平均成绩为72.9444.3、 四分位数:将一组数据由小到大(或由大到小)排序后,用3个点将全部数据分为四等分,与这3个点位置上相对应的数值称为四分位数。统计量数学成绩N有效18缺失0百分位数2556.005078.507589.00 由以上结果可以看出,该班学生数学成绩的第一分位数Q1=56,第二分位数Q2=78.5,第三分位数Q3=89。4、 十分位数:将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为10等分,与这9个点位置上相对应的数值称为十分位数。统计量数学成绩N有效18缺失0百分位数1047.302055.603058.104068.805078.506082.607089.008089.009099.0010099.00 由以上结果可以看出,该班学生数学成绩的D6=82,其余十分位数D1=47.3,D2=55.6,D9=99。5、 频数:某变量中某个数据出现的次数。数学成绩频率百分比有效百分比累积百分比有效2315.65.65.65015.65.611.15415.65.616.756211.111.127.85915.65.633.36715.65.638.97015.65.644.47815.65.650.079211.111.161.18815.65.666.789422.222.288.999211.111.1100.0合计18100.0100.0 由以上结果可以看出各个分数的得分人数,如的89分的人最多为4个,得56分、79分和99分的人各有2个,其余的分数都为1人。6、 峰度:描述总体数据所有取值分布形态陡缓程度的统计量。统计量数学分数N有效18缺失0峰度.488峰度的标准误1.038 由上图可以看出个案N为18,峰度为0.488,峰度大于0,表示该班级数学成绩分布比正态分布高峰更加陡峭。7、 偏度:描述的是某总体取值分布的对称性。统计量数学分数N有效18缺失0偏度-.810偏度的标准误.536 由以上结果可以看出个案数N为18个,偏度为0.8010,偏度小于0,表示该班级数学成绩分布中,负偏差数值较大,为负偏或左偏,即和正态分布相比较,分数偏低的人数较多,有一条长尾巴拖在左边。第二章 实验二 均值比较和T检验第一节 均值比较均值比较:即Means过程,它倾向于对样本进行描述的过程,它可以对需要比较的各组计算描述指针,进行检验前的预先分析。它的优势在于所有的描述性统计变量均按因变量的取值分组计算,而无须先进行文件拆分过程,且在输出结果中将各组的描述指针放在一起,以便于相互比较分析,Means过程计算指定变量的综合描述统计计量,包括均值、标准差、总和、观测数量和方差等一系列单变量描述统计量案例处理摘要案例已包含已排除总计N百分比N百分比N百分比数学成绩 * 性别11100.0%0.0%11100.0%报告数学成绩性别均值N标准差方差Female55.25426.550704.917Male84.71713.973195.238总计74.001123.444549.600ANOVA 表a平方和df均方F显著性数学成绩 * 性别组间(组合)2209.82112209.8216.052.036组内3286.1799365.131总计5496.00010a. 分组变量 性别 是字符串,因此无法计算线性检验。相关性度量EtaEta 方数学成绩 * 性别.634.402 以上结果显示:总共11个个案进行了统计,其中男生的数学成绩平均分为84.71分,标准差为13.97;女生的数学成绩平均值为55.25分,标准差为26.55;总体平均值为74分,标准差为23.44.由此可以看出女生的数学成绩总体上说差于男生,未达到总体的平均分。第二节 单一样本T检验问题:分析该班学生的数学成绩和全国的平均成绩70分之间是否存在显著性差异。1、 单一样本T检验:用于检验正态总体的均值是否与给定的检验值之间存在显著性差异。单个样本统计量N均值标准差均值的标准误数学成绩1174.0023.4447.068单个样本检验检验值 = 70 tdfSig.(双侧)均值差值差分的 95% 置信区间下限上限数学成绩.56610.5844.000-11.7519.75由以上结果可以看出:11个学生的数学成绩平均值为74分,标准差为23.44,均值误差为7.07.本例中的检验均值为70分,样本均值和检验均值的差为4,计算出的T值为0.566,相伴概率为0.584。95%的置信区间-11.75,19.75,表示95%的样本差值在该区间内。假设显著性水平a为0.05,由于相伴概率大于a,因此接受原假设,即认为该11名同学的均值和全国的数学均值相比,没有显著性差异。第三节 两独立样本T检验研究问题:分析清华、北大大一学生的高考数学成绩之间是否存在显著性差异1、 两独立样本T检验:用于检验两个独立样本是否来自于具有相同的均值的总体,也就是检验两个独立正态总体的均值是否相等。组统计量source01N均值标准差均值的标准误数学成绩dimension10976.8916.5645.5211969.0023.5377.846独立样本检验方差方程的 Levene 检验均值方程的 t 检验FSig.tdfSig.(双侧)均值差值标准误差值差分的 95% 置信区间下限上限数学成绩假设方差相等.571.461.82216.4237.8899.594-12.44928.227假设方差不相等.82214.363.4247.8899.594-12.63928.417由以上结果可以看出:两个学校9个学生的数学平均分分别为76.89和69分,标准差分别为16.56和23.54,均值误差分别为5.52和7.85.统计量F的相伴概率为0.461,大于显著水平0.05,接受方差相等的假设,即认为两个学校学生的数学成绩无显著差异。方差相等时T检验结果,统计量T的相伴概率为0.423,大于显著性水平0.05,接受T检验的零假设,也就是说,两个学校18个学生高考数学成绩平均值不存在显著差异。第四节 两配对样本T检验问题:研究一个班同学在参加了暑期数学培训之后,数学成绩是否有明显的变化?姓名数学1数学2A19998A28889A37980A45978A55478A68989A77987A85676A98956A109976A112389A128989A137099A145089A156788A167898A178978A1856891、两配对样本T检验:用于检验两个相关样本是否来自具有相同均值的总体,即对于两个配对样本,推断两个总体的均值是否存在显著差异。成对样本统计量均值N标准差均值的标准误对 1数学172.941820.1574.751数学284.781810.3392.437成对样本相关系数N相关系数Sig.对 1数学1 & 数学218-.077.761成对样本检验成对差分tdfSig.(双侧)均值标准差均值的标准误差分的 95% 置信区间下限上限对 1数学1 - 数学2-11.83323.3525.504-23.446-.221-2.15017.046 由以上结果可以看出:参加培训前后,该班学生数学成绩分别为72.94和84.77分,培训前后数学成绩序列的均值相差-11.83。计算出的T统计量为-2.15,相伴概率为0.046,比显著水平0.05小,因此拒绝原假设,即认为培训前后该班学生的数学成绩有显著的差异,培训后,该班学生数学成绩明显提高。第三章 实验三 相关分析第一节 实验理论概述1、 实验理论概述 任何事物的变化都与其他事物是相互联系和相互影响的,用于描述事物数量特征的变量之间自然也存在一定的关系。变量之间的关系归纳去来可以分为两种类型,即函数关系和统计关系。衡量事物之间,或称变量之间的线性相关程度的强弱并用适当的统计指标表示出来,这个过程就是相关分析。比较直接和常用的一种方法是绘制散点图,但是为了能更加准确地描述变量之间的线性相关程度,可以通过计算相关系数来进行分析。如果相关系数是根据总体全部数据计算的,称为总体相关系数,记为p,如果是根据样本数据计算来的,则称为样本相关系数,记为r.在统计学中,一般用样本相关系数r来推断总体相关系数。 相关系数的取值范围在-1和+1之间,即-1r+1.其中: 若0r1,表明变量之间存在正相关关系。 若-1r0,表明变量之间存在负相关关系。 当|r|=1时,其中一个变量的取值完全取决于另一个变量,二者即为函数关系;若r=+1,表明变量之间完全正相关;若r=-1,表明变量之间完全负相关。 当r=0时,说明变量之间不存在线性相关关系。在说明变量之间线性相关程度时,根据经验可将相关程度分为以下几种情况: 当|r|0.8时,视为高度相关。 0.5|r|0.8时,视为中度相关。 0.3|r|0.5时,视为低度相关。 |r|0.3时,说明变量之间的相关程度极弱,可视为不相关。a) 二元定距变量的相关分析统计学上的定义和计算公式 二元定距变量的相关分析是指通过计算定距变量间两两相关的相关系数,对两个或两个以上定距变量之间两两相关的程度进行分析。 在二元相关分析过程中比较常用的几个相关系数是Pearson简单相关系数、Sperman和Kendalls tua-b等级相关系数。 Pearson简单相关系数用来衡量定距变量间的线性关系。 研究问题: 某班级学生数学和化学期末成绩如图所示,现要研究该班学生的数学和化学成绩之间是否具有相关性。人名数学化学Yuli9990Yafe8899Ty6570Yu8978Zhang9488Wang9088Hai7975Bill9598Cfei9598Kake8099Jou7089Heyy8998Marry8588Mary5060Ming8787Chen8787Smith8688Jess7679 SPSS操作结果:描述性统计量均值标准差N数学83.5612.14218化学86.6110.77118相关性数学化学数学Pearson 相关性1.742*显著性(双侧).000N1818化学Pearson 相关性.742*1显著性(双侧).000N1818*. 在 .01 水平(双侧)上显著相关。 由以上结果可以得出第一个表格所有人(n=18)的数学成绩(83.5556)、数学成绩的标准差(12.14240)、化学平均成绩(96.6111)和化学成绩的标准差(10.777109)。 第二个表格则是所要求的相关系数,它以一个矩阵的形式表示。从中可以看出,数学成绩和化学成绩的相关系数为0.742.在这个数据的旁边有两个星号,表示用户指定的显著性水平为0.01时,统计检验的概率小于等于0.01,即数学和化学显著相关,且为正相关。绘制相关散点图 从图中明显看出这两个变量线性正相关,数学成绩好的学生其化学成绩也较好。第三节 二元定序变量的相关分析 研究问题某语文老师先后两次对其班级学生同一篇作文加以评分,两次成绩分别记为变量“作文1”和“作文2”,如图所示。问两次评分的等级相关有多大,是否达到显著水平?人名作文1作文2Yuli8683Yafe7882Ty6270Yu7573Zhang8992Wang6765Hai9693Bill8085Cfei7775Kake5965Jou7975Heyy6870Marry8580Mary8775Ming7580Chen7378Smith9590Jess8890 实现步骤步骤1在“Analyze”菜单“Correlate”中选择Bivariate命令,如图所示。步骤2在弹出如图所示的Bivariate Correlate对话框中,从对话框左侧的变量列表中分别选择“作文1”和“作文2”变量,单击 按钮使这两个变量添加到Variables框。在Correlation Coefficients框中选择Spearman和Kendalls tua-b等级相关系数;在Test of significance框中选择相关系数的双侧(Two-tailed)检验,选中Flag significations correlations 选项,则相关分析结果中将不显示统计检验的相伴概率,而以星号(*)显示。如图。步骤3单击OK按钮,SPSS开始计算Spearman和Kendalls tua-b等级相关系数。SPSS的运行结果如下:相关系数作文1作文2Kendall 的 tau_b作文1相关系数1.000.745*Sig.(双侧).000N1818作文2相关系数.745*1.000Sig.(双侧).000.N1818Spearman 的 rho作文1相关系数1.000.874*Sig.(双侧).000N1818作文2相关系数.874*1.000Sig.(双侧).000.N1818*. 在置信度(双测)为 0.01 时,相关性是显著的。 从结果中可以看出,语文老师两次评分的Spearman和Kendalls tua-b等级相关系数分别为0.745和0.874.在这个数据的旁边有两个星号,表示用户指定的显著水平为0.01时,统计检验的相伴概率小于等于0.01,即两次评分显著相关,且为正相第四节 偏相关分析偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程。相关性控制变量产量降雨量温度-无-a产量相关性1.000.981.986显著性(双侧).000.000df088降雨量相关性.9811.000.957显著性(双侧).000.000df808温度相关性.986.9571.000显著性(双侧).000.000.df880温度产量相关性1.000.780显著性(双侧).013df07降雨量相关性.7801.000显著性(双侧).013.df70a. 单元格包含零阶 (Pearson) 相关。 从结果中可以看到,上班部分是变量两两之间的Partial简单相关系数,以“产量”和“降雨量”为例,它们之间的Partial简单相关系数为0.9811。下半部分是偏相关分析的输出结果,其中,对每个变量都有三行输出结果;第一行为偏相关系数、第二行为统计检验的自由度,第三行为检验统计量的相伴概率。从中可知,在剔除“温度”变量的影响条件下,“产量”与“降雨量”二变量的影响条件下,“产量”与“降雨量”二变量的偏相关系数为0.7803,自由度为7,相伴概率为0.013。可见,简单相关系数和偏相关系数相比,前者有夸大的成分,后者更符合实际。第五节 距离相关分析 距离相关分析是对观测量之间或变量之间相似或不相似的程度的一种测量,可以用于同一变量内部各个取值间,以考察其相互接近程度;也可用于变量之间,以考察预测值对实际值的拟合优度。 距离相关分析根据统计量不同,可分为:不相似性预测和相似性预测。根据分析对象不同,可以分为:样本间分析和变量间分析。研究问题1变量之间的相似性预测分析案例处理摘要案例有效缺失合计N百分比N百分比N百分比6100.0%0.0%6100.0%近似矩阵 值向量间的相关性 r1r2r3r11.000-.041-.564r2-.0411.000-.263r3-.564-.2631.000这是一个相似性矩阵 第一个表格是个案概述,表明6个个案数据全部有效。第二个表格列出了变量之间的相似性分析结果。从表格中可以看出,第一次测量和第三次测量的结果较为一致,但一致不是很明显;第一次测量和第二次测量的结果最不一致;第二次测量和第三次侧量的结果也不太一致。研究问题2变量之间的不相似性测量分析案例处理摘要案例有效缺失合计N百分比N百分比N百分比6100.0%0.0%6100.0%近似矩阵 Euclidean 距离 r1r2r3r1.000.010.010r2.010.000.010r3.010.010.000这是一个不相似性矩阵 第一个表格是个案概述,第二个表格列出了变量之间的相似性分析结果。第二个表格列出了3个个案之间的相似性分析结果。 研究问题3个案之间的相似性预测分析案例处理摘要案例有效缺失合计N百分比N百分比N百分比3100.0%0.0%3100.0%近似矩阵 值向量间的相关性 12311.000.999.9992.9991.0001.0003.9991.0001.000这是一个相似性矩阵 第一个表格是个案概述, 第二个表格列出了3个个案之间的相似性分析结果。从表格中可以看出,3个个案的相似性非常高,分别为0.999和1.其中第二个和第三个幼子最相近。研究问题4个案之间的不相似性预测分析案例处理摘要案例有效缺失合计N百分比N百分比N百分比3100.0%0.0%3100.0%近似矩阵 Euclidean 距离 1231.00011.26913.191211.269.0002.236313.1912.236.000这是一个不相似性矩阵第一个表格是个案概述,表明3个数据全部都有效。第二个表格列出了3个个案之间的不相似性分析结果。从表格中可以看出,第一个幼子和第二个幼子之间的欧氏距离为11.269;第一个幼子和第三个幼子之间的欧氏距离为13.191;第二个幼子和第三个幼子之间的欧氏局距离为2.236,可见第二个幼子和第三个幼子最相近。第四章 实验四 回归分析原理:线性回归分析是研究一个因变量和一个或多个自变量之间是否存在某种线性关系的统计学方法。第一节 一元线性回归一元线性回归:研究一个自变量与一个因变量间是否存在线性关系,要求因变量是随机变量,自变量一般是可控制的普通变量。输入移去的变量b模型输入的变量移去的变量方法1拉伸倍数a.输入a. 已输入所有请求的变量。b. 因变量: 强度(kg/mm)模型汇总模型RR 方调整 R 方标准 估计的误差1.986a.972.969.4118a. 预测变量: (常量), 拉伸倍数。Anovab模型平方和df均方FSig.1回归58.894158.894347.273.000a残差1.69610.170总计60.59011a. 预测变量: (常量), 拉伸倍数。b. 因变量: 强度(kg/mm)系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量).166.278.595.565拉伸倍数.867.047.98618.635.000a. 因变量: 强度(kg/mm)第二节 多元线性回归分析 原理:多元线性回归是研究多个自变量与一个因变量间是否存在线性关系(相互依存关系),并用多元线性回归方程来表达这种关系(或用回归方程定量地刻画一个因变量与多个自变量间的线性依存关系)。描述性统计量均值标准 偏差N满意度23.003.36436Z156.725.03536Z254.615.96836Z359.727.42036Z453.536.97536Z553.365.92436Z654.316.20536相关性满意度Z1Z2Z3Z4Z5Z6Pearson 相关性满意度1.000.413.118.326.427-.076.245Z1.4131.000.186.386.315.043.213Z2.118.1861.000-.006.241.373.045Z3.326.386-.0061.000.217.200.454Z4.427.315.241.2171.000.353.322Z5-.076.043.373.200.3531.000.330Z6.245.213.045.454.322.3301.000Sig. (单侧)满意度.006.246.026.005.330.075Z1.006.139.010.031.402.106Z2.246.139.485.078.012.397Z3.026.010.485.102.121.003Z4.005.031.078.102.017.028Z5.330.402.012.121.017.025Z6.075.106.397.003.028.025.N满意度36363636363636Z136363636363636Z236363636363636Z336363636363636Z436363636363636Z536363636363636Z636363636363636输入移去的变量b模型输入的变量移去的变量方法1Z6, Z2, Z1, Z4, Z5, Z3a.输入a. 已输入所有请求的变量。b. 因变量: 满意度模型汇总b模型RR 方调整 R 方标准 估计的误差更改统计量Durbin-WatsonR 方更改F 更改df1df2Sig. F 更改1.607a.368.2382.937.3682.818629.0282.055a. 预测变量: (常量), Z6, Z2, Z1, Z4, Z5, Z3。b. 因变量: 满意度Anovab模型平方和df均方FSig.1回归145.860624.3102.818.028a残差250.140298.626总计396.00035a. 预测变量: (常量), Z6, Z2, Z1, Z4, Z5, Z3。b. 因变量: 满意度系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)4.4077.733.570.573-11.40920.223Z1.128.114.1911.118.273-.106.361.413.203
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 乐理音程考试题库及答案
- 森林防护巡护知识培训课件
- 森林家庭防火知识培训课件
- 棋王课件中职
- 海南省养老护理员职业资格技师考试题(含答案)
- 2025年精细化工作业面试宝典涵盖各类工艺作业预测题
- 2025年裁判台球考试题及答案
- 2025年公路水运安全员(交安abc)考试考核题库答案
- 2025年项目经理从业资格认证考试模拟试题集及答题技巧
- 2025年软件工程师职称评定预测试题及答案参考
- 征收房屋转让协议书
- 锅炉使用单位安全员考试试题
- 上海世博轴及地下综合体工程施工组织设计
- 液化天然气码头设计规范JTS 165-5-2021
- TFSI 098-2022 《氨基硅油》发布稿
- 2025年高考物理二轮复习:11个模块知识讲义
- 胖东来面试题及答案
- 2024初级注册安全工程师笔试真题含答案
- 海宁市食品农产品检验检测中心改建项目环评报告
- 石油化工设计能耗计算标准
- 泵站运行管理规范
评论
0/150
提交评论