统计学大作业_第1页
统计学大作业_第2页
统计学大作业_第3页
统计学大作业_第4页
统计学大作业_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.宁波大红鹰学院工商管理分院应用统计学实验(践)报告专业:工商管理专业班级:学生姓名:同组人员:无任课老师:黄涛2017年6月12日目录实验(一) SPSS安装2实验(二) 统计数据的搜集与整理6实验(三)统计数据的图表描述9实验四 统计数据的度量16实验五 统计抽样与参数估计19实验六 相关与回归分析24实验七 统计数据的动态分析33实验八 统计指数分析35实验(一) SPSS安装.一、实验名称:SPSS安装二、实验目的:学会安装spss软件及有关操作三、实验步骤:SPSS的安装和启动 在启动SPSS软件之前,需要先在计算机上进行安装。其安装方法主要有两种:一是直接使用SPSS安装光盘进行安

2、装;二是通过网络下载SPSS安装程序进行安装。本小节使用第二种方法详细介绍SPSS的安装步骤(以IBM SPSS 19.0为例)。1.打开计算机,找到已经下载到计算机上的SPSS安装程序。如图一图 一2.单击该图标,按照顺序下去,直到出现如下界面,单击“下一步”,则弹出对话框;个人用户选择第一个“单个用户许可证”,如果图二所示。图 二3.单击“下一步”,切换到用户协议对话框。在该对话框中接受用户协议,然后单击“下一步”,如图三所示。图 三 4.单击“下一步”,显示客户信息。在该对话框中填写好用户姓名与单位,然后单击“下一步”,如图四所示。图 四5.单击“下一步”,语言选择。选择“英语”,然后单

3、击“下一步”,如图五所示。图 五6.在弹出的对话框中是选择文件安装位置,如图六所示。在该对话框中单击“更改”,可调整软件的安装位置。图 七7.在选择文件安装对话框中单击“下一步”,在弹出的对话框中单击“安装”即可,如图七所示。 图 七8.此时则弹出正在安装的界面,如图八所示。图 八9.在以上安装程序完后,则弹出授权许可证的对话框。把框中的勾去掉,单击“确定”,如图九所示。图 九 10.此时则弹出产品授权对话框,选择“启用以用于临时使用”按钮,单击“下一步”,如图十所示。图 十11.单击“”按钮,选择文件“temp.txt”,再单击“打开”,如图十一所示。图十一12.单击“下一步”,弹出临时使用

4、期已启用对话框,单击“完成”。如图十二所示。图 十二13.再找到已经下载到计算机上的SPSS安装程序的补丁,双击该程序,单击“下一步”,如图十三所示。图 十三14.确认好安装文件夹路径,单击“下一步”, 便开始安装,如图十四所示。图 十四安装完成后,便可以启动SPSS软件了。启动SPSS软件的方法主要有以下三种:(1)单击“开始”菜单中的IBM SPSS 19.0命令,如图十五所示。图 十五(2)双击.sav格式的文件,因为SPSS的默认文件格式为.sav。(3)从安装程序直接启动。如果在桌面创建了SPSS快捷菜单,可双击桌面上的快速启动图标四、实验后记(必写)出现的错误与解决(概述)问题:在

5、spss安装过程中一些具体过程细节没有注意,导致出现安装失败。解决方法:具体研究实验指导书要求及方法并请教老师,重新安装直至成功。希 望利用好SPSS软件,让其真正帮助平时的生活及学习中。实验(二) 统计数据的搜集与整理一、实验名称:统计数据的搜集与整理二、实验内容:上网搜集反映我国历年国民经济发展情况的主要统计数据(包括:国内生产总值、固定资产投资总额、进出口额、社会商品零售总额、能源消耗量、年末人口总数、人均可支配收入、铁路货运量、居民消费价格指数、人口出生率、城镇人口数和农村人口数)。三、实验步骤1、请说出上述统计指标的含义。国内生产总值:是指一个国家或者地区所有常驻单位在一定时期内生产

6、的所有最终产品和劳务的市场价值。GDP是国民经济核算的核心指标,也是衡量一个国家或地区总体经济状况重要指标。固定资产投资总额:以货币表现的建造和购置固定资产活动的工作量,它是反映固定资产投资规模、速度、比例关系和使用方向的综合性指标。进出口额:指实际进出我国国境的货物总金额。进出口总额用以观察一个国家在对外贸易方面的总规模。我国规定出口货物按离岸价格统计,进口货物按到岸价格统计。社会商品零售总额:指各种经济类型的批发零售贸易业、餐饮业、制造业和其他行业对城乡居民和社会集团的消费品零售额和农民对非农业居民零售额的总和。能源消耗量:指能源使用单位在报告期内实际消费的一次能源二次能源的数量。年末人口

7、总数:是指某年12月31日24时的人口数,或者是下年l月1日零时的人口数,即下年的年初人口数。年末人口数或下年年初人口数通过人口经常登记或抽样调查推算的办法取得,也可以用(上年年末人口数+本年出生人数-本年死亡人数+本年迁入人数-本年迁出人数)求得。人均可支配收入:指居民家庭全部收入中,可用于支付生活费用的收入。人均可支配收入是按家庭全部人口计算的平均每人生活费收入。它包括居民家庭所有成员的工资、奖金、津贴、洗理费、书报费、交通补贴、价格补贴、独生子女费以及离、退休者收入、赡养赠送收入、出售财物收入、利息收入、稿费、讲课费等全部经常和一次性收入,但应扣除赡养、赠送支出、记帐补贴、个种税金(个人

8、所得税、车船使用税等)铁路货运量:货运量是指设计线(或区段)一年内单方向需要运输的货物吨数。居民消费价格指数:CPI(Consumer Price Index),即居民消费价格指数,指在反映一定时期内居民所消费商品及服务项目的价格水平变动趋势和变动程度。居民消费价格水平的变动率在一定程度上反映了通货膨胀(或紧缩)的程度。居民消费价格指数是度量居民生活消费品和服务价格水平随着时间变动的相对数,综合反映居民购买的生活消费品和服务价格水平的变动情况。是进行国民经济核算、宏观经济分析和预测、实施价格总水平调控的一项重要指标,并且世界各国一般用消费价格指数作为测定通货膨胀的主要指标。人口出生率:指某地在

9、一个时期内(通常指一年)出生人数与平均人口之比,它反映了人口的出生水平,一般用千分数表示。城镇人口数:是指居住于城市、集镇的人口,主要依据人群的居住地和所从事的产业进行归类。“城镇人口”的特点所从事的产业为非农业生产性产业(自然经济)为主的人群及其家庭;一般认为城镇人口占有率的高低反应出一个地区的工业化、城镇化或城市化水平。在中国大陆,“城镇人口”自1990年代前后在统计学领域渐渐使用较多的用语,以代替之前非农业人口。农村人口数:包括农业人口和一部分非农业人口。中国现行统计制度规定:农村人口包括:国营农场户数中的常住人口。乡村户数中的常住人口。其中包括常住农村的外出民工、工厂临时工、户口在农村

10、的外出学生,但不包括户口在农村的国家职工。2、请将相关数据整理至一张表格中2003-2013年数据表:时间国内生产总值(亿)固定资产投资总额(亿)进出口额(亿)社会商品零售总额(亿)能源消耗量(吨)年末人口总数(万人)人均可支配收入(元)铁路货运量(吨)居民消费价格指数人口出生率()城镇人口数(万人)农村人口数(万人)2003137422.055566.6170483.5052516.3197083.001292278472.2224248101.212.4152376768512004161840.270477.4395539.1059501.0230281.001299889421.624

11、9017103.912.2954283757052005187318.988773.61116921.8068352.6261369.0013075610493.0269296101.812.4056212745442006219438.5109998.16140974.0079145.2286467.0013144811759.5288224101.512.0958288731602007270232.3137323.94166924.1093571.6311442.0013212913785.8314237104.812.1060633714962008319515.5172828.401

12、79921.47114830.1320611.0013280215780.8330354105.912.1462403703992009349081.4224598.77150648.06133048.2336126.0013345017174.733334899.311.9564512689382010413030.3251683.77201722.15158008.0360648.0013409119109.4364271103.311.9066978671132011489300.6311485.13236401.99187205.8387043.0013473521809.839326

13、3105.411.9369079656562012540367.4374694.74244160.21214432.7402138.0013540424564.7390438102.612.1071182642222013595244.4446294.09258168.89242842.8416913.0013607226467396697102.612.0873111629612、相关数据表格3、请指出所搜集到的各组数据有何特征和规律。答:逐年上涨的趋势,每年的数据都在不断地攀升,经济不断发展。4、投资、出口、内需是拉动GDP增长的三驾马车,从数据中能否看出谁的贡献最大?为什么?答:从数据中

14、看出是投资的贡献最大。原因从数据观察看出投资的增长量最大,且增长速度最快,影响力最大。今后我国应大力发展内需,使投资、出口、内需三者达到均衡。5、GDP与人均可支配收入、铁路货运量存在什么关系?答:人均可支配收入越高铁路货运量也越大。6.请计算我国历年的城镇化率。四、实验后记(必写)出现的错误与解决(概述)在实验过程当中经常会忘记勾选显示正态图,导致后面要再去修改,非常浪费时间。希 望希望能够熟练掌握spss软件,不用看着视频来做,操作起来更方便、更快。实验(三)统计数据的图表描述习题2.1结果分析描述性统计表从表2.1中可以读出以下信息:有效样本为50个,没有缺失值。学生的平均体重为62.7

15、82,标准差为6.7214,最大值是76.2,最小值是48.3等等。频数分布表2.1 描述性统计表表2.2给出了学生体重的频数分布。该表中从左到右分别是有效样本值、频数、频数占总数的百分比、有效数占总数的百分比、累计百分比。表2.2 频数分布 (1) 带正态曲线的直方图图2.1是学生体重的直方图,从图中可以看出学生体重近似服从正态分布,而且集中趋势是集中在63。图2.1 正态曲线分布图习题2.2结果分析表2.3 描述性分析结果如表2.3所示,样本个数为50个,极差为27,最小值是154,最大值是181,均值为169.72,均值的标准误是0.989,标准差是6.993,方差是48.900,偏度系

16、数是-0.446,峰度系数是-0.760。描述性统计分析有一个特色是,它可以将原始数据转换成标准化的取值并以变量的形式存入当前的数据库。如图2.2所示。图2.2习题2.3分析结果(1) 数据记录统计表表2.4从表2.4中可以读出以下信息:粤东气温组有12个样本,粤西气温组也是12个样本,都没有缺失值记录。案例处理摘要地区案例有效缺失合计N百分比N百分比N百分比降雨量粤东12100.0%0.0%12100.0%粤西12100.0%0.0%12100.0%(2) 城市分组的各组描述统计量表2.5从表2.5中可以看到各组的描述统计量,包括均值、标准差、最大值、最小值、极差等。(3) M估计量表2.6

17、M估计量可以用来判别数据中有无明显异常值。Spss输出的M估计量有4种,分别是Huber、Tukey、Hampel、Andrews提出来的,其区别似乎使用的权重不同。从表2.6中可以看到4种不同权重下的最大似然数。容易发现,粤东和粤西的降雨量的4个M估计量离平均数和中位数都很近,这就说明数据中应该没有明显的异常值。(4) 分组后的百分位数表2.7百分位数是一种位置指标,它将一组观察值分为两部分。比如百分位数5代表的值就表示理论上有5%的观察值比该值小,有95%的观察值比该值大。表2.7中可以看出分组后的各个百分位数。百分位数地区百分位数5102550759095加权平均(定义 1)降雨量粤东1

18、369.1001381.0701409.6251499.4501859.3252178.100.粤西1222.6001235.7401377.4501922.8002304.3752391.200.Tukey 的枢纽降雨量粤东1409.6501499.4501770.750粤西1382.5001922.8002294.250(5) 最大值最小值(TOP5)表2.8表2.8给出了分组后的5个极大值和极小值。(6) 正态分布的检验结果如表2.9所示,两组的显著性都很低,正态分布特征不明显。表2.9正态性检验地区Kolmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量d

19、fSig.降雨量粤东.30212.003.77512.005粤西.22412.098.84912.036a. Lilliefors 显著水平修正(7) 直方图两个地区降雨量的直方图如图2.3所示,容易发现两组各年降雨量都无明显集中趋势。图2.3(8) 茎叶图图2.4所示是两组数据的茎叶图。从左往右分别是频数、茎、叶三部分。其中茎代表数值的整数部分,叶代表数值的小数部分。每行的茎叶构成的数字再乘以茎宽,则为实际数据的近似值。图2.4(9) 正态概率图图2.5是粤东和粤西降雨量的正态概率图,其中的斜线表示正态分布的标准线,点表示实际数据的分布,各点越接近于直线,则数据的分布越接近于正态分布。本例中

20、两个地区的分布拟合度都不是很好,说明正态分布并不明显。图2.5(10) 去除掉趋势的正态概率图图2.6是去除掉趋势的正态概率图。去掉趋势的正态概率图反映的是按正态分布计算的理论值和实际值之差(也就是残差)的分布情况。如果数据从正态分布,数据应该均与的分布在中间标准线的上下。本例中,数据点的分布不仅不均匀,还存在着一定的波动趋势,所以正态分布特征不明显。图2.6(11) 箱图图2.7给出了粤东降雨量和粤西降雨量的箱图。其中箱分为四分位间距的范围。所谓四分位间距救市百分位数75代表的值减去百分位数25代表的值。中间的粗线表示平均数,上面和下面的细线分别表示最大值和最小值。图2.7习题2.4结果分析

21、本例的数据信息如表2.10所示,样本数1799,没有缺失值。 案例处理摘要案例有效的缺失合计N百分比N百分比N百分比学校 * 升学1799100.0%0.0%1799100.0%表2.10(1) 列联表表2.11如表2.11所示,X中学的升学率是97.5%,未升学率是2.5%。(2) 卡方检验结果表2.12如表2.12所示,卡方检验的结果是不显著的,说明两个学校的升学率之间差别不明显。频数分布图分组下的频数分布如图2.8所示。图2.8实验四 统计数据的度量一、实验名称:统计数据的度量二、实验目的:在掌握相对指标和平均指标基本理论和方法的基础上,能运用SPSS对统计数据进行描述性分析。通过训练,

22、了解统计方法的实际应用。从而提高统计方法实际应用的技能水平。表A 公司2011年的主要业务数据保险项目保险金额(亿元)保费收入(万元)赔款及付给(万元)企业财产险149042.11332148.6649303.2家庭财产险8250.1106035.953260.9机动车辆险17161.01900886.61202605.3船舶险13646.8132516.479410.9货物运输险14373.81103719.4540278.6卫星及核能险1249.214504.18038.9建筑、安装工程险1849.7116656.376575.0其他险1746.429111.615234.1合计20731

23、9.14735578.92624706.9表B 公司200名业务员月销售额统计数据 (单位:千元)25.0517.4813.8025.2915.4216.2221.0917.9326.5122.288.8142.3823.4027.9328.6415.5613.2221.7217.5217.7524.2617.5721.6625.5323.9417.0721.1917.9718.6922.659.6417.5718.7312.3715.4817.1417.1618.0215.4315.8811.0515.6426.7425.8316.9821.2531.3132.4017.5713.8519.

24、0515.6414.5226.0718.7830.318.4018.2413.6123.2725.6417.6141.8114.2617.7915.1315.8824.8718.9615.8419.2725.4632.7826.7015.7618.2218.2927.3943.1621.9212.9625.7718.2817.8430.6117.2541.6413.5119.2523.5031.1630.7034.9226.9315.8221.5313.9718.3311.4315.1517.2523.1615.0817.6631.5317.3435.3423.4519.3523.7613.3

25、327.7521.4229.7615.8619.4614.6136.4231.3417.6217.2535.7113.2531.1617.1617.4131.8837.5117.4324.2013.6129.5035.2719.4522.8423.6517.9617.4819.5512.7431.4037.9038.9430.3415.9937.4338.5518.6319.9124.8013.6825.4015.3722.5536.1622.1322.1618.6444.039.2410.820.929.834.211.520.328.129.110.815.414.320.424.635.

26、334.230.530.412.617.615.442.318.319.520.022.124.317.219.220.422.520.619.721.622.621.619.718.017.616.515.6三、实验步骤:1、对公司2011年主要业务数据(表A)进行结构分析。并作简要文字说明该公司2011年度保险项目保险金额第一的是企财产险高达149042.1(万元)占总保险金额的71.89%,第二的为机动车辆险,金额为17161(万元),占总金额的8.28%。两者所占份额相差巨大。保费收入第一的是机动车辆险价值为1900886.6(万元)占总保险收入的40.14%;保险收入第二是企业财产险

27、为1332148.6(万元),占总保险收入的28.13%。保险项目赔款及付给第一的是机动车辆险为1202605.3(万元)占总赔款付给的45.82%;第二的是企业财产险为649303.29(万元),占总赔款付给的24.74%综上所述,企业财产险和车辆险的市场份额多于其他。2、对(表B)数据进行编码、录入,建立SPSS数据文件。3、利用SPSS,计算有关统计量(均值、中位数、众数、四分位数、极差、四分位差、标准差、偏度和峰度),并生成直方图和箱线图。均值:21.8950、中位数:19.5250、众数:17.25、四分位数:25%的数:17.0025、50%的数:19.5250、75%的数:25.

28、8150、极差:35.99、四分位差:8.8125、标准差:7.66122、偏度:0.883、峰度:0.260四、实验后记(必写)出现的错误与解决(概述)对于结构分析不理解,只能根据自己字面理解意思来做题希 望多多练习提高自己实验五 统计抽样与参数估计一、实验名称:统计抽样与参数估计二、实验内容:通过实训,掌握利用SPSS统计软件进行区间估计的基本步骤。第一题:背景资料:有几位大学生组成的调查组,为了解他们所在地区居民的收入情况,作为匡算某种商品需求量的依据之一,从该地区230万居民中随机抽取了500人进行调查,取得有关收入数据如表所示。 样本数据 单位:万元第二题:背景资料:近期有多家超市接

29、到顾客投诉,反映国内某品牌直饮净水器的使用寿命太短。国家规定该规格直饮净水器的平均使用寿命不低于1200升。为了检验该产品的质量,超市随机抽取100件该品牌直饮净水器进行使用寿命的测试,测得结果如表所示。 样本数据 单位:升三、实验步骤:第一题:(1)利用SPSS统计软件,在95%概率保证下,估计该地区全部居民人均收入的置信区间。案例处理摘要案例有效缺失合计N百分比N百分比N百分比居民收入500100.0%0.0%500100.0%描述统计量标准误居民收入均值2.81150.04428均值的 95% 置信区间下限2.7245上限2.8985方差0.98标准差0.99011偏度0.3740.10

30、9峰度0.6510.218如上图所示在95%概率保证下,该地区全部居民人均收入的置信区间为2.72452.8985。(2)如果估计的误差不超过0.12万元,在同样的置信度下应该抽取多少人进行调查。单个样本统计量N均值标准差均值的标准误居民收入5002.8115.99011.04428单个样本检验检验值 = 0.12 tdfSig.(双侧)均值差值差分的 95% 置信区间下限上限居民收入60.785499.0002.691502.60452.7785在同样的置信度下应该抽取61人进行调查。第二题:利用SPSS统计软件,对该直饮净水器的平均使用寿命(出水量)进行区间估计,要求推断的把握程度为95%

31、。案例处理摘要案例有效缺失合计N百分比N百分比N百分比直饮净水器使命寿命100100.0%0.0%100100.0%描述统计量标准误直饮净水器使命寿命均值1197.26.611均值的 95% 置信区间下限1184.08上限1210.32标准差66.111极小值803该直饮净水器的平均使用寿命(出水量)区间为:1184.081210.32(2)结合直方图或正态分布图及箱线图对顾客提出的意见加以分析说明。根据直方图分析得:该品牌直饮净水器平均使用寿命低于国家规定该规格直饮净水器的平均使用寿命1200升。根据箱线图分析得:虽然众数大于1200,但是还存在下限大大低于1200、平均数低于1200很多的

32、产品,所以此品牌直饮净水器的不合格率高,是问题的产品。提意见:超市:严格把关净水器品质,禁止质量低下的商品进入超市。对不合格商品,要求厂商退货或者相应的赔偿。厂商:对出厂商品严格把关,进行抽样检测保证合格率。消费者:要有维权意识,发现有问题商品及时曝光及时维权。市场监管部门:加强市场监管,提高市场准入原则。四、实验后记(必写)出现的错误与解决(概述)在操作中还是不会分析,对于数据不是很理解希 望尽快学会数据分析实验六 相关与回归分析一、实验名称:相关与回归分析二、实验内容:第一题: 一家汽车销售商的经理认为,汽车的销量与投入的广告费用有着密切的关系。为研究他们之间的关系,这位经理搜集了过去10

33、年的数据表5-18 20012010年汽车销量与广告费用资料年份序号汽车销售量(辆)广告费用(万元)2001200220032004200520062007200820092010123456789101100125012801360148015001720180018902100385420406490525602651735721840你认为汽车销量与广告费相关吗?有关根据散点图判断,你认为汽车销量与广告费是数目关系?Y=392.217+2.001X若2011年和2012年广告费用投入1000万元和1250万元,汽车销量可能为多少辆?第二题:通过实训使学生在理解相关分析与回归分析基本理论的

34、基础上,能熟练运用SPSS统计软件进行相关与回归分析。 前景资料:投资、消费、出口是拉动经济增长的三驾马车,以下是19912011年我国固定资产投资额和国内生产总值统计资料: 表5-18 19912011年我国固定资产投资额和国内生产总值统计资料年份序号固定资产投资额(亿元)国内生产总值(亿元)1991199219931994199519961997199819992000200120022003200420052006200720082009201020111234567891011121314151617181920215278.007582.0011829.0015926.0019445

35、.0023660.0025300.0028406.0029855.0032918.0037213.0043500.0055567.0070477.0088774.00109998.00137324.00172828.00224599.00278122.00311022.0021781.5026923.5035333.9048197.9060793.7071176.6078973.0084402.3089677.1099214.60109655.20120332.70135822.80159878.30184937.40216314.40265810.30314045.40340902.8040

36、1202.00471564.00资料来源:中国统计年鉴2011、2011年全国年度统计公报。三、实验步骤:第二题:1、 用SPSS软件,通过绘制相关图和计算相关系数,对我国固定资产投资额与国内生产总值进行相关分析答:我国笃定资产投资与国内生产总值具有高度相关性。相关系数值为0.989相关性固定资产投资额(亿元)国内生产总值(亿元)固定资产投资额(亿元)Pearson 相关性1.989*显著性(双侧).000N2121国内生产总值(亿元)Pearson 相关性.989*1显著性(双侧).000N2121*. 在 .01 水平(双侧)上显著相关。2、利用SPSS软件建立我国固定资产投资额与国内生产

37、总值的回归方程,并说明我国固定资产投资额与国内生产总值两者的数量变动比率。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)43558.2245879.1487.409.000固定资产投资额(亿元)1.400.048.98928.914.000a. 因变量: 国内生产总值(亿元)答:回归方程:Y=43558.224+1.4X回归方程表明固定资产投资每增加一个单位,国内生产总值增加43559.624个单位。3、根据SPSS输出结果,对所建立的回归方程进行评价和检验。模型汇总模型RR 方调整 R 方标准 估计的误差1.989a.978.97713973.73027a. 预测变量:

38、 (常量), 国内生产总值(亿元)。答:判定系数R方=0.978,接近于1,表明回归方程对于数据的拟合程度好。Anovab模型平方和df均方FSig.1回归1.632E1111.632E11836.004.000a残差3.710E9191.953E8总计1.670E1120a. 预测变量: (常量), 国内生产总值(亿元)。b. 因变量: 固定资产投资额(亿元)答:根据F检验,因为Sig值小于0.05,所以回归方程的线性关系是存在的。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-28581.9914901.193-5.832.000国内生产总值(亿元).698.024.

39、98928.914.000a. 因变量: 固定资产投资额(亿元)根据t检验,两个Sig都小于0.5,表明我国固定资产投资额对国内生产总值线性效果明显。4、用SPSS软件选择合适的趋势方程,计算2012年和2013年我国固定资产投资额的趋势值。系数未标准化系数标准化系数tSig.B标准误Beta个案顺序13031.6662009.754.8856.484.000个案序列 * 2-1814.453209.699-2.791-8.653.000个案序列 * 392.6066.2752.92614.758.000(常数)-10218.6105226.641-1.955.067Y=-10218.61+9

40、2.606X3-1814.453X2+13031.666X2012年我国固定资产投资额趋势值为384352.301592013年我国固定资产投资额趋势值为456402.215925、根据计算得到的趋势值,用SPSS软件预测2012年和2013年我国内生产总值的置信区间,要求置信水平为95%。2012置信区间:369160.39299,399544.210192013置信区间:437821.64984,474982.78199描述性统计分析综合实验实验内容和要求:请根据数据资料(employee data.sav),就该企业的人员薪资情况展开综合性描述分析。要求结合图、表和文字进行分析,不少于1

41、000字。1.频数分析图 1当前薪资水平从图1可以看出当前薪资水平集中于$25,000到$50,000的区间内。图 2开始薪资水平从图2可以看出开始薪资多数都少于$20,000。综上所述当前薪资水平与开始薪资水平差距较大。2.描述性分析表 1薪资描述性统计表由表1可得开始薪资和当前薪资的统计量都为474。开始薪资均值为$17,016.09当前薪资均值为$34,419.57,当前薪资均值大于开始薪资。开始薪资的极大值为$79,980极小值为$9,000当前薪资的极小值$15,750极大值$135,000,所以开始薪资的极大极小值均小于当前薪资。当前薪资的标准差为$17,075.66开始薪资的标准

42、差是$7,870.64,说明当前薪资的大部分数值和其平均值之间差异大于开始薪资。3.当前薪资与性别关系:图 3当前薪资与性别关系图从图1可以看到当前薪资水平跟性别有关系:男员工的当前薪资均值高于女性员工。4.当前薪资与雇员类型关系图 4当前薪资与雇员类型关系图表 2各类型雇员当前薪资表结合图4和表2可以看出文员的平均工资为27839,管理员的平均工资为30939,经理的平均工资为63978,是非管理层员工平均工资的2倍以上。不同雇员的薪资平均水平总体上是经理管理员文员。5.当前薪资与受教育程度关系图 5当前薪资与受教育程度关系图表 3当前薪资水平图当前薪资水平教育程度文员均值管理员均值经理均值

43、总计均值8 22316.25 30807.69 24399.06 12 25276.19 31580.77 59400.00 25887.16 14 31625.00 31625.00 15 31175.77 24300.00 47662.50 31685.00 16 36281.04 56416.71 48225.93 17 32100.00 69812.50 59527.27 18 55412.50 67903.57 65127.78 19 36000.00 73925.00 72520.37 2064312.50 64312.50 2165000.00 65000.00 总计27838.

44、54 30938.89 63977.80 34419.57 结合图5和表3可以得出相同雇员的薪资平均水平总体随着教育年限的增加而增加,虽然有个别特殊,但不影响总体趋势。受教育程度越高获得高职位的可能性越大,相应获得的工资越久越高。6.当前薪资与就业时间图 6当前薪资与就业时间关系图表 4当前薪资与就业时间相关性分析表从表4和图6可知就业时间与员工当前工资的显著性概率p0.05,即二者相互独立,不具有相关关系;既往就业时间与当前薪资的显著性概率p0.05,说明员工之前的工作经历对员工的当前工资没有影响。7.当前薪资与民族图 7当前薪资与民族关系图从图7可以看出在这个样本范围内少数民族的员工人数少

45、于汉族员工。少数民族员工与非少数民族员工的工资具有差异。表 5当前薪资与民族相关系数表民族与当前工资的Eta值分别为-0.177,显著性概率p均小于0.01,少数民族与非少数民族员工工资具有差异,但值仅为0.177,说明二者相关性极其微弱。结论:表 6员工当前薪资水平影响因素相关性分析图(1)开始工资与当前工资具有很强的正相关关系,相关系数为0.880,即开始工资越高,其薪资水平越高,反之,则越低。(2)性别与当前工资的相关比率为-0.450,说明不同性别的员工平均工资具有显著差异,性别影响企业员工收入。(3)雇员类别与当前薪资的Eta值为0.780,雇员类别影响企业员工的当前薪资收入且相关性

46、显著。其显著差异体现在管理层和非管理层的工资收入差距上。(4)教育程度与当前薪资的Eta为0.661,即教育程度影响企业员工的当前薪资收入。且教育程度与当前薪资水平的相关关系较强。表明受教育年限越高,其薪资水平越高;反之,则越低。(5)就业时间和既往就业时间对企业员工的当前工资没有影响。(6)少数民族员工与非少数民族员工的工资具有差异,但民族与当前工资的相关强度很微弱。四、实验后记(必写)出现的错误与解决(概述)通过实验可以加强我统计数据的认知和运用,更好的学习统计学的知识希 望以后在实验前应该先将所涉内容梳理一遍,带着问题和知识点去做实验可以让实验过程不在那么枯燥无谓。实验七 统计数据的动态分析一、实验名称:统计数据的动态分析二、实验内容:通过实训,掌握各种动态分析指标的计算方法,进一步理解每一个动态分析指标的含义及相互关系。通过实训,掌握利用SPSS统计软件趋势分析。背景资料:以(表6-1)20012010年我国分主要经济数据作为资料。1、分别计算国内生产总值、城镇居民家庭人均可支配收入、农村居民家庭人均可支配收入、全国人均消费水平、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论