回归分析实验报告.doc_第1页
回归分析实验报告.doc_第2页
回归分析实验报告.doc_第3页
回归分析实验报告.doc_第4页
回归分析实验报告.doc_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学实验报告 数据的整理与分析实 验报 告 实验名称: 数据整理与分析 相关分析实验报告 实验课程: 统计学 数据的整理与分析一、 实验目的:学会运用Excel中次数分布表、透视表、统计图以及描述性统计功能来分析一组有调查意义的数据;从而通过分析得出有意义的结论以及推测预计。二、实验原理 :次数分布表的制作过程,第一步找出最大、最小值,确定全距R;第二步利用斯透奇斯规则确定组数m,再根据组数与组距的关系确定组距;第三步分组,根据分组标志和分组上限确定在组内数据的频数以及频率。数据透视表,选中当前数据库表中人一个单元格,单击菜单中的“数据”“数据透视表与数据透视图”。直方图是在平面坐标上一横轴根据各组组距的宽度标明各组组距,一纵轴根据次数的高度表示各组次数绘制成的统计图。折线图是在直方图的基础上,用折线连接各个直方形顶边中点并在直方图形两侧各延伸一组,使者限于横线相连。三、实验环境:实验地点:实训楼计算机实验中心五楼实验室3试验时间:第五周周二实验软件:Microsoft Excel 2003四、 实验内容1、(1)在数据源中选取所需数据,对数据进行分析。利用Excel 对数据进行描述性统计分析。实验内容包括:数据分组、直方图、描述性分析、透视表、实验结果分析。(2)数据资料:数据来源“9-33 各地区农村居民家庭平均每人主要食品消费量 (2008年)”如下图所示。2、 实验步骤第一步:在数据库中把所要研究的数据对象复制黏贴到新建的Excel工作表sheet1中。我要研究的是“各地区农村居民家庭平均每人主要食品消费量 (2008年)”挑选了其中的蔬菜。第二步:对sheet2中的数据进行分组。(1) 找出这31个数据中的最大、最小值,得到全距R(2) 其次利用斯透奇斯规则确定组数m,再根据组数与组距的关系确定组距i;(3) 然后分组,根据分组标志和分组上限确定在组内数据的频数以及频率(4) 最后得到全国各地区蔬菜消费量的次数分布表。第三步:数据分析(1) 在Excel表工具栏中点开“加载宏”“分析工具库”确认(如图);(2) 再次打开工具栏“数据分析”“描述统计”确定,得到对该组数据的描述性统计数据。以下截图为部分实验步骤:图1.1图1.2图1.3图1.4图1.5图1.6图1.7图1.8图1.9图1.10图1.11图1.12图1.13图1.14图1.15图1.16五、 实验结果 :这次的实验是运用Excel的统计分析功能,进行数据的搜集整理和显示.并进行统计数据的录入、分组、汇总及各种常用统计图表的绘制,让我对数据的整理有了更深层次的理解,从而在有限经验样本的基础上实现对总体或现实世界的认识。先讲述下本次的实验过程。首先是对斯透奇斯公式的计算,m=1+3.322lgN,从以上实验数据中可以得出,N=31,代入公式后得出m=5.95.约等于6.所以组数为6组;组限R=Max-Min=Max(B3:B33)=Min(B3:B33)=162.79-20.57=142.22;组距i=R/m=142.22/6=23.7,所以得出i=25. 其次根据算出来的分组标志进行分组。分成(2045),(4570),(7095),(95120),(120145),(145170)共六个组。根据“上组限不计入的原则”,在下方将每组的最大值一次排列为“44,69,94,119,144,169”.之后依次计算出“各组频数,各组频率,向上累计次数,向上累计频率,向下累计次数,向下累计频率”。接下来是FREQUENCY函数的应用。它的用途是以一列垂直数组返回某个区域中数据的频率分布。所以先选中D20:D25区域,然后在菜单栏上面点击“插入”,选择“插入函数”,将或选择类别改成“统计”,选择函数“FREQUENCY”,然后点击确定。在Data array中填入B:B,在Bins array中填入E13:E18。则各组数据则显示出来,将每一列的数据加起来,看看是否与题目总提供的个数相同,确实为31.以此类推,将各组频率,向上累计次数,向上累计频率,向下累计次数,向下累计频率均填写完整。 再次,点击“工具-加载宏-勾选分析数据库-确定”,然后,点击“工具-数据分析”,然后在数据分析中选择“描述统计”,点确定。将31个原始数据,输入到工作表中的B3:B33。然后步骤如下:第1步:选择“工具”下拉菜单。第2步:选择“数据分析”选项。第3步:在分析工具中选择“描述统计”。第4步:当出现对话框时,在“输入区域”方框内键入B3:B33;在“输出选项”中选择输出区域(在此选择“新工作表”);选择“汇总统计”(该选项给出全部描述统计量);选择“确定”最后得出这31个数的平均数92.4994,中位数93.85.标准差为34.269,方差1174.354等一系列数据。六、实验结果分析 (运用理论分析实验结果)在这一组实验数据中,蔬菜的最大产量为162.79千克,最小为20.57千克,而平均值为92.4994千克,所以用平均值分析离散趋势还是不准确的。他不能准确估计平均水品,也让我们判断出不同地区的实际差距还是很大的。这个应该与各个地区的气候地域、环境是密切相关的,比如辽宁,这是一个土地肥沃适合农产种植的地方,而且近年来辽宁省很多地方农村采用保护地生产(以日光温室和大中小棚生产为主)与露地蔬菜栽培相结合的技术措施,一年四季均可栽培蔬菜,并获得优质高产,增加农民收入,满足城市居民蔬菜需求。那该地区的蔬菜人均消费量当然大大提高。而相对于那些土地贫瘠,农业生产相对资源不足,只能以拓展畜牧业为生的地区,人均蔬菜消费量肯定很低。而住在牧区的人他们吃得东西主要是藏族传统食物,在牧区的帐篷里,你才有机会吃到最好的酥油,最棒的酸奶.有些地理环境艰苦地方的牧民一年内可能吃得蔬菜很有限。然后在这组数据中中位数是第16个数,这就说明大部分地区消费量还是比较少,这就是因为各地之间的经济水平,蔬菜的产量不同而决定。要增加各个地区人均蔬菜消费量的话,除了积极开发当地的经济水平,多多调节南北之间的物资,还应多依靠科学技术,增加产量。7 结论 (验证理论、新发现、体会)在本次实验过程中,首先进行的就是对统计数据的输入与分析。这个输入过程并不轻松,既要细心又要用心。不仅仅是仔细的输入一组数据就可以,还要考虑到整个数据模型的要求,合理而正确的分配和输入数据。因此,输入正确的数据也就成为了整个统计实验的基础。 数据输入后就是统计数据的描述与分析,这是整个统计实验关键中的关键。对统计数据的众数,中位数,均值的描述可以让我们对其有一个初步的印象和大体的了解,在此基础上的概率分析,抽样分析,方差分析,图形描述等则更具体和深刻的向我们揭示了统计数据的内在规律性。在对数据进行描述和分析的过程中,Excel软件的数据处理功能得到了极大的发挥,工具栏中的工具和数据功能对数据的处理是问题解决起来是事半功倍。所以EXCEL是我们统计试验的基础知识。若不知EXCEL的运用则无法进行试验。这一次的统计学实验是我大学生活中不可或缺的重要经历,它对我的学习以及将来工作生活中都有很大的帮助。其一,我可以将自己所学的知识应用于实践中,理论和实际是不可分的,在实践中理论知识得到了巩固与加强,解决问题的能力也受到了锻炼得以提升;其次,本次实验开阔了我的视野,使我对统计在现实中的运作有所了解,也对统计也有了进一步的掌握。统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。 统计学是收集、处理、分析、解释数据并从数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论