实验一 数据的搜集与整理.doc_第1页
实验一 数据的搜集与整理.doc_第2页
实验一 数据的搜集与整理.doc_第3页
实验一 数据的搜集与整理.doc_第4页
实验一 数据的搜集与整理.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验一 统计数据的搜集与整理一、实验目的培养学生处理数据的基本能力。通过本实验,学生应开始了解Excel 2003的操作界面,在有效搜集数据资源的基础上,利用软件完成数据的输入、导入、保存、编码、分类(组)、筛选、排序等数据整理工作。二、实验手段计算机、Excel 2003三、实验要求(1)熟悉Excel 2003的基本操作界面;(2)熟悉间接数据的搜集方法、搜集途径,能熟练通过网络搜集间接数据;(3)了解直接数据的搜集;(4)掌握不同类型的数据的处理方法,尤其是注意Excel 2003在数据输入、导入等方面的区别,掌握数据文件的建立和保存方法。(5)掌握数据的编码、分类(组)、筛选、排序等整理操作的方法。四、实验内容(一)数据的搜集统计数据主要来源于两种渠道:一种是来源于别人的调查或实验数据,称为间接数据;另一种是来源于科学实验或者直接的调查数据,称为直接数据。1.间接数据的搜集间接统计数据主要是公开出版或报道的数据,可以通过年鉴、期刊、报纸、广播、电视等途径搜集获取。在网络广泛普及的今天,通过网络搜集间接数据已经成为了一种主流手段。一般,在网络上搜集数据可以采用两种方式。一种方式是直接进入网站查询数据。比如,要搜集四川省成都市2008年经济数据,你可以进入网址/index.asp,点击其中的统计数据目录,如图1-1所示。图1-1进入统计数据页面,选择其中的统计年鉴,如图1-2所示。图1-2进入统计年鉴页面,点击2008年年度数据,就可以下载和查看成都市2008年的年鉴经济数据文件了。如图1-3所示。图1-3常见的统计数据获取网站可见表1-1。表1-1 常见的统计数据网站网站名称网址简介中华人民共和国国家统计局/提供全国的月度数据、季度数据、年度数据、普查数据、专题数据、部门数据和国际数据各地方统计局及国外统计网站/tjlj/可以从国家统计局的网站链接目录,链接进入各地方统计局及国外统计网站,获取统计数据中国人口信息网/提供有关人口统计的公报、专题抽样调查数据、常用人口数据等中国经济信息网/提供宏观经济信息、地区经济信息、行业经济信息、国际经济信息、专业统计数据等中宏数据库/macro_data/涵盖了20世纪90年代以来宏观经济、区域经济、产业经济、投资消费、统计数字、研究报告等方面的详尽内容第二种通过网络获取二手数据的方式是使用搜索引擎。比如,我们可以使用谷歌网站,搜索四川省成都市2008年经济数据。在浏览器地址栏中输入.hk ,进入谷歌搜索网站,在搜索框中输入“成都市2008年经济数据”,如图1-4所示。图1-4单击“Google 搜索”按钮,获得搜索结果如图1-5所示,可以在搜索显示出的结果中,选择链接进入查看是否符合自己的搜索目标。图1-5实例操作:例:查询北京市2008年的人口数。方法一:查询2009年北京统计年鉴,可通过纸质年鉴,也可以通过网络获取。如果通过网络获取,步骤如下:第一步:浏览器中输入地址/,进入北京统计信息网;第二步:选择“统计数据年度数据”,在年度选择下拉框中选择2009年,点击查询,进入北京市2009年度统计年鉴,界面如图1-6所示;图1-6第三步:在年鉴中点击“3-1人口状况(1978-2008年)”,内容如图1-7所示。图1-7第四步:查询得到北京市2008年常住人口1695.0万人,户籍人口1229.9万人。方法二:通过搜索网站。步骤如下: 第一步:浏览器中输入地址,进入谷歌搜索网站;第二步:在搜索框中输入“北京市2008年人口数”;第三步:单击“Google 搜索”按钮,获得搜索结果,如图1-8所示;图1-8第四步:点击“2008年中国各城市人口数量 广阔天地 新浪博客”这一搜索结果,得到北京市2008年人口数为1633万人(如图1-9所示)。图1-92.直接数据的搜集直接统计数据可以通过两种途径获得:一是统计调查或观察,二是实验。统计调查是取得社会经济数据的最主要来源,它主要包括普查、重点调查、典型调查、抽样调查、统计报表等调查方式。本实验主要介绍抽样调查取得直接数据的方法。抽样调查的步骤如图1-10所示:调查方案设计调查问卷设计问卷发放问卷收回数据初步整理图1-10实例操作:例:大学生生活费收支状况调查步骤一:调查方案设计一、调查方案:(一)调查目的:通过了解大学生日常收入和消费的主要状况,为学校的助学政策提供参考,同时为大学生消费市场的开发提供一定的参考。(二)调查对象:西南科技大学经济管理学院在校本科大学生(三)调查单位:抽取的样本学生(四)调查程序:1.设计调查问卷,明确调查方向和内容2.分发调查问卷。随机抽取该大学大一至大四的在校本科大学生,每一年级随机抽出男、女生各30人左右作为调查单位3.根据回收的有效问卷进行分析,具体内容如下:(1)根据样本的生活费来源、分布状况的均值、方差等分布的数字特征,推断西南科技大学经济管理学院大学生总体分布的相应参数;(2)根据性别进行男女两个总体生活费军纸质差得比较以及方差笔的区间估计;(3)对四个年级的在校本科生进行四个总体生活费均值之差即方差笔的区间估计;(4)绘制统计图形是样本数据直观化并对统计量进行分析。(五)调查时间:年月日年月日步骤二:问卷设计在明确了调研的目的后,应该思考数据搜集的方法,确定问题的回答方式和问题的用词方式,使得问卷易于回答且不会产生歧义。完成初步问卷的设计和编排后,征询相关方面的意见,通过小范围测试或反复修订,得到最终的问卷,用于实施发放。大学生收支调查问卷同学:您好,请配合我们完成以下调查问卷,请在符合您的实际情况的选项下画“”Q1.您的性别:A.男 B.女Q2.您的年级:A.大一 B.大二 C.大三 D.大四Q3.您的月生活费支出在: A.300元以下 B.300-400元 C.400-500元D.500-600元 E.600-700元 F.700元以上Q4.您的生活费主要来源依次是: A.父母 B.勤工俭学 C.助学贷款 D.其他 (请注明)请排序:Q5.您的各项开支为(单位:元) A.伙食费 B.衣着 C.学习用品 D.日化用品 E.娱乐休闲 F.其他 非常感谢您的合作!步骤三:问卷的发放与收回本次调查采取分层抽样,对在校本科生各个年级男、女各发放问卷30份左右;共发放问卷份,回收问卷份,其中有效问卷份。各年级男女生回收有效问卷具体情况:大一: (男生)份 (女生)份大二: (男生)份 (女生)份大三: (男生)份 (女生)份大四: (男生)份 (女生)份(二)数据的整理1.Excel的数据整理及数据文件的建立首先,大家应该熟悉Excel的操作界面。(1)数据的编码 编码是对数据进行初步分组和确定数字代码的过程。它可以把复杂的文字用简单的代码代替,有利于简化数据输入和处理。一般直接数据如果是由封闭式问题获取,那么涉及问题的时候就已经对答案进行了预编码。如果数据是由开放式的问题来获取的,那么,需要对答案进行罗列、合并、设码三个过程来完成编码工作。(2)数据的录入 数据的录入是将搜集到的数据直接输入到数据库文件中。数据录入既要讲究效率,又要保证质量。Excel的数据录入操作比较简单,一般只要在工作表中,单击激活一个单元格就可以录入数据了。单元格的切换可以使用鼠标,也可以在激活一个单元格以后用Enter键(或者Tab)键,向下(或者向右)切换单元格。在单元格内部的换行可以使用“Alt+Enter”。当然,数据录入中最重要的还是要保证数据形式完整和性质正确。这就需要通过“格式-单元格格式”(Ctrl+1)菜单来实现。对于录入重复数据,大家一般都习惯使用复制功能(Ctrl+C),但是Excel在简单复制数据时不能保证格式的完整性,这个时候,就需要单击鼠标右键,使用“选择性粘贴”,进行设置来实现复制的格式要求。对于未输入(或未确定格式)的数据,想要实现和已经输入数据相同的格式要求,则可以使用工具栏中的“格式刷”。 (3)数据文件的导入 Excel数据文件的导入是将别的软件形成的数据或数据库文件,转换到Excel工作表中。这样,大家就不必要掌握那么多纷繁复杂的软件,方便提高工作效率,也方便协同处理数据。Excel支持文本文件、Office数据库文件、网页文件、Dbase文件、Paradox文件、Xml文件等多种外部数据源的导入。导入的方法有二,一是使用“文件-打开”菜单,二是使用“数据-导入外部数据-导入数据”菜单,两者都是打开导入向导,按向导一步步完成对数据文件的导入。(4)数据的筛选 数据的筛选是从大数据表单中选出分析所要用的数据。Excel中提供了两种数据的筛选操作,即“自动筛选”和“高级筛选”。“自动筛选”使用“数据-筛选-自动筛选”菜单,通过下拉箭头的选择来实现筛选。一般用于简单的条件筛选,筛选时将不满足条件的数据暂时隐藏起来,只显示符合条件的数据。如果在下拉箭头中选择“自定义”,自动筛选还可以根据条件筛选出数据在某一范围内符合条件的记录,自定义中可以用“与”、“或”来约束区分条件。此外,使用“自动筛选”还可同时对多个字段进行筛选操作,此时各字段间限制的条件只能是“与”的关系。“高级筛选” 使用“数据-筛选-高级筛选”菜单,调用对话框来实现筛选。一般用于条件较复杂的筛选操作,其筛选的结果可显示在原数据表格中,不符合条件的记录被隐藏起来;也可以在新的位置显示筛选结果,不符合的条件的记录同时保留在数据表中而不会被隐藏起来,这样就更加便于进行数据的比对了。高级筛选需要在单元格或区域内输入筛选条件,由于Excel的筛选只认列数据,所以列标题成为筛选的标题依据。列标题下可以输入筛选的条件,条件放在同一行表示“与”的关系,条件不在同一行表示“或”的关系。(5)数据的排序 数据的排序是将数据的次序排列整理并显示出来的过程。排序在显示数据的序数排列结果的同时,也有利于方便的查询某些数据,比如:最大、最小等。 Excel的排序功能主要靠“升序排列”(“降序排列”)工具按钮和“数据-排序”菜单实现。在选中需排序区域数据后,点击“升序排列”(“降序排列”)工具按钮,数据将按升序(或降序)快速排列。“数据-排序”菜单可进行最多三级的条件排列。同时,“数据-排序”菜单还可进行自定义排序,来实现那些直观从数据、时间、文本或字母上排序无意义的数据排序特殊要求。一般要自定义特殊的排序要求,需要先使用“工具-选项-自定义序列”,手工输入新的排序序列,然后在“数据-排序”菜单打开的排序对话框中点击“选项”,在新弹出的对话框的“自定义排序次序”下拉框中选择手工输入的排序次序。 此外,Excel分析工具库宏中的“排位与百分比排位”工具,也能部分实现显示排序结果的功能。其调用菜单为“工具-数据分析-排位与百分比排位”。(6)数据的分组 数据分组是将数据整理形成汇总表或频数分布表的过程。汇总表可以使用“数据-分类汇总”菜单来实现,可形成求和、平均值、最大值、最小值、乘积、标准差、方差等条件的分类汇总结果。频数分布分组情况可以由Frequency函数或直方图工具来实现。Frequency函数以一列垂直数组返回某个区域中数据的频率分布。它可以计算出在给定的值域和接收区间内,每个区间包含的数据个数。Frequency函数要求按组距上限分组,输入的组限数据比每组的上限少1,并

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论