统计学实验报告书.doc_第1页
统计学实验报告书.doc_第2页
统计学实验报告书.doc_第3页
统计学实验报告书.doc_第4页
统计学实验报告书.doc_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学实验报告姓名 学号 班级 成绩一、实验步骤 (一)数据的搜集与整理实验目的:培养学生处理数据的基本能力。通过本实验,学生应开始了解Excel 2003的操作界面,在有效搜集数据资源的基础上,利用软件完成数据的输入、导入、保存、编码、分类(组)、筛选、排序等数据整理工作。实验要求1、熟悉Excel 2003的基本操作界面;2、熟悉间接数据的搜集方法、搜集途径,能熟练通过网络搜集间接数据;3、了解直接数据的搜集;4、掌握不同类型的数据的处理方法,尤其是注意Excel 2003在数据输入、导入等方面的区别,掌握数据文件的建立和保存方法。5、掌握数据的编码、分类(组)、筛选、排序等整理操作的方法 以获取四川省成都市2008年的经济数据为例A,直接进入网站查询数据 B,使用搜索引擎 由该案例可以知道直接统计数据可以通过两种途径获得:一是统计调查或观察,二是实验。统计调查是取得社会经济数据的最主要来源,它主要包括普查、重点调查、典型调查、抽样调查、统计报表等调查方式。下面进行分析:(一)数据的搜集1、间接数据的搜集(1)直接进入网站查询数据重要的网站有:中华人民共和国国际统计局、各地方统计局及国外统计网站、中国人口信息网、中国经济信息网、中宏数据库(2)使用搜索引擎例如使用百度搜索,但是可靠性不及直接进入网站查询2、直接数据的搜集(1)统计调查或观察(社会经济数据最主要来源)包括普查、重点调查、典型调查、抽样调查、统计报表等调查方式二)数据的整理1、数据的编码编码是对数据进行初步分组和确定数字代码的过程,可以把复杂的文字用简单的代码代替,有利于简化数据输入和处理。2、数据的录入数据的录入是将搜集到的数据直接输入到数据库文件中。数据录入既要讲究效率,又要保证质量。Excel的数据录入操作比较简单,一般只要在工作表中,单击激活一个单元格就可以录入数据了。录入重复数据,使用复制功能(Ctrl+C)时,Excel在简单复制数据时不能保证格式的完整性,需要单击鼠标右键,使用“选择性粘贴”,进行设置来实现复制的格式要求。3、数据的导入Excel数据文件的导入是将别的软件形成的数据或数据库文件,转换到Excel工作表中。导入的方法有二,一是使用“文件-打开”菜单,二是使用“数据-导入外部数据-导入数据”菜单,两者都是打开导入向导,按向导一步步完成对数据文件的导入。 4、数据的筛选数据的筛选是从大数据表单中选出分析所要用的数据。Excel中提供了两种数据的筛选操作,即“自动筛选”和“高级筛选”。5、数据的排序Excel的排序功能主要靠“升序排列”(“降序排列”)工具按钮和“数据-排序”菜单实现。在选中需排序区域数据后,点击“升序排列”(“降序排列”)工具按钮,数据将按升序(或降序)快速排列。Excel分析工具库宏中的“排位与百分比排位”工具,也能部分实现显示排序结果的功能。6、数据文件的保存 保存经过初步处理的Excel数据文件。可以使用“保存”工具按钮,或者“文件-保存”菜单,还可以使用“文件-另存为”菜单。(二)描述数据的图表方法实验目的:应用软件将数据转化成为直观的统计表和生动形象的统计图。实验要求:1.熟练掌握Excel 2003的统计制表功能2.熟练掌握Excel 2003的统计制图功能3.掌握各种统计图、表的功能,并能准确的根据不同对象的特点加以应用 1,频数频率表Frequency函数用途:以一列垂直数组返回某个区域中数据的频率分布。它可以计算出在给定的值域和接收区间内,每个区间包含的数据个数。语法:FREQUENCY(data_array,bins_array)参数:data_array是用来计算频率一个数组,或对数组单元区域的引用。bins_array 是数据接收区间,为一数组或对数组区域的引用,设定对data_array 进行频率计算的分段点。2、直方图分析工具“工具”“数据分析”“直方图”(二)统计图1、直方图:不支持手工输入,用来看分布状况2、折线图:用来同时分析比较两组计量组以上的数据3、散点图:用来看两组数据之间是否有共同变化的趋势三)统计数据的描述一:实验目的1.熟练掌握Excel 2003中描述统计指标对应的函数,包括算数平均数、调和平均数、几何平均数、众数、中位数、标准差、方差、偏度、峰度等2.熟练掌握Excel 2003“描述统计”工具进行描述统计,注意其结果解释。 3.注意比较函数方法和“描述统计”工具所得结果二:实验步骤1使用函数描述a.了解函数名称:函数名称函数功能Average计算指定序列算数平均数Geomean计算数据区域的几何平均数Harmean计算数据区域的调和平均数Median计算给定数据集合的中位数Mode计算给定数据集合的众数Max计算最大值Min计算最小值Quartile计算四分位点Stdev计算样本的标准差Stdevp计算总体的标准差Var计算样本的方差Varp计算总体的方差2均值:算术平均数a.激活一空白单元格,输入公式回车:几何平均数a.使用Geomean函数来计算几何平均数b.使用语法geomean(number1,number2,.)求目标的几何平均数中位数a.使用函数median(number1,number2,).计算目标中位数。众数a.使用MODE(number1,number2,)函数来计算目标的众数3:离散程度度量极差a.使用MAX(number1,number2,)计算组中最大值b.使用MIN(number1,number2,)计算组中最小值c.利用极差定义,构建函数组合MAX-MIN,算出极差方差和标准差a.使用VARP(number1,number2,)计算总体的方差b,使用VAR(number1,number2,)估算样本方差c.使用STDEVP(number1,number2,)返回整个总体的标准偏差d.使用STDEV(number1,number2,)估算样本的标准偏差:变异系数a. 在另一空白单元格中输入“XXX变异系数=”字样,b.在另一空白单元格中输入公式“=STDEV()/AVERAGE()”回车,4“描述统计”分析工具扩展函数a.使用“工具-数据分析-描述统计”进入“撕碎统计”对话框b.输入相应数据点击确定按钮,得到结果四)参数估计A,抽样“抽样”分析工具将输入区域视为总体,并使用总体来建立样本。当总体过大而无法处理或制成图表时,就可以使用代表样本。如果输入数据是周期性的,也可以建立只包含某个周期特定部分数值的样本。例如若输入区域包含了每季的销售量,就可以在输入区域的同一季4个地点数值中以周期性比率来抽样。B,参数估计点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。点估计问题就是要构造一个只依赖于样本的量,作为未知参数或未知参数的函数的估计值。例如,设一批产品的废品率为。为估计,从这批产品中随机地抽出n个作检查,以X记其中的废品个数,用X/n估计,这就是一个点估计。区间估计是依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总体分布的未知参数或参数的函数的真值所在范围的估计。例如人们常说的有百分之多少的把握保证某值在某个范围内,即是区间估计的最简单的应用。TINV用途:返回作为概率和自由度函数的t 分布的t值。语法:TINV(probability,degrees_freedom)参数:probability 为对应于双尾t分布的概率,degrees_freedom为分布的自由度。NORMSINV用途:返回标准正态分布累积函数的逆函数。该分布的平均值为0,标准偏差为1。语法:NORMSINV(probability)参数:probability 是正态分布的概率值。ABS 用途:求出相应数字的绝对值。 语法:ABS(number) 参数:number代表需要求绝对值的数值或引用的单元格。Chiinv用途:返回卡方分布单尾概率的逆函数。语法:CHIINV(probability,degrees_freedom)参数:Probability 为卡方分布的单尾概率,Degrees_freedom 为自由度。FINV用途:返回F 概率分布的逆函数值,即F 分布的临界值。语法:FINV(probability,degrees_freedom1,degrees_freedom2)参数:Probability 是累积F 分布的概率值,Degrees_freedom1 是分子自由度,Degrees_freedom2 是分母自由度。CONFIDENCE用途:返回总体平均值的置信区间,它是样本平均值任意一侧的区域。语法:CONFIDENCE(alpha,standard_dev,size)。参数:Alpha 是显著水平参数,Standard_dev 是数据区域的总体标准偏差,Size 为样本容量。实验五) 假设检验实验目的:应用统计软件,在抽样数据获取的基础上,对总体参数进行假设检验。实验要求:了解不同假设检验内容要求的不同检验统计量和检验方法;掌握利用函数表单进行假设检验的方法和步骤;掌握Excel 2003中应用分析工具库进行假设检验的方法和步骤。 实验内容:假设检验的函数表单函数表单构建的基本思路是:1.确定需进行假设检验的总体参数2.确定抽样样本统计量及其服从的分布3.进行假设设计(单侧,双侧)4.确定置信水平5.计算检验统计量6.计算置信水平下的检验区间(或检验临界值)7.比较检验统计量与检验区间(或检验临界值) ,得出结论总体方差已知,总体均值检验,不论样本大小都用正态分布处理总体均值u的双尾检验假设检验H0总体均值=总体均值假设值H1总体均值总体均值假设值样本统计量样本个数=Count(样本数据)样本均值=Average(样本数据)用户输入总体标准差总体均值假设值置信水平计算结果抽样平均误差=总体标准差/Sqrt(样本个数)检验统计量=(样本均值-总体均值假设值)/抽样平均误差检验区间下限=Normsinv(1-置信水平)/2)检验区间上限=Normsinv(1-(1-置信水平)/2)检验结果=If(And(检验区间上限检验统计量,检验统计量检验区间下限),“接受H0”,“拒绝H0”)总体均值u的左单侧检验假设检验H0总体均值总体均值假设值H1总体均值总体均值假设值样本统计量样本个数=Count(样本数据)样本均值=Average(样本数据)用户输入总体标准差总体均值假设值置信水平计算结果抽样平均误差=总体标准差/Sqrt(样本个数)检验统计量=(样本均值-总体均值假设值)/抽样平均误差检验临界值=-Normsinv(1-置信水平)检验结果=If(检验统计量检验临界值,“拒绝H0”,“接受H0”)总体方差未知,大样本,总体均值检验总体均值u的双尾检验假设检验H0总体均值=总体均值假设值H1总体均值总体均值假设值样本统计量样本个数=Count(样本数据)样本均值=Average(样本数据)样本标准差=Stdev(样本数据)用户输入总体均值假设值置信水平计算结果抽样平均误差=样本标准差/Sqrt(样本个数)检验统计量=(样本均值-总体均值假设值)/抽样平均误差检验区间下限=Normsinv(1-置信水平)/2)检验区间上限=Normsinv(1-(1-置信水平)/2)检验结果=If(And(检验区间上限检验统计量,检验统计量检验区间下限),“接受H0”,“拒绝H0”)总体均值u的左单侧检验假设检验H0总体均值总体均值假设值H1总体均值总体均值假设值样本统计量样本个数=Count(样本数据)样本均值=Average(样本数据)样本标准差=Stdev(样本数据)用户输入总体均值假设值置信水平计算结果抽样平均误差=样本标准差/Sqrt(样本个数)检验统计量=(样本均值-总体均值假设值)/抽样平均误差检验临界值=-Normsinv(1-置信水平)检验结果=If(检验统计量检验临界值,“拒绝H0”,“接受H0”)总体比率检验总体比率的双侧检验假设检验H0总体比率=总体比率假设值H1总体比率总体比率假设值样本统计量样本个数=Count(样本数据)样本比率用户输入总体比率假设值置信水平计算结果抽样平均误差=Sqrt(样本比率*(1-样本比率)/样本个数)检验统计量=(样本比率-总体比率假设值)/抽样平均误差检验区间下限=Normsinv(1-置信水平)/2)检验区间上限=Normsinv(1-(1-置信水平)/2)检验结果=If(And(检验区间上限检验统计量,检验统计量检验区间下限),“接受H0”,“拒绝H0”)总体比率的左单侧检验假设检验H0总体比率总体比率假设值H1总体比率总体比率假设值样本统计量样本个数=Count(样本数据)样本比率用户输入总体比率假设值置信水平计算结果抽样平均误差=Sqrt(样本比率*(1-样本比率)/样本个数)检验统计量=(样本比率-总体比率假设值)/抽样平均误差检验临界值=-Normsinv(1-置信水平)检验结果=If(检验统计量检验临界值,“拒绝H0”,“接受H0”)分析工具库 F-检验:双样本方差 t-检验: 双样本等方差假设 t-检验:双样本异方差假设 t-检验:成对双样本均值分析 Z-检验:双样本均值分析 F-检验:双样本方差 该工具通过双样本的F检验,对两个样本的方差进行比较。用于说明两个样本的方差是否存在显著差异。显示内容平均样本1均值样本2均值方差样本1方差样本2方差观测值样本1个数样本2个数df分子自由度分母自由度F样本1方差/样本2方差P(F=f) 单尾单尾检验的显著水平F 单尾临界单尾检验的F临界值结果解释假设检验H0样本1总体方差=样本2总体方差H1样本1总体方差样本2总体方差判别(1)若P小于显著性系数,拒绝H0,说明两样本方差存在显著差异;反之,接受H0,说明两样本方差不存在显著差异。(2)若F大于临界值,拒绝H0,说明两样本方差存在显著差异;反之,接受H0,说明两样本方差不存在显著差异。2. t-检验: 双样本等方差假设 该工具是在一定置信水平之下,在两个总体方差相等的假设之下,检验两个总体均值的差值等于指定平均差的假设是否成立的检验。 显示内容平均样本1均值样本2均值方差样本1方差样本2方差观测值样本1个数样本2个数合并方差样本1方差和样本2方差的加权平均数假设平均差样本1总体均值和样本2总体均值的平均差df假设检验的自由度t Stat两个样本均值差值减去假设平均差之后再除于标准误差P(T=t) 单尾单尾检验的显著水平t 单尾临界单尾检验t的临界值P(T=t) 双尾双尾检验的显著水平t 双尾临界双尾检验t的临界值结果解释假设检验H0样本1总体均值-样本2总体均值=假设平均差H1样本1总体均值-样本3总体均值假设平均差判别(1)若P小于显著性系数,拒绝H0;反之,接受H0。(2)若t stat大于临界值,拒绝H0;反之,接受H0。3. t-检验:双样本异方差假设 该分析工具可以进行双样本t-检验,与双样本等方差假设检验不同,该检验是在两个数据集的方差不等的前提假设之下进行两总体均值差额的检验,故也称作异方差t-检验。可以使用t-检验来确定两个样本均值实际上是否相等。 当进行分析的样本个数不同时,可使用此检验。如果某一样本组在某次处理前后都进行了检验,则应使用“成对检验”。显示内容平均样本1均值样本2均值方差样本1方差样本2方差观测值样本1个数样本2个数合并方差样本1方差和样本2方差的加权平均数假设平均差样本1总体均值和样本2总体均值的平均差df假设检验的自由度t Stat两个样本均值差值减去假设平均差之后再除于标准误差P(T=t) 单尾单尾检验的显著水平t 单尾临界单尾检验t的临界值P(T抽样调查统计推断结论。这里,研究设计就是制定调查研究和实验研究的计划,抽样调查是搜集资料的过程,统计推断是分析资料的过程。显然统计的主要功能是推断,而推断的方法是一种不完全归纳法,因为是用部分资料来推断总体。增加定义:是关于收集、整理、分析和解释统计数据的科学,是一门认识方法论性质的科学,其目的是探索数据内在的数量规律性,以达到对客观事物的科学认识。统计学是收集、分析、表述和解释数据的科学。二、统计学的重要性认识统计在现代化管理和社会生活中的地位日益重要。随着社会、经济和科学技术的发展,统计在现代化国家管理和企业管理中的地位,在社会生活中的地位,越来越重要了,统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。今天的统计学已展现出强有力的生命力。人们的日常生活和一切社会生活都离不开统计。在过去的五十年中,社会学总的趋势是向更为严格、清晰的假设;更大更详细的数据集合发展;为了拟合数据,统计模型变得越来越复杂;主要社会学期刊所发表文献的统计分析水平也在不断提高。统计方法在社会学领域成功地走过了半个世纪,使得该学科研究的科学水平有了极大的提高。社会学中广泛的使用了各种各样的统计学方法和统计模型。由此可见统计学的重要性三、对统计学前景的认识 德国的斯勒兹曾说过:“统计是动态的历史,历史是静态的统计。”可见统计学的产生与发展是和生产的发展、社会的进步紧密相联统计在现代化管理和社会生活中的地位日益重要。随着社会、经济和科学技术的发展,统计在现代化国家管理和企业管理中的地位,在社会生活中的地位,越来越重要了。人们的日常生活和一切社会生活都离不开统计。英国统计学家哈斯利特说:“统计方法的应用是这样普遍,在我们的生活和习惯中,统计的影响是这样巨大,以致统计的重要性无论怎样强调也不过分。”甚至有的科学有还把我们的时代叫做“统计时代”。显然,20世纪统计科学的发展及其未来,已经被赋予了划时代的意义。在我国,目前统计还是一个初级阶段,各个行业对统计的认识还是非常落后的,认为统计仅仅是对过去某些数据的的汇总,就是一些报表而已,而不是从学科的角度上认识他,对其的了解太少了。实际上统计在很多的方面都有很大的应用,在医学、物理、天文、政治、文化、经济有着很重要的作用。单从经济方面来说,统计可以说是了解现在经济状况、预测今后经济发展的重要工具。对与市场,统计更是能直接的反映出来。在国外大多数的企业都运用统计设有自己的市场调研部,之所以这样做,就是要适应当代经济的发展状况,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论