统计学第三章统计数据的整理_第1页
统计学第三章统计数据的整理_第2页
统计学第三章统计数据的整理_第3页
统计学第三章统计数据的整理_第4页
统计学第三章统计数据的整理_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计数据的整理,重点:统计分组与分布数列的关系第一节统计整理第二节统计分组与次数分布第三节统计数据的显示第四节EXCEL的应用,“绘制统计图表”任务书(三)一、任务题目:自选某一社会经济现象,将相关数据信息用统计图表反映出来。二、主要内容:学习统计分组方法和次数分布的特征;学习统计表的制作要求和方法;学习统计图的绘制方法和技巧;自选某一社会经济现象,将相关数据信息用统计图表反映出来。三、基本要求:1.所选社会经济现象可以是工商企业的生产经营数据资料;学校的人财物结构分布等。2.收集资料的方法可以是实地调查、网络调查等;3.每人用EXCEL制作一张复合分组表;同时将相关数据信息绘制成圆饼图、折线图或直方图。4.将所作的统计图表存入一个文件夹,拷贝到自己的U盘备查。四、成绩评定:1评分标准。基础分:统计图表设计正确、数据真实可信。4分;加分:按时提交作业,独立完成。加1分。2.成绩占学期总成绩5%。任务下达日期:2012年3月22日任务完成日期:2012年3月30日指导教师签字:,任务书,第一节统计整理重点:统计分组的作用和方法带着问题学:1、为什么对研究对象要进行统计分组?2、按数量标志分组要掌握什么技巧?,一、统计数据整理的意义和内容意义统计整理是指根据统计研究的需要,将统计调查阶段搜集到的大量个体资料进行科学的分类汇总、加工或再加工处理,使之系统化,条理化,成为能反映总体特征的综合资料的过程。内容数据处理:分组、汇总、制表。数据管理:传输、存储、更新、输出。要求科学性、条理性、充分性。二、统计数据审核与汇总原始资料审核。数据资料分类汇总。编制统计报表或绘制统计图。数据保管和发布。,汇总技术:有传统手工汇总和现代电子计算机汇总两种技术。(1)手工汇总。常用的汇总方式有四种:划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项目较多的资料的汇总。折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张一张的重叠在一起,再进行汇总。这种方法一次只能选择一个项目及其数据进行汇总,故适用于数据较少的资料。卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器材类的实物资产的汇总。(2)电子计算机汇总。其数据处理程序如下:第一步,编程。使用计算机语言编写出一套完整的数据处理程序。第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果存储在磁盘、磁带等磁介质中。第三步,审核。对程序设计进行逻辑性审核;对录入数据进行误差审核。第四步,输出结果。,第二节统计分组与次数分布,重点:对变量数列进行统计分组带着问题学:1、为什么对研究对象要进行统计分组?2、对变量数列如何正确进行分组3、次数分布有哪些表现形式?,第二节统计分组与次数分布(重点节),一、统计分组1、统计分组的概念和作用根据研究任务需要,将总体中所有单位按一定的标志划分为若干性质不同而又有联系的部分的一种统计方法。对总体是分;对总体单位是合。科学性原则:关键是正确选择分组标志。互斥性原则:同组同性。2、统计分组的作用划分社会经济现象类型。研究总体内部结构。分析现象之间的依存关系。,(三)统计分组的方法(重点),1、按分组标志个数简单分组和复合分组。简单分组onlyone复合分组twoorgreater(按两个或两个以上标志分组,且重叠排列.)2、按分组标志性质品质标志分组与数量标志分组。数量标志分组(又称变量分组)中根据离散型变量和连续型变量不同可进行单项式分组或组距式分组。,(例:复合分组)某地区2009年工业总产值和职工人数,某地区工业企业2009年基本情况统计表,这是复合分组表吗?,(例:离散型变量单项式分组)某汽配厂生产“东风”汽车某种配件产量统计表,(例:离散型变量组距式分组)某企业工人日产量登记表次数表,(例:连续型变量组距式分组)某班学生考试成绩次数表,注意:相邻两组的上下限是否重合?,课堂练习题判断题1:下面的两种分组中,分组方法正确的是()12,第二种分法有两个错误:同组异性;数值断缺、脱节。,二、次数分布(分配数列),1、次数分布的概念概念_指在统计分组的基础上,形成总体单位在各组间的分布的一种数列。2、要素组名(标志);总体单位数(次数、频数或频率)3、分布数列的种类品质数列(属定性数列)例P59表3.7;变量数列(属定量数列)例P59表3.8_3.10。,2、次数分布的类型及图示,U形分布,正J形分布,反J形分布,统计分组与分布数列的对应关系及内容,统计分组分布数列(以标志为主线,组距式分组为重点)(以分组为基础,以两要素为纲展开标志标志一个_简单分组品质标志_品质数列个数数量标志_变量数列多个_复合分组)单位数(表现形式)品质标志绝对数_频数(次数)性质相对数_频率数量标志离散型单项式连续型组距式组数组距等距(均匀分布),异距(不均匀分布)上限下限组限开口组(缺限)_邻组组距作本组组距.上下限重合_下限在内,上限不在内(指该单位数)组中值假定性(组内各单位均匀分布,组间分布可不均)计算:(上限值+下限值)/2,(二)变量数列的编制,(例:品质数列)某地区2009年底按三次产业分类的就业人数,3、变量数列的编制某班学生统计学考试成绩分布表,判断题:下面的两个统计资料中,属于分配数列的是()1.2.,第二个表是。具备了分配数列的两要素。,返回,第三节统计数据的显示(重点节),重点:统计表、统计图的制作。带着问题学:1、统计表的结构和种类有哪些?2、复合分组表的特点是什么?3、统计图有哪些种类?怎样正确选用统计图来反映社会经济现象?,第三节统计数据的显示重点:统计图表的制作(一)统计表,1、统计表的概念统计表指将经过调查整理的统计数据资料填列在表格中,形成统计表。,、统计表的结构(例P65表3.12)按形式:按内容:标题总标题(表名)横栏标题(组名).主词纵列标题(指标).宾词格线(左右两端不封口)数字(绝对数,相对数,平均数),3、统计表的种类,按主词是否分组及分组标志的个数多少分为:简单表(未分组表)no(例如:职工工资表、学生成绩单、零售商品销售流水账等)分组表yes简单分组表onlyone复合分组表twoorgreater(按两个或两个以上标志分组,且重叠排列.),简单表例:某班学生统计学成绩(分),759068737586688987627286837174778495809051666279758381536065496870707275828390918589777563868280818587787695,例:复合分组表某地区2009年工业总产值和职工人数,(二)统计图(重点),直方图折线图曲线图累计曲线图茎叶图箱图饼图EXCEL,1、直方图:用直方形的宽度和高度来表示频数分布的图形,即在直角坐标系上,以横轴表示变量,以纵轴表示频数或频率,以各个宽度为组距、高度为频数或频率的直方块矩形所构成的图形。2、折线图:在直方图的基础上,将各组直方形顶边线的中点(即由组中值与频数或频率确定的坐标点)用直线连接起来,就形成为折线图。3、曲线图:当变量数列的分组数较多、组距较小时,折线图就变成了平滑的曲线图。4、累计曲线图:根据累计频数或累计频率分布数列,可以绘制累计分布图。它以分组变量为横轴,以累计频数或累计频率为纵轴,以各组的上限(下限)与累计频数或累计频率为坐标点,平滑连接各点即成向上(向下)累计曲线。5、茎叶图:茎叶图是一种用以表现原始数据分布状况的图形,由“树茎”与“树叶”两部分构成,并且都是以数字来表示的。6、箱形图:箱形图是由变量的5个特征值绘制而成的图形,由一个箱子和两条线段组成。5个特征值是变量的最大值、最小值、中位数、第一四分位数和第三四位数(中位数和分位数在下一章介绍)。连接两个分位数画出一个箱子,箱子用中位数分割,把两个极点值与箱子用线条连接,即成相形图。,直方图(条形图),直方图(条形图),2009年四川部分地区城乡居民储蓄存款余额,饼图(圆形图),股票K线图,折线图,累计曲线图(据某校教师年龄数据绘图)累计频数(人)累计频率(%),。,。,。,。,。,。,。,。,。,。,洛伦茨曲线,A,B,基尼系数是国际上综合考察居民内部收入分配差异状况的指标联合国定:.绝对平等;.比较平均;.相对合理;.差距较大;.以上差距悬殊国际警戒线.,绝对平等线,实际收入分配曲线,茎叶图(假设):工人日加工零件茎叶表,象形图,第四节EXCEL的应用,重点:运用EXCEL的功能(统计函数)进行数据处理。带着问题学:1、EXCEL表进行数据处理的程序是什么?2、对组距式变量数列进行次数统计时,手工汇总与EXCEL处理的区别何在?,例:某班54名学生按学号登记的统计学期末考试成绩:7590687375866889876272868371747784958090516662797583815360654968707072758283909185897775638682808185877876952、排序1打开EXCEL工作表。将原始数据录入相应的单元格区域中“B2:B55”。2排序。光标指向B2单元格,按下鼠标左键,拖曳光标覆盖B2:B55区域(如图3-15),选定数据区域。左击“数据”菜单,弹出下拉菜单。选择并单击“排序”按钮,弹出对话框,在“主要关键字”空格内输入“成绩(分)”。若需从小到大排序,则单击“升序”按钮前面的圆圈;若需从大到小排序,则单击“降序”按钮前面的圆圈,再按“确定”按钮。,3分组及分布数列分组。在C1单元格输入“分组上限值”,在C2:C6采用键盘输入方式输入各组上限值。需要注意的是,因为EXCEL的FREQUENCY函数进行次数(频数)统计时采用的是“上限值包含在内”的原则,意即不会发生相邻两组上下限重合的现象,但C2:C6各组的实际组距与图3-16中内嵌的一张成绩分布表的“按成绩分组”栏的D4:D8区域内的组距是一致的。,次数分布(频数和频率)。光标指向E4单元格,按下鼠标左键,拖曳光标覆盖E4:E8E区域。单击“插入”菜单,在下拉菜单在选择“函数”,弹出“插入函数”界面。在“选择类别”的空格内选择“统计”。在“选择函数”框内选择FREQUENCY函数,再按“确定”按钮。如图3-16所示。,统计函数:频数“FREQUENCY”,在弹出的对话框“函数参数FREQUENCY”中的“Data-array”框内输入原始数据所在的数据区“B2:B55”,在“Bins-array”框内输入分组上限值所在的数据区“C2:C6”,然后同时按下“Ctrl-Shift-Enter”三个键,便可以得到图3-17中E4:E8所示的各组次数。计算合计数。在E9单元格中输入公式“=SUM(E4:E8)”,再按回车键即得。计算各组比重(频率)。在F4单元格中输入公式“=E4/$E$9*100”,再按回车键即得第一组占全部人数的比重(频率)。然后将F4单元格中的公式复制到数据区域内的其它单元格。方法是光标指向F4单元格右下角,此时光标变成实体小十字星“+”,按下鼠标左键,拖曳到F8单元格,即可得到其余各组的频率。计算合计数。在F9单元格中输入公式“=SUM(F4:F8)”,再按回车键即得。也可以从E9单元格复制,方法是光标指向E9右下角,此时光标变成实体小十字星“+”,按下鼠标左键,拖曳到F9单元格,即可得到频率合计数。,向上累计次数和频率:,在G4单元格中输入公式“=E4”,意即将初始值“3”存入G4单元格。在G5单元格输入公式“=G4+E5”,意即将第一组次数与第二组次数的累计数存入G5单元格,按回车键即可得G5单元格的累计数。然后将G5单元格中的公式复制到数据区域内的其它单元格。方法是光标指向G5单元格右下角,此时光标变成实体小十字星“+”,按下鼠标左键,向下拖曳到G8单元格,即可得到其余的累计数。同理,在H4单元格中输入公式“=F4”,意即将初始值“5.5555”存入H4单元格。在H5单元格输入公式“=H4+F5”,意即将第一组频率与第二组频率的累计数存入H5单元格,按回车键即可得H5单元格的累计数。然后将H5单元格中的公式复制到数据区域内的其它单元格。方法是光标指向H5单元格右下角,此时光标变成实体小十字星“+”,按下鼠标左键,向下拖曳到H8单元格,即可得到其余的累计数。,向下累计次数和频率:,在I8单元格中输入公式“=E8”,意即将初始值“6”存入I8单元格。在I7单元格输入公式“=I8+E7”,意即将第五组(最后一组)次数与第四组次数的累计数存入I7单元格,按回车键即可得I7单元格的累计数。然后将I7单元格中的公式复制到数据区域内的其它单元格。方法是光标指向I7单元格右下角,此时光标变成实体小十字星“+”,按下鼠标左键,向上拖曳到I4单元格,即可得到其余的累计数。在J列进行累计频率的操作。其操作步骤和原理与次数累计相同。次数和频率的“合计”栏不填数字。在G9单元格输入“/”,复制到H9:J9区域即可。全部计算结果如图3-18所示。,返回,本章小结1统计整理是对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论