统计学基础第03章数据的整理与显示_第1页
统计学基础第03章数据的整理与显示_第2页
统计学基础第03章数据的整理与显示_第3页
统计学基础第03章数据的整理与显示_第4页
统计学基础第03章数据的整理与显示_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第3章 统计数据的整理与显示学习目标本章介绍统计数据整理的预处理过程、统计分组的概念和方法、频数分布及变量数列的编制方法以及统计表与统计图的结构和绘制方法。3.1 统计数据的预处理3.1.1 数据的审核完整、准确 适用、时效3.1.2 数据的筛选剔除 保留3.1.3 数据的排序排序递增、递减 升序、降序数据的审核原始数据(raw data)完整性审核应调查的单位或个体是否有遗漏所有的调查项目或变量是否填写齐全准确性审核数据是否真实反映实际情况,内容是否符合实际数据是否有错误,计算是否正确等数据的审核二手数据(second hand data)适用性审核弄清楚数据的来源、数据的口径以及有关的背景

2、材料确定数据是否符合自己分析研究的需要时效性审核尽可能使用最新的数据 确认是否有必要做进一步的加工整理数 据 的 筛 选(data filter)将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除数 据 的 排 序 (data rank)分类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分数值型数据的排序递增排序:设一组数据为x1,x2,xn,递增排序后可表示为:x(1)x(2)x(2)x(n) 3.2 统计数据的整理3.2.1 统计分组的

3、概念和作用1)统计分组的概念2)统计分组的作用(1)区分事物性质,划分现象类型(类型分组)(2)反映现象的内部结构(结构分组)(3)分析现象之间的依存关系(相关分组)3.2.2 统计分组的分类和方法1)统计分组的分类(1)按分组标志的多少划分 简单分组 复合分组(2)按分组标志的类型划分 品质分组 数量分组(3)按分组的作用划分类型分组 结构分组 分析分组2)统计分组的方法(1)单项式分组(数值型数据)(2)组距式分组(数值型数据)例:某高中学生年龄分布表年龄(岁)学生数比率(%)1610010.311720020.621824024.741921021.652022022.68合计97010

4、0.00例:某企业职工按工资分组表月工资分组(元)职工人数比重(%)1000-150012010.001500-200028023.332000-250050041.672500-300020016.673000以上1008.33合计1200100.00组距式分组有关概念 分组的原则不重复不遗漏 连续变量分组,临组限重叠; 离散变量分组,临组限间断。一组的最小值叫下限 一组的最大值叫上限组中值=(上限+下限)/2 开口组组距按邻组计算 等距分组 异距分组 等距分组的步骤、方法1)确定组数。 斯特格斯(Sturges)经验公式: k=1+3.322lgN2)确定组距。 组距=(最大值-最小值)/

5、组数异距分组(频数密度=频数/组距)3)确定组限。最低组下限小于最小值,最高组上限大于最大值。 例:某车间50名工人日加工零件数117 122 124 129 139 107 117 130 122 125110 118 123 126 133 134 127 123 118 112108 131 125 117 122 133 126 122 118 108112 134 127 123 119 113 120 123 118 112137 114 120 128 124 115 139 128 124 12150名工人分组步骤1、确定组数k=1+3.322lg5072、计算组距=(139-

6、107)/7=4.653、确定组限,编制频数分布表 工人日加工零件频数分布表按零件数分组工人数频率(%)105-11036110-115510115-120816120-1251428125-1301020130-135612135-14048合计501003)累计频数和累计频率(定序、定距、定比数据)例:某高校抽查50名学生月平均通信费分布月平均通信费(元)频数频率(%)向上累计向下累计频数频率频数频率15以下484850100152381612244692233115302754387631396123366234639477144080173447556124692102055以上485

7、010048合计50100例: 某银行窗口服务态度统计表(定序数据)服务态度服务人次向上累计频数向下累计频数很不满意3370不满意91267满意273958很满意317031合计703.3 统计数据的显示3.3.1 统计表1)统计表的结构形式:表头、列标题、行标题、数字资料、表 外附加内容:主词、宾词统计表的结构20022003年城镇居民家庭抽样调查资料项目单位2002年 2003年 调查户数 平均每户家庭人口 平均每户就业人口 平均每户就业面 平均一名就业者负人数 平均每人全部年收入 可支配收入 平均每人消费性支出户人人%人元元元453173.041.5851.971.928177.4077

8、02.806029.88480283.011.5852.491.919061.228472.206510.94资料来源:中国统计年鉴2004,中国统计出版社,2004,第359页。注:本表为城市和县城的城镇居民家庭抽样调查资料。 行标题列标题数字资料表头附加2)统计表的分类简单表、分组表、复合表3)统计表的设计 合理安排统计表的结构 总标题内容应满足3W 要求 数据计量单位相同时,可放在表的右上角标明,不同时应 放在每个变量后或单列出一列标明 表中的上下两条横线一般用粗线,其他线用细线 通常情况下,统计表的左右两边不封口 表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一

9、 对于没有数字的表格单元,一般用“”表示 必要时可在表的下方加上注释1)定性数据的图形描述(1)条形图(bar graph) 横置条形图 (条) 纵置条形图 (柱)(2)饼形图(pie chart)(3)环形图3.3.2 统计图购买饮料品牌【例】一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次 。右边就是记录的原始数据。绿色健康饮品购买饮料品牌条形图对比条形图购买饮料品牌饼图环形图8%36%31%15%7%33%26%21%13%10% 非常不满意 不

10、满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价2)定量数据的图形描述 (1)直方图(histogram) (2)折线图(line) (3)茎叶图(stem-and-leaf display) (4)线图 (5)雷达图例:某企业职工某项食品月支出表月支出(元)职工数(人)比重(%)200以下 20 20200-400 50 50400-600 20 20600-800 10 10合计 100 100职工生活费支出直方图和折线图折线图与直方图下的面积相等!例:某企业50名应聘者回答问题的正确数 112 73 126 82 92 115 95 84 68 100 72 92 128 10

11、4 108 76 141 119 98 85 69 76 118 132 96 91 81 113 115 94 97 86 127 134 100 102 80 98 106 106 107 73 124 83 92 81 106 75 95 119茎叶图69 87 2 3 6 3 6 5 8 6 2 3 1 1 0 4 59 7 2 2 6 2 1 5 8 8 5 410 7 4 8 0 2 6 6 0 6 11 2 8 5 9 3 5 912 6 8 7 413 2 414 16 8 97 2 3 3 8 0 1 1 2 3 4 5 69 1 2 2 2 4 5 5 6 7 8 8 10 0 0 2 4 6 6 6 7 810 2 3 5 5 8 9 9 12 4 6 7 813 2 41 直方图与茎叶图的区别例:某地区20102017年人均收支记录(元)表3-21某地区20102017年人均收支记录 单位:元年份20102011201220132014201520162017人均收入1700.62026.62577.43496.24283.04838.951

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论