




已阅读5页,还剩80页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章 统计整理,统计学课件,制作人: 胡 宝 臣,教学目的与要求 通过本章学习,首先要明确统计整理的意义和步骤,重点掌握统计分组的理论和方法,学会编制变量数列和统计表。 教学重点与难点 重点:分组标志的选择; 连续型变量的组距分组;次数分布数列的编制;权数意识的培养,正确理解权数。 难点:组距分组中组数、组距和组限的确定。,1.女,本科,讲师,月收入3500; 2.男,本科,副教授,月收入3800; 3.男,专科,讲师,月收入2600; 4.女,本科,讲师,月收入2800; 5.女,本科,副教授,月收入3900; 6.女,研究生,讲师,月收入3100; 7.男,本科,教授,月收入4200; 8.女,研究生,副教授,月收入3200; 9.女,研究生,教授,月收入4300; 10.女,专科,讲师,月收入2900; 11.女,本科,讲师,月收入3100; 12.女,研究生,讲师,月收入3100; 13.男,本科,教授,月收入4500; 14.男,研究生,教授,月收入3600; 15.女,本科,讲师,月收入3500; 16.男,研究生,副教授,月收入3800; 17.男,专科,讲师,月收入2600; 18.女,本科,讲师,月收入2800; 19.女,本科,副教授,月收入3900;20.女,本科,副教授,月收入3100; 21.男,本科,教授,月收入4200; 22.女,研究生,教授,月收入3500; 23.女,研究生,讲师,月收入3200 24.女,研究生,讲师,月收入3900; 25.女,研究生,教授,月收入4800;26.女,研究生,讲师,月收入3100;,教学导例 某高校教师有关资料,27.男,本科,教授,月收入4500; 28.男,研究生,教授,月收入4700 29.男,研究生,教授,月收入4800;30.女,研究生,讲师,月收入3800 31.女,研究生,讲师,月收入3500;32.男,研究生,副教授,月收入3600 33.男,本科,副教授,月收入4200;34.女,本科,教授,月收入3900 35.男,研究生,讲师,月收入3200;36.女,本科,讲师,月收入3200 37.女,本科,助教,月收入2100; 38.男,本科,副教授,月收入3600; 39.男,专科,讲师,月收入2600; 40.女,本科,教授,月收入4800; 41.女,本科,副教授,月收入3900;42.女,研究生,讲师,月收入3100; 43.男,本科,教授,月收入4500; 44.女,研究生,副教授,月收入3900 45.女,研究生,教授,月收入4200;46.女,专科,助教,月收入2900; 47.女,研究生,讲师,月收入2800;48.女,本科,教授,月收入4900; 49.男,本科,助教,月收入1800; 50.男,研究生,教授,月收入4600; 51.女,本科,助教,月收入1900; 52.男,本科,副教授,月收入3800;,某高校教师有关资料(续1),53.男,专科,讲师,月收入2600; 54.女,本科,助教,月收入1800; 55.女,本科,助教,月收入1900; 56.女,本科,副教授,月收入3100; 57.男,本科,教授,月收入4200; 58.女,研究生,副教授,月收入3500 59.女,本科,讲师,月收入2800; 60.女,研究生,副教授,月收入3900 61.女,研究生,教授,月收入4100;62.女,研究生,助教,月收入1800 63.男,本科,助教,月收入1800; 64.男,研究生,助教,月收入1600 65.女,本科,助教,月收入1900; 66.男,本科,副教授,月收入3700 67.男,专科,讲师,月收入2600; 68.女,本科,讲师,月收入2800; 69.女,本科,助教,月收入1600; 70.女,本科,副教授,月收入3100 71.男,本科,教授,月收入4200; 72.女,研究生,教授,月收入4500 73.女,本科,讲师,月收入2800; 74.女,研究生,副教授,月收入4200 75.女,研究生,助教,月收入2100; 76.女,研究生,助教,月收入1800 77.女,本科,助教,月收入1800; 78.女,本科,副教授,月收入3900 79.女,研究生,讲师,月收入3300 80.女,本科,助教,月收入1800,某高校教师有关资料(续2),面对如此繁杂的 个体资料,大家 感觉怎么样?,那么整理为下面的图表又怎么样呢?,乱乱乱,整理结果的表现形式-统计图 该校教师职称及性别柱形图,该校教师职称、性别、学历结构图,整理结果的表现形式-统计表 该校教师职称及性别分布数列 单位:人,某高校教师月收入分布表,本章主要内容, 统计整理的意义和步骤 统计分组 次数分布(分配)数列 统计表,第一节 统计整理的意义和步骤,主要内容 统计整理的意义 统计整理的步骤, 统计整理的地位 统计调查 统计整理 统计分析,一、统计整理的意义,搜集原始资料 对个体的感性认识,分类、汇总 过渡阶段,取得研究结论 对总体的理性认识, 统计整理的概念 根据目的 对统计调查资料 实施分类、汇总 编制统计图表 为统计分析奠定基础,二、统计整理的步骤,制订整理方案,审核调查资料,具体实施整理,复查整理结果,编制统计图表,1,3,4,4,2,5,统计整理的步骤(续), 制订整理方案:主要内容有: 统计分组体系和统计指标体系; 编制整理表格和填表说明; 整理的组织形式和汇总的技术方法。 审核调查资料:审核内容包括: 调查资料的完整性和正确性。 审核方法:逻辑检查和计算检查。 绘制统计图表:统计资料表现形式,2010年全国不同规模的家庭户类别,“十五”时期我国进出口情况,第二节 统计分组,主要内容 统计分组的意义 统计分组的两个关键问题 统计分组体系 统计分组的种类及方法,一、统计分组的意义, 统计分组: 根据统计研究的需要,将总体 按一定的标志划分为若干性质 不同的组成部分的统计方法。, 两个涵义: 对总体而言是“分”, 对个体而言是“合”。,质量标准: 组内同质性 组间差异性,统计分组的主要作用,对社会经济现象进行类型划分 统计分组过程就是类型划分的过程。划分类型,揭示差异是统计分组的根本作用 。 对社会经济现象进行结构分析 反映总体内部结构,判定现象性质及变化。 研究社会经济现象间的依存关系 分析影响因素和结果之间的变动关系及规律。,2000及2011年我国城乡居民消费结构对比表,(资料来源:2001、2012年中国统计年鉴) 注:表中“用”为家庭设备、用品及服务; “教”为教育文化娱乐服务;“通”为交通和通讯。,2012年某地区职工受教育程度与月收入关系表,二、统计分组的两个关键问题,(一)选择分组标志(首要问题),选择分组标志 的原则,根据研究目的,具体问题具体分析,选择主要标志,(二)划分各组界限,在选定分组标志后,就需要明确组与组之间的界限。,如何正确选择分组标志?,选择主要标志:有时存在若干个标志 都能不同程度满足研究目的的需要。 如研究某高校职工生活水平,可用的 标志有:职工工资、收入、职工家庭月 人均收入、职工家庭年人均收入。 该选择哪个更为合适呢?,三、统计分组体系,简单分组:对总体只按一个标志分组。,平行分组体系:两个及以上标志分别分组,统计分组体系:运用多个分组标志对同 一总体进行分组形成的一系列相互联系、相互补充的统计分组的整体。,复合分组体系:两个及以上标志层叠分组,平行分组体系(人口分组为例),性别 男 女,年龄 0-14 15-64 65以上,户籍 城 乡,平行分组体系适宜对研究对象进行 多角度、多方面分析。,复合分组体系(人口分组为例),城镇,农村,男,女,女,男,0-14 15-64 65以上,0-14 15-64 65以上,0-14 15-64 65以上,0-14 15-64 65以上,复合分组体系宜对研究对象 进行 多层次逐层深入分析,复合分组体系,注意:复合分组每增加一个层次就会使组数几何级增加。如上例: 2618组。因此复合分组层次也不可过多。有时候,为了排版和观感的需要复合分组的表现形式还可以采用上表式样。,2010年第六次人口普查分性别和年龄的人口复合分组情况,对问题的研究往往需要多角度和多层次。平行分组体系可以满足多角度研究的需要,复合分组体系可以满足多层次研究的需要。,四、统计分组的种类及方法,统计分组,变量分组,品质分组,单项分组,组距分组,等距分组,异距分组,(一) 品质分组(实例),(二)变量分组,变量分组反映的是各组量的差别,通过量的差别来反映事物间的性质差别。,1.单项分组 每组只用一个具体的变量值来表示的分组。其组数由不重复的变量值个数决定;各组组值明确。适用于不重复的变量值个数不多的离散变量。,单项分组(实例),现有50名育龄妇女(15-49)生育子女数情况: 0 2 1 1 3 1 3 0 0 1 1 3 2 0 0 0 3 1 0 0 2 0 2 0 1 1 0 1 1 0 1 1 2 1 3 1 5 3 2 1 2 0 2 3 2 1 0 1 2 0,按育龄妇女生育子女数进行单项分组可分为: 0、1、2、3、5五组。,2、组距分组,各组用变量值的变动区间来表示。适用于连续变量和不重复的变量值个数很多的离散变量。 (1)几个基本概念: 组限:(下限、上限) 闭口组:下限、上限都有。如200300 开口组: 下开口组: 以下 上开口组: 以上,为什么要设开口组?,统计分组的原则:“不漏不重” 。即: (1)要使总体中的每个单位都有组可归,贯彻分 组的“穷举”原则;即:“不遗漏”原则。 (2)每个单位都只能归到某一组,不能重复归组; 即“互斥”原则。 在出现极端值情况下,为了遵循统计分组的原则,应设置开口组解决极端值归组问题。,全距=最大值最小值 组距=上限下限 (注意:开口组组距以邻组组距代替)实例:,组距分组(续2),学生成绩分组 60以下 60-70 70-80 80-90 90以上,职工工资分组 1000以下 1000-2000 2000-3000 3000-4000 4000以上,年龄 0-14 15-64 65以上,下开口组 以下,上开口组 以上,上限,下限,组距,组中值,注 意 组中值代表组内各单位的一般水平。 其代表性受组内各单位分布是否均匀或是否在 组中值两侧成对称分布,否则计算出来的数值 与实际会有较大偏差。,(2)组距分组要解决的几个主要问题 组距:等距分组或异距分组? 组距多长? 实际工作中,一般采用等距分组。 组数 :就是决定将总体分成多少组? 组距和组数必须先确定一个。当研究对象有明显的几个组成部分,则可先确定组数,再根据情况确定各组的组距。 组限:确定组限就是要找出何处是决定事物性质差别的数量界限?组限的表示方法?,组距和组数的关系 组数与组距的确定,要力求能够将总体分布的特点反映出来。由于全距是既定的,在等距分组情况下,组距和组数存在相互制约的关系:,需要注意:根据上式计算的只能是一个参考数。,若先确定组距 组距要适中。若组距过小,易将同质单位划分在不同组;若组距过大,会使不同性质的单位同处一组,掩盖现象质的差异。 若先确定组距,应先观察原始资料,大致判断总体的水平高低和分布,然后确定组距。如对某公司职工按月收入分组。据资料若大致判断其收入普遍在3000元左右,此时以500元或1000元做为组距比较合适,若大致为1000元左右,则组距为100元或200元比较合适。,资料:现有某地区500个企业的计划完成 程度资 料,其中最低83%,最高125%,全距为42%。,据本资料可确定组数为6,则计算出的组距为7,分组结果为(1)。观察以下三种分组结果:,若先确定组数-实例讨论,先确定组数-实例讨论,分组结果(1) 83% -90% 90%-97% 97%-104% 104%-111% 111%-118% 118%-125%,分组结果(3) 80%-90% 90%-100% 100%-110% 110%-120% 120%-130%,分组结果(2) 83%-93% 93%-103% 103%-113% 113%-123% 123%-133%,以上哪种分组效果最好? 首先,分组(1)杂乱,难分析判断。一般等距分组时,组距尽可能取10或10的倍数,此例选10较合适。 其次,分组(1)第三组和分组(2)第二组均出现严重问题,既包括超额完成计划的,还包括没有完成计划的。 再次,组限问题,如确定组距为10,组数为5,而各组具体范围没搞清,分组(2)也不合适。 最后,在算全距时要注意别机械。若有极端值,则以次大或次小值计算全距,再用开口组解决最大或最小值归组问题。 若此例有20%和180%,可以在计算全距时不考虑,组限的表示方法 组限的表示方式取决于变量的类型。连续变量,须采用重叠组限;离散变量可采用间断组限或重叠组限。如:企业按职工人数分组,不重叠组限 99以下 100 999 10004999 5000以上,重叠组限 100以下 1001000 10005000 5000以上,连续变量组限的表现方法-重叠组限,职工月收入分组 (元) 1500以下 1500-2000 2000-2500 2500-3000 3000-3500 3500-4000 4000以上,组距分组一般采用等距分组; 各组组距以10或10的倍数为宜; 组数不可过多(少),10组以内5-10组为宜; 组限以10或10 的倍数为宜; 为保持一致,离散变量也采用重叠组限的方法。重叠组限解决了遗漏问题,但同时却出现了重复归组问题。为解决此问题,采用重叠组限时,应遵循“上组限不在内”原则。 根据“穷举”原则要求,最小组的下限要不高于最小变量值; 最大组的上限要不低于最大变量值。,组距分组的一般处理方法,第三节 次数分布(分配)数列,主要内容 次数分布(分配)数列概念及构成 次数分布(分配)数列的种类及编制 变量数列次数分布的主要类型 统计汇总技术,一、次数分布(分配)数列概念及构成,次数分布(分配)数列:是指在统计分组的基础上,将总体各单位进行归组整理编制而成的一种反映总体单位在各组之间分配状况的统计数列。,权 数,各组组别 单位数(频数、次数) 比重(频率),构成 要素,【课堂讨论1】,讨论目的:认识权数的作用; 比较绝对数权数和相对数权数的作用差别 资料(1)现有甲乙两个班的某学期考试的成绩。,甲乙两班的英语学习成绩表,【课堂讨论2】,资料(2):现有A、B两个不同股份公司的甲、乙两股东所持本公司股份如下表。若甲、乙都是所在公司第一大股东。甲掌握本公司2000万股份,而乙只掌握本公司120万股份。 要求:判断甲、乙在本公司的决定权大小。,二、次数分布(分配)数列的种类,次数 分布,等距 数列,变量 数列,品质 数列,单项 数列,组距 数列,异距 数列,某校学生性别构成,某村农户按子女数分组,品质数列,次数,频率,变量数列,组别,组距数列的编制(实例),资料:现有2012年某地50户居民家庭人均月收入资料如下: 822 794 773 737 898 827 798 776 746 811 855 740 775 796 867 824 882 729 764 788 735 771 791 819 860 726 762 786 809 852 1520 722 760 784 940 930 689 659 380 803 700 753 781 801 829 712 857 781 803 832 可以看出这些资料很凌乱,难以直接判断其分布特征。,组距数列的编制实例(续1),第一步:按顺序排列变量值;,第二步:计算全距; 变量值在380-1520之间,全距为1140。由于 380和1520为极端值,计算全距可不予考虑。可用 开口组表示;则全距=940-659=281,第三步:确定组距或组数; 若分6组,则组距=281/6=46.8 ,组距设为 50;若分4组,则组距设为100。组距太小不能反映收入水平的差异,若先考虑组距,100更合适。,组距数列的编制实例(续2),某地50户居民家庭人均月收入表(1),组距数列的编制实例(续3),某地50户居民家庭人均月收入表(2),对以上两种组距数列进行比较可以看出:表(1)反映情况比较详细。,三、累计次数和累计频率,向下累计:将各组次数和频率由变量值大的组向变量值小的组逐项累计,各组累计数表明各组下限以上的累计次数和累计频率。,向上累计:将各组次数和频率由变量值小 的组向变量值大的组逐项累计,各组累计 数表明各组上限以下的累计次数和累计频 率。,累计次数和累计频率(实例1),某班英语考试成绩表,累计频数和累计频率(实例2),累计频数和累计频率亦可用于品质数列,如:,累计频数和累计频率(实例3),某县农民家庭户按年人均纯收入累计次数和累计频率表,四、次数分布的主要类型,各种不同性质的现象有着各自特殊的次数分布。概括起来主要有三种:钟形(正态与偏态)、 U形和J形(正J与反J)分布。如下图:,五、统计汇总,统计汇总:是在统计分组基础上,根据整理方案所确定的指标体系的要求,计算各项指标分组数值和总计数值,以获得综合统计资料的工作过程。 统计汇总组织形式:逐级汇总和集中汇总 统计汇总技术方法:手工汇总 计算机汇总,第四节 统计资料的主要表现形式 (统计表),主要内容 统计表的作用 统计表的分类 统计表的构成 统计表的设计,根据某机械制造厂职工资料分组汇总如下: 初级工:240人,其中男80人,女160人,在男职工中,工龄在5年以下的30人,在5-10年的40人,10年以上的10人,在女职工中,工龄在5年以下的90人,在5-10年的40人,10年以上的30人; 中级工:420人,其中男380人,女40人,在男职工中,工龄在5年以下的150人,在5-10年的200人,10年以上的30人,在女职工中,工龄在5年以下的10人,在5-10年的25人,10年以上的5人;高级工:360人,其中男250人,女110人,在男职工中,工龄在5年以下的50人,在5-10年的70人, 10年以上的130人,在女职工中,工龄在5年以下的70人,在5-10年的30人,10年以上的10人。,思考:该种表现形式好吗?,某机械制造厂职工分布情况表-统计表表现整理结果 单位:人,这种表现形式如何?,一、统计表的作用,统计表:是用表格来系统显示统计资料的一种基本形式。统计表是重要和有效的统计资料表现形式。 广义的统计表包括统计工作各个阶段的一切表格,包括调查表、整理表和分析表。统计整理表是表明前述资料整理的结果,又是后续资料分析工作的开始。 统计表的作用:通过对统计资料有条理地组织与安排,统计表使枯燥杂乱的统计数字资料系统清晰,直观易懂,鲜明、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 防汛知识培训班新闻稿课件
- 防汛相关知识培训课件
- 摄影服务公司员工保密协议
- 防汛业务知识培训
- 金融行业营销推广方案
- 购物体验行业技术标准与规范
- 微前端与跨平台应用的无缝集成研究-洞察及研究
- 防恐怖知识培训内容课件
- 楼房外墙物业维修基金维合同2篇
- 基因表达调控网络-第4篇-洞察及研究
- 脑梗死恢复期护理查房范文讲课件
- 京东安全工程师笔试题库
- 2025版校园食堂日管控、周排查、月调度记录表
- 生产件批准程序PPAP学员版
- 2022年03月北京肿瘤医院公开招聘笔试参考题库含答案解析
- YB 4094-1993炮弹用方钢(坯)超声波探伤方法
- 《雨巷》优秀课件-雨巷课件一等奖
- 《嫦娥(李商隐)》课件
- 《人工染色体载体》课件
- 平行平板的多光束干涉
- 项目代建大纲
评论
0/150
提交评论