描述定性数据的图形法和数值法_第1页
描述定性数据的图形法和数值法_第2页
描述定性数据的图形法和数值法_第3页
描述定性数据的图形法和数值法_第4页
描述定性数据的图形法和数值法_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三讲第三讲 描述统计学(二)描述统计学(二)描述定性数据的图形法和数值法描述定性数据的图形法和数值法假定已经搜集了一个感兴趣的数据假定已经搜集了一个感兴趣的数据集,如何弄清楚它的意义?集,如何弄清楚它的意义?统计数据整理的基本程序审审 核核分类(组)分类(组)制表制表 作图作图3.1审审 核核完整性检查完整性检查准确性检查准确性检查资料是否收齐资料是否收齐调查项目答案是否完整调查项目答案是否完整逻辑性检查逻辑性检查计算检查(计算方法、计算检查(计算方法、计算口径、计算结果)计算口径、计算结果) 有错误的数据,能更正的更正,不能更正的统计时有错误的数据,能更正的更正,不能更正的统计时要舍弃并注

2、明。要舍弃并注明。 在描述定性观测值时,我们以这样一种方式来定在描述定性观测值时,我们以这样一种方式来定义义类(或组)类(或组):每个观测值能落入一类(或组)并且每个观测值能落入一类(或组)并且只能落入一类(或组),然后给出落入每一类(或组)只能落入一类(或组),然后给出落入每一类(或组)的观测值个数或相对于观测值总数的比例,用这种数的观测值个数或相对于观测值总数的比例,用这种数值方法来描述数据集合。值方法来描述数据集合。 定义定义3.1 3.1 对于给定的类(或组),对于给定的类(或组),频数(次数)频数(次数)是指落入这个类中的观测值的个数。是指落入这个类中的观测值的个数。 定义定义3.2

3、3.2 对于给定的类(或组),对于给定的类(或组),相对频率(比重)相对频率(比重)是指落入这个类中的观测值的个数相对于观测值总数是指落入这个类中的观测值的个数相对于观测值总数的比例。的比例。3.2 分组分组3.2.1分组标志的选择分组标志的选择分组标志选择的原则分组标志选择的原则正确选择分组标志是统计分组的核心问题。正确选择分组标志是统计分组的核心问题。(1)根据研究问题的目的来选择。)根据研究问题的目的来选择。例如:同一个工人总体,例如:同一个工人总体, 应选用工人的文化程度作为分组标志或选用技术水平应选用工人的文化程度作为分组标志或选用技术水平等级作为分组标志,观察具有大学、中学、小学、

4、文盲等等级作为分组标志,观察具有大学、中学、小学、文盲等文化程度,或具有不同等级的工人人数各占多少;文化程度,或具有不同等级的工人人数各占多少; 研究的任务是分析工人的文化素质或业务素质,研究的任务是分析工人的文化素质或业务素质, 应选用工人的年龄作为分组标志,观察工人中老年、应选用工人的年龄作为分组标志,观察工人中老年、壮年、青年的比例各为多少。壮年、青年的比例各为多少。 研究的目的是分析工人劳动能力状况,研究的目的是分析工人劳动能力状况,(2)要选择)要选择最最能够反映事物本质或主要特征的标志。能够反映事物本质或主要特征的标志。 例如:研究职工生活水平高低情况,可以选用职工的例如:研究职工

5、生活水平高低情况,可以选用职工的工资水平最为分组标志,也可以用职工家庭成员平均收入工资水平最为分组标志,也可以用职工家庭成员平均收入水平作为分组标志。选哪个更好呢?水平作为分组标志。选哪个更好呢? 选用人均收入水平更好。选用人均收入水平更好。(3)要结合现象所处的具体历史条件或经济条件来选择。)要结合现象所处的具体历史条件或经济条件来选择。 例如:研究职工生活水平高低情况,现在要分列出来例如:研究职工生活水平高低情况,现在要分列出来职工生活困难户一组,那么什么是困难户的标准呢?职工生活困难户一组,那么什么是困难户的标准呢? 必须根据必须根据现在现在的物价水平确定困难户的标准,然后再的物价水平确

6、定困难户的标准,然后再分组。分组。3.2.2简单分组、复合分组和分组体系简单分组、复合分组和分组体系 总体只按总体只按一个一个标志分组称为标志分组称为简单分组简单分组按商品分类分组按商品分类分组构成构成(%)食品类食品类衣着类衣着类家庭设备用品类家庭设备用品类文化娱乐用品类文化娱乐用品类交通通讯类交通通讯类医疗保健类医疗保健类居住类居住类杂项商品类杂项商品类40.6 4.7 7.511.610.8 4.714.4 5.7合计合计100 例:例:简单分组简单分组 将同一总体选择两个或两个以上的标志分别进将同一总体选择两个或两个以上的标志分别进行简单分组,排列起来,即成为行简单分组,排列起来,即成

7、为平行分组体系平行分组体系。 例:例:平行分组体系平行分组体系对工业经济总体的研究。对工业经济总体的研究。(1 1)按轻、重工业分:)按轻、重工业分: 轻工业轻工业 重工业重工业(2 2)按经济类型分:)按经济类型分: 国有国有 集体集体 (3 3)按隶属关系分:)按隶属关系分: 中央中央 地方地方(4 4)按地区分:)按地区分: 华北地区华北地区 东北地区东北地区 复合分组与复合分组体系复合分组与复合分组体系 对同一个总体选择两个对同一个总体选择两个或两个以上标志重叠起来进或两个以上标志重叠起来进行分组,就叫行分组,就叫复合分组复合分组 多个复合分组组成的体多个复合分组组成的体系,就是系,就

8、是复合分组体系复合分组体系。 例:例:复合分组体系复合分组体系在运输邮电统计中,对货运在运输邮电统计中,对货运量、客运量进行的复合分组量、客运量进行的复合分组及其体系。及其体系。货运量货运量 铁路运输铁路运输 中央中央 地方地方 公路运输公路运输 中央中央 地方地方 水路运输水路运输 中央中央 地方地方 空运空运 中央中央 地方地方 客运量客运量 按运输按运输方式分方式分类类按隶属按隶属关系分关系分类类 定性数据的表格常用统计表中的定性数据的表格常用统计表中的频数分布表频数分布表。3.3 制表制表 作图作图3.3.1 3.3.1 频数分布表制作的基本要求频数分布表制作的基本要求1 1)必须包括

9、)必须包括类别名称和频数或相对频数类别名称和频数或相对频数。2 2)表的最后一行或列通常列出)表的最后一行或列通常列出“合计合计”项。项。3 3)必须有)必须有总标题总标题(例如:(例如:“表表1 1 与能源有关的死亡与能源有关的死亡事故原因统计表事故原因统计表”)。表头要言简意赅的给出表的)。表头要言简意赅的给出表的主要内容,要有序号,方便引用,表头字数不要太主要内容,要有序号,方便引用,表头字数不要太多,居中放置。多,居中放置。4 4)表格的边框:开口表(两侧无线),最上面和最)表格的边框:开口表(两侧无线),最上面和最下面的线粗,内部的线细,一般采用三线两格或下面的线粗,内部的线细,一般

10、采用三线两格或四线三格形式。四线三格形式。5 5)表中不能有空白项,没有数据的用)表中不能有空白项,没有数据的用“”,有,有数据但是缺失的用数据但是缺失的用“.”.”。6 6)有计量单位的数据,需要注明单位。)有计量单位的数据,需要注明单位。3.3.2 统计表的结构统计表的结构(1 1)总标题)总标题 :表明全部统计资料的内容,一般写在表的:表明全部统计资料的内容,一般写在表的上端正中。上端正中。(2 2)横标题)横标题 :通常也称为统计表的主词(主栏),它是:通常也称为统计表的主词(主栏),它是表明研究总体及其组成部分,也是统计表所要说明的对象,表明研究总体及其组成部分,也是统计表所要说明的

11、对象,一般写在左方。一般写在左方。表表2 210 10 我国我国20022002年国内生产总值年国内生产总值 (总标题)按三次产业分国内生产总值国内生产总值(亿元)(亿元)比上年增长比上年增长率率(%(%) 第一产业第一产业 14883 14883 2.9 2.9 第二产业第二产业 52982 52982 9.9 9.9 第三产业第三产业 34522 34522 7.3 7.3 合 计 102398 102398 8.0 8.0横标题主 词 (4 4)数字资料:即各横栏与综栏交叉处的数字。)数字资料:即各横栏与综栏交叉处的数字。 注:主词和宾词不是固定不变的,而是可以互换的,特注:主词和宾词不

12、是固定不变的,而是可以互换的,特别是主词的分组太多时,往往将一些分组移到宾栏中,这别是主词的分组太多时,往往将一些分组移到宾栏中,这由统计表如何设计更为合理、鲜明、清晰而定。由统计表如何设计更为合理、鲜明、清晰而定。 (3 3)纵标题:)纵标题: 通常也称为统计表的宾词(宾栏),它通常也称为统计表的宾词(宾栏),它是表明总体特征的统计指标的名称,一般写在表的上方。是表明总体特征的统计指标的名称,一般写在表的上方。按三次产业分按三次产业分国内生产总值国内生产总值(亿元)(亿元)比上年增长比上年增长率率(%(%) 第一产业第一产业 14883 14883 2.9 2.9 第二产业第二产业 5298

13、2 52982 9.9 9.9 第三产业第三产业 34522 34522 7.3 7.3 合合 计计 102398 102398 8.0 8.0纵标题纵标题宾词宾词数字资料数字资料统计表的种类统计表的种类1 1、简单表简单表。即统计表的主词栏,未经任何分组,仅仅罗列各。即统计表的主词栏,未经任何分组,仅仅罗列各单位名称,或按时间顺序排列的表格(如表单位名称,或按时间顺序排列的表格(如表3-13-1)。)。表表3-1 3-1 我国三个城市的人口数我国三个城市的人口数(1990(1990年年7 7月月1 1日日0 0时时) ) 城城 市市 人口数人口数( (人人) )较较19821982年年7 7

14、月月1 1日日0 0时增长时增长% % 北京市北京市 10819407 10819407 17.21 17.21 天津市天津市 8785402 8785402 13.15 13.15 上海市上海市 13341896 13341896 12.50 12.50 2 2、简单分组表。简单分组表。按一个标志进行分组的统计表。(表按一个标志进行分组的统计表。(表3-23-2)。)。表表3-2 3-2 我国我国20022002年国内生产总值年国内生产总值按三次产业分按三次产业分国内生产总值国内生产总值(亿元)(亿元)比上年增长率比上年增长率(%(%) 第一产业第一产业 14883 14883 2.9 2.

15、9 第二产业第二产业 52982 52982 9.9 9.9 第三产业第三产业 34522 34522 7.3 7.3 合合 计计 102398 102398 8.0 8.0 3 3、复合分组表。复合分组表。按两个或两个以上标志进行分组的统计表按两个或两个以上标志进行分组的统计表(如表(如表3-33-3)。)。某年末某地区人口资料某年末某地区人口资料按城乡及按城乡及性别分组性别分组人口数人口数(万人)(万人)增长率()增长率()(与上年比)(与上年比)城镇人口城镇人口 男性人口男性人口 女性人口女性人口农村人口农村人口 男性人口男性人口 女性人口女性人口合计合计 四、宾词指标的设计四、宾词指标

16、的设计 宾词指标的设计大致有两种方式:(宾词指标的设计大致有两种方式:(1 1)简单设计,将宾)简单设计,将宾词指标作平行配置,一一排列;(词指标作平行配置,一一排列;(2 2)复合设计,把各个指)复合设计,把各个指标结合起来,作层叠配置,分层排列。标结合起来,作层叠配置,分层排列。 P60-61P60-61表表2-172-17和表和表2-182-18。五、编制统计表时应注意的问题五、编制统计表时应注意的问题 (1 1)设计表之前,要对列入表中的统计资料进行全面的)设计表之前,要对列入表中的统计资料进行全面的分析研究:研究如何分组,如何设置指标,哪些指标放在主分析研究:研究如何分组,如何设置指

17、标,哪些指标放在主栏,哪些放在宾栏,等等。栏,哪些放在宾栏,等等。 (2 2)标题应十分简明地概括所要反映的内容。总标题应)标题应十分简明地概括所要反映的内容。总标题应标明资料所属的地区和时间。标明资料所属的地区和时间。 (3 3)表中主词各行和宾词各栏,一般应按先局部后整体)表中主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列各个项目,后列总体。若无必要列出所的原则排列,即先列各个项目,后列总体。若无必要列出所有项目,就要先列总体,后列其中一部分重要项目。有项目,就要先列总体,后列其中一部分重要项目。 (4 4)表中应注明数字资料的计量单位。当全表只有一种)表中应注明数字资料的计量

18、单位。当全表只有一种计量单位时就写在表的右上方。若有多种计量单位时,横行计量单位时就写在表的右上方。若有多种计量单位时,横行的计量单位,可以专设的计量单位,可以专设“计量单位计量单位”一栏,纵栏的计量单位,一栏,纵栏的计量单位,要与纵栏表目写在一起,用小字标写。要与纵栏表目写在一起,用小字标写。 (5 5)表中数字上下位置要对齐。遇有相同数字应照写,)表中数字上下位置要对齐。遇有相同数字应照写,不能用不能用“同上同上”“”“同左同左”字样。无数字的空格,用符号字样。无数字的空格,用符号“”表示,当缺乏某项资料时,用符号表示,当缺乏某项资料时,用符号“”表示,以免表示,以免人误以为漏项,表内还应

19、列出合计数,便于核对和运用。人误以为漏项,表内还应列出合计数,便于核对和运用。 (6 6)统计表的表式,一般是开口式,即表的左右两端不)统计表的表式,一般是开口式,即表的左右两端不画纵线,表的上下通常用粗线封口。对于栏数较多的统计表,画纵线,表的上下通常用粗线封口。对于栏数较多的统计表,通常加以编号。主词栏和计量单位栏用甲、乙等文字标明;通常加以编号。主词栏和计量单位栏用甲、乙等文字标明;宾词栏各栏用(宾词栏各栏用(1 1)、()、(2 2)、()、(3 3)等标明栏号。见表)等标明栏号。见表2 21212和表和表2 21818。 (7 7)必要时,统计表应加以注释,连同数字的资料来)必要时,

20、统计表应加以注释,连同数字的资料来源等一般都写在表的下方。源等一般都写在表的下方。案例案例 8 20132013年,徐海学院共有毕业生年,徐海学院共有毕业生18451845名,其中名,其中115115名名学生考取了硕士研究生,具体情况见表学生考取了硕士研究生,具体情况见表1.1. 表表1 1给出了学生的姓名、班级、本科专业、考取学给出了学生的姓名、班级、本科专业、考取学校、考取专业,这些数据均为定性数据。校、考取专业,这些数据均为定性数据。 我们首先按照研究目的对数据进行整理,制表。我们首先按照研究目的对数据进行整理,制表。目的:分析学院各系学生考取情况目的:分析学院各系学生考取情况为了方便计

21、数,我们对各系进行编码,指定:为了方便计数,我们对各系进行编码,指定:系别系别 经管经管 文艺文艺 英语英语计算机计算机机电机电信电信电建工建工编号编号1 12 23 34 45 56 67 7系别系别编号编号人数(人)人数(人)比重比重经管经管1 1181816%16%文艺文艺2 2171715%15%英语英语3 38 87%7%计算机计算机4 41 11%1%机电机电5 5232320%20%信电信电6 6313127%27%建工建工7 7171715%15%合计合计115115100%100%表表3.4 2013年徐海学院读研毕业生所在系别分布表年徐海学院读研毕业生所在系别分布表频数分布表频数分布表示例示例 定义定义3.33.3 柱形图柱形图:将各类别放在横轴,用宽度相:将各类别放在横轴,用宽度相同、高度不等的柱子表示各类的频数多少,这样同、高度不等的柱子表示各类的频数多少,这样的图形称为柱形图。的图形称为柱形图。柱形图柱形图 定性数据的图形描述常用定性数据的图形描述常用柱形图、条形图、饼图柱形图、条形图、饼图及柏拉图。及柏拉图。柱形图柱形图 定义定义3.43.4 条形图条形图:将各类别放在纵轴,用宽度相:将各类别放在纵轴,用宽度相同、高度不等的横条表示各类的频数多少,这样同、高度不等的横条表示各类的频数多少,这样的图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论