下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章统计资料的收集、整理与图表,2.1数据收集,数据收集:根据统计研究的目的,运用科学的方法,有计划、有组织地采集数据的过程。 统计数据按来源不同分为: 第一手资料,通过专门的调查或试验,直接向需要观察的对象收集的反映其情况的统计资料。 对原始资料的收集,称统计调查。 第二手资料,对他人调查或实验取得的原始资料进行加工后得到的数据。,统计调查方式,统计报表制度 普查 抽样调查 重点调查 典型调查,利用二手数据注意事项,a.引用数据的计算口径及其合理性 b.一定要注明数据的来源,以尊重他人的劳动成果 间接数据的主要来源 a. 国家统计数据库 b.中经网统计数据库 c.中宏数据库 d. 经济、金
2、融、证券研究数据库,社会经济调查和统计研究,(1)选题:社会现实和要解决的实际问题 (2)了解情况:查阅文献、请教先有知识和经验的人、社会了解(个案调查、典型调查) (3)建立假设:明确研究范围,在初步探索的基础上,提出想法和建立假设 (4)确立概念和测量方法 (5)设计问卷 (6)试填问卷 (7)调查实施(抽样调查) (8)校核与登录 (9)统计分析与假设/命题的检验,不仅研究孤立的社会经济现象,而且研究现象之间的联系,差异式:现象与现象之间存在联系 Eg.男同学和女同学就业意向不相同 不同专业同学就业意向不相同 函数式:现象与现象之间存在联系,且表明两者之间的变化 A高则B高 A高则B低
3、Eg.年纪越小,越倾向于离家远的地方就业,即年龄与就业地呈反比关系,初步想法,或称假设,用适当的术语或概念来描述研究对象 运用概念建立定量测量的方法,概念通过操作化定义得到了测量和量化,问卷包括的内容,事实:被访人的年龄、性别、职业、文化程度等 态度与看法:受访者对某种行为、政策是否赞成等 行为趋向:具有假设性。要了解的往往是在某一种情况下,受访者会有什么样的行为。 理由:了解受访者采取某种态度或行为趋向的原因,2.2 数据整理(1)概述,定义:按照统计研究的要求,对调查所收集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程。 数据整理的内容 a.统计资料的审核。整理前,检查原始数据的
4、完整性与准确性 b.资料的分组和汇总。统计分组和统计指标 c.编制统计表或绘制统计图,描述整理结果 d.统计资料的积累、保管和公布,(2)统计分组,概念:根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体分为若干个不同性质的组。 关键:标志选择 统计分组遵循的原则: 穷尽原则和互斥原则 统计分组的种类 a.按分组标志的多少分为: 简单分组只使用一个标志 和符合分组使用两个或两个以上的标志,表2.1 各地区按性别分的15岁及以上文盲人口 (2011年)本表是2011年全国人口变动情况抽样调查样本数据,抽样比为0.850。,b. 按分组标志的性质不同分为: 品质分组和数
5、量分组,表2.2 按收入等级分城镇居民家庭基本情况 (2011年),数据来源:中国统计年鉴(2012年).北京.中国统计出版社,2012,城镇家庭收入分组方法 是将所有调查户按户人均可支配收入由低到高排队,按10%、10%、20%、20%、20%、10%、10%的比例依次分成:最低收入户、较低收入户、中等偏下收入户、中等收入户、中等偏上收入户、较高收入户、最高收入户等七组。总体中最低5%的户为困难户。,数量分组,注意事项: a.数量界限的划分必须能反映事物质的差别 b.据被研究的现象总体的数量特征,采用适当的分组形式 数量分组的种类 a.单项式分组(离散变量)和组距式分组(连续变量) b.间断
6、组距分组和连续组距分组 凡是总体某一个单位的变量值是相邻两组的界限值,这个单位归入做为下限的那一组,即“上限不在内原则” c.等距分组和异距分组,组距式分组中相关指标的计算,组距 连续组距式分组: 组距=本组上限本组下限 间断组距式分组: 组距=本组上限前组上限 或 组距=本组下限前组下限,组数斯特杰斯(H.A.Sturges)提出的经验公式,n为组数;N为总体单位数;d为组距; R为全距,即最大变量值与最小变量值之差,分组组数参考表,组中值:上下限之间的中点数值,连续组距式分组: 间断组距试分组: 开口组组中值和组距参照相邻组确定。 计算平均指标或进行其他统计分析时,常以组中值来代表各组标志
7、值的中等水平。,(3)频数分布,定义 在统计分组的基础上,将总体所有的单位按组进行归类排列,形成各个单位在各组间的分布。 分布数列的两个要素 总体按某个标志所分的组 各组所出现的单位数 (4)频数和频率,表2.3 2010年某地区50户城镇居民家庭的月人均消费额(单位:元),全距:R=1630-810=820(元),表2.4 50户城镇居民家庭的月消费分布数列(880元-1630元)连续组距式分组,表2.5 间断组距式分组,(5)累积频数和累积频率,向上累计频数(频率)分布 先列出各组的上限,然后由标志值低的组向上标志值高的组依次累计。 关注的是标志值比较小的现象的频数分布情况,以表明在这些数
8、值以下所有数值所占的比重。 先下累计频数(频率)分布 先列出各组的下限,然后由标志高的组向标志值地的组依次累计。 关注的是标志值比较大的现象的频数分布情况,以表明在这些数值以上所有数值所占的比重。,表2.6 50户城镇居民家庭月消费额累计数据列表,累计频率(频数)分布曲线,图2.1 累计频率(频数)分布示意图,累计频数(频率)分布曲线的用途:研究财富、土地和工资收入的分配是否公平,洛伦兹曲线(Dr.M.O.Lorenz) 绘制方法 a.将分配对象和接受分配者的数量均化成结构相对数并进行向上累计。 b. 纵轴和横轴均为百分比尺度,纵轴自下而上用以测定分配对象(如一国的财富、土地或收入等),横轴由左向右用以测定及接受分配者(如一国的人口) c. 根据计算所得的分配对象和接受分配者的累计百分数,在图中标出相应的绘示点,链接各点并使之平滑。,表2.7 某国收入分配情况,收入%,人口%,表2.7 工业企业工人数、产值和利润资料表,作业,简要阐述五种统计调查方式 据表2.7的数据绘制工业企业的工人数、产值和利润指标的洛伦兹曲线图,并该地区工业企业的工人数、产业和利润指标的构成和集中状况予以简要说
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 免税店服务外包合同
- 公司合同与外包合同
- 公司跟我签外包合同
- 兼职公司外包合同
- 冷饮厂代工外包合同
- 办公室耗材外包合同
- 劳动关系外包合同
- 医疗机构外包合同
- 卫生绿化外包合同
- 同城手工外包合同
- 2026年威海热电集团有限公司招聘工作人员(44人)笔试参考试题及答案解析
- 云南省曲靖一中2026届高三年级教学质量检测(七)语文+答案
- 2025年浙江宁波市慈溪市国有企业招聘工作人员面谈笔试历年常考点试题专练附带答案详解
- 2026来凤同风建筑工程有限责任公司招聘项目经理等工作人员2人笔试备考试题及答案解析
- 2026浙江工商大学杭州商学院招聘辅导员5人笔试参考题库及答案解析
- 2026年事业单位面试中的公基热点预测
- 2026年湖南省安全员-C2证题库(附答案)
- 2026智能工厂梯度培育行动专项申报解读及建设方案
- 2026届西藏自治区拉萨市高三下学期第二次联考数学试卷(解析版)
- 2026届浙江省杭州市高三二模英语试题(含答案和音频)
- 2026届江苏省南京市、盐城市高三一模物理卷(含答案)
评论
0/150
提交评论