




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1
第七章资料的整理与分析§7.1调查资料的整理§7.2调查资料的分析§7.3统计图表2§7.1调查资料的整理
一、资料整理的含义和步骤二、资料整理的基本方法——统计分组3
根据研究目的,运用科学的方法,对调查资料进行审核、分类或分组、汇总,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的工作过程。
作用:是市场调查的继续,统计分析的前提和基础(承上启下)。资料整理含义与作用44资料审核分组处理统计汇总计算机汇总手工汇总数据陈示程序设计数据编码数据录入逻辑检查汇总制表齐备性完整性准确性时效性真伪性资料整理的步骤5实地资料的审核资料的审核1、不完整答卷2、有明显错误答卷3、乏兴回答问卷4、开放式问题打乱顺序问卷次级资料的审核1、著述性文献2、统计资料6
根据社会调查的目的和要求,按照一定标志,将所研究的事物或现象区分为不同的类型或组的一种整理资料的方法。
统计分组作用:(1)可以找出总体内部各个部分之间的差异。(2)可以深入了解现象总体的内部结构。(3)可以显示社会现象之间的依存关系。
总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。7
我国三次产业分类的从业人员构成情况
单位(%)
年份产业19931994199519961997第一56.451.352.250.049.9第二22.422.723.023.523.7第三21.223.0024.826.026.4合计100.0100.0100.0100.0100.0
某地区粮食单位面积产量和施肥量的关系每公顷化肥施用量(千克)粮食单位面积产量(千克/公顷)116.25133.50145.50153.75163.502827.53124.53396.03608.33484.08a.分组的类型1、根据分组标志的性质
简单分组复合分组品质分组数量分组2、根据分组标志的数量99消费者高收入男女中收入低收入本科以上本科、专科高中及以下本科以上本科、专科高中及以下本科以上本科、专科高中及以下男女男女男女男女男女男女男女男女复合分组1010例
为了了解某地区银行存款的构成,可以选用存款性质、期限两个标志分别进行分组按存款性质分组
企业存款储蓄存款财政性存款按存款期限分组
活期存款定期存款简单分组存款同时按其性质及期限分组
企业存款活期定期储蓄存款活期定期财政性存款活期定期复合分组品质分组11例2:企业职工按工龄分组
5年以下
5~10年
10~15年
15~20年
20年以上数量标志分组12b.分组界限(1)确定分组形式(2)确定组距(3)确定组限“上限不在内”
等距分组I=R/k
不等距分组I=R/(1+3.322lgn)13
案例:电脑用户情况调查编码对照表
1、您的年龄是
18岁以下18-30岁31-50岁50岁以上
2、选购电脑时经销商的介绍对您的影响程度是
0102030405060708090100(%)
3、您选购电脑时,可能会考虑各种因素,请您按先后顺序进行排序
价格品牌功能售后服务
4、其他条件不变时,如果电脑系列产品平均降低售价10%,您的态度是
马上购买会来购买比较后再看
没有吸引力不会来购买肯定不购买
3.编码
就是给每一个问题的每一个可能的答案分配一个代码,通常用数字表示。14
案例:电脑用户情况调查编码对照表
问题1编号答案类别
118岁以下
218-30岁
331-50岁
450岁以上
问题3A编号答案类别价格问题3B编号答案类别品牌问题3C编号答案类别功能问题3D编号答案类别售后服务问题2编号答案类别
10—10210—20320—30430—40540—50650—60760—70870—80980—901090—100
问题4编号答案类别
1马上购买
2会来购买
3比较后再看
4没有吸引力
5不会来购买
6肯定不购买15
案例:调查答案综合表
回答者序列号问题顺序1233334001253124200237213430033723141________________________________100482413116171819202122§7.2调查资料的分析一、交叉列表分析二、集中趋势分析
算术平均数
中位数
众数三、离中趋势分析
全距(极差)
标准差23
交叉列表技术是同时将两个或两个以上具有有限类数目的确定值的变量,按照一定的顺序对应排列在一张表中,从分析变量之间的相关关系得出科学的结论。交叉列表分析技术24拥有情况家庭收入水平行总计高收入中收入低收入有没有25215615624096300504696列总计4083963961200轿车的拥有情况与家庭收入之间的关系
例:某项对家庭轿车拥有情况的调查,通过交叉列表分析,可以看出轿车的拥有情况和家庭收入水平有很大的关系。25(一)交叉列表分析中变量的选择和确定在运用交叉列表分析时,对变量的选择和确定是否正确,是关系到分析结果是否正确的关键因素之一。示例:某项关于交通事故的调查
轿车驾驶者的事故比率百分比从未在驾驶中出过事故62在驾驶中至少出过一次事故38列总计100被调查总人数1403026男性(%)女性(%)从未在驾驶中出过事故5668在驾驶中至少出过一次事故4432列总计100100被调查总人数70806950交通事故与性别关系表男性驾驶公里数女性驾驶公里数大于15000小于15000大于15000小于15000至少出过一次事故52%25%52%25%被调查总人数5010207019155035事故发生率与驾驶里程数关系表27(二)双变量交叉列表分析方法双变量交叉列表分析法是一种最基本的交叉列表分析方法。通常,把双变量交叉列表分析中的各项绝对值转化为百分数,能清楚地显示相互关系。计算百分数可以按列进行,也可以按行进行。值得注意的是,并非两种计算所得到的结果都有现实意义,基本原则是以自变量为基准来计算百分数。
28业务增长经营年限行总计小于6年6-12年12年以上增长慢增长快455234535527134132列总计978782266经营年限与业务增长之间的关系表
例:某项对企业业务增长和经营年限长短之间的相关联系进行的研究,被调查的企业,按经营年限的长短分为三个档次;对企业业务增长情况分为快和慢两类。交叉列表分析如下:29业务增长经营年限小于6年6-12年12年以上增长慢增长快46.4%53.6%39.1%60.9%67.1%32.9%列总计100%100%100%业务增长经营年限行总计小于6年6-12年12年以上增长慢增长快33.6%39.4%25.4%40.1%41.0%20.5%100%100%按经营年限计算的经营业务增长速度按经营业务增长速度计算的经营年限示例30(三)三变量交叉列表分析方法3131(三)三变量交叉列表分析方法1、更精确的显示原有联系时装购买状况婚姻状况已婚未婚高低31%69%52%48%列总计100%100%被调查人数700300婚姻状况与时装购买状况的关系32时装购买状况性别男性女性婚姻现状婚姻现状已婚未婚已婚未婚高低35%65%40%60%25%75%60%40%列总计100%100%100%100%被调查人数400120300180婚姻状况、性别与时装购买状况的关系33(三)三变量交叉列表分析方法2、显示原有联系是虚假的3、显示出原先被隐含的联系
出国旅游愿望年龄小于45岁45岁或以上有否50%50%50%50%列总计100%100%被调查人数500500
年龄与出国旅游愿望的关系34出国旅游愿望性别男性女性年龄年龄<45≥45<45≥45有否60%40%40%60%35%65%65%35%列总计100%100%100%100%被调查人数300300200200
年龄、性别与出国旅游愿望的关系35经常外出吃快餐家庭规模小大是否65%35%65%35%列总计100%100%被调查人数500500
家庭规模与经常外出吃快餐的关系(三)三变量交叉列表分析方法4、不改变原先反映出的联系
36经常外出吃快餐收入水平低收入高收入家庭规模家庭规模小大小大是否65%35%65%35%65%35%65%35%列总计100%100%100%100%被调查人数250250250250
家庭规模、收入与经常外出吃快餐的关系37SPSS演示38SPSS演示39SPSS演示40SPSS演示41SPSS演示42SPSS演示43SPSS演示44SPSS演示45指总体中各单位的次数分布从两边向中间集中的趋势,用平均指标来反映。集中趋势可以反映现象总体的客观规律性反映总体各单位变量分布的集中趋势可以对比同类现象在不同的时间、地点和条件下的一般水平可以分析现象之间的依存关系计算平均指标的作用指同质总体中各单位某一数量标志的一般水平,是对总体单位间数量差异的抽象化46平均指标的种类平均数、众数和中位数。平均数是根据总体所有标志值计算的,称为数值平均数,众数和中位数是根据标志值所处的位置确定的,称为位置平均数47将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值,用表示中位数(Median)不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。中位数的作用:48
如果统计资料中含有异常的或极端的数据,就有可能得到非典型的甚至可能产生误导的平均数,这时使用中位数来度量集中趋势比较合适。比如有5笔月手机消费:
30元,35元,40元,40元,155元平均手机消费为300/5=60元。很明显,这并不是一个好的代表值,而中位数40元是一个更好的代表值。49中位数的位次为:即第3个单位的标志值就是中位数【例】某售货小组5个人,某天的销售额按从小到大的顺序排列为440元、480元、520元、600元、750元,则中位数的确定----奇数50中位数的位次为:中位数应为第3和第4个单位标志值的算术平均数,即【例】若上述售货小组为6个人,某天的销售额按从小到大的顺序排列为440元、480元、520元、600元、750元、760元,则中位数的确定---偶数51指总体中出现次数最多的变量值,用表示,它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。众数(Mode)52有时众数是一个合适的代表值
比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。
53月均食堂消费(元)学生人数(人)100-500500-10001000-15001500-20002000元以上70100380150100合计800【例】已知某高校学生的的月均食堂消费资料:众数的确定54指总体中各单位标志值背离分布中心的规模或程度,用标志变异指标来反映。离中趋势反映统计数据差异程度的综合指标,也称为标志变动度变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大555657585960测定标志变异度的绝对量指标测定标志变异度的相对量指标全距标准差全距系数标准差系数标志变异指标的种类61指所研究的数据中,最大值与最小值之差,又称极差。全距【例】某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则62优点:计算方法简单、易懂;缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差
全距的特点63是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用来表示;标准差的平方又叫作方差,用来表示。标准差计算公式:总体单位总数第个单位的变量值总体算术平均数64【例】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。解:即该售货小组销售额的标准差为109.62元。65标准差的特点不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.66标准差系数变异系数指标用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小:——标准差系数小的总体,其平均数的代表性大;反之,亦然。应用:67§7.3统计图表一、统计图二、统计表★68统计图以点、线条、面积等方法描述、显示统计数据的形式组成:坐标系图形图例作用:可以揭示现象的内部结构和依存关系,显示现象的发展趋势和分布状况,有利于统计分析与研究。形象、生动、具体、直观69常用统计图条形图(Bar)用于显示离散型变量的次数分布70条形图(Bar)用于显示离散型变量的次数分布71圆形图(饼图
Pie
)主要用于显示定类变量的次数分布727374趋势图主要用来探索两个数值变量之间的关系。通常用于显示时间序列75散点图(Scatter)主要用来观察变量间的相关关系,也可显示数量随时间的变化情况7620%40%60%80%100%
知名度满意度
雅虎网易新浪搜狐77雷达图主要用来显示多个变量78§7.3统计图表一、统计图二、统计表★79具有容量大、方便计算等特点统计表的常用结构:统计表以纵横交叉的线条所形成的表格来表现统计资料的形式总标题宾词栏主词栏数据栏80
可以从两个角度考察:1.从形式上,统计表由
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 供水合同范本模板模板
- 农业温室气体调控与净化设备创新创业项目商业计划书
- 虚拟学习助手创新创业项目商业计划书
- 军训服装租赁合同范本
- 体育用品采购协议合同
- 公司维修改造合同范本
- 人工话务外包合同范本
- 农田种植服务合同范本
- 小学语文教师面试教学设计指引
- 企业员工劳动合同签订指南模板
- 2020-2025年一级造价师之工程造价案例分析(水利)题库与答案
- 客户开发情况汇报
- 公安执法执勤规范课件
- 2025年冠脉介入考试题库
- 2025年保密观所有试题及答案
- 《机械创新设计》课件-k第五章 机构组合与创新设计
- 国家开放大学《社会心理适应》形考任务1-7参考答案
- 法拉利介绍教学课件
- 2025至2030全球及中国固定线路宽带接入设备行业产业运行态势及投资规划深度研究报告
- 遗传性球形红细胞增多症护理查房
- 全国一等奖统编版语文三年级上册《小狗学叫》公开课课件
评论
0/150
提交评论