第2章 数据的收集及整理_第1页
第2章 数据的收集及整理_第2页
第2章 数据的收集及整理_第3页
第2章 数据的收集及整理_第4页
第2章 数据的收集及整理_第5页
已阅读5页,还剩178页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、管理统计学管理统计学第第2章章 数据收集与整理数据收集与整理本章概要 第一节 统计数据的收集 第二节问卷设计 第三节 统计数据的整理 第四节 SPSS基础第第2章章 数据收集与整理数据收集与整理 第一节第一节 统计数据的收集统计数据的收集 1. 收集数据的重要性 2. 统计数据的类型和计量 3. 统计数据的来源 4. 统计数据的误差 5. 统计调查的步骤第第2章章 数据收集与整理数据收集与整理1. 统计数据收集的意义 数据是统计学研究的原材料。 原材料的好坏决定了统计分析的效果。第第2章章 数据收集与整理数据收集与整理2. 统计数据的计量与类型 例 以下是关于职业调查的几道问题 1.您的职业是

2、什么? A.程序猿 B.小编 C.boss D.以卖萌为生 2.你对自己职业的收入满意吗? A.很满意 B.较为满意 C.一般 D.不满意 E.很不满意 3.你工作城市的平均气温是 度。 4.您每个月的到手收入是 元。第第2章章 数据收集与整理数据收集与整理2. 统计数据的类型以及计量方式 定类尺度、 定序尺度、 定距尺度、 定比尺度第第2章章 数据收集与整理数据收集与整理2. 统计数据的计量与类型 定类数据 将数字作为现象总体中不同类别或不同组别的代码。这是最低层次的尺度。 如性别:男,女 定序数据 按照特征等级进行排序,数据之间有大小之分,但没有大多少的概念。 优、良、中、差第第2章章 数

3、据收集与整理数据收集与整理2. 统计数据的计量与类型 定距数据(间隔数据) 不仅可以用数值表示现象类(组)别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差别。 数据之间可做加减,不能做乘除,只有相对大小。 如:摄氏度 定比数据(比例数据) 不仅有确定的间距,而且有自然确定绝对的零点。 数据之间可做加减,也可做乘除,既有相对大小,又有绝对大小。第第2章章 数据收集与整理数据收集与整理2. 统计数据的计量与类型 问题,下面数据按照计量方式?问题,下面数据按照计量方式? 性别 体重 速度 温度 兄弟姐妹个数 成绩:A,B,C,D第第2章章 数据收集与整理数据收集与整理u按照数据

4、的时间特征划分统计数据按照数据的时间特征划分统计数据 横截面数据(时间固定)横截面数据(时间固定) 在同一时间,不同统计单位相同统计指标组成的数据。 时间序列数据(事物,现象固定)时间序列数据(事物,现象固定) 在不同时间,同一事物、现象岁时间的变化状况。 第第2章章 数据收集与整理数据收集与整理3 3、面板数据(横截面数据与时间序列数据、面板数据(横截面数据与时间序列数据)第第2章章 数据收集与整理数据收集与整理3.统计数据的来源数据来源数据来源二手数据二手数据原始数据原始数据公司内部信息公司内部信息专门机构获取专门机构获取政府机构提供政府机构提供观察法观察法实验法实验法报告法报告法询问法询

5、问法第第2章章 数据收集与整理数据收集与整理4.统计数据的误差(自己看ppt,课下自学) 调查的偏差来自许多方面,分为两类:抽样误差和非抽样误差 抽样误差 由抽样随机性造成,只存在于概率抽样中。 非抽样误差 覆盖误差 测量误差 处理误差 无反应误差第第2章章 数据收集与整理数据收集与整理4.统计数据的误差 1.覆盖误差:指由于在抽样框或样本中出现了涵盖不全、过度涵盖、重复以及错误的分类而导致估计的偏倚。 2.测量误差:指对一个问题所做的记录与它的真值不同,可能是由于被调查者和调查者对问题的误解、收集数据方式不同或测量工具而造成的。 道德误差调查人员缺乏业务培训或职业道德 被调查者误差理解有误,

6、有意欺瞒 3.处理误差:可能发生在数据编码、数据录入、审核及插补等步骤中。第第2章章 数据收集与整理数据收集与整理4.统计数据的误差 4.无反应误差 在抽样调查中,我们希望能取得所要求的全部样本单位的数据或特征记录,但在实践中,常有部分单位的调查结果会因多种原因而出现空缺,即常称的无反应现象。 调查中无反应的原因 (1)调查对象联络不上,已经搬走 (2)被调查者不能胜任或无能力 (3)调查期间人不在 (4)拒绝合作 (5)丢失调查表第第2章章 数据收集与整理数据收集与整理4.统计数据的误差 案例 Literary Digest杂志自第一次世界大战以来一直进行总统预测,而且每次都预测准了。 19

7、36年美国总统选举前,Literary Digest杂志发出了1000万张调查问卷。回收到240万张,预测共和党候选人兰登(London)和民主党候选人罗斯福(Roosevelt)的得票比例是57:43,预测是根据240万张的民意调查回单作出的。 但实际选举结果是罗斯福赢得了这场选举,他与兰登得票比例是62 :38。第第2章章 数据收集与整理数据收集与整理4.统计数据的误差 分析出现预测错误的原因: 第一.选取样本的方式不是随机的,它主要是从电话号码簿和各种俱乐部会员名册上去选取的,这些人大多是有钱人,他们支持共和党候选人兰登; 第二. 有760万张问卷无反应,在没有寄回的人中支持共和党和支持

8、民主党人的比例一般与寄回来的240万答卷中的支持比例不一样,例如该杂志向芝加哥地区三分之一的登记选民发了调查问卷,有20%的被询问者作了回答,其中一半以上支持兰登,但实际选举的结果是在芝加哥地区是2 : 1有利于罗斯福。第第2章章 数据收集与整理数据收集与整理4.统计数据的误差 由于无反应(等于改变了原先随机抽取的样本)而造成的偏差叫“无反应偏差”。在调查中我们要尽量减少这种偏差。 为解决无反应问题,常用的处理方法有: 多次调查 对调查结果进行估算 在无回答者中抽取随机子样本调查 对无回答者的替代第第2章章 数据收集与整理数据收集与整理总体总体(学生学生)样本框架样本框架(电话簿里(电话簿里的

9、学生)的学生)计划选取样本计划选取样本(选定的学生选定的学生)实际的实际的样本样本覆盖面误差覆盖面误差抽样误差抽样误差不回答和不回答和度量误差度量误差4.统计数据的误差第第2章章 数据收集与整理数据收集与整理5.统计调查的步骤 1.明确调查目的(根据目的确定获得数据方法) 探测性调研(揭示现象) 夏士莲绿茶洗发水受消费者青睐吗? 适合的调查方式:对目标顾客进行抽样调查 描述性调研(定量描述) 某家电商场在周日的人流量是多少? 适合的调查方式:观察法 因果性调研(测试因果关系) 假如将某一款产品降价10,会不会有大量消费者购买?消费者的数量能增加多少? 适合的调查方法:实验法第第2章章 数据收集

10、与整理数据收集与整理5.统计调查的步骤 2、确定调查对象和调查单位。 调查对象:是指需要调查的现象总体,该总体是由许多性质相同的调查单位组成的。 调查单位:是指所要调查的具体单位。 报告单位:报告单位亦称填报单位,它是负责向上报告调查内容、提交统计资料的单位。调查单位与报告单位,有时是一致的,有时不一致。 3、确定调查项目。调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系列定性数据和定数量所构成。第第2章章 数据收集与整理数据收集与整理5.统计调查的步骤 4、调查表格和问卷的设计。 调查表:将各个调查项目按照一定的顺序排列在一定的表格上,就构成了调查表。 问卷调

11、查:根据调查目的,在调查对象中随机选择或有意识地确定调查单位,以书面文字或表格形式了解被调查者的意见,调查者自愿、自由地回答问卷中所提出的问题。 5、确定调查时间。 统计调查时间包括二种涵义,即调查时间和调查期限。 调查时间:是指调查资料所属的时间。 调查期限:是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间。第第2章章 数据收集与整理数据收集与整理5.统计调查的步骤 6 、调查的计划实施 7 、加工数据 8 、分析数据 9 、解释发现 10 、报告结果第第2章章 数据收集与整理数据收集与整理 第二节问卷设计第第2章章 数据收集与整理数据收集与整理问卷设计问卷设计问卷的概念及其结构

12、问卷的概念及其结构问卷设计的原则问卷设计的原则问卷设计的步骤问卷设计的步骤问卷设计的具体方法问卷设计的具体方法问卷设计中的常见错误问卷设计中的常见错误问卷的发放与回收问卷的发放与回收如何设计出高质量的问卷如何设计出高质量的问卷第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理问卷的一般结构问卷的一般结构封面信封面信指导语指导语问题及答案问题及答案编码及其他资料编码及其他资料第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集

13、与整理 是问卷的主体,也是问卷设计的主要内容。 问卷中的问题从形式上看,可分为: 开放式问题 封闭式问题第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理问卷的分类问卷的分类访谈问卷访谈问卷自填问卷自填问卷邮寄问卷邮寄问卷发送问卷发送问卷第第2章章 数据收集与整理数据收集与整理问卷设计的原问卷设计的原则则明确问卷设计明确问卷设计的出发点的出发点明确阻碍问卷明确阻碍问卷调查的因素调查的因素明确与问卷明确与问卷设计紧密相连设计紧密相连的各种因素的各种因素第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与

14、整理第第2章章 数据收集与整理数据收集与整理问卷设计的步骤问卷设计的步骤探索性工作探索性工作问卷设计初稿问卷设计初稿试用试用修改定稿并印制修改定稿并印制第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理问卷设计的具体方法问卷设计的具体方法问题的形式问题的形式答案的设计答案的设计问题的语言及提问方式问题的语言及提问方式问题的数量与顺序问题的数量与顺序相倚问题相倚问题第第2章章 数据收集与整理数据收集与整理问题的形式常见考试题型?常见考试题型难以回答

15、和处理的题型=问卷的题型第第2章章 数据收集与整理数据收集与整理问题的形式问题的形式 填空题 选择题(单项选择题(2选1,多选1);多项选择题(限选几个,限选排序,多项任选题);矩阵式问题(同类问题集中在一起);问题题)第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集

16、与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理问卷设计中的常见错误问卷设计中的常见错误概念抽象概念抽象问题含糊问题含糊问题带有倾向性问题带有倾向性问题的提法不妥问题的提法不妥问题有多重含义问题有多重含义问题与答案不协调问题与答案不协调第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收

17、集与整理 第第2章章 数据收集与整理数据收集与整理第第2章章 数据收集与整理数据收集与整理影响问卷回收率的因素影响问卷回收率的因素调查的组织工作的严密调查的组织工作的严密程度和调查者的负责精程度和调查者的负责精神神调查课题的吸引力调查课题的吸引力问卷填写的难易程度问卷填写的难易程度对问卷回收的可控制程对问卷回收的可控制程度度第第2章章 数据收集与整理数据收集与整理如何设计高标准的问卷如何设计高标准的问卷第二章统计资料的整理第二章统计资料的整理时间序列表:时间序列表:华南农业大学华南农业大学年份年份总人数总人数2010届人数95562011届人数93652012届人数95772013届人数942

18、32014届人数9224第二章统计资料的整理第二章统计资料的整理 地域列表地域列表几个重要城市几个重要城市2017/82017/8的房价的房价城市名称平均房价(元/)环比上月同比上年北京63,204-4.60%+29.39%重庆10,299-1.14%+49.91%广州31,783+2.43%-上海52,339+0.98%+16.96%深圳53,320+1.67%+10.74%天津25,593-3.27%+35.83%第二章统计资料的整理第二章统计资料的整理定性分布表格定性分布表格的例子:的例子:第二章统计资料的整理第二章统计资料的整理 频数分布:频数分布: 按变量所取的值进行分类,于是资料中

19、每个观测按变量所取的值进行分类,于是资料中每个观测值都分到相应类中去。记录各类中观测值出现的次数,值都分到相应类中去。记录各类中观测值出现的次数,制成频数分布表。制成频数分布表。确确定定组组数数k k找出找出xmin与与x xmaxmax计计算算组组距距h h确定确定每组每组上下上下限限将将相应相应数据数据归并到归并到各组各组maxminxxhkX Xminmin 最小值最小值,x,xmaxmax 最大值最大值频数分布表频数分布表第二章统计资料的整理第二章统计资料的整理分数分数 计计 数数 人数(人数(f f) 404049491 150505959正正正正141460606969正正正正正正

20、正正正正正正正正正正正正正正正正555570707979正正正正正正正正正正正正正正正正正正正正正正585880808989正正正正正正正正正正正正正正正正正正正正525290909999正正正正正正17171001001091093 3 总数总数 200 200 在所属组的记录栏做一记号,按照我国习惯,用写在所属组的记录栏做一记号,按照我国习惯,用写“正正”字字方法,英文书使用方法,英文书使用“# #”符号符号 表表2-4 2-4 某校某校200200个学生高等数学考试成绩个学生高等数学考试成绩第二章统计资料的整理第二章统计资料的整理表表2-5 2-5 某校某校200200个学生高等数学考试

21、成绩的频数分布表个学生高等数学考试成绩的频数分布表分数分数 人数(人数(f f) 分数分数 人数(人数(f f) 404045451 1767681812525464651510 0828287874242525257571212888893931010585863632929949499991111646469692828100100105 105 3 3 707075 75 3939总总 数数 200 200 第二章统计资料的整理第二章统计资料的整理统计表统计表第二章统计资料的整理第二章统计资料的整理表表2-52-5与与表表2-62-6的的对比对比表表2-52-5中组距等于中组距等于6 6

22、,频数分布,频数分布的规则性,仍然可以维持,同的规则性,仍然可以维持,同时细节的损失也可减轻时细节的损失也可减轻表表2-62-6中的组距等于中的组距等于2 2,各组频数,各组频数分布就变得很不规则了。分布就变得很不规则了。由此可见,组数的确定应适当,由此可见,组数的确定应适当,亦不宜太多亦不宜太多统计表统计表 第二章统计资料的整理第二章统计资料的整理累积频数(累积频数(Cumulative FrequencyCumulative Frequency):由第一组起):由第一组起至第至第i i组止各频数之和称为第组止各频数之和称为第i i组的累积频数组的累积频数, ,记为记为F Fi i, ,即即

23、: :11 (1) (2-1)iikiikFfFfi频率(频率(Percent FrequencyPercent Frequency): :就是频数除以总数就是频数除以总数n n:f fi i/n/n,经常以百分数表示。经常以百分数表示。累计频数与频率累计频数与频率第二章统计资料的整理第二章统计资料的整理频数和累计频数频数和累计频数 根据上述公式,确定组数为根据上述公式,确定组数为8,组距为组距为96/8=12.为了简单起见,为了简单起见,组距设为组距设为10.050010001500200025003000123456学历人数050010001500200025003000123456学历人数25N =X1销售价格16001

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论