




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Charpter2 数据与数据的获得,2-1 总体、个体、特征与数据 2-2 数据类型 2-3 获得数据的调查方法 2-4 问卷设计,2-1 总体、个体、特征与数据,2.1 总体、个体、特征与数据,总体 ( Population or Universe) 所研究对象的全体,称为总体.例如,某专业同一年的考生可以构成一个总体,一条生产线上生产出来的某零件可以构成一个总体。,2.1 总体、个体、特征与数据,2. 个体( Individual Or Case) 或成分(Elements) 组成总体的元素(Element), 称为个体 有限总体:在某个总体中,若个体的数目是有限的Finite. 无限总
2、体:总体中,个体的数目无限(Infinite),2.1 总体、个体、特征与数据,3. 指标或变量(Variable) 研究任何总体,必然对其个体的某些特征感兴趣。 Ex:农民(总体) 附着于“个体”的信息,即个体特征,年收入,对政策的态度,受教育程度,2.1 总体、个体、特征与数据,表征个体特征(Characteristics)的量称为指标或变量. Ex: “学生” -考分 身高 “零件” -直径 长度 耐磨损度 “药品”-疗效 副作用 “企业”-年销售额 年利润 资金周转率,2.1 总体、个体、特征与数据,我们对任何总体感兴趣,其实是对总体中的个体的特征感兴趣。当要联合考察总体或个体的若干个
3、特征,我们面对的就是指标向量。 Ex: “学生” (考分 身高 年龄 性别 ),2.1 总体、个体、特征与数据,4. 指标值或数据(Data) 在研究一个总体时,所要研究的每个特征,在每个个体上,都有一个反映该特征的具体描述,被称之为指标值。 Ex:考生个体 考分(定量型Quantitative,有数值) 性别(定性型Qualitative) 受教育程度(半定量的Semi-Quantitative),2.1 总体、个体、特征与数据,定性型的数据和半定量的数据,通常是对个体分组(分类)的依据. 一个个体的所有特征的数据,被称为一条记录或一个数据向量。 考生A(姓名,年龄,考分,成绩),2-2 数
4、据类型,Scale 刻度级数据 数据的最高等级,只能用数字来表示 比率级Ratio : 有具体的实际测量值,可做+ - * / 运算. 间距级Interval: 具体有一定单位的实际测量值。例如摄氏温度。可比较变量之间的差异,作+ - 运算,不能进行* / 运算。,2.2.1 数据测度的分类,2. Ordinal 序次级数据 数据的中间级。可用数字,字母来表示 Ex: 受教育程度,小学 = 1 初中 = 2 高中 = 3 大学本科 = 4 研究生 = 5,各编码的序值,代表了受教育程度的高低差异。这一差异不能准确描述差别的大小,但可以确定其顺序,即可进行不等式运算。 研究生 大学本科 高中 ,
5、3.(Nominal)名义级数据 数据的最低级,无次序之分,只是一种标志,用以区分变量的不同值。可用数字也可用字母。,Ex: 性别:女(0) 男(1),女(F) 男(M),在统计分析中,不同测度类型的数据扮演不同的角色。不同测度级别的数据,应用范围不同。 等级越高,应用范围越广泛;等级越低,应用范围越受限制。,2.2.2 不同测度类型的数据的用途,不同测度类型的数据都可以作为统计对象直接进入统计处理。,Ex: 当我们获得不同文化程度的顾客对某种数码产品的偏好数据后,我们可以用统计方法来分析两个变量(文化程度, 品牌)是否相关。,文化程度:顺序型变量 品牌:名义级变量,分类分组作用 Ex: 名义
6、级变量Categorical Variable,“职工的性别”:将职工总体分为“男”“女”两组,统计不同组的平均工资。 顺序级变量也可作为分类得依据,“受教育程度”将职工总体分为教育程度由低到高的若干组。 刻度级数据可用于分类,如按照“考试成绩”将学生总体分类等等。,一般说来,等级高的数据,兼具等级低的数据的功能;而等级低的数据,不可能兼有等级高的数据的功能。 名义级的数据,通常是样本分类(分组)的依据。,2.2.3 观察数据与实验数据,从数据获得的角度对数据进行分类 观察数据:,在获得数据过程中,不对被调查对象数据产生的条件施加任何控制所得到的数据。观察数据通常是众多因素共同作用的结果。,E
7、x: 调查农民年收入情况,农业技术来源情况,受教育情况,地区差异等等通常为观察数据。 农民的年收入显然是众多因素复合作用的结果。,实验数据:在获得数据过程中,对数据产生的条件实施了控制而得到的数据为实验数据。实验数据通常是单一因素作用的结果。,Ex: 研究汽油添加剂对增加汽车行程的影响,实验中限制如下条件,剂量一致 同一辆汽车进行实验 同一道路上进行测试实验 选择无风的天气,排除风向和风速对汽车行程的影响。,此时,影响“汽车行程”的因素基本上是由添加剂本身的因素造成的。,2-3 获得数据的调查方法,观察(调查)法,普查方法,获得数据的方法分为两大类,实验方法,抽样调查,2.3.1 概念与基本方
8、法,1.普查 (Census) 普查针对有限总体而言。收集有限总体中每个个体的有关指标的指标值。 Ex: 人口普查,2.抽样调查(Sampling)与样本(Sample) 在总体中选择一部分个体进行调查,从所了解的局部数据来了解总体情况。 总体中,部分个体所组成的集合称为样本(Sample)集合。,抽样调查有两层含义 “抽样”:抽取部分个体 “调查”:调查反映在个体上的,所要研究的特征的数据。 样本个体的特征数据为“样本数据”,相对于普查,抽样调查的成本低,所耗费的时间少,在收集个体信息方面,信息收集更为详尽和准确。,从总体中,恰当地选取部分个体进行调查,是统计学中最重要的问题之一,也是“获得
9、数据方法”所要研究的中心内容。那么 如何取样?,4. 抽样方法 Methods of Sampling 非随机抽样Judgment Sampling 按照非随机的原则或者依据对个体和总体特征的判断,从总体中抽取个体的做法。,Ex: 典型调查,有意识地选择具有代表性的典型个体进行深入细致的调查。,Ex: 调查贫困地区学龄儿童受教育情况 依据 “人均收入”的数据或“经济发展”的有关资料, 主观选择某个地区进行调查,为典型调查。,随机抽样(Random Sampling) 按照一定随机规则(如概率分配),从总体中抽取部分个体的抽样模式。,(1) 简单随机抽样(Simple Random Sampli
10、ng) 按照“每个个体被抽到的机会均等”的规则,从总体中抽取部分个体。 Ex: 300个贫困地区中,按照等概率原则(1/300),抽取10个地区进行调查。,几种综合的抽样方法: (2) 分层抽样 Stratified Sampling 按照总体中个体的某特征,把总体中的个体分为若干群组(类)。对类中的个体进行简单随机抽样。分层抽样要求层之间的差异大于层的内部的个体差异。,总体,分类,简单随机抽样,分层抽样 Stratified Sampling,不同群体所抽取的个体个数,采用以下两个方法确定 等数分配法:每类抽取同样数量的个体 等比分配法:抽样比例一致,抽样比例5%,5,15,50,(3) 整
11、群抽样 Cluster Sampling 将总体中的个体,按照某一标志量分为若干群,然后以群为单位,对群进行随机抽样,再对抽出来的群进行普查。整群抽样要求群体之间具有相似的特征。,总体,分群,随机抽样,Ex: 一个公司可能将其顾客以地理位置划分区域。整群抽样。整群抽样即是从这些地理区域中随机抽取,对所抽中的这些区域内的所有顾客进行调查。,整群抽样 Cluster Sampling,(4) 系统抽样 Systematic Sampling 从总体中间隔性选取样本的抽样计划。,随机抽样出第1个样本,(5)连续抽样(多阶段抽样) Sampling from a continuous process
12、分阶段,从一个连续的过程中抽取样本 Ex: 调查某省农民的收入情况,县级,随机抽样,乡级,随机抽样,村级,随机抽样,户级,随机抽样,(6)成本约束下的调查 假设调查费用预算额为10000元,调查组固定费用为2,000元,每调查一个个体的可变费用为20元,在整群抽样中有20个群,每个群个体数在60-80之间,问:如何确定所抽群体的个数?,2-4 问卷设计,数据的调查通常是以问卷为基础的。问卷,是管理学科调查收集数据的最重要的工具。 问卷问题的设立,通常是从分析研究目标开始的。依据研究的目标,确定需要收集哪些数据,从而确定设置那些问题。,对变量(特征)之间的相互关系的猜想。根据变量间的相关性设计问
13、卷问题。 2. 从数据处理方法来判断需要设计哪些问题。,问卷设计的两个重要方面,Ex1: 研究“企业对开展电子商务的政策要求” 若猜想“企业态度”与“企业开展电子商务的情况”有关, 则将企业开展电子商务的有关情况(开展电子商务的投资,开展电子商务而获得的收益) 纳入问卷。,Ex2: 研究“农民对土地使用权转让的态度” 直观做法:初步研究的基础上,列出相关态度,请农民选择,自己的态度。 进一步考虑:,农民态度,年收入,非农收入占年收入的比例,考虑在问卷中设计这三个因素之间相关的问题。,问卷设定的几个准则,设置在问卷中的问题,力求能够获得诚实回答。 Ex1: 某大学想了解考生的情商,就增加了情商测
14、试题. Q:当你受挫后,你的反应是 非常沮丧,长时间不能回复正常情绪 很沮丧,较长时间不能回复正常情绪 很沮丧,当很快能回复正常情绪 无明显情绪变化,放弃就是了,这显然是一个不能获得诚实答案的问题。谁愿意暴露自己的缺点而不被录取呢?,Ex2. 某机构在研究居民对个人所得税起征点时,设置问题: Q:当个人所得税起征点时如下哪种情况时,你认为不必逃税? a.800元 b.1500元 c.2000元 d.2500元 这也是一个难以获得诚实回答的问题:谁愿意在税务机关面前表示自己是想逃税的呢?,对“怀疑得不到诚实回答”的问题,应当在不同位置,设置相同、相近、相反的问题,以求相互验证。 Ex2: 在调查
15、社会各阶层对官本位的态度时,设置了如下问卷问题: Q: 你最尊重的人是(选一): a. 有知识的人 b. 富有的人 c. 有权的人,这显然也是一个难以获得诚实答案的问题。所以为了验证问题回答的可靠性,可再问卷中追加如下问题:,Q1: 假如你正在忙于一件对于你个人而言非常重要的事情,这时你的同事告诉你,你的上司找你有事,你会(选一) 立即放下手头的事情,去见上司 请同事转告上司稍等,马上过来 请同事转告上司稍等,现在手头忙,忙完马上过来。,Q2: 假如你正在忙于一件对于你个人而言非常重要的事情,这时你的同事告诉你,有位名教授来访,你(选一) : 立即放下手头的事情,马上去见教授。 请同事转告教授
16、稍等,即可过来 请同事转告教授稍等,现在手头忙,忙完马上过来。,Q3: 假如你正在忙于一件对于你个人而言非常重要的事情,这时你的同事告诉你,有位重要领导来访,希望你去介绍情况(选一) : 立即放下手头的事情,马上去。 请同事转告领导稍等,即可过来 请同事转告领导稍等,现在手头忙,忙完马上过来。,如此问卷设计,往往可以得到很有意思的回答。大致反映被访者的真实态度,从而对分析问题,了解真实情况很有帮助。,Q-1: 在所有行业中设立行政等级制度是(选一) 有益无害 利大弊小 利弊相当 利小弊大 有害无益,Q-2: 领导干部经商与干部的关系是(选一) 无关 少数有关 半数有关 多数有关 全部有关,1)
17、单选问题:备选答案为答案空间的完整划分,问卷写法的几个关键问题,Ex: 领导干部经商与干部的关系是(选一) 无关 领导自律不严 领导纵容包庇 权钱交易 ,2)单选问题:备选答案不应该为两个空间(层面)的混淆,领导的“态度”空间,领导的“关系”空间,Ex1: 在所有行业中设立行政等级制度是(多选) 必要的 可有可无 利大弊小 利弊相当 利小弊大 有害无益,3) 多选问题:备选答案可以交叉,也可以处于不同层面。,利弊大小层面,必要性层面,Q: 在调查农民对土地使用权转让的态度问题中,设置问题:你家耕种土地,是因为 收入稳定,自己喜欢 没有别的收入途径 ,4)多选/单选问题:备选答案中不能有多重含义
18、,解释:a 选择包含了两个答案空间,选a的人即可能是因为喜欢,也可能是因为收入稳定。做统计分析的时候,无法统计出两种不同情况下人数的比例.,Ex : 在调查农民对土地使用权转让的态度问题中,设置问题: Q:你家耕种土地,是因为 收入稳定,自己喜欢 没有别的收入途径 确保全家生计,5)多选/单选问题:备选答案之间不能有包含关系,解释:选b必然会选c,b为c所包含,Ex1: 若问题中出现“最”就不可能是多选. Ex2: 调查一个地区的犯罪情况时,要严格界定何谓“犯罪”,明确到界定的程度。 明确的含义,才能确保问卷数据的有效性。,6)问题设计的用词要准确,含义明确.,7) 问题的提法不同,将导致不同的回答,郝兹伯格提出的“双轨道论”论,即对某个问题的满意与不满意的感觉是两个平行的轨道,每个轨道的刻度范围都是从0% 100%。 我们得到的重要启示是,问题的提法不同,导致不同的结果。,Q1: 对品牌A手机的满意程度.,Q2: 对品牌A 手机的不满意程度,70%,30% ?,40%,50%,得不到诚实回答数据的处理办
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年综合类-喷煤工考试-瓦斯检查工考试历年真题摘选带答案(5卷单选题100题)
- 2025年综合类-口腔医学技术(师)-口腔正畸学历年真题摘选带答案(5卷-选择题)
- 2025年综合类-单证员基础理论与知识-第一章国际贸易单证概述历年真题摘选带答案(5卷-选择题)
- 2025年综合类-化工总控工考试-化工总控工考试-锅炉水处理工历年真题摘选带答案(5卷单选题100题)
- 2025年综合类-初级经济基础知识-财政收入历年真题摘选带答案(5卷单选一百题)
- 2025年综合类-初级房地产经济-第二章我国土地基本制度历年真题摘选带答案(5卷单选一百题)
- 农业资源数字化管理项目协议
- 电子商务平台运营培训合作协议
- 2025年综合类-儿科相关专业知识-儿科急救历年真题摘选带答案(5卷单选题100题)
- 2025年综合类-保险公估人考试-保险公估人的监管历年真题摘选带答案(5卷单选题100题)
- 新入职的职工劳动合同书
- 草原放牧(简谱)课件
- 工程招标代理服务投标方案(技术方案)
- 【创优】风力发电工程标准清单(国标、行标)
- ICD-9-CM3编码与手术分级目录
- 淹溺诊疗规范内科学诊疗规范诊疗指南2023版
- PremiereProCC视频剪辑基础教程PPT完整版全套教学课件
- 新教材北师大版高中英语选择性必修第一册全册各单元学案(单词短语句型写作等知识点汇总)
- 2022年石嘴山市矿业(集团)有限责任公司招聘考试真题
- 哪些农产品免税(免税农产品包括哪些)
- 镀锌板国家新标准规定
评论
0/150
提交评论