




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
调查概论名词解释1.调查:调查就是使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的部分或所有单元收集感兴趣的指标信息,并将这些信息综合编辑成有用的简要形式的所有活动。2.名录框:定义为一份所有总体单元的实际的或者概念的名录清单。3.多重抽样框:多重抽样框是两个或两个以上抽样框的组合。例如。它可能是名录框和区域框的组合或者两个及两个以上名录框的组合。4.无回答:是指调查时未能从指定的被调查者处获得有效的回答。无回答有两种类型:一种是全部无回答,又称单元无回答,它是指被调查单元没有提供任何信息。另一种是部分无回答,又称项目无回答,它是指问卷中某些问题回答的空缺。5.派员访问:是派调查员与被调查者面对面进行的一种调查方式。对某些目标总体来说,这是收集数据惟一可行的方法。例如:有些调查无法采用自填的方式;有些大规模调查对象要求调查员在现场确定被调查对象;很多被调查对象没有电话或者识字率很低。6.直接观察法是由调查员在现场对被调查者的情况直接观察、记录以取得有关信息的一种调查方法。它不是直接向被调查者提出问题要求回答,而是凭调查人员的直观感觉或是利用有关器械,如照相机、录像机或其他器材,记录和考察被调查者的活动和现场事实,以获得必要的信息。7.小组座谈法是采用小型座谈会的形式,从调查对象中挑选一组有代表性的人,在主持人的组织下,就某个专题进行讨论,从而获得对有关问题的深入了解。8.问卷的有效性:有效性又称效度或准确性。它是指问卷能准确地反映客观事物特征或属性的程度。如果某之方法准确地反映了我们所要了解的现象或概念,就称该方法是有效的。9.问卷的可靠性:可靠性又称信度,它是指问卷测量结果的一致性或稳定性。10.焦点座谈:焦点座谈是由从所研究总体中选出的若干对象对所选主题进行的非正式讨论。通过焦点座谈这种形式,使被调查对象或数据用户以及调查员有机会把他们的观点纳入问卷数据过程。11.引导性问题P60;引导性问题是指建议或指导被调查者选择某一特定答案时具有倾向性。换句话说,问题措辞方法对问题的回答产生了影响。引导性问题能误导调查回答并影响调查结果。12.随机化回答方法P66对敏感性问题的一种特殊的调查方法是采取随机化回答方法,这一方法是由美国统计学家沃纳提出来的。这种方法的设计原则是建立在不暴露被调查者对问题的直接回答的基础上。13.李克特度量方法P74又称加分打分的度量方法,这种度量方法在问卷设计中应用十分广泛。它是由一组反映态度的问题组成,根据被调查者态度反映的不同程度给定分数。14.项目间比较量表P76项目间比较量表通常采用固定和方法,这种方法是对两个或两个以上的项目给出一个总分,要求被调查者在各项目之间进行划分。这个总分通常是100分,对于计算比例比较方便。15.样本的抽样概率P81:一个是指在一定的抽样方式下有多少不同的样本可以抽取,某个具体样本被抽中的概率。另一个含义是指某个总体单元被选入样本的概率。16.抽样比:是指样本的容量n与总体的容量N之间的比率17.配额抽样:抽样是要从各个子总体中选取特定数量的样本单元,这种特定数量的比例关系就称作配额。故配额抽样本质上是一种满足每个特定子总体样本量的一种手段。18.滚雪球抽样:如果我们想找到在总体中某种较为稀少的个体,而且我们已经知道其中某些个体并有可能与其接触,那么就有可能通过询问这些个体,获得他们类似的个体。这样所得的样本就像一个从小山上滚下来的雪球那样逐渐增大。19.PPS抽样:不等概率抽样,采用抽选的概率与单元规模大小成比例,用英语单词的第一个字母表示,简称PPS抽样20.整群抽样:由若干个有联系的基本单元所组成的集合称为群。抽样时以群为抽样单元的抽样方法就称为整群抽样。21.抽样分布:估计量是一个随机变量,它的具体估计值是随着不同的样本单元而变化的,因而就有一定的分布,这个分布就叫做抽样分布。22.设计权数:设计权数其实就是样本单元的入样概率的倒数,通常假定每个单元的入样概率是已知的,这样我们才能对总体进行估计。对于概率抽样来说,每个单元都有一个已知的入样概率。假如入样概率为1/50,那么每个入选样本代表总体中的50个单元,此时设计权数即为50。23.自加权设计:如果所有样本单元的设计权数都相同,那么称这样的抽样设计为自加权设计。24.无回答调整因子:无回答调整因子是原样本单元的权数之和与给出回答的单元的权数之和的比值。25.事后分层:如果可能从其他方面获得分层信息,或者抽选样本后可以得到更新、更可靠的分层信息,那么在数据收集之后,可以利用数据收集的结果,选用其中合适的变量对收集到的样本进行分层,从而对样本的权数进行调整,这就是通常所说的事后分层。26.访问手册:访问手册是访问员(调查人员)主要的工作指南,调查人员根据访问手册开展工作。27.编码:编码是给问题的每项答案赋予一个数值代码,以便于数据录入和作进一步处理的过程。28.双机录入:双机录入是指将同一问卷上的内容在计算机中录入两次,两次使用不同的录入人员。29.插补:插补就是在审核过程中辨别出来的数据缺失、无效与不一致等问题的过程。30.均值插补:均值插补就是对缺失或不一致的值用插补类的均值代替。31比率或回归插补:比率或回归插补是使用辅助信息及其他记录中的有效回答建立一个比率或回归模型,该模型表明了两个或多个变量之间的关系。32.热平台插补:热平台插补是使用同一插补类中的供着记录的信息来替代一个相似的受着记录中缺失的或不一致数据的插补方法。33冷平台插补:冷平台插补与热平台插补类似,不同之处在于热平台插补使用当前调查的供者,而冷平台插补则使用其他资料中的供者。;冷平台插补经常使用前期的或普查中的数据。34中位数:中位数是一组数据按数值大小排序(例如从小到大)后,位置在最中间的值。35,。众数:众数是出现频率最高的那个数值(对样数据来说,它是出现频率较高的加权数值)。36、极差:又称全距,是数据最大值与最小值之差(对样本数据来说,是加权最大值与加权最小值之差),由于这个度量只用到了数据分布中的两个值,所以它只给出了数据离散趋势的一个大致的描述,并且很容易受极端值的影响。37、推断性数据分析就是采取概率抽样所收集的数据来推断总体的特征。所使用的分析方法有置信区间、假设检验、方差分析和线性回归。38、线性模型是一种统计方法,它用于研究一个响应变量(又称因变量)和多个解释变量(又称自变量)之间的线性关系。 39、泄密控制指那些为避免数据发布侵犯被调查者的隐私而采取的措施。例如,汇总表中带标志的数格可能暴露被调查者的个人机密。有时候,泄密控制会对数据的质量产生负面影响,因为有些数据得不到发表或必须进行修改(通过舍入数据、合并类别、排除小数格等)。泄密控制是为了确保被调查者的个人隐私受到尊重,与此同时最大程度地保持数据的效用。40.归属泄密是指发布数据时,提供了关于某个特定子总体或特定组的信息,这些信息通常不应为人所知。由于普查(全面调查)的调查结果通常没有或然性,所以归属泄密经常发生在普查(全面调查)中。 简答 论述 多选1.调查目标的确定:1.明确信息需求2.数据使用者和数据的用途3.确定2.调查指标和调查对象抽样调查和全面调查之间做抉择时,要考虑几个重要因素:1.费用2.时效3.总体大小4.小区域(范围)的估计5.属性的多寡6.调查误差7.特殊要求8.其他因素值得注意的是:全面调查和抽样调查部室完全对立的,根据具体调查的需要,可将这两种方法结合起来使用3. 一个抽样框包括的内容 1 识别资料 2 联系资料 3 辅助资料4. 名路况的内容1 生命统计登记 2 商业注册登陆 3 地址和邮政编码 4 电话号码簿5.抽样框的优良性准则 1 关联性 2 准确性 3 时效性 4 费用 5 抽样框所提供的信息应该使用标准的概念、定义跟方法,并使客户对这些都能理解6. 抽样框典型缺陷 1 不完全涵盖或称不完全覆盖 2 过涵盖也称过覆盖 3 重复 4 空白单位 5 分类错误7. 自填式问卷优点 1 自填式问卷一般通过邮寄方式进行,通常采用匿名的方法2 费用比较低3 调查区域广泛8. 自填式问卷缺点 1 回答率通常低于访员协助式方法 2 当问卷中包含许多有关问卷的调查概念、定义和指南的参考资料时通常就不如调查员在场的效果好 3 自填式方法对被调查者的回答负担较大9. 访问调查的优点 1 回答率较高 2 访问调查可以使用比较复杂的问卷 3 访问调查的数据比较准确 10. 访问调查缺点 1 面访调查的费用比较高 2 调查的时间比较长 3 某些群体的访问成功率比较低 4 实施质量控制比较困难 5 对调查人员要求高11.电话调查的优势 1 时效快 2 费用低 3 可能访问到不容易接触到的对象 4 与邮寄调查相比可以及时处理疑难问题 5 易于控制实施的质量12. 网络调查的优点 1 成本低、范围广、速度快 2 交互性好能够实现问卷多样化设计 3 为各种调查提供了丰富的抽样框 4 有更好的质量控制13.各种数据的收集方法的比较 1 从抽样框的情况来考虑 2 从目标总体的特征来考虑 3 从调查问题的性质来考虑 4 从调查的经费与资源来考虑 5 从管理的难易程度来考虑 6 从数据质量要求来考虑14. 问卷测试的重要性好处跟方法 好处有,使问卷对被调查者和调查人员具有友好的界面;有利于收集到正确的数据时问卷的格式更有利于数据编码跟录入;减少数据收集和处理的费用及时间。 问卷调查的方法很多,主要有认知法和焦点座谈法。认知法是考察被调查者回答问题时的思考过程和方法,它有助于评估问题的有效性和识别计量误差的潜在来源;焦点座谈法是由从所研究总体中选出的若干对象对所选主题进行的非正式讨论,通过这种形式使被调查对象或数据用户以及调查员有机会把他们的观点纳入问卷数据过程15.随机化回答方法 对于某个要调查的敏感性问题,列出正反两个问题,由被调查者从中随机抽取一个来回答。被调查者抽选到哪个问题来回答,并不告诉调查人员,回答的内容是把抽到的问题与被调查者的实际情况相对照,只回答“是”或“否”。这样,调查人员就不知道被调查人员在回答哪一个问题,从而为被调查者提供真实情况起到了保密的作用。16. 问卷的格式 1 问题的顺序 2 过度的说明 3 对被调查者的提示或说明4 格式的考虑17.非概率抽样的优点1.快速简便2.费用相对较低3.不需要任何抽样框4.非概率抽样对探索性研究和调查的设计开发很有用18.分层抽样的优点1. 分层抽样能提高对总体估计值的精度,从而使抽样效率更高2. 能保证样本对被定义为层的那些子总体的代表性,从而得到有效的估计3. 操作与管理方便4. 能避免得到一个差的样本5. 在不同的层中可以使用不同的抽样框和不同的抽样方法19.那些设计师自加权的呢?简单随机抽样是一种自加权设计,这是每个单元都有相等的入样概率。同样道理,系统抽样也是一种自加权设计。对于分层抽样,如果按各层的大小等比例分配样本,而且每层内都采用简单随机抽样,那么它也是自加权设计。也就是说,如果各层的抽样比相同,总体中每个单元就具有相同的入样概率,这样的分层抽样设计就是自加权设计。20.使用辅助信息主要有两个原因:首先,为使调查估计值与已知的总体总值,或者从另一调查所得的估计值相匹配。使用辅助变量的第二个原因是为了提高估计值的精度。21.调查前的准备:编写手册 职员和调查人员的招聘和培训 编制名录和寻踪22.访问手册内容:1一般信息 2简介 3问卷说明 4问卷的审核与整理 5单个样本单元的管理 6作业管理 7问题与答案23.你为什么挑选我?调查人员应该对随机抽样的方法进行说明,让被调查者明白他是被随机抽取的,他实际上代表了总体中的个体,所以他的回答对于整个调查时非常重要的。24.常用的追问方法:1.重复提问2.无重复被调查者的回答或用中性的词语提问3.启发的帮助被调查者回忆4.利用适当的停顿或沉默5.鼓励被调查者使他们放心25.数据质量的监控方法:严格管理调查人员;2.检查(或现场检查)已完成的问卷;3.严格的文档控制;4.对调查员的询问.26.审核的目标:更好的理解数据和数据处理过程;2.检查问卷;3.回访被调查者;4.检出填错的或漏填的数据;5.删除无效记录;6.分离需要插补的记录.27.现场审查的目的:1.确认是否需要改善收集数据的工具2.发现明显的错误3.发现缺失信息4.“净化”被调查者的回答5.确定是否需要进一步培训28.选择性检查的优点有:1.节省费用且不降低数据质量2.把重点放在影响较大的记录上,从而提高数据质量3.缩短处理时间,加快进度,从而提高时效性4.减少回访比例,减轻被调查者答题负担(这对小单位特别重要,因为他们对回访特别敏感29.选择性审查的缺点1.从个体单位的水平看,对数据质量重视较少2.对于较小的估计域,与对问卷全部审核时相比,非抽样误差可能会增大3.可能会有来自数据处理人员和数据用户方面的阻力,数据用户可能认为数据缺乏可信度4.数据中可能存在不一致性,从而给数据用户造成数据质量不佳的印象30.插补的局限性:虽然均值插补可能会得到较好的点估计(对总量估计和均值估计等),但由于在插补类均值这一点形成一个人为的“峰值”,从而破坏了分布状态和变量之间的关系。因此,如果用常规的抽样方差公式进行计算,就会低估最终的方差。31.插补准则1插补得到的记录应该和审核有问题的记录非常相似。2好的插补会为评估留下审查的线索,并保证插补的记录具有内部一致性。插补处理过程应该是自动的,客观的,可再现的和有效的。3插补得到的记录硬挨满足所有审核规则。4插补值应标明,插补方法所使用的资料也应该清楚的标明。记录中变量的插补和非插补的值都应该保留,以便对插补的程度和影响进行评估。5仔细选择插补的方法,考虑每一种插补方法的优缺点以及要插补的数据类型。6插补方法应减少无回答偏差,并尽可能地保持不同变量之间的关系。7插补系统应事先考虑周全做出规定并编程和调试。8插补系统应该能处理各种却是和不一致的项目。9对于供者插补方法,插补得到的记录应尽可能与选中的供者相似。这有利于保证插补记录中插补值与非插补值的组合不仅满足审核规则而且具有多样性。32.调查报告写作的基本要求1实事求是2要熟悉调查领域的业务。3观点和数据要结合运用。33.定义敏感数格的准则:第一,切除规则第二,(n,k)规则第三,P百分数规则34.几种处理敏感数格的方法:1.限制法第一,合并数格 第二,隐藏数格2.扰乱法第一,系统舍入 第二,随机舍入 第三,有控制的随机舍入 第四,对微型数据文件的泄密控制法35.减少敏感性问题的方法:仔细的措辞在一定程度上也能帮助减少敏感问题的影响。有以下一些方法:1.释疑法2.假定法3.转移法36.如何抽取PPS样本1. 随机法2.系统法3.随机系统法计算1.例6.1p118 2.p121 3.例6.7 p129-132 4.p1375.例6.11p142-144 6.例7.2p157-158 续p163-164 7.189 8.209其他重点内容1. 评估插补工作,最关心的指标就是对调查估计值的偏差和产生的查补方差。2. 调查是认识客观世界的一种手段。任何工作都离不开调查。3. 决策就必须进行市场调查,因此很多调查公司应运而生。4. 社会经济调查的任务主要是应用统计学的调查、整理和分析方法研究社会经济问题,目的是科学地反应社会、经济中各种各样的问题,分析问题形成的原因和影响,研究其发展和变化的客观规律,为解决问题制定政策或政策提供依据。简单地说,调查是为决策服务。5. 调查的第一个阶段是计划,负责调查计划和设计的应该是一个由多方面人员组成的小组。6. 进行全面调查还有一些其他的原因,其中之一就是为以后的抽样调查提供抽样框。7. 值得注意的是:全面调查和抽样调查并不是完全对立的,根据具体调查的需要,可将这两种方法结合起来使用。8. 防止泄密的方法主要有两种:限制 扰乱。9. 均值插补局限性:虽然均值插补可能会得到较好的点估计(对总量估计和均值估计等),但由于在插补类均值这一点形成一个人为的“峰值”,从而破坏了分布状态和变量之间的关系,因此,如果用常规的抽样方差公式进行计算,就会低估最终的方差。10. 离群值的检验可以看作审核的一种类型,主要是用来发现和确认可疑的记录。离群值被定义为一个观察值或一组观察值,他们看起来与数据中的其他观察值不一致。11. 集中趋势的另一个度量是中位数。对与样本数据中位数是加权数据的中间值,如果数据个数为偶数,中位数是最中间两个数值的平均数。中位数即可用于定量数据,也可用于定序数据。而且对于有序数据来说,中位数是刻画集中局势最好的度量。12. 与均值相比,中位数的主要优点在于它更少受极端值的影响。13. 集中趋势的最后一个度量是众数。14. 如果一个分布是双峰的,则在解释数据的集中趋势度量是要特别小心,均值和中位数都可能导致误解。在这种情况下,有两个众数,给出这两个众数可以很好的地解释数据分布中存在的两个峰值。15. 在统计分析中,有时还是用其他统计量。雨中位数一样,四分位数也是一个位置度量,16. 有时候,泄密控制会对数据的质量产生负面影响,因为有些数据低不到发表或必须进行修改(通过舍入数据、合并类别、排除小数格等)。泄密控制是为了确保被调查者的个人隐私受到尊重,与此同时最大程度地保持数据的效用。17. 调查中的泄密主要有两种类型:身份泄密和归属泄密。18. 由于普查(全面调查)的调查结果通常没有或然性,所以归属泄密经常发生在普查中。例如在某一地区医生收入的全面调查中提供了过于狭窄的范围。19. 调查的步骤与过程:一,调查的计划与设计二,调查前的准备三,调查的实施四,调查结果的分析与报告20. 进行全面调查还有一些其他原因,其中之一是为以后的抽样调查提供抽样框21. 值得注意的是:全面调查和抽样调查并不是完全对立的,根据具体调查的需要,可将这两种调查方法结合起来使用22. .调查总体即实际调查所覆盖的总体.在抽样调查中称作被抽样的总体.23. 非抽样误差不仅出现在抽样调查中,也出现在全面调查中.24. 效率原则:在同样完成调查要求的前提下,问卷设计应保证效率尽可能高.也就是说,要在获得同样信息的前提下,应选择最简洁的调查方式,以使问卷的长度和题量达到最小.25. 关于态度的度量方法:要对这种有关态度问题的精度量是比较困难的,通常只能采取打分或评定等级进行排序的方法。26. 样本的抽选概率与抽样比(看看P81)27. 介绍Deff指标(熟悉P84)28. 圆形系统抽样:如果N不能被n整除,则可以使用圆形系统抽样法来避免出现可能样本量不一致的情况。我们把总体单元假想排列在一个圆上,并采用模余数法。29. 整群抽样的具体方法:整群抽样包括两步过程,首先将总体划分为群,然后抽选群的样本,再调查样本群中的所有单元。30. 抽样方差的大小与样本量的关系:如果其他因素不变,抽样方差的大小一般随着样本量的增大而减少。然而,为获得给定的方差,所需的样本量并不随总体大小的增大而等比例增加。实际上,在确定给定抽样方差所需的样本量时,对中等规模的总体来说,总体大小仅起有限的影响;而对大的总体则几乎没有影响。31. 样本量和精度之间的关系:随着抽样方差的不断减小,估计值的精度就会逐渐提高,而估计值的精度越高,所需的样本量相应也就越大。32. 精度的表示方法:我们一再提到精度是用调查估计值的抽样方差或抽样误差来表示的,抽样方差或抽样误差越小,精度越高。调查估计值的精度与样本量时密切相关的,随着样本量的增加调查估计值的精度也会不断提高。换句话说,对应估计量的抽样方差就会不断减小。所以,样本量取决于调查估计值所要求的精度。33. P149表:注意此表中,当样本量从50加一倍增到100时,比例估计值的误差限有所降低,从0.14减少到0.10,并没有如我们可想象的那样,减半至0.07。同样,对于500的样本量,或者5倍于100的样本量,误差限也只是减少到0.045,也没有与样本量增加5倍相对应的,减少到原来的1/5,即从0.1减少到0.02。最后,样本量从500增加到1000时误差限也没有减少一半。34. 总体指标的变异程度何时最大:对于只取两个值的指标,即二元变量,则当这两个值在总体中以50%和50%的比例出现时,总体指标的变异程度最大。35. 如何确保达到调查要求的精度:为确保达到调查要求的精度,在计算样本量时,建议对某一指标的总体变异程度采取较为保守的估计。换句话说,在实际中如果事先不知道调查中要测量指标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高端系统门窗合同范本
- 房产采购家电合同范本
- 外贸劳务英文合同范本
- 咳嗽变异性哮喘雾化吸入护理查房
- 包子店劳务合同范本
- 毛坯租房合同范本
- 模具快速原型制作合同
- 房屋自动延续合同范本
- 装卸及安装合同范本
- 地瓜基地采购合同范本
- 桥梁安全保护区管理制度
- 学堂在线 大学生国家安全教育 章节测试答案
- 2025至2030中国增强型飞行视觉系统行业发展趋势分析与未来投资战略咨询研究报告
- 华文版二年级上册-写字-书法
- 学堂在线 数据结构(上) 章节测试答案
- 安全文明生产的保证措施
- 车辆运输安全培训
- 工贸企业安全培训课件
- 长沙市太平街、西文庙坪历史文化街区保护提升项目可行性研究报告
- 业绩分红方案(3篇)
- 中国金属材料检测服务行业市场占有率及投资前景预测分析报告
评论
0/150
提交评论