




已阅读5页,还剩37页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章 基本概念,1 总体与样本,一、总体,由许多具有某种相同性质的单位构成的整体,总体分为目标总体和实际总体目标总体是研究目标所针对的总体;实际总体是实际调查时所针对的有限的、具体的总体。,总体与个体:总体是个体的集合,个体是构成对应总体的单元。一切构成总体的个体或子总体泛称为总体单元,其中个体称为基本单元。基本单元是总体中最小的、不可再分的单元。,二、抽样框与抽样单元,(一)定义:包含所有抽样单元的总体称为抽样框,构成抽样框的单元称为抽样单元。,(二)抽样框的形式:名单、手册、地图、数据包等。,(三)抽样框的要求:,1、抽样框必须是有序的,即抽样单元必须编号,且根据某种顺序进行了排列;,2、抽样框中包含的抽样单元务必要“不重不漏”,否则将出现抽样框误差。(称为穷尽原则和互斥原则),三、抽样与样本,样本由样本点(抽样单元)构成。,根据样本抽取方法的不同,可以将抽样分为全样本抽取和逐个抽取。全样本抽取和逐个无放回抽取是等价的。,抽样比:样本量 与抽样框的抽样单元数 之比称为抽样比。,样本中包含的样本点(抽样单元)称为样本量。(样本容量),2 若干数学准备,1、盒子模型,一般抽样调查面临的总体只有有限多个初级单元。从总体中抽样,就相当于从一个盒子里摸取若干张票,盒子里的票数相当于有限总体的单元个数,票上记载着反映该单元特征的指标的值。设总体有N个单元,各指标值为则盒子如图21所示:,该盒中票的平均数为:,即总体平均数,它表示票上指标的中心。,另一个重要的总体参数是盒中票的指标的离散程度,用指标值关于中心的距离的平方和的平均数来表示:,这实际上是总体的方差;但大部分情况采用:,如果我们只关心总体中具有某些特定类型的集合占整个总体的比例.,只要将盒子中的票子分为两类,我们感兴趣的一类全标上1,其余的都标上0。于是盒子可用图22表示:,则盒子中票子指标的平均数为:,正好是我们关心的那类个体占总体的比例。因此,凡对总体平均数有的结果,总体比例也有相应的结果。,此时,盒子的方差化为:,常采用的方差表示为:,从盒子中作随机抽取常常有两种不同方式:随机有放回抽取和随机无放回抽取。,但是,当盒子中的票数相当多,而抽取的票数相对较少时,有许多事件的概率习性对于有放回或无放回两种情况几乎差不多,因而有时候我们常从随机有放回这一最简单的形式入手讨论问题,而将有关的结果近似地套到随机无放回的情形。,随机无放回通常比随机有放回应“有效”一些。,2、随机误差与无偏估计量,设有一个容量为7的总体由下面盒子给出,如图23所示:,总体平均数和方差为:,标准差,此时,盒子中指标值以及总体的参数 和 对于调查者来说是未知的。调查者的任务就是从总体中抽出一个样本,构造样本估计量,来推断总体平均数 和方差 。,设样本容量n=3,使用样本 的样本均值和方差来估计总体的平均值 和方差 。,考虑不放回简单随机抽样,由于抽样是随机的,7个个体中的任何3个都可能入选样本。所有可能的样本数有,此时,每一个样本被抽中的概率都相等且为,如抽中样本(2,3,6),则,用它们来估计总体的平均数和方差,误差如下:,对平均数有随机误差,对方差有随机误差,由于样本是随机的,误差也将随着样本的不同而发生变化。若抽到的样本是(1,2,3),则,随机误差分别为,随机误差就大得许多。,为什么还要用样本平均数和方差来估计总体平均数和方差呢?,原因一: 和 是样本平均数 和方差 的波动中心,换句话说,虽然估计量 和 会发生随机误差,随机误差有正有负,但随机误差的平均值为0。或者说,所有可能的 和 的平均值分别为 和 。,以前述例子为例:所有可能的 的平均值为,类似:所有可能的 的平均值为,原因二: 随着样本容量 n 的增大(与总体容量N相比仍可能很小), 与 以及 与 发生大的误差的可能性越来越小,以至于可以忽略,而误差在 0 附近的可能性变得越来越大,或者说某种平均意义下的误差越来越小。,一般来说,基于抽样数据的统计量通常记为 ,在前面的例子中是 和 作为参数 的估计量,总是希望能够较好地近似代表 。由于依据局部来估计总体避免不了会发生误差,这个误差还是随机的,任何两次抽样所产生的误差都不会相同,每次所产生的误差都是这个随机变量的一次实现。,另外,待估参数又是未知的,我们也不可能知道抽样误差到底等于多少。为了排除偶然因素,我们往往从平均意义上来看抽样误差。这就是在数学上对随机变量取数学期望。,3 误差与精度,抽样调查中的误差有两类:抽样误差和非抽样误差。控制非抽样误差的方法:严格调查程序、规范调查步骤、加强人员的培训和管理、合理地设计问题和答卷、改进测量方法和工具。,(一)定义:估计量误差平方的期望。设要估计的总体特征为 ,由样本推算总体的估计量为 。则均方误差,一、均方误差和偏倚,均方误差可作如下分解:,(因 ),第一项是 的方差,定义为,第二项为 的偏倚的平方:,若偏倚为0,即 ,则称估计量为无偏估计量。,以上分析告诉我们,所谓无偏估计并非是说估计量与参数之间就没有偏差,而是说估计量所有可能取值的平均值等于参数。或者说估计量与参数的平均偏差为零。,有时 是 的有偏估计,即偏倚不为0,但是随着样本容量 n 的增大 ,并且 具有其它良好的性质。称具有这种性质的估计量为抽样调查中的渐近无偏估计量。,其中, 为 的标准差,需要利用样本数据进行估计。,(一)置信区间:设 为标准正态分布的双侧 分位数,则置信水平为 的近似置信区间可以写成:,二、置信区间与误差限,可用估计量:,(二)误差限,误差限是指在某种概率意义下的最大绝对误差或相对误差,这里的概率即置信度,假设置信度为 , 为绝对误差限。则有:,若 表示相对误差限,则有,由于抽样调查中常用的估计量在大样本时是渐近正态分布的,因此只要 充分大,估计量 的分布是近似正态分布,即,对可用估计量,必定是渐近无偏的,于是上式可表示为:,再根据正态分布的性质,若是标准正态分布的双侧分位数,则,于是有:,(二)效率 效率是指以最小的费用达到要求的精度或者在给定费用的情况下达到最大的精度。,三、费用与效率,4 几种基本的抽样方法,一、简单随机抽样,注意各种调查方式的概念及优缺点。,二、分层抽样,三、整群抽样,四、系统抽样,五、多阶段抽样,调查问卷的基本格式:,说明词:解释调查意义、表达感激之情等,主题问句:被调查者基本情况、调查项目,作业记录:时间、操作者等,5 问卷调查,一、问卷设计的基本原则:,问题的提出要紧扣主题,问句和标准答案要易于理解和回答,先易后难、先封闭后开放、先基本问题后派生问题,以不超过30分钟为宜,二、成功的问卷设计必须体现的两方面的作用:,1、将调查者需了解的问题准确地传达给被调查者,2、使被调查者乐于回答,三、问卷设计的步骤:,1、确定所需的调查资料,根据调查的主题要求,研究要完成拟定的目标需要哪些资料,这些资料可以从哪些地方得到,划定调查的范围,进而考虑问卷设计的整体构思。,(1)将初步考虑所需要的资料列出;,(2)对需要调查的资料的收集方式进行研究。,2、研究调查的样本特征,针对所拟定的调查对象群体,分析样本的基本特征,并根据这些特征来拟定问题。,3、确定问题,问卷设计的关键、 科学合理地拟定每一个问题,先尽可能详尽的列出问题,再进行增、删,最后确定先后顺序。,4、进行试调查,(1)看问题是否清楚,被调查者是否明了;,(2)看被调查者是否能够和愿意回答;排列是否符合逻辑;时间是否太长。,(3)所得资料是否能满足调查的要求;,(4)问卷的编码、录入、汇总过程中有无问题。,5、定稿付印,四、问题的设立,1、问题的种类,(1)按答题的形式,可划分为开放性、封闭性和半开放、半封闭性问题。,封闭性问题又可分为:A、两项式;B、多项式;C、等级式D、排序式;E、矩阵式或表格式;F、后续式。,限制性多项式:目前您家有几台彩电?(1)无;(2)1台;(3)2台;(4)3台及以上,非限制性多项式:请问您家有下列哪些家用电器?(1)彩电;(2)录象机;(3)摄像机;(4)影碟机;(5)组合音响;(6)电冰箱;(7)收录机;(8)洗衣机;(9)电热水器;(10)空调;(11)微波炉;(12)电磁炉:(13)电饭锅;(14)电子游戏机;(15)电脑,等级式:直销方式是不通过商店销售,而是通过推销员将公司的产品直接卖给消费者的一种售货方式。请问您对直销方式感兴趣吗?(1)特别感兴趣; (2)很感兴趣; (3)有些兴趣;(4)无所谓 ; (5)不太感兴趣; (6)完全不感兴趣,排序式又可分为部分排序和全排序,部分排序:您对改进公交车辆服务质量的最大愿望是什么?(请在以下项目中选择三项,并按其重要程度大小在 内顺序填写数字1、2、3。 (1)司售人员的服务态度和好; (2)车站候车秩序良好; (3)车辆不脱班,候车时间正常; (4)能及时到达目的地; (5)车厢内外整洁、舒适; (6)车辆不出故障; (7)对老弱病残孕乘客的照顾。,全排序:您选择工作单位时考虑的顺序是(按考虑先后从19排序,填入答案前面的( )内)( )单位发展前途; ( )离家近;( )福利待遇; ( )能发挥自己的才能;( )出国机会; ( )较高的社会地位;( )工作安稳舒适; ( )解决市区户口;( )单位所有制性质。,2、问题设计的原则,1、避免一般性问题;,2、问题的定义必须清楚;,3、避免使用多语意字眼;,4、避免使用摸棱两可的提问;,5、避免出现引导性问题。,3、问题的顺序,五、问卷的格式,1、介绍词,2、填表说明,3、问题的安排,4、编码栏的设立,您是否吸烟(如果选,则跳过、 题)吸烟不吸您每天大约吸多少支烟5支以下5-10支 10-15支 15-20 20-25支 25支以上您的吸烟历史大约有多长 1年以下1-5年5-10年10年以上您是否认为吸烟有害健康(请写出理由),调查单位中吸烟人所占比例,吸烟人群日吸烟数量情况,吸烟人群吸烟历史情况,调查对象对吸烟的看法,石家庄城市居民消费与投资倾向调查问卷尊敬的先生、女士: 我们是石家庄经济学院的学生。为了积极参与贯彻国家关于扩大内需推动经济增长的方针和理论与实践相结合的教育原则,在老师指导下我们组织了这次千户居民的社会调查。请您给予支持。调查不记名,全部资料用计算机处理,绝对保密和安全,您只需在符合您的情况的答案上打个勾,花费几分钟时间。谢谢!,(1)您家是否已经拥有下列耐用家电设备 1、彩电,2、组合音箱, 3、VCD(或DVD), 4、冰箱, 5、空调,6、电脑(2)您家的住房是: 1、租赁公房,2、有产权公房 ,3、新商品房, 4、其他(请注明) (3)您家今明两年是否准备以下项目支出: 1、购买家电设备 5、现有住房装修 2、购买成套家俱 6、支付子女教育费 3、购买汽车 7、国内或国际旅游 4、购买(或置换)房屋,(4)您今明两年不准备上列大项目支出的主要 原因是:(选填3项) 1、没有必要5、售后服务差 2、经济不宽裕6、价格不合理 3、品牌不中意7、其他(请注明) 4、质量信不过(5)您购买商品考虑的主要因素是: 1、实用价值4、品牌 2、商品质量 5、售后服务 3、价格 (请按您认为的重要性在中写上位序),(9)您收入节余用予以下哪些项?各项约占多大比重?1.银行储蓄 ( )% 4.其他债券 ( )% 2.国债(国库卷) ( )% 5.股票 ( )% 3.基金 ( )% 6.保险 ( )% 7.其他 ( )% (10)您存钱的主要目的是: 1、购买设备 4、子女教育 2、购买住房 5、养老防病 3、结婚 6、旅游(请按你认为的重要性在中写位序),(11)您是否了解现在推行的信贷消费 1、不了解,2、了解一点,3、了解, 4、很了解(12)您是否打
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年广西pcr上岗证考试题及答案
- 2025年北师大专业测试题及答案
- 2025年餐饮三级教育试题及答案
- 2025年测绘专业卓越班面试题及答案
- 村民开路协议书
- 杨超越的协议书
- 林地种植协议书
- 果然婚前协议书
- 架电线杆协议书
- 柴油代储协议书
- Excel常用函数公式及技巧
- 学校心理健康教育合作协议书
- 2024-2030年中国军用滑环行业市场发展趋势与前景展望战略分析报告
- 部编版高中语文必修上第六单元任务群教学设计
- 线上线下教学衔接北师大版数学三年级下册口算脱式计算、应用题复习、期中、期末检测试卷(含部分答案解析)
- 人教版七年级上册英语UNIT 4 My Favourite Subject单元测试卷
- 光明乳销售合同范本
- (正式版)JTT 1497-2024 公路桥梁塔柱施工平台及通道安全技术要求
- ISO15614-1 2017 金属材料焊接工艺规程及评定(中文版)
- 企业项目规划书样本
- 产科营养门诊工作总结
评论
0/150
提交评论