已阅读5页,还剩46页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第6章抽样 第1节抽样原理 第2节抽样的方法 第3节样本容量 第1节抽样原理 一 抽样与抽样调查 二 抽样术语 三 抽样的程序 四 抽样分布与抽样原理 一 抽样与抽样调查 抽样 Sampling 是一种选择调查对象的程序和方法 抽样调查是依据一定抽样方法从构成研究对象整体的总体中抽取部分作为样本进行调查研究 然后用样本的调查结果来推论和说明总体的一种调查方式 总体 是构成研究单位的所有单位的集合 该单位是构成总体的基本单位 Population Thesetofunitsthattheresearcherwishestoexplain 样本 就是从总体中以一定的抽样方法抽取的一部分单位的集合 一个样本也就是总体的一个子集 Sample Asubsetofallunits elements inthepopulation 二 抽样术语 总体与样本 抽样框 是一次直接抽样时所有抽样单位的名单 SampleFrame alistofwhichisusedtorepresentalltheelementinthepopulation 抽样比率 一次抽样中 样本占总体的比率 SamplingRatio ratioofthesizeofthesampletothesizeofpopulation 二 抽样术语 抽样框与抽样比率 参数值 是关于总体中某一变量的综合描述 或者说是总体中所有元素的某种特征的综合数量表现 Parameter acharacteristicofthepopulation统计值 也称样本值 它是关于样本中某一变量的综合描述 或者说是总体中所有元素的某种特征的综合数量表现 Statistic acharacteristicofthesample 二 抽样术语 参数值与统计值 抽样单位 samplingunit 是一次直接抽样所使用的基本单位 抽样误差 是指由于抽样本身的随机性而导致的用样本值推论总体值时的误差 它是样本代表性大小的一个标准 是不可避免的 二 抽样术语 抽样单位与抽样误差 1 界定总体2 编制抽样框3 确定样本数和抽样方法4 实际抽取样本5 评估样本质量 三 抽样的程序 四 抽样分布 四 抽样分布原理 SAMPLE 1 四 抽样分布原理 SAMPLE 2 四 抽样分布原理 样本增大与抽样误差的关系 第2节抽样的方法 一 概率抽样方法 ProbabilitySampling 二 非概率抽样方法 Nonprobabilitysampling 1 简单随机抽样 一 概率抽样方法 2 系统抽样 3 分层抽样 4 整群抽样 5 多阶段抽样 6 PPS抽样 7 户内抽样 1 简单随机抽样Samplerandomsampling selectpeoplebasedonatruerandomprocedure 1 运用随机数表 抓阄 计算机处理 2 要求调查对象的名单必须是可以列举出来的 一 概率抽样方法 简单随机抽样 示例 EXCELL随机抽样 INT RAND b a a 用随机数表抽样方法 500名学生中抽取80名 2 系统抽样Systematicsampling selecteveryKthperson步骤 1 排列抽样框名单 2 计算抽样距离K 抽样比率的倒数 实为抽样框数N 样本数 3 选择起始CASE 4 选择样本 A nK n 0 1 2 3 一 概率抽样方法 系统抽样 系统抽样示例 36人中选5人 系统抽样可能遇到的问题 1 当总体的排列没有规律时 用等距抽样较好 但如果总体排列按某种规律循环出现 用等距抽样就有危险 以总体的随机排列为前提 距离不能等于循环节的倍数 2 抽样框的名单如果可以按一定标准编号 比如从收入高到低 间距为25 则起点对样本的偏差比较大 3 K不为整数时的处理 一 概率抽样方法 系统抽样 K 8 K 7 系统抽样示例 36人中选5人 分层抽样 Stratifiedsampling systematicallyselectelementsineachofpreviouslyestablishedcategories先将总体依照某种或某几种特性分为几个子总体整群抽样 Clustersampling takemulti stagesamplesineachofseverallevels各群体的同质性高的总体用整群抽样较好各分层群体异质性高的总体用分层抽样较好 一 概率抽样方法 分层抽样与整群抽样 群内异质性低群间异质性高 群内异质性高群间异质性低 整群抽样 分层抽样 一 概率抽样方法 分层抽样与整群抽样 一 概率抽样方法 分层抽样 1 分层的标准选择 1 研究的主要变量或相关变量作为分层的标准 2 分层标准具有区分层间差异大而层内差异小的特征 3 一 概率抽样方法 分层抽样 农村学生95 某高校学生分布情况 城市学生占5 抽样条件 学生总数5000人 现要抽取500人 抽样调查该校学生的月平均消费 假如农村学生的月均消费为500元 城市学生月消费为800元 等比抽样与异比抽样 一 概率抽样方法 分层抽样 抽样条件 学生总数5000人 现要抽取500人 计算该校学生的月平均消费 假如农村学生的月均消费为500元 城市学生月消费为800元 因此该校学生的月均消费 参数值 应为 500元 人 4500人 800元 人 250人 5000人 490元异比抽样法 农村城市各抽取250名 其计算的月均消费统计值 500元 人 250人 800元 人 250人 500人 650元加权后计算的统计值 权重 等比抽样人数 异比抽样人数 475 250 500元 人 250人 25 250 800元 人 250人 500人 515元 等比抽样与异比抽样 群内异质性高群间异质性高 一 概率抽样方法 多阶段抽样 总体 哪一级的异质性高 就在哪一级提高样本比率 一级抽样 二级抽样 一 概率抽样方法 多阶段抽样 一 概率抽样方法 多阶段抽样 从某县10个乡镇200个村中抽取1200名农民调查 10X4X30 12002X20X30 120010X20X6 12008X15X10 12005X12X20 12004X10X30 12003X10X40 12002X10X60 12001X12X100 1200 三种抽样方法的比较 一 概率抽样方法 PPS抽样 PPS抽样 概率与元素的规模大小成比例的抽样Samplingwithprobabilityproportionaltosize特点 是多阶段抽样方法的特定形式 其二级单位规模的大小影响到被抽取的概率 例 抽样条件 在武汉50所大学 每个大学的学生数差异很大 现在要在这50所大学中抽取20所 共抽取2000名学生进行调查 一 概率抽样方法 PPS抽样 一 概率抽样方法 户内抽样 户内抽样 Within householdSampling往往是多阶段抽样的最后环节 一般使用 KISH选择法 一 概率抽样方法 户内抽样 KISH表 1 偶遇抽样 二 非概率抽样方法 2 主观抽样 3 定额抽样 4 滚雪球抽样 偶遇抽样 方便抽样 Haphazardsampling selectanyonewhoisconvenient主观抽样Purposivesampling selectanyoneinahardtofindtargetpopulation 二 非概率抽样方法 偶遇抽样与主观抽样 定额抽样Quotasampling selectanyoneinpredeterminedgroups滚雪球抽样Snowballsampling selectpeopleconnectedtoanother 二 非概率抽样方法 定额抽样与雪球抽样 第3节样本容量 一 样本容量定性确定方法 二 样本容量定量确定方法 三 常用抽样比率 影响样本容量的因素 1 决策的重要性2 研究的性质3 变量的个数4 完成率 回复率低则样本容量大 5 总体的性质 同质性高则小 否则大 6 资源限制 资金与时间 一 样本容量确定的定性方法 N t2s2 e2N t2p 1 p e2 二 样本容量确定的定量方法 总体规模与样本量间的关系 样本容量确定的统计学方法 1 调查平均值问题 对于估计平均值问题 计算其所需的样本容量的公式 Z 标准误差的置信水平的临界值 即总体平均值包括在指定置信区间内的置信度是多少 标准误差的置信水平允许确切值Z 总体标准差 E 可接受的抽样误差范围 允许误差 t值与E值必须由调查人员与客户进行磋商后确定 总体标准差值只能通过以前的资料 试点调查 二手资料通过主观判断等途径来确定 应用举例 计算平均数的样本容量确定应用举例 例 研究快餐族平均每月吃快餐的次数 与委托单位磋商以及对精确度的要求后 调查人员规定估计值不得超过实际值的0 10 1 10 即允许误差E值确定为0 10 调研人员认为 考虑全局 需要把实际总体平均值在 样本平均值 E 区间以内的置信度定为95 而若要置信度为95 应必须在2倍标准误差范围内 严格是1 96 即Z值可确定为2 值借用公司以前作过的类似调查的资料 标准差为1 39 以此作为值 2 计算比例问题 这就是比例问题调查的样本容量确定问题 公式 公式中 P为总体比例的估计值 可以借用过去的调查估计值 例 确定研究最90天内曾在网上购物的所有成年人的比例或百分比的调查的样本容量 假设可接受的误差范围为 2 即E值确定为0 02 假定调查人员要求抽样估计在实际总体比例的 2 范围内的置信度为95 那么按前例 可将2作为Z值代入公式 根据前一次调查 有5 的被调查者表示在最近90天内曾在网上购物 因此 可将0 05作为P值代入公式 计算样本容量的公式中没有一个用到总体容量 只有样本容量相对于总体容量而言过大 5 以上 时 总体容量才会影响到样本量的大小 当样本容量超过总体容量的5 时 就需要调整样本容量 一般都假设样本的抽取是相互独立的 独立假设 这一假设在样本相对于总体很小时成立 当样本量占总体比例相对较大 5 以上 时 假设就不成立 因此 我们必须调整标准公式 如前面关于平均数的样本容量就应作调整 公式为 n 修改后的样本量 n 原样本量 N为总体单位数 如总体单位数为2000 原样本量为400 则修改后的样本量应为 3 注意事项 抽样比率过大问题 3 注意事项 无回答的问题 实际调查中 由于调查对象未找到或拒绝访问等原因 实际收回的样本数与理论决定的样本数可能不同 另外 即使所有样本单位都接受了调查 还会因为他们对调查中各个问题的回答率不同 而发生不同的调查项目样本规模不一致的情况 因此 确定样本大小时 还应将这些情况考虑进去 例 初确定的样本容量是1000 但估计可能有20 的无回答 则实际调查所用的样本容量1000 80 1250 4 附录 总体异质程度 其他条件一定 总体异质性程度越大 所要求的样本容量越大 反之 所要求的样本容量就越小 总体的异质程度大小可用标准差估计值来反映 标准差计算公式 应用举例 4 附录 标准差计算公式应用举例 调查某地家庭每月用于购买家用电器的支出情况 事先抽取10户 n 进行调查 经计算 平均每月每户用于购买家电的支出为500元 实际上 每户用于购买家电的支出有很大差别 分别为 385 390 500 450 800 345 510 240
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026四川广安市广安区紧密型医共体医疗辅助人员招聘7人笔试备考试题及答案详解
- 2026年大庆市第三医院招聘1名司机、2名电生理医生笔试备考题库及答案详解
- 2026中国热带农业科学院农业机械研究所第二批招聘3人(第1号广东)笔试备考试题及答案详解
- 2026云南保山市龙陵县卫健系统所属事业单位招聘编外人员43人笔试备考题库及答案详解
- 2026广西崇左市江州区左侨卫生院招聘编外聘人员4人笔试模拟试题及答案详解
- 2026四川攀枝花市第三人民医院招聘临床见习生22人笔试备考试题及答案详解
- 2026上半年浙江杭州市丁桥医院招聘高层次人才3人(第二批)笔试备考题库及答案详解
- 2026赣州市人才集团有限公司第一批次就业见习招聘10人笔试备考试题及答案详解
- 2026广西柳州柳城县公安局招聘警务辅助人员30人笔试备考试题及答案详解
- 2026贵州黔南州公安机关招聘警务辅助人员413人笔试参考题库及答案详解
- 达州会考生物试卷及答案
- 湘方言课件教学课件
- 国家事业单位招聘2024国家艺术基金管理中心应届毕业生招聘2人笔试历年参考题库典型考点附带答案详解(3卷合一)
- 静脉采血顺序错误对标本影响分析培训
- 地理测量控制点交接与验收记录
- 食堂机械操作安全培训课件
- 建筑满堂架安装安全施工方案
- 高素质农民培育项目服务方案投标文件(技术方案)
- 建行工会活动方案
- 茶光互补分布式光伏发电项目可行性研究报告申请报告范文
- 2025年四川省遂宁市中考物理试卷及答案
评论
0/150
提交评论