已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卫生统计学,郝元涛中山大学马晓光浙江大学,第十四章调查研究设计,目录,第一节:调查设计的基本内容,第二节:基本的概率抽样方法及其样本量估计,第三节:非概率抽样方法,第四节:数据质量评价指标,01,02,03,04,重点难点,调查研究设计的一般做法基本的抽样方法及其样本量估计信效度的概念及其评价指标,第一节调查设计的基本内容,1.了解总体参数,说明总体特征2.研究事物之间的关联,(一)调查目的,第一节调查设计的基本内容,1.确定调查总体,划清调查总体的同质范围2.明确调查的人群及调查的时间和地点3.不在总体范围内的个体不应作为观察单位,(二)调查对象与观察单位,第一节调查设计的基本内容,1.调查方法和调查项目(1)根据调查目的、调查对象和具备的调查条件确定调查方法(2)根据调查指标确定调查项目2.调查方式(1)观察法(2)问卷法(3)访谈法3.调查表4.组织计划和实施,(三)调查方法与调查项目,第一节调查设计的基本内容,调查表的构成(1)标题(2)说明(3)被访者基本情况(4)主要内容(5)编码(6)作业证明的记载,(四)调查表,第一节调查设计的基本内容,调查表制定的一般步骤(1)明确调查目的(2)提出调查项目(3)项目筛选(4)确定项目的提问形式,(四)调查表,第一节调查设计的基本内容,(5)确定项目的回答选项(6)预调查及评价(7)修改完善,调查表问题的设置(1)避免不确切的表述(2)避免判定性的问题(3)避免引导性的问题,(四)调查表,第一节调查设计的基本内容,(4)避免难堪或禁忌的敏感问题(5)避免笼统和抽象的问题(6)避免多重问题,调查员的选择调查员的培训(1)介绍本次调查的目的、计划、内容、方法等有关情况(2)介绍调查的具体内容和任务(3)调查问卷的培训(4)模拟调查或访问(5)建立监督、管理和相互联系的方法和规定(6)预调查,(五)组织计划和实施,第一节调查设计的基本内容,问卷核查(1)完整性核查(2)逻辑检查数据编码(1)包括事前编码和事后编码(2)需要按照统一规则进行编码(3)将编码信息制定成编码手册,(六)数据整理分析计划,第一节调查设计的基本内容,数据录入(1)使用FoxPro、Excel、Epidata等建立数据库结构(2)对数据录入员提供统一录入说明,双录入(3)数据录入完毕后,应作抽查或全面核查数据整理(1)保存原始数据(2)对数据变量和内容进行清理检查数据分析,(六)数据整理分析计划,第一节调查设计的基本内容,第二节基本的概率抽样方法及其样本量估计,1.概率抽样(probabilitysamples)按照某种特定的机会抽取样本。2.样本量估计(1)样本量估计是抽样设计的重要部分。(2)样本量不足,则抽样误差较大;在统计推断时,检验效能偏低,导致假阴性结果。(3)片面追求大的样本量,不仅导致人力、物力和时间的浪费,也可能引入其他一些偏倚。(4)在调查研究设计中,需根据设计类型、抽样方法及结局变量的性质,借助适当的公式进行样本量的估计。,(一)基本概念,第二节基本的概率抽样方法及其样本量估计,1.基本概念(1)简单随机抽样(simplerandomsampling):或称单纯随机抽样,保证总体中的每一个个体都有同等的机会被抽出来作为样本的抽样方法。它是最基本的抽样方法,也是其他抽样方法的基础。(2)抽样框(samplingframe):将总体的全部观察单位编号,形成抽样框,在抽样框中随机抽取部分观察单位组成样本。2.优缺点(1)优点:简单直观、均数(或率)及其标准误的计算简便。(2)缺点:是总体较大时,难以对总体中的个体一一进行编号,且抽到的样本分散,不易组织调查。,(二)简单随机抽样,第二节基本的概率抽样方法及其样本量估计,3.样本量估计(1)样本量估计的依据总体中个体的变异程度:如果个体间变异程度小,则所需样本量也较少;反之,如果变异程度大,则需较大的样本量。通常用变异系数CV来反映个体间变异。调查的精度:用最大相对误差反映精度的要求,即测定值与真实值之差与真实值的比值。精度要求越高,所需样本量就越大。可由研究者根据研究问题的背景加以确定。置信程度:通常用置信水平1-反映置信程度。置信程度要求越高,所需样本量越大。置信水平也可由研究者根据研究问题的背景加以确定,通常取90%、95%或99%。,(二)简单随机抽样,第二节基本的概率抽样方法及其样本量估计,(2)样本量估计公式估计总体均数时:估计总体率时:当初步估计在0.20.8时:当初步估计小于0.2或大于0.8时:,(二)简单随机抽样,第二节基本的概率抽样方法及其样本量估计,例2在西藏某地区5400名居民中抽取270人作为样本测量血清硒含量,结果发现,居民血清硒含量平均为26.80g/L,标准差为3.49g/L,患大骨节病的居民123人。为调查西藏该地区居民血清硒含量的平均水平及患大骨节病的比例,基于上述信息,估计进行简单随机抽样所需样本量。(1)估计总体均数时:根据已知信息,血清硒含量均数26.80g/L,标准差3.49g/L。若要求最大相对误差为=0.02,置信水平为1-=95%:因此,欲调查血清硒含量的平均水平,至少需要调查163名居民。,(二)简单随机抽样,第二节基本的概率抽样方法及其样本量估计,(2)估计总体率时:根据以上预调查数据,p=123/270=0.456(推测介于0.20.8之间),同样,相对误差为=10%,置信水平为1-=95%:因此,欲调查患大骨节病的居民所占百分比,至少需要调查459名居民。由于例2拟通过同一项调查达到2个目的,该调查的样本量应取163和459两个数的最大值,即需调查459名居民。,(二)简单随机抽样,第二节基本的概率抽样方法及其样本量估计,1.基本概念系统抽样(systematicsampling):又称机械抽样,按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。2.优缺点(1)优点:易于理解,简便易行;容易得到一个在总体中分布均匀的样本。(2)缺点:当总体的观察个体按顺序有周期性或单调增减趋势时,可能产生偏倚;抽到的样本较分散,不易组织调查。3.样本量估计由于系统抽样无专用的标准误计算公式,往往按简单随机抽样的方法来估计样本量。,(三)系统抽样,第二节基本的概率抽样方法及其样本量估计,1.基本概念分层抽样(stratifiedsampling):将总体中全部个体按某种特征分成若干“层”(stratum),再从每一层内随机抽取一定数量的个体组成样本。2.优缺点(1)优点:样本具有较好的代表性,抽样误差较小;各层可根据调查对象的特征,采取不同的抽样方法以及资料收集方式;统计分析内容更丰富,可以对不同层进行独立分析,还可以比较不同层间的差异。(2)缺点:若分层变量选择不当,层内变异较大,层间变异较小,则分层抽样失去意义。,(四)分层随机抽样,第二节基本的概率抽样方法及其样本量估计,3.样本量估计(1)样本量估计的依据总体变异程度CV的估计:(以预调查数据对总体CV做初略估计)上式中,样本均数:样本方差:式中wh=Nh/N为总体中各层的观察单位数占总观察单位数的比例,L为“层”数,为各层的均数,为各层的方差。,(四)分层随机抽样,第二节基本的概率抽样方法及其样本量估计,估计的总体率p:可通过预调查,以各层的观察单位数占总观察单位数的比重作为权数,粗略估计加权合计率。相对误差:可根据研究问题的背景加以确定。置信水平1-:也可根据研究问题的背景加以确定。(2)样本量估计公式估计总体均数时:估计总体率时:当初步估计在0.20.8时:当初步估计小于0.2或大于0.8时:,(四)分层随机抽样,第二节基本的概率抽样方法及其样本量估计,例3在例2的总体中,牧区有2900人,林区有2500人,如先将总体分为牧区和林区两个层,预调查得到牧区、林区各层内居民145和125人,平均血清硒含量分别为27.80g/L、26.20g/L,标准差分别为4.30g/L、3.43g/L,患大骨病的频率分别为30%,55%。现在估计分层随机抽样所需样本量。,(四)分层随机抽样,第二节基本的概率抽样方法及其样本量估计,(四)分层随机抽样,第二节基本的概率抽样方法及其样本量估计,(1)按总体均数估计:若仍以=0.02,置信水平为1-,则样本量为:按比例分到2个地区:可见,欲调查平均血清硒含量,两个地区分别至少需要调查103和89名居民。,(四)分层随机抽样,第二节基本的概率抽样方法及其样本量估计,(2)按总体率估计,首先粗略估计总的频率:若仍以=0.02,置信水平为,则样本量为:按比例分配,则两个地区需抽取的居民人数分别为:可见,欲调查患大骨节病居民所占百分比,两个地区分别至少需要调查286和246名居民。例3拟通过同一项调查达到两个目的,两个地区该调查的最小样本量应取(103,286)和(89,246)的最大值,即分别最少需调查286和246名居民。,1.基本概念整群抽样(clustersampling):以“群”(cluster)为基本单位的抽样方法。先将总体分成若干个群,从中随机抽取一些群,被抽中群内的全部个体组成调查的样本。2.优缺点(1)优点:便于组织调查,节约成本,容易控制调查质量。(2)缺点:样本量一定时,抽样误差一般大于简单随机抽样。,(五)整群抽样,第二节基本的概率抽样方法及其样本量估计,(五)整群抽样,第二节基本的概率抽样方法及其样本量估计,对于总体均数估计:对于总体率估计:当总体为无限总体时:当总体为有限总体时:(2)相对误差:可根据研究问题的背景加以确定。(3)置信水平1-:也可根据研究问题的背景加以确定。,(五)整群抽样,第二节基本的概率抽样方法及其样本量估计,(五)整群抽样,第二节基本的概率抽样方法及其样本量估计,(1)按总体均数估计:可见,欲调查平均血清硒含量,至少需调查12个乡镇。(2)按总体率估计:可见,欲调查大骨节病患病居民所占百分比,至少需调查8个乡镇。同样,该调查的最小样本量应取12和8的最大值,即最少需调查12个乡镇。,(五)整群抽样,第二节基本的概率抽样方法及其样本量估计,1.基本概念(1)二阶段抽样(two-stagesampling):如果整群抽样中调查的不是抽中群内的所有个体,而是在群内再进行抽样,调查其中的部分个体。(2)多阶段抽样(multi-stagesampling):在初级抽样单位中抽取二级抽样单位,又在二级抽样单位中抽取三级抽样单位等,将整个抽样过程分成若干个阶段进行的抽样方法。2.优缺点(1)优点:便于组织调查,节约成本,容易控制调查质量。(2)缺点:样本量一定时,抽样误差一般大于简单随机抽样。,(六)多阶段抽样,第二节基本的概率抽样方法及其样本量估计,3.样本量估计(1)多阶段抽样设计一般较为复杂,得到精确的方差估计公式很困难,尤其是多种抽样方法结合使用时。(2)单独按照常用的基本抽样方法估算的样本量一般偏小,可以采用设计效应进行调整。(3)设计效应(designeffect,Deff)首先是1965年L.Kish在他的代表作抽样调查中提出的,Deff是复杂抽样设计与简单随机抽样设计估计量的方差之比,用来反映复杂抽样设计的效率或相对精确程度。,(六)多阶段抽样,第二节基本的概率抽样方法及其样本量估计,第三节非概率抽样方法,不考虑等概率原则,主要依据研究者的主观意愿、经验或方便程度等条件来抽取调查对象。在应用时需研究人员具备深厚的专业背景知识与相关经验。,(一)非概率抽样方法的定义,第三节非概率抽样方法,偶遇抽样目的抽样滚雪球抽样定额抽样空间抽样,(二)常用的几种非概率抽样方法,第三节非概率抽样方法,第四节数据质量评价指标,1.基本概念效度(validity)即真实性,也称准确度(accuracy),意指调查表确实测定了研究者所要测定的特征及其程度,即测量指标或观察结果在多大程度上反映了所测对象信息的客观真实性。一个调查表的效度越高,说明调查的结果越能显示其所测对象的真正特征。2.主要评价指标(1)内容效度(contentvalidity)(2)结构效度(constructvalidity)(3)标准关联效度(criterion-relatedvalidity),(一)效度的概念及其评价指标,第四节数据质量评价指标,3.内容效度(1)内容效度:也称内在效度(intrinsicvalidity),是指调查表测量的内容与所要测量的内容之间的符合情况。(2)内容效度的评价主要通过主观经验判断,如调查表包含了所要测量的内容,则可认为具有较好的内容效度;否则,内容效度不好。也可用调查结果分析,如某调查目的是想了解某病可疑的危险因素,调查后进行的分析没有找到可疑危险因素,说明在调查表设计时遗漏了一些重要的因素,其内容效度不好。,(一)效度的概念及其评价指标,第四节数据质量评价指标,4.结构效度(1)结构效度:也称构思效度或特征效度(traitvalidity),说明调查表的结构是否符合理论构想和框架,即调查表是否真正测量了所提出的理论构思,因而结构效度是最重要的效度指标之一。(2)结构效度的评价较为复杂,通常采用验证性因子分析来揭示众多条目之间内在的联系,判断是否与理论构想一致。验证性因子分析方法可参阅相关文献。,(一)效度的概念及其评价指标,第四节数据质量评价指标,5.标准效标效度(1)标准关联效度:也称效标效度(criterionvalidity),是调查表所得数据与某种外部标准(效标)间的关联程度,常用测量数据与效标之间的相关系数表示。(2)效标可以是该调查表以外的一些客观指标或从另一种调查表得到的数据。,(一)效度的概念及其评价指标,第四节数据质量评价指标,1.基本概念信度(reliability):指调查表测量结果的可靠性、稳定性和一致性,亦即精确度(precision),它反映的是观测误差引起的变异程度。2.主要评价指标(1)重测信度(test-retestreliability)(2)分半信度(split-halfreliability)(3)内部一致性信度(internalconsistentreliability),(二)信度的概念及其评价指标,第四节数据质量评价指标,3.重测信度重测信度:指用同一调查表在不同时间对同一组调查对象进行重复测量,两次结果间的一致性即重测信度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年中国螺旋桨除冰系统行业市场占有率及投资前景预测分析报告
- 2026年中国真空(充气)包装机行业市场规模及投资前景预测分析报告
- 鼻窦炎患者护理要点
- 2025年玩具销售合同书样本
- 2025年科技项目知识产权质押合同
- 2026年邢台应用技术职业学院单招职业倾向性测试必刷测试卷新版
- 房屋权属证书代办委托协议范本
- 2024年行测真题及答案
- 2026年吉林城市职业技术学院单招职业适应性考试题库必考题
- 2026年西藏昌都地区单招职业适应性测试必刷测试卷附答案
- 矩阵论知到智慧树期末考试答案题库2025年哈尔滨工程大学
- 法理学马工程教材
- 2023学年完整公开课版《Ourdreams》教学
- 个人借条电子版模板
- 销售人员绩效考核办法
- 执业兽医兽医公共卫生学课件
- 植入性Holter的临床应用课件
- 嘘 - 副本【经典绘本】
- 小古文《李广射虎》(四年级晨诵)
- 新昌人民医院固定资产及设备全资源管理系统项目采购要素
- 练习打字的文章(精选21篇)
评论
0/150
提交评论