抽样研究与估计性分析_第1页
抽样研究与估计性分析_第2页
抽样研究与估计性分析_第3页
抽样研究与估计性分析_第4页
抽样研究与估计性分析_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样 研究与估计性分析 公共卫生学院卫生统计教研室 易 静 一、 抽样研究 1. 为什么进行抽样研究? 2. 抽样研究的目的 3. 抽样时考虑的问题 4. 抽样研究的基本类型 5. 常用抽样方法和常用分组方法 3. 抽样时考虑的问题 从研究方来考虑 从被研究方来考虑(研究对象) 从社会与自然环境条件考虑 ( 1) 研究目的 ( 2) 投入的人、财、物、时是否充沛 ( 3) 质量控制是否全面严格 ( 4) 对历史情况和相关文献参考信息( 、 s、 p、 是否掌握 ( 5) 激励措施的运用(劳务补偿、礼品)和组织宣传管 理措施的实行 ( 6) 失访、无效或失败(包括死亡)比例的预测 x( 1)对象是什么 人群 单位 动物 ( 2)对象的总体规模 ( 3)对象是否愿意合作 ( 4)访问和测试对象是否存在客观困难 ( 5)协调人、联系人 ( 1)取样可行性(远近、交通方便否、自然 风险、气候等) ( 2)社会结构特点差异悬殊性(经济、文化、 年龄、社交、见识和理解能力等) ( 3)组织与投入艰巨性(可利用集会、赶集、 喜丧事等 ) 4. 抽样研究的基本类型 按时间划分 按抽取样本的方式划分 按资料性质、分析方法划分 现状或横断面抽样研究 回顾性抽样研究:病例 由果溯因 前瞻性抽样研究:队列研究 ( 由因探果 概率抽样 单纯、系统、分层、整群、多阶段、结合式 非概率抽样 偶遇、判断、定额、滚雪球 定性调查 访谈、二分类记录 定量调查 问卷与量表、仪器测定 常用抽样方法 单纯随机抽样 ( 系统随机抽样 ( 分层随机抽样 ( 整群随机抽样 ( 结合型:分层整群随机抽样 多阶段随机抽样 常用随机分组方法 完全随机分组 ( 分层随机分组 ( 例 试将 10头动物应用随机数字表分配到甲 、 乙两组 。 按动物体重编号 。 从某随机数字表的第 21行 , 第 21列往右查 10个 2位数的随机数 。 规定奇数为甲组 , 偶数为乙组 。 动物编号 1 2 3 4 5 6 7 8 9 10 随机数字 68 47 22 0 20 35 55 31 51 83 组 别 乙 甲 乙 乙 乙 甲 甲 甲 甲 甲 1 1 1 2 2 2 3 3 3 动物编号 1 2 3 1 2 3 1 2 3 随 机 数 别 丙组 甲组 乙组 乙组 甲组 丙组 甲组 乙组 丙组 4 4 4 5 5 5 6 6 6 动物编号 1 2 3 1 2 3 1 2 3 随 机 数 别 丙组 乙组 甲组 乙组 丙组 甲组 乙组 丙组 甲组 例 二、抽样研究时对象基本情况的考虑 1. 同质性和纳入标准 2. 对处理因素反应的敏感性和稳定性 3. 随机性 4. 独立性 5. 数量性( 、 1 、 / ) 6. 依从性 四个主要因素: 、 1 、 、 ( ) 第一类错误的概率 ,即检验水准 越小,所需样本含量越多。一般取 =应明确单双侧。 检验效能 1 为第二类错误的概率, 1表示在特定的 水准下, 1越大,所需样本含量越多。通常取 =般 1不能低于 样本含量的估计 允许误差 样本和总体间或两个样本间某统计量的差别大小 。 如 =12, 或 =12。 越小 , 所需样本含量越 多 。 可通过预实验或用专业上有意义的差值代替 。 总体变异度( 或 ) 越大,所需样本含量越多。通常根据预实验、查阅 文献和专业知识判断 值。 2222/ 222/ 1- u n , 2 / 05 . 0 t - 1. 估计总体均数 有单侧和双侧之分 , 只取单侧值 。 先采用自由度 ;然后利用算出的 n查 再计算 n, 直至 t t t 1 2 2 2. 单样本均数检验或均数的配对检验 例 某医师试验某种升白细胞药的疗效,先以 9 例低白细胞 病人做预试验,结果计算出用药前后白细胞差值的标准差为 2 . 5 千个 / m 或 1 09/ L ) ,现要做正式临床试验,且要求白细 胞平均上升 1 千个 / m 或 1 09/ L ) 才算该药有临床实际有效, 问要多少病人进行正式临床试验? 解:本例 1 , 2 . 5 ,单侧 0 . 0 5 , 单侧 0 . 1 , 先以 查 t 界值表 , 得, 1 . 6 4 5 , , 1 . 2 8 2 , 代入公式 。 ( n,取 54 再以 54 1 53 查 t 界值表 ,得53, 53, 代入前式, 5 5 . 212 . 51 . 2 9 81 . 6 7 42( 2 ) n,取 56 。 再以 56 1 55 查 t 界值表,得55, 1. 6 7 3 , 55, 7 , 再代入前式, 5 5 . 112 . 51 . 2 9 71 . 6 7 32( 3 ) n,取 56 。 查统计书找相应的样本量计算公式 三、概率性抽样研究的基本程序 1. 设计抽样方案 2. 编制抽样框 (设计调查表 ( 3. 预调查和预实验(试验) 4. 正式抽样 5. 资料输入与整理 6. 数据分析 7. 总结评价 四、适应现代小区楼群的 to 例:某社区总户数 20000,分属 80栋楼(每栋楼户数不一样),现决定抽 2400户( 24栋楼、每栋楼 100户)。 抽样操作规则 ( 1) 80栋楼按坐落位置、层数、结构和朝向分组类 ( 2)各组类中均抽取,达 24栋 ( 3)被抽中楼内不采取系统抽样 ( 4)户内采用出生日期距离法或 ( 5)调整户数采用随机抽余楼对层对户方法 特定一栋楼每户)被抽中的概率是不一样的,但对全部各楼各户主被抽动中概率完全相等。 五、流动总体抽样 (捕获 标记 再捕获抽样 ) 1. 用于估计总体对象数(总体 ( M :捕获和标记数; n:再捕获数; x:再捕获中的标记数) 2. 用于估计总体阳性数(总体 例:某地人口 3657394,抽取 n=3705,恶性肿瘤 x=8,估计总体恶性肿瘤数? M=7897 )1( )()1( 22 nn 7 7 8 1 0 0 02 S 计性分析 1. 对总体参数进行点估计 ( 1)点估计、点估计量特性 ( 2)数值变量资料点估计 2. 对总体参数进行区间估计 与之区别的概念:临床参考值 集中位置 正态分布 对数正态 偏态单峰 )lg( n XG i )lg( f i 分组(频数表) 不分组(原始数据) 分组(频数表) 分组(频数表) 不分组(原始数据) 不分组(原始数据) 12 n 1 1 2 2 3 31 2 3 f X f X f f f f f %5021 nd 122 正态分布 对数正态 偏态单峰 Q=1/)( 22( 22数表)标准差 不分组(原始数据)标准差 )1 /)(lg( ( 1)作图法 ( 2)偏度与峰度 ( 3) ( 4) 临床参考值制定 ( 1)选择适宜人群 ( 2)方法学要求(方法、样品、 4 ( 3)单双侧 ( 4) 测量值( x)分布 ( 5)正态分布、百分位界 正态大样本 双侧 对数正态大样本 偏态分布大样本 正态大样本 单上限 对数正态大样本 偏态分布大样本 正态大样本 单下限 对数正态大样本 偏态分布大样本 X 96.1xx 96.1(lg X )64.1(lg X x p0 95xx p m a )64.1(lg X ( 1)抽样误差 ( 2)抽样分布 ( 3)区间估计含义 ( 4)区间估计方法 抽样误差的概念:于抽样引起的样本统计量与总体参数之间的差异。 抽样误差的原因:抽样的偶然性、个体变异。 抽样误差的度量 正态分布 二项分布 泊松分布 p /)1( 1/ s 大样本 服从 的正态分布, 正态总体抽样 小样本 服从 单峰对称分布, 大样本( 不偏) 二项分布 二项总体抽样 根据中心极限定理 小样本 大样本( ) 服从 的泊松分布 泊松分布总体抽样 根据中心极限定理, 亦近似正态 小样本 只服从于 的泊松分布 x ),( x)/)1(,( n x ),( xSs s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论