Logistic模型应用的方法与技术_第1页
Logistic模型应用的方法与技术_第2页
Logistic模型应用的方法与技术_第3页
Logistic模型应用的方法与技术_第4页
Logistic模型应用的方法与技术_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Logistic模型应用的方法与技术 宁波大学医学院沈其君 问题提出 可用于慢性非传染性疾病的病例对照资料分析 可用于病例对照研究资料分析 不仅限于病例对照研究资料分析 样本量要求50以上 对调查的因素或变量先做单因素Logistic模型分析 再有意义的因素变量做多因素变量筛选 即可获得模型分析结果 问题提出 模型分析结果为某一些因素变量有统计学意义 模型拟合良好 P 0 8256 P 0 05 模型分析结果与专业解释有矛盾 专业上认为有意义的 检验结果无意义 或虽有统计意义 但符号和方向相反 自变量为计量资料 数值变量 信息最多 变量处理上比较简单 可直接进入模型分析 Logistic模型应用的方法与技术 适用资料和研究设计类型与模型分析目的模型的应用条件Logistic模型的样本量资料准备与变量设置变量筛选与因素分析Logistic模型的流行病学意义不同分析目的和设计类型对分析结果选取 适用资料与研究设计类型 病例对照研究资料成组设计个体匹配 1 1 1 M N M 和频率匹配横断面调查观察资料队列研究资料 封闭队列 随机对照试验资料交叉试验设计资料药物与毒物剂量反应研究资料 模型的分析目的 因素分析 自变量与因变量间有无关联性在调整和控制其他因素条件下研究自变量与因变量间的关系可能的危险因素 结合设计与专业问题剂量反应关系 连续与有序多分类 自变量与因变量关系的形态 线性 型 型 对数线性等 模型分析目的 建模预测判别 分析的基础上建立Logistic回归方程 用于因变量的预测与判别仅对前瞻性研究资料 包括临床随机试验 反映模型拟合度的指标要好回代符合率与前瞻符合率要高对模型的适合性有较高要求有较好专业研究基础 应用条件 Logistic模型是以二项分布为基础独立 重复 互拆独立 各个体间发病 事件 相互不影响重复 各个体事件发生的条件相同且有一定的重复数 多个调查结果的合并分析与样本量 互拆 只有两种对立的结果 两分类 应用条件 实例分析 在高血压患病率与危险因素的现况调查中 以高血压病人为病例 非高血压病人为对照 应用logistic模型分析影响高血压发病的可能危险因素 GEE模型 应用logistic回归模型分析传染病病例对照研究资料 探索传染病发病的可能影响因素 Logistic模型的样本量 研究对象个数大于参数个数一般为自变量个数 参数个数 的5 10倍小样本时模型效率较差 传统概念为50与参数个数 病例与非病例的比例 比数比 OR 大小有关 中国公共卫生 中国卫生统计学 许多情况下样本量50仍有效确切Logistic回归模型 资料准备 变量设置 二分类变量 直接设置成0 1变量无序多分类 计数资料中的多分类 将k类设置成k 1个0 1变量 血型x1x2x3O型000A型100B型010AB型001 血型x1x2x3O型100A型010B型001AB型000 资料准备 变量设置 有序多分类变量 等级分组资料 设置成0 1 2 3 4 根据专业问题设置成特殊的数量等级关系 如0 1 5 3 5转换成k 1个0 1变量例如大便隐血试验结果 隐血试验结果X1X2X3X4 0000 1000 0100 0010 0001 资料准备 变量设置 计量资料 连续性变量 以原始变量值进入将原始变量值作适当变换 如对数变换 后进入 从专业上和数量关系上先进行探索将原始变量值中心化 尺度化和标准化将连续性变量离散成有序多分类 或再转化为0 1变量 探索规律 不十分准确离散较大 从专业探索与多种方式偿试Datacleaning 变量筛选与因素分析 单变量分析与多变量分析一般软件中有逐步筛选法 向前法和向后法变量简单筛选只是最初步分析 可能会产生不理想或有矛盾的结果 单变量分析作用 探索计量资料变换规律部分因素变量进行多种变量设置后进入模型 或调整不同的基础水平可区分混杂因素与处理因素 但是相对 混杂因素设置可粗一些 处理因素设置要精细一些 因素分析 实例分析 妇女年龄与低出生体重的关系分析 年龄在16 45岁直接输入无统计意义或弱统计意义标准化或转换无改变用0 1变量分析 以低年龄组为基准 中间年龄危险度低 高年龄组危险度高 分别以中间年龄组和高年龄组为基准分别进行分析 可能的矛盾结果及原因分析 因素应有意义 回归系数无统计意义 回归系数的符号与专业意义相反变量筛选过程中变量有进有出 变量间作用可能有包含有重叠作用选用不同的 水平 结果相差较大或截然不同的结果选用不同的基础水平或不同的变量设置或转换方式结果相差较大或相反 可能的矛盾结果及原因分析 变量 因素 间有相关性 共线性重要直接的变量未调查或未引入模型样本有偏性或有局限 取值范围较窄样本量较少变量设置不合理研究问题不适合用乘法Logistic回归模型 还有加法模型 幂转换模型 非线性模型或其他模型 可能解决的处理方法 Datacleaning分析数据结构 数据的分布范围 相互关系 因素和变量重新设置 其他多元统计方法先处理或专门的分析模型 从专业上分析研究问题的重要变量和样本的局限性 取值范围是否较窄 深入进行因素分析 重新设置变量取值试用其他分析模型 加法模型 构造非线性模型 广义相对危险度模型 Logistic模型参数意义与结果选取 病例对照研究b0受病例组与对照组从相应总体抽样的抽样比 1 0 影响 其关系为b0 b0 ln 1 0 病例对照研究中 当因素为两分类时 OR eb 在任何设计中 当因素为有序多分类或数值变量时 OR exp b xk x1 例某研究者欲比较3个不同的药物治疗病情不同的某病的效果 研究数据见

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论