版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、会计学1Logistic回归回归(hugu)(1)第一页,共36页。392讲述内容讲述内容(nirng):(nirng):第一节第一节 logistic logistic回归回归第二节第二节 条件条件logisticlogistic回归回归第三节第三节 logistic logistic回归的应用回归的应用 及其注意事项及其注意事项第1页/共36页第二页,共36页。393目的:作出以多个自变量(危险因素)估计应变量(结果因素)的目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。属于回归方程。属于(shy)概率型非线性回归。概率型非线性回归。资料:资料:1. 应
2、变量为反映某现象发生与不发生的二值变量;应变量为反映某现象发生与不发生的二值变量;2. 自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。第2页/共36页第三页,共36页。394用途:研究某种疾病或现象发生和多个危用途:研究某种疾病或现象发生和多个危 险因素(或保护因子)的数量关系。险因素(或保护因子)的数量关系。 用用 检验(或检验(或u检验)的局限性:检验)的局限性: 1.只能研究只能研究1个危险因素;个危险因素; 2.只能得出只能得出(d ch)定性结论。定性结论。2第3页/共36页第四页,共36页。3
3、95 种类种类: 1. 成组(非条件成组(非条件(tiojin))logistic回归回归方程。方程。 2. 配对(条件配对(条件(tiojin))logistic回归方回归方程。程。第4页/共36页第五页,共36页。396第一节第一节 logistic logistic回归回归(hugu) (hugu) (非条件(非条件logisticlogistic回归回归(hugu) (hugu) )第5页/共36页第六页,共36页。7 1. 1.应用背景应用背景 Logistic Logistic回归模型是一种概率回归模型是一种概率模型,适合于病例模型,适合于病例对照研究、随访对照研究、随访研究和横断
4、面研究,且结果发生的变研究和横断面研究,且结果发生的变量取值必须是二分量取值必须是二分(r fn)(r fn)的或多项的或多项分类。可用影响结果变量发生的因素分类。可用影响结果变量发生的因素为自变量与因变量,建立回归方程。为自变量与因变量,建立回归方程。第6页/共36页第七页,共36页。82、Logistic回归模型(mxng)的数据结构第7页/共36页第八页,共36页。9 n yn an1 an2 an3 anp n其中:y取值是二值或多项分类第8页/共36页第九页,共36页。第9页/共36页第十页,共36页。11两个,不满足正态分布。两个,不满足正态分布。第10页/共36页第十一页,共36
5、页。12l 令: y=1 发病(f bng)(阳性、死亡、治愈等)l y=0 未发病(f bng)(阴性、生存、未治愈等)l 将发病(f bng)的概率记为P,它与自变量x1, x2,xp之间的Logistic回归模型为:l可知,不发病(f bng)的概率为:l )exp(1)exp(110110ppppXXXXp )exp(111110ppXXp 第11页/共36页第十二页,共36页。经数学变换(binhun)得:定义:为Logistic变换(binhun),即: ppXXpp 110)1/(ln)1/(ln)(logpppitppXXpLogit 110)(第12页/共36页第十三页,共3
6、6页。14 4、回归系数i的意义 流行病学的常用指标优势比(odds ratio,OR)或称比数比,定义为:暴露(bol)人群发病优势与非暴露(bol)人群发病优势之比。 即Xi的优势比为:)1/()1/(0011PPPPORiiiPitPitORLn)0() 1()0(log)1 (log)(00第13页/共36页第十四页,共36页。ibi的标准差。为的标准差,为其中ySXSSSbbyiiyiii,/*影响越大。其因素对的估计值,此值越大,为Ybii)(96. 1exp(iibSEb 第14页/共36页第十五页,共36页。二 、Logistic回归(hugu)的参数估计及意义 Logisti
7、c回归(hugu)的参数估计及意义 P表示某个体(gt)发生某病的概率,自变量表示m个危险因素,式中的常数项表示在无各危险因素时的发病概率对不发病概率之比的自然对数,而logistic回归系数表示当危险因素每变化1个单位时(其它危险因素取值的变化量。 通常用最大似然估计法求解模型中参数的估计值 似然函数 niYiYiiiPPL11)1(第15页/共36页第十六页,共36页。pii, 2 , 1 , 0, 0 0i20i0i计算(j sun)统计量为:Wald2,自由度等于(dngy)1。第16页/共36页第十七页,共36页。182d2lndGDD 不包含此变量的模型 包含此变量的模型不含此变量
8、的似然函数含此变量的似然函数第17页/共36页第十八页,共36页。19Model Parameter -2lnL P-value G Score 1 0 244.346 0.02 - - 2 0, 1 236.736 0.03 7.610 7.854 3 0, 1, 2 227.200 0.06 9.536 6.898 4 0, 1, 2,3 222.616 0.09 4.583 5.309 Comparing Model 3 and 4 200.227ln2L 616.222ln2L 583. 4616.222200.227)ln2(ln2LLG 13412kk, 05. 0P Model
9、4 is the best model 第18页/共36页第十九页,共36页。20Wald 检验 将各参数的估计值jb与 0 比较,而用它的标准误jbS作为参照,检验统计量为 2, 1jjjjbbbbuSS2 或 221220111022120.8856 34.860.15000.5261 11.200 :0, :0, 0.05,:0, :0,.157 0 05,2.HHHH 2值均大于 3.84,说明食道癌与吸烟、饮酒有关系,结论同前。 2.第19页/共36页第二十页,共36页。21第20页/共36页第二十一页,共36页。22第21页/共36页第二十二页,共36页。、似然比检验(jinyn)
10、检验(jinyn)统计量为 )ln(ln201LLG G服从(fcng)2分布, 自由度为增加变量的个数。、Wald检验(jinyn) 检验(jinyn)统计量为22)(SE第22页/共36页第二十三页,共36页。第23页/共36页第二十四页,共36页。25第24页/共36页第二十五页,共36页。26应的优势比ORi=exp(bi)1,说明该因素是保护因素。n第25页/共36页第二十六页,共36页。27 method method中文名称中文名称剔除依据剔除依据EnterEnter全部进入全部进入Forward:condiForward:conditionaltional向前逐步向前逐步条件参
11、数估计似然比条件参数估计似然比Forward:LRForward:LR向前逐步向前逐步最大偏似然估计似然比最大偏似然估计似然比Forward:WaldForward:Wald向前逐步向前逐步WaldWald统计量统计量Backward:condBackward:conditionalitional向后逐步向后逐步条件参数估计似然比条件参数估计似然比Backward:LRBackward:LR向后逐步向后逐步最大偏似然估计似然比最大偏似然估计似然比Backward:WaldBackward:Wald 向后逐步向后逐步WaldWald统计量统计量第26页/共36页第二十七页,共36页。28第27页
12、/共36页第二十八页,共36页。例 题第28页/共36页第二十九页,共36页。性别年龄学历体重指数家族史吸烟血压总胆固醇甘油三脂hdlldl糖尿病160221114.301.501.242.300148321114.601.321.152.300263211124.601.151.152.300168322114.151.431.073.210145212113.421.22.632.300145332114.16.96.982.650159211114.321.021.053.490168331113.801.422.86.850263221113.871.552.44.810第29页/共36页第三十页,共36页。因素变量名赋值说明性别X1男=1,女=2年龄X2学历X3小学以下=1,小学=2,初中=3,高中=4,大专及以上=5体重指数X424=1, 2426=2, 26=3家族史X5无=1,有=2吸烟X6不吸=1,吸=2血压X7正常=1,高=2总胆固醇X8甘油三酯X9高密度脂蛋白X10低密度脂蛋白X11糖尿病Y对照=0,病例=1第30页/共36页第三十一页,共36页。第31页/共36页第三十二页,共36页。第32页/共36页第三十三页,共36页。第33页/共36页第三十四页,共36页。第34页/共36页第三十五页,共36页。此表为进入方程的变量,包括回归系数此表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年内镜下胃病变诊疗试题及答案(消化内科版)
- 滑膜炎痤疮脓疱疹骨肥厚骨炎综合征护理查房
- 钢材供应合同
- 2026年河北省事业单位公开遴选笔试试题及答案解析
- 《新能源汽车故障诊断与排除》课件-3-2 旋变信号故障的诊断与排除
- 2026二年级上《表内乘法一》思维拓展训练
- 2026年戏剧基础课程
- 赠与协议模板
- 2026六年级道德与法治下册 心理健康成长
- 2026年特殊钢管行业分析报告及未来发展趋势报告
- 2026年江苏苏锡常镇四市高三下学期二模物理试卷和答案
- 国家事业单位招聘2025中国宋庆龄青少年科技文化交流中心招聘人员笔试历年参考题库典型考点附带答案详解
- 安徽省合肥市2026届高三下学期第二次教学质量检测政治卷及答案
- 共推生态墨脱建设方案
- 上海杉达学院《金融学基础》2025-2026学年期末试卷
- 2025年重庆市渝北八中教育集团渝北校区小升初数学试卷(含解析)
- 2026安徽省交控建设管理有限公司校园招聘5人笔试参考题库附带答案详解
- 危险品司机考核制度
- GB/T 46940-2025中医药中医临床术语系统分类框架
- 生产型企业全套财务制度
- 护工预防跌倒培训课件
评论
0/150
提交评论