调查数据分析二元Logistic回归_第1页
调查数据分析二元Logistic回归_第2页
调查数据分析二元Logistic回归_第3页
调查数据分析二元Logistic回归_第4页
调查数据分析二元Logistic回归_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

许多社会科学观察是分类的,而不是连续的。例如,是否选举候选人经常是政治学研究的课题。经济研究涉及是否出售或购买某种商品,是否签订合同等。这种选择措施通常分为两类,即“是”和“否”。在社会学和人口研究中,人们的社会行为和事件的发生如犯罪、逃学、迁移、结婚、离婚、生病等。可以根据两个分类变量进行测量。对数线性模型通常用于分类变量的分析,当因变量是二元变量时,对数线性模型变成逻辑回归模型。逻辑回归是一个概率模型,所以它可以用来预测一个事件的概率。例如,购买某种产品的可能性可以根据消费者的某些特征来判断。目的:建立多自变量的logistic回归方程来估计因变量。它属于概率非线性回归。数据:1。因变量是反映现象发生和不发生的二元变量;2.所有或大部分独立变量应该是分类变量,可能有一些数字变量。分类变量应该量化。目的:研究哪些变量影响因变量、影响程度、方向、大小等。4,逻辑回归模型,1。模型2介绍。逻辑回归模型的估计。逻辑回归模型4的评估。逻辑回归系数5的统计推断。逻辑回归诊断,回归模型二元逻辑回归模型。当虚拟变量是因变量时,虚拟变量有两个值,可以使用二元逻辑回归。例如,在一项关于公共交通的调查中,调查项目之一是“乘公共汽车或骑自行车上下班”。因变量有两个值,当值为1时,乘公交车上下班;值为0,骑自行车上下班。回归模型二元逻辑回归模型,回归模型二元逻辑回归模型,自变量(解释变量):X1:年龄,取值范围为18-58;X2:月收入(元),价值850,950,1000,1200,1300,1500,1800,2100;X3:性别,值为1,表示男性;值0表示女性。8、回归建模二元逻辑回归模型,研究目的:X1、X2、X3等因素对因变量(使用何种运输方式)有什么影响?为y和x建立多元线性回归模型?(值0和1),9,回归建模二元逻辑回归模型,建立p(Y=1|X)和X多元线性回归模型?(取值范围0 1),线性回归模型的基本假设:(1)随机误差项的均值为0 :(2)随机误差项的方差相同;(3)随机误差项在不同样本点之间是独立的,不存在序列相关性;(4)随机误差项与解释变量(自变量)不相关;(5)随机误差项遵循正态分布的0均值和相同方差,回归建模二元Logistic回归模型,1,出现概率p的大小范围0,1,以及p与自变量之间的关系难以用多元线性模型来描述。2.当P接近0或1时,P值的微小变化很难用常规方法发现和处理。总的来说,找到P的严格单调函数Q会更方便;同时,要求Q对p=0或p=1附近的微小变化敏感。,回归建模二元逻辑回归模型,13,回归建模二元逻辑回归模型,罗吉斯(P),P,14,回归建模二元逻辑回归模型,建立罗吉斯(P)和x多元线性回归模型:(取值范围- ),优势比(Ods),15,逻辑回归模型,逻辑回归模型:16,逻辑回归模型估计:最大似然估计,逻辑回归模型估计的假设不同于OLS。(1)逻辑回归的因变量是二元变量。(logistic回归的因变量和自变量之间的关系是非线性的。(3)在逻辑回归中没有相同分布的假设。(4)逻辑回归没有关于自变量(离散、连续、虚拟)的“分布”的假设。logistic回归模型估计:最大似然估计,多元回归采用最小二乘估计,最小化因变量真值与预测值之差的平方和;逻辑斯蒂变换的非线性特征使得在估计模型时可以通过使用最大似然估计的迭代方法来找到系数的“最可能”估计,并且在计算整个模型的拟合度时可以使用似然值。18,逻辑回归模型估计:最大似然估计,最小二乘估计(OLS):根据线性回归模型,选择参数估计,使估计值和模型真实值之间的偏差平方和最小。最大似然估计:选择最大化似然函数的参数估计。因为所有的观测值都是相互独立的,它们的联合分布如下:最大似然估计,20,寻找似然函数的最大值,21,分别寻找参数的偏导数,然后使其等于0:寻找估计值,从而获得(pi的最大似然估计),这是在给定的xi下yi=1的条件概率的估计,并且它表示逻辑回归模型的拟合值。逻辑回归模型估计:最大似然估计,22,解释逻辑回归系数,所以当其他变量保持不变时,单位数量的增加对对数发生率的影响比为1,这表明当变量增加时,Y=1事件的发生率较高。逻辑回归模型估计:最大似然估计,24,逻辑回归模型的评估,1 goonessoff it)1.1皮尔逊检验,1.2霍斯默-勒默肖检验,2逻辑回归模型的预测精度:柯克斯内尔斯夸尔斯指数和纳格尔克尔斯夸尔斯指数。Logistic回归模型的拟合优度检验、拟合优度检验是通过将模型预测的事件发生和不发生的频率与实际观测值进行比较来进行检验的。如果预测值更接近实际观测值,模型的拟合效果更好。模型的拟合优度检验方法包括偏差检验、皮尔逊检验和Homser-Lemeshow。分别计算统计量X2D、X2P和X2HL。统计值越小,相应的概率就越大。原假设H0:模型拟合效果好。模型的拟合优度信息指数为:-2nl、AIC和SC。这三个指标越小,模型越适合。26,类R2是预测精度的粗略近似值。当自变量完全独立于因变量时,类R2值接近0;当和模型能够很好地预测时,类R2模型的预测精度接近1。2.1逻辑回归模型、27的预测精度、2逻辑回归模型、以及CoxSnellRSquare指数,其中总和表示零假设模型和集合模型各自的似然值,n是样本量。逻辑回归模型的预测精度为28,2.1。然而,对于逻辑回归,上面定义的R的最大值小于1。提出了logistic回归的调整决定系数,logistic回归模型的统计推断值为30。logistic回归方程的检验(模型回归系数的总体检验):似然比检验(似然比检验),计分检验和Wald检验的Logistic回归系数的显著性检验:Wald检验Logistic回归参数的置信区间,Logistic回归参数的置信区间出现率的置信区间测试方法包括likehoodratiotest、scoretest和waldtest。在这三种方法中,似然比检验是最可靠的,评分检验一般与之一致,但两者都需要大量的计算。然而,沃尔德检验没有考虑各种因素的综合影响。当因素之间存在共线性时,结果不如另外两个可靠。似然比检验是通过比较两个模型的对数似然函数的变化来进行的,这两个模型包含或不包含一个或几个待检验的观测因子,其统计量为G(也称为偏差)。当样本量G=-2(lnLp-lnLk)较大时,G近似服从2-分布,自由度为待测因子数。似然比检验,当G大于临界值时,接受H1,拒绝无效假设,认为总体上适合进行逻辑回归分析,建立回归方程。Logistic回归系数显著性检验,为了确定哪些自变量可以进入方程,还需要对每个自变量的回归系数进行假设检验,判断它是否对模型有贡献。WaldX2测试是常用的。logistic回归系数的显著性检验& Wald检验是基于大样本下值服从正态分布的性质。这是标准误差。原假设:该自变量下的回归系数=0,36,Logistic回归参数的置信区间,Logistic回归系数的置信区间为:发生率的置信区间,37,二元逻辑回归。回归建模二元逻辑回归模型=0,36,逻辑回归可以直接预测事件发生的概率,如果预测概率大于0.5,则预测事件的发生(y=1);如果预测概率小于0.5,则不会发生(Y=0)。43、逻辑回归模型诊断、多重共线性异常值诊断、44、多重共线性诊断、相关系数矩阵容差方差扩展因子因为只关心自变量之间的关系,所以容差指数可以通过线性回归得到。45,异常值的诊断(1),归一化残差(Pearson残差)yj是第j个协变量组合的正值(值为1),观察值的数目nj是第j个协变量组合的观察单位的数目Pj是第j个协变量组合的概率估计,通常认为如果残差值超过2,它可能是异常点,46,异常值的诊断(2),偏差残差,其中sgn表示该公式的符号与(YY)的符号相同通常认为,如果残差超过2,则可能是异常点。47.示例:影响高中毕业生继续在大学学习的可能性的因素,如果高中毕业生进入大学,y=1;如果你不上大学,y=0。p是高中毕业后进入大学的概率。自变量为性别(1为男性,0为女性)、高中类型(1为重点中学,0为普通中学)和高中成绩均值。前两个是虚拟变量,Meangr是连续变量。逻辑回归模型是:48,数据,49,最终的回归结果是:二元逻辑回归模型与分组数据,例如:在一个房展会,总共n=313名客户签署了初步意向书与房地产开发商。在接下来的三个月里,只有一些顾客真正买了房子。购买房屋的顾客被计为1,而不购买房屋的顾客被计为0。以客户年家庭收入(万元)为自变量x,建立了Logistic回归模型。分组数据的二元逻辑回归模型,分组数据的二元逻辑回归模型,分组:9个组,不同的组,不同的家庭年收入(10,000元),分组数据的二元逻辑回归模型,转换后的模型是一个普通的线性模型,分组数据的二元逻辑回归模型,该回归模型可以用来预测购买比例,例如,当收入x=8,实际购买比例估计为59%的家庭年收入80,000元与房地产开发商在交易会上签署了初步购买意向书。分组数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论