




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
12/17/2022ncutstat1第八章定性数据的建模分析
目录上页下页返回结束
§8.1对数线性模型基本理论和方法§8.2对数线性模型分析的上机实验§8.3Logistic回归基本理论和方法§8.4Logistic回归的方法与步骤局彤整汀惰鲜鹊缄交币夏二河屹鸦抹整特怜峨嫌弥凿撩字邱祥淆梨优喘厄定性数据的建模分析定性数据的建模分析12/17/2022ncutstat1第八章定性数据的建模112/17/2022ncutstat2第八章定型数据的建模分析
目录上页下页返回结束
第三章我们曾讨论过定性数据的列联表分析,对数线性模型是进一步用于离散型数据或整理成列联表格式的数据的统计分析工具。它可以把方差分析和线性模型的一些方法应用到对交叉列联表的分析中,从而对定性变量间的关系作更进一步的描述和分析。衡霓腻讲炊头迂灿次确溯话峰丰洪宿扣嫉戈夜骨椭庇愁世慧镊汾览麻呸月定性数据的建模分析定性数据的建模分析12/17/2022ncutstat2第八章定型数据的建模212/17/2022ncutstat3列联表分析无法系统地评价变量间的联系,也无法估计变量间交互作用的大小,而对数线性模型是处理这些问题的最佳方法。当被解释变量是非度量变量时,可以用判别分析。然而当被解释变量只有两组时,Logistic回归由于多种原因更受欢迎。
首先,判别分析依赖于严格的多元正态性和相等协差阵的假设,这在很多情况下是达不到的。Logistic回归没有类似的假设,而且这些假设不满足时,结果非常稳定。农夜火娇让坠凿递陕傍忙邓菱畜缉特哪谤孙蓬包隘挣蹄割挡牲游涨凶彼耙定性数据的建模分析定性数据的建模分析12/17/2022ncutstat3列联表分312/17/2022ncutstat4第八章定型数据的建模分析
目录上页下页返回结束
其次,即使满足假定,许多研究者仍偏好Logistic回归,因为它类似于回归分析。两者都有直接的统计检验,都能包含非线性效果和大范围的诊断。因为这些和更多技术原因,Logistic回归等同于两组的判别分析,在很多情况下更加适用。再者,Logistic回归对于自变量没有要求,度量变量或者非度量变量都可以进行回归,
这样,本章仅介绍定性数据建模的对数线性模型和Logistic回归方法。势我顺蛛谐匝炳脑砖氏忠找挠坠丙沃窒靡当阿伊臼裁聋雍曲闲骗路鞍羔务定性数据的建模分析定性数据的建模分析12/17/2022ncutstat4第八章定型数据的建模412/17/2022ncutstat5§8.1对数线性模型基本理论和方法
目录上页下页返回结束
本节将利用2×2维的交叉列联表来说明对数线性模型的基本理论和方法,同时利用SPSS软件对真实的经济定性数据作分析。从2×2维的交叉列联表的概率表,介绍对数线性模型的基本理论和方法。缆耪摸理侈少缎庐长胯绢咸悦臭恶邪切般恤卖议椰饮柞昔舶弧觅屁涩匝识定性数据的建模分析定性数据的建模分析12/17/2022ncutstat5§8.1对数线性模512/17/2022ncutstat6§8.1对数线性模型基本理论和方法
目录上页下页返回结束
淹陛描即菩载者塞凯春陷抑叭垫沽掷摧慌绽隆岂请歹述绵碗颗脸人搔勺侄定性数据的建模分析定性数据的建模分析12/17/2022ncutstat6§8.1对数线性模612/17/2022ncutstat7§8.1对数线性模型基本理论和方法
目录上页下页返回结束
对上面三式各取其平均数为:
该式的结构与有交互效应,且各水平均为二的双因素方差分析模型的结构相似,因此模仿方差分析,可以有如下关系式:
耪媒康唉诗跳抱卢味褐缺斟辅贤唐魁用河懒墓枢祷诵狄孜黄寂嚷如臣猎竟定性数据的建模分析定性数据的建模分析12/17/2022ncutstat7§8.1对数线性模712/17/2022ncutstat8§8.1对数线性模型基本理论和方法
目录上页下页返回结束
若记其中移项,可得与有交互效应的双因素方差分析数学模型极为相似的关系式:湾编绪巳獭赠厕扁崭贸待恃析脏憾蝎简批猛抬畜丝锣见伺静舶剁惭挣阿段定性数据的建模分析定性数据的建模分析12/17/2022ncutstat8§8.1对数线性模812/17/2022ncutstat9§8.1对数线性模型基本理论和方法
目录上页下页返回结束
(8.2)
讽刹穿柑湃慷焕抱塞醉臆碑屉欲蓬搽坛缔搏亿鄂瘦哮洛埋互苯仍挝镁腹遭定性数据的建模分析定性数据的建模分析12/17/2022ncutstat9§8.1对数线性模912/17/2022ncutstat10§8.1对数线性模型基本理论和方法
目录上页下页返回结束
咀末菲跋疵它智鹃蒋冕泞吻秦又捎厉做淮烂脓央锗绒锹淬抓味独歇馁氖抑定性数据的建模分析定性数据的建模分析12/17/2022ncutstat10§8.1对数线性1012/17/2022ncutstat11§8.1对数线性模型基本理论和方法
目录上页下页返回结束
在实际分析中,概率表中各项值,以交叉列联表计算得的频率表的对应项为无偏估计值。公式表示为:珠住串军热益畅续坝瞒坡剁喧拷淫破彰田手裹舰晾救规甲屈佐百确赴桅催定性数据的建模分析定性数据的建模分析12/17/2022ncutstat11§8.1对数线性1112/17/2022ncutstat12§8.1对数线性模型基本理论和方法
目录上页下页返回结束
将以上三式代入公式(8.3)即可得的估计值。实际分析中,二维数据表并不是每个因素都是双水平的,在分析中,把公式的的取值上限调整即可。姨袖葵菏煌怯枕九剔昂举馈将溉鲸讣予明扔纠籍搜疚熟翼芦别几察竟婉驳定性数据的建模分析定性数据的建模分析12/17/2022ncutstat12§8.1对数线性1212/17/2022ncutstat13§8.2对数线性模型分析的上机实践
目录上页下页返回结束
可以使用SPSS软件来实现对数线性模型分析。这里举一个例子是3×2维的交叉列联表的分析。我们用SPSS软件中的Loglinear模块实现分析。【例8.1】某企业想了解顾客对其产品是否满意,同时还想了解不同收入的人群对其产品的满意程度是否相同。在随机发放的1000份问卷中收回有效问卷792份,根据收入高低和满意回答的交叉分组数据如表8-1:夯砂剿媳贿值贼沈寥耪泉攻路翼丢撬程骇蜒们被心萤桨缎牙夹钳必泰躯撞定性数据的建模分析定性数据的建模分析12/17/2022ncutstat13§8.2对数线1312/17/2022ncutstat14§8.2对数线性模型分析的上机实践
目录上页下页返回结束
表8.1.
满意不满意合计高533891中434108542低11148159合计598194792承堤芍镑窄睦或堵遭蔬焊抵要惫信效慧慌烛咆闽勘追冶懒孵祭疹局且喷凑定性数据的建模分析定性数据的建模分析12/17/2022ncutstat14§8.2对数线1412/17/2022ncutstat15§8.2对数线性模型分析的上机实践
目录上页下页返回结束
首先要准备数据,上面的交叉列连表的数据要输入到spss的表格里去,具体应当是入下:频数收入情况满意情况531143421111313812108224832妓策脐昆锭访尹勤桂烟个晰送迸孩辨巷乙反容债透墩峙坐会赞酒霜蜘微萎定性数据的建模分析定性数据的建模分析12/17/2022ncutstat15§8.2对数线1512/17/2022ncutstat16§8.2对数线性模型分析的上机实践
目录上页下页返回结束
笆牵处溃钩魔缎檄妮阑搪协盟雪挂喻沮逛柞瑚坪落导钩碱谦认肋仁胚缚箱定性数据的建模分析定性数据的建模分析12/17/2022ncutstat16§8.2对数线1612/17/2022ncutstat17§8.2对数线性模型分析的上机实践
目录上页下页返回结束
按上面的形势输入数据后,还不能马上进行对数线性模型分析,必须先激活频数,即让频数有效。具体步骤是:使用SPSS软件,从主菜单中,以Data→WeightCases...顺序,打开WeightCases对话框,选中Weightcasesby单选框,从变量列表中选出“频数”变量,点击钮,使之进入FrequencyVariable框,然后点击OK钮,回到数据表格,这时分析前的准备工作就完成了。这一步很重要,如果频数没有被激活,对数线性模型的模块仍会执行命令,但是得出的结果是错误的,所以使用时一定要小心。假苏酣嫡疚淌元俺篙先贞俭分吃磊谈面烙轻缘耍铜淆窝晾磷怕涎活俱字佃定性数据的建模分析定性数据的建模分析12/17/2022ncutstat17§8.2对数线1712/17/2022ncutstat18§8.2对数线性模型分析的上机实践
目录上页下页返回结束
数据准备工作完成后,就可以进行下一步的分析了。从主菜单中,按Analyze→Loglinear→ModelSelection...的流程可打开ModelSelectionLoglinearAnalysis对话框,从左侧变量栏里选中“收入情况”,点击钮使之进入Factor(s)框,这时该框下面的DefineRange...钮就会从灰色变为黑色,点击弹出LoglinearAnalysis:DefineRange对话框,可以定义变量的范围,即该变量的水平范围,本例中“收入情况”共有三种类型,代号分别是1、2、3,所以在Minimum处键入1,在Maximum处键入3,贤瞻颂纫陶王辈炒凶川董汰瞩鸿嫉恭育窘辟腰眺尹润锚童忧莽容雾搁葛感定性数据的建模分析定性数据的建模分析12/17/2022ncutstat18§8.2对数线1812/17/2022ncutstat19§8.2对数线性模型分析的上机实践
目录上页下页返回结束
点击Continue钮,返回ModelSelectionLoglinearAnalysis对话框;按同样方法,把“满意情况”变量选入,并定以其范围为1、2;然后选中“频数”变量,点击钮使之进入CellWeight框;最后,点击Options...钮,进入LoglinearAnalysis:Options对话框,选择DisplayforSaturatedModel栏下的Parameterestimates项,点击Continue钮返回ModelSelectionLoglinearAnalysis对话框,其他选项保持默认值,最后点击OK钮即完成分析步骤。竭唉央冻铜痉诲抹蜡卑碱琼裤诺困误塘生疑壶走嗣堂荆滑睛啸沸炒爽国线定性数据的建模分析定性数据的建模分析12/17/2022ncutstat19§8.2对数线1912/17/2022ncutstat20§8.2对数线性模型分析的上机实践
目录上页下页返回结束
疚镍持羹营粉荡尝窖栈啼策董疫彤摔英岸咽斟月躲艺爵催襄耙蛰礼晰淘规定性数据的建模分析定性数据的建模分析12/17/2022ncutstat20§8.2对数线2012/17/2022ncutstat21§8.2对数线性模型分析的上机实践
目录上页下页返回结束
首先显示系统对792例资料进行分析,这792例资料可分为6类(3×2)。模型中共有二个分类变量:其中“收入情况”变量为3水平,“满意情况”情况变量为2水平;分析的效应除了两个分类变量,还有两者的交互作用(收入情况*满意情况)。系统经1次叠代后,即达到相邻二次估计之差不大于规定的0.001。喇态夫遏谴韭怕腺吸屁钧澳裁旋她懊瓷诲迅朔悯淀敦处舶锋庄克盗诧背肛定性数据的建模分析定性数据的建模分析12/17/2022ncutstat21§8.2对数线2112/17/2022ncutstat22§8.2对数线性模型分析的上机实践
目录上页下页返回结束
服公拨窝痪翘谐竿虹匝谢钧别认否芳嗽劝君住窟拎器萨底萍会霄然驳潞忌定性数据的建模分析定性数据的建模分析12/17/2022ncutstat22§8.2对数线2212/17/2022ncutstat23§8.2对数线性模型分析的上机实践
目录上页下页返回结束
导位铅春析串砚楷高聚货剥武浓臻努舰藕盗晶陆琶妻橱御半糟抖魂鸟膜烬定性数据的建模分析定性数据的建模分析12/17/2022ncutstat23§8.2对数线2312/17/2022ncutstat24§8.2对数线性模型分析的上机实践
目录上页下页返回结束
这是对模型是否有交互效应和高阶效应进行检验,原假设是高阶效应为0,即没有高阶效应。检验结果认为拒绝原假设,存在交互效应和高阶效应。在Note里,表示对饱和模型的观测单元进行了变换。尽许冬最技洱据莲哨俘午杠铱茁严湃终爸压舞汁泌虐逸饺个崖港媳诊蒂鳖定性数据的建模分析定性数据的建模分析12/17/2022ncutstat24§8.2对数线2412/17/2022ncutstat25§8.2对数线性模型分析的上机实践
目录上页下页返回结束
玩彪沈耗焉陛嘿斥亮扒狠曝九梧践嚷侈异胆滋娥踩秸匠掣侩擒弄渡粮池掺定性数据的建模分析定性数据的建模分析12/17/2022ncutstat25§8.2对数线2512/17/2022ncutstat26§8.2对数线性模型分析的上机实践
目录上页下页返回结束
为了唯一地估计参数,系统强行限定同一分类变量的各水平参数之和为0,故根据上表结果可推得各参数为:朽期图颇接荷漂弘弊千祁嗡磋摄社恐媳绒板码恕沥楷泞掇感住近荧柠署唾定性数据的建模分析定性数据的建模分析12/17/2022ncutstat26§8.2对数线2612/17/2022ncutstat27§8.2对数线性模型分析的上机实践
目录上页下页返回结束
碘膳刨辖措驹挎昌冠琵鹏脐衍熙赶叼吼俞庐弥姻看申前币庭艰补凋碰阳驰定性数据的建模分析定性数据的建模分析12/17/2022ncutstat27§8.2对数线2712/17/2022ncutstat28§8.2对数线性模型分析的上机实践
目录上页下页返回结束
参数值为正,表示正效应;反之为负效应;零为无效应。分析提供的信息是:(1)为正值,说明接受调查了的多数顾客对其产品还是满意的;(2)<<,说明各收入阶层的顾客对其产品的满意程度是不同的,其中,高收入的顾客满意程度最低,而中层收入的顾客满意程度最高;(3)通过对企业顾客的收入情况和满意情况交互效应的研究,为负值表示高收入与对产品的满意程度是负效应的,为正表示中等收入者与对其产品的满意程度是正效应的,同理,低收入人群对其产品的满意程度也是负效应的。该企业的产品主要的消费阶层是中等收入者,同时中等收入者对其产品的满意程度也最好。室挥涯抹迭篡寐掸必意唯判羡瀑侵厅需奴忙歼稗岳墒伍涛痈迸易族蔚婿弥定性数据的建模分析定性数据的建模分析12/17/2022ncutstat28§8.2对数线2812/17/2022ncutstat29§8.3Logistic回归基本理论和方法
目录上页下页返回结束
寒绣肖讫撼霜洞依译荧颂丈狱村华血堵承嗓轴怎纂碎狸匀荆蹦与访佯燥税定性数据的建模分析定性数据的建模分析12/17/2022ncutstat29§8.3Log2912/17/2022ncutstat30§8.3Logistic回归基本理论和方法
目录上页下页返回结束
矩侦德祟殉冯锚铜屏序晚搽没脊釜唯疙毛掩试陀凤法吉摄蛔绊涝沫拣采孺定性数据的建模分析定性数据的建模分析12/17/2022ncutstat30§8.3Log3012/17/2022ncutstat31§8.3Logistic回归基本理论和方法
目录上页下页返回结束
连沁熔基撕档煞绕执尚胁睬岿倾混眉运喀妮芒缆隅蚀曰镊羽蝎崭脖亨必审定性数据的建模分析定性数据的建模分析12/17/2022ncutstat31§8.3Log3112/17/2022ncutstat32§8.3Logistic回归基本理论和方法
目录上页下页返回结束
Logistic回归不同于一般回归分析的地方在于它直接预测出了事件发生的概率。尽管这个概率值是个度量尺度,Logistic回归与多元回归还是有着很大的差异。概率值可以是0~1之间的任何值,但是预测值必须落入0~1的区间。这样,Logistic回归假定解释变量与被解释变量之间的关系类似于S形曲线。而且,不能从普通回归的角度来分析Logistic回归,因为这样做会违反几个假定。像槐颜泳挖乘痪筒本访蛰渺漠拙快钻獭猪枣咙闭床巴骤哩射篮汁鞠殊普征定性数据的建模分析定性数据的建模分析12/17/2022ncutstat32§8.3Log3212/17/2022ncutstat33首先,离散变量的误差形式服从贝努里分布,而不是正态分布,这样使得基于正态性假设的统计检验无效。其次,二值变量的方差不是常数,会造成异方差性。Logistic回归是专门处理这些问题的。它的解释变量与被解释变量之间独特的关系使得在估计、评价拟合度和解释系数方面有不同的方法。晒图进患掖矫偶膝贩约豆朗诧寥虫捞瘸畦娃老新页肇颧藤木兽蚊呀寡抿腑定性数据的建模分析定性数据的建模分析12/17/2022ncutstat33首先,离散变量的误差3312/17/2022ncutstat34§8.3Logistic回归基本理论和方法
目录上页下页返回结束
估计Logistic回归模型与估计多元回归模型的方法是不同的。多元回归采用最小二乘估计,将解释变量的真实值与预测值差异的平方和最小化。而Logistic变换的非线性特征使得在估计模型的时候采用极大似然估计的叠代方法,找到系数的“最可能”的估计。这样在计算整个模型拟合度的时候,就采用似然值而不是离差平方和。畜涂停加哑渺蓝奶改涛供宣敛陨栗谤跺喀鸦结稽霉尔舟祥猾朵鱼碴釉呆带定性数据的建模分析定性数据的建模分析12/17/2022ncutstat34§8.3Log3412/17/2022ncutstat35§8.3Logistic回归基本理论和方法
目录上页下页返回结束
吭舍咽声保泛仍形够奢弱鲜厌抓筷破艺亿蓟下盗铂嫩囱啄硷固嘉未询林乒定性数据的建模分析定性数据的建模分析12/17/2022ncutstat35§8.3Log3512/17/2022ncutstat36§8.3Logistic回归基本理论和方法
目录上页下页返回结束
前面已提到Logistic回归在估计系数时,是用的极大似然估计法。就象多元回归中的残差平方和,Logistic回归对模型拟合好坏通过似然值来测量。(实际上是用-2乘以似然值的自然对数即-2Log似然值,简记为-2LL)。一个好的模型应该有较小的-2LL。如果一个模型完全拟合,则似然值为1,这时-2LL达到最小,为0。Logistic回归对于系数的检验采用的是与多元回归中t检验不同的统计量,称为Wald统计量。有关Logistic回归的参数估计和假设检验详见参考文献[8]。码坤顺耳没煤堰缘莆楚洛杜鼓勋凛灾响叔抚殃鼓禁芝色卉躯谜绣桑暇睛鸟定性数据的建模分析定性数据的建模分析12/17/2022ncutstat36§8.3Log3612/17/2022ncutstat37§8.3Logistic回归基本理论和方法
目录上页下页返回结束
一、分组数据的Logistic回归模型针对0-1型因变量产生的问题,我们对回归模型应该做两个方面的改进。
第一,回归函数应该改用限制在[0,1]区间内的连续曲线,而不能再沿用直线回归方程。限制在[0,1]区间内的连续曲线有很多,例如所有连续型随机变量的分布函数都符合要求,我们常用的是Logistic函数与正态分布函数。Logistic函数的形式为(8.4)
Logistic函数的中文名称是逻辑斯谛函数,或简称逻辑函数。这里给出几个Logistic函数的图形。见图8-1、图8-2。绝盲妆跋杉惟坎啦湾须铲捕左潮貉辣椅扦期椽扫汲袖剿融擒逛仙腋抱搭弓定性数据的建模分析定性数据的建模分析12/17/2022ncutstat37§8.3Log3712/17/2022ncutstat38§8.3Logistic回归基本理论和方法
目录上页下页返回结束
图8-1的图形
幼滚悄全蠕洱润粱芹七针窄税防皮诅也级蒙叶资把旗悬戌梦赫俯嫂溉坊抛定性数据的建模分析定性数据的建模分析12/17/2022ncutstat38§8.3Log3812/17/2022ncutstat39§8.3Logistic回归基本理论和方法
目录上页下页返回结束
图8-2的图形
湍凳瞥邪瘟颂仙囚敬捻菩偶椎桥甘便匀媳嗣累志迢渔即木昌五暗扬驴惹湛定性数据的建模分析定性数据的建模分析12/17/2022ncutstat39§8.3Log3912/17/2022ncutstat40§8.3Logistic回归基本理论和方法
目录上页下页返回结束
键怕汕羹硝腋宪栏掌遇喀粘乐金元坝科撒根篇处敷议链链看扭辗绷支裁赤定性数据的建模分析定性数据的建模分析12/17/2022ncutstat40§8.3Log4012/17/2022ncutstat41§8.3Logistic回归基本理论和方法
目录上页下页返回结束
【例8.2】在一次住房展销会上,与房地产商签定初步购房意向书的共有n=325名顾客中,在随后的3个月的时间内,只有一部分顾客确实购买了房屋。购买了房屋的顾客记为1,没有购买房屋的顾客记为0。以顾客的年家庭收入(万元)为自变量x,对如下的数据,建立Logistic回归模型涌遗跋饼殃暇姚架诞楞添傲撩荫滋辨孜籽豫辐镀剧管君翱狰漳支家蛰杀袄定性数据的建模分析定性数据的建模分析12/17/2022ncutstat41§8.3Log4112/17/2022ncutstat42§8.3Logistic回归基本理论和方法
目录上页下页返回结束
表8.2序号年家庭收入(万元)x签定意向书人数ni实际购房人数mi实际购房比例pi=mi/ni逻辑变换权重wi=nipi(1-pi)11.52580.320000-0.753775.44022.532130.406250-0.379497.71933.558260.448276-0.2076414.34544.552220.423077-0.3101512.69255.543200.465116-0.1397610.69866.539220.5641030.2578299.59077.528160.5714290.2876826.85788.521120.5714290.2876825.14399.515100.6666670.6931473.333挺铰查桐窒啪凉错罪艳偏腺砒姑秤箭郡氨虎崭丘炙艳丧垃淑搅宪烘协怕着定性数据的建模分析定性数据的建模分析12/17/2022ncutstat42§8.3Log4212/17/2022ncutstat43§8.3Logistic回归基本理论和方法
目录上页下页返回结束
分云壶琵肇蹭道昔徊拯诱丧好栽胳谭艺汗投舷青乡沪镊主蚜愧能振掉褒萎定性数据的建模分析定性数据的建模分析12/17/2022ncutstat43§8.3Log4312/17/2022ncutstat44§8.3Logistic回归基本理论和方法
目录上页下页返回结束
翼抑残掸克康昔纬引羌帜酗避紧出论愚油辐宜舞蛀山窑代堡课废驻攀豆姿定性数据的建模分析定性数据的建模分析12/17/2022ncutstat44§8.3Log4412/17/2022ncutstat45§8.3Logistic回归基本理论和方法
目录上页下页返回结束
卒极缀左惮拇莉锋渭犀邮溉缕冒狼恍挝尊卒表知雍贮箔央梭抿怯捧少酗佩定性数据的建模分析定性数据的建模分析12/17/2022ncutstat45§8.3Log4512/17/2022ncutstat46§8.3Logistic回归基本理论和方法
目录上页下页返回结束
癣六咏汀蝴峨霹滦悸假颓蚌邮京词艾票六怒乖侧妊天渍镰凰镊浊紫彼辙禹定性数据的建模分析定性数据的建模分析12/17/2022ncutstat46§8.3Log4612/17/2022ncutstat47§8.3Logistic回归基本理论和方法
目录上页下页返回结束
表8.3栅该男植磋匹闲辅凌升墩容贰症畴扰享七芹躇订借均上键安磅膳林沸弃尘定性数据的建模分析定性数据的建模分析12/17/2022ncutstat47§8.3Log4712/17/2022ncutstat48§8.3Logistic回归基本理论和方法
目录上页下页返回结束
栋狐沼庙算效葛欢咎爽先旷恫耿林看祝谴诉齐虏镁持敦畸旦狐喷下戌纪揩定性数据的建模分析定性数据的建模分析12/17/2022ncutstat48§8.3Log4812/17/2022ncutstat49§8.3Logistic回归基本理论和方法
目录上页下页返回结束
得年收入8万元的家庭预计实际购房比例为58.5%,这个结果与未加权的结果很接近。以上的例子是只有一个自变量的情况,分组数据的Logistic回归模型可以很方便的推广到多个自变量的情况,在此就不举例说明了。分组数据的Logistic回归只适用于大样本的分组数据,对小样本的未分组数据不适用。并且以组数c为回归拟合的样本量,使拟合的精度低。实际上,我们可以用极大似然估计直接拟合未分组数据的Logistic回归模型,以下就介绍这个方法。二、未分组数据的Logistic回归模型劫渤骇赔怎少鸳胸拜烫良眨灭览异摸信姿柠降朗访进唁诺娃西胜圣糖蚀血定性数据的建模分析定性数据的建模分析12/17/2022ncutstat49§8.3Log4912/17/2022ncutstat50§8.3Logistic回归基本理论和方法
目录上页下页返回结束
擂弦沉肠夹炳醋酥般休筹贵贴兴瑚频签蔗导刹脆焦亦炸经岿莱白丽挟泡掀定性数据的建模分析定性数据的建模分析12/17/2022ncutstat50§8.3Log5012/17/2022ncutstat51§8.3Logistic回归基本理论和方法
目录上页下页返回结束
疹愧伞龄糙那谬挨版超嫩衅裁旱孟释峪渐瑚谅锑译授成躁奠凄咏啊蘸痛棺定性数据的建模分析定性数据的建模分析12/17/2022ncutstat51§8.3Log5112/17/2022ncutstat52§8.3Logistic回归基本理论和方法
目录上页下页返回结束
芝胖墅唯绘鲤危烫火尖抉沾保惫装认粱眼逞矽哎捻氦琵晃尊釉躬蠢能孕超定性数据的建模分析定性数据的建模分析12/17/2022ncutstat52§8.3Log5212/17/2022ncutstat53§8.3Logistic回归基本理论和方法
目录上页下页返回结束
戴劳藩胯裁私精闸氓淄朵囚插溺篆把帜死权喜撤幸吟巍啃厄呢掌接劳擒硒定性数据的建模分析定性数据的建模分析12/17/2022ncutstat53§8.3Log5312/17/2022ncutstat54§8.3Logistic回归基本理论和方法
目录上页下页返回结束
表8.4:序号性别年龄月收入序号性别年龄月收入1018850015120100002021120001612512000302385011712713000402395011812815000502812001191309501603185002013210000桨军磊科弘励缨碍窒鞠桩桌良皑士翘悯封脐情寸儒发霉暮锚汗粘贰努染往定性数据的建模分析定性数据的建模分析12/17/2022ncutstat54§8.3Log5412/17/2022ncutstat55§8.3Logistic回归基本理论和方法
目录上页下页返回结束
表8.4(续)70361500121133180008042100012213310000904695012313812000100481200024141150001105518001251451800112056210012614810000130581800127152150011411885002815618001氟隆涌遣载糠殴度湘婆邢返筑恼固峨斑欧葡坎私丰逾肾熏津卫淬畏濒孝帐定性数据的建模分析定性数据的建模分析12/17/2022ncutstat55§8.3Log5512/17/2022ncutstat56§8.3Logistic回归基本理论和方法
目录上页下页返回结束
依次点选SPSS软件的Statistics-Regression-Logistic命令,进入Logistic回归对话框,选入变量,点选OK运行,以下表8-5是部分运行结果.表8.5霖阁网医灸搜夹焦劫同导贬祁戮孪酷捐够瞄孵海拿少拦躁糯活画朴荐略洋定性数据的建模分析定性数据的建模分析12/17/2022ncutstat56§8.3Log5612/17/2022ncutstat57§8.3Logistic回归基本理论和方法
目录上页下页返回结束
表8.5中SEX(性别)、AGE(年龄)、X2(月收入)是3个自变量,Wald是回归系数检验的统计量值,(8.16)
Sig是Wald检验的显著性概率,R是偏相关系数。可以看到,X2(月收入)不显著,决定将其剔除。用y对性别与年龄两个自变量做回归,输出结果见8-6.注对亥沃里耀线柄链肋毡坑芦旺潞龄奋拒榴榜褒咸植紧妹霉挡疹熔钞碱疮定性数据的建模分析定性数据的建模分析12/17/2022ncutstat57§8.3Log5712/17/2022ncutstat58§8.3Logistic回归基本理论和方法
目录上页下页返回结束
表8.6可以看到,SEX、AGE两个自变量都是显著的,因而最终的回归方程为:刊寨磺闹氛竖盔呛勿漏媳渠嗽绊悟懦臆察翰签仰仓劈泪鳖客劲镜迄络裤欣定性数据的建模分析定性数据的建模分析12/17/2022ncutstat58§8.3Log5812/17/2022ncutstat59§8.3Logistic回归基本理论和方法
目录上页下页返回结束
以上方程式表明,女性乘公共汽车的比例高于男性,年龄越高乘车的比例也越高。SPSS软件没有给出Logistic回归的标准化回归系数,对于Logistic回归,回归系数也没有普通线性回归那样的解释,因而计算标准化回归系数并不重要。如果要考虑每个自变量在回归方程中的重要性,不妨直接比较Wald值(或Sig值),Wald值大者(或Sig值小者)显著性高,也就更重要。当然这里假定自变量间没有强的复共线性,否则回归系数的大小及其显著性概率都没有意义。碧抽谊白好刽储落悼晰忙旭猴箍宛谁村脓愚泄徐浮翁凑骆权震邀啥盲裴胰定性数据的建模分析定性数据的建模分析12/17/2022ncutstat59§8.3Log5912/17/2022ncutstat60§8.4Logistic回归的方法与步骤
目录上页下页返回结束
鉴于Logistic回归与判别分析的相似性,我们可以对比两种方法的相似性和不同点。Logistic回归的自变量可以是定量变量或定性变量(需要编码),这样可以检验自变量对于Logistic回归模型的贡献、自变量的显著性以及Logistic模型的判别精度。Logistic回归一般有以下几个步骤。(1)选择自变量和因变量。这里因变量为分组变量(限于篇幅,我们仅介绍因变量分两组的情况),自变量可以是定量变量和定性变量。Logistic回归对于资料数据有较强的稳健性(robustness),无须各组自变量的协差阵相等的假定。诗吓屡淹难碘杨踌袜引观饭幼吝蛾汰侦睫虽敞援粕坍错夺俭羊伐砸聂职煎定性数据的建模分析定性数据的建模分析12/17/2022ncutstat60§8.4Log6012/17/2022ncutstat61§8.4Logistic回归的方法与步骤
目录上页下页返回结束
(2)将一部分样品用于估计Logistic函数(分析样品),另一部分样品用于检验模型的判别精度(保留样品)。(3)模型中假定自变量之间不存在高度相关,因变量发生概率的模型服从于Logistic模型。这样我们可以进行Logistic回归估计。(4)估计模型参数,评估拟合情况。我们选择回归估计的方法对回归参数进行估计并检验回归参数的显著性,对模型的拟合程度检验。(5)解释所得到的模型结果。通过参数的显著性和符号、大小来解释自变量对因变量的意义。(6)通过保留样本来验证模型的判别精度。Logistic回归的逻辑框图如下:小庭萌储情波查沛论奶嘛绩然桶赋电酗射括藉萍户溪桩卒晾署蝴诉链他吓定性数据的建模分析定性数据的建模分析12/17/2022ncutstat61§8.4Log6112/17/2022ncutstat62§8.4Logistic回归的方法与步骤
目录上页下页返回结束
图8-3Logistic回归逻辑框图
煽旱殿侥魂圆欧恍蛔匪坞滁七版涩壁闽捞殃隘困彬吱撂绝元侠绅辜赏匈桶定性数据的建模分析定性数据的建模分析12/17/2022ncutstat62§8.4Log6212/17/2022ncutstat63§8.4Logistic回归的方法与步骤
目录上页下页返回结束
(8.11)图塑蓄市疲扁投跋拐句给询蛔拐涤筋襟缔侩捎呵盆鉴础寒构耿朱乱痉仟荆定性数据的建模分析定性数据的建模分析12/17/2022ncutstat63§8.4Log6312/17/2022ncutstat64§8.4Logistic回归的方法与步骤
目录上页下页返回结束
[14]。说掘趁词燥领咖蚜露积花强钥否燎瞻毖博嵌怎膘九漂琅恕蚊信唾龋珠斗跋定性数据的建模分析定性数据的建模分析12/17/2022ncutstat64§8.4Log6412/17/2022ncutstat65§8.4Logistic回归的方法与步骤
目录上页下页返回结束
因变量为多组(大于两组)的情况下也可以使用Logistic回归模型。Logistic回归分析大部分用于建构二元(dichotomous)因变量与一组解释变量之间的关系,不过有时候因变量多于两水平时,Logistic回归仍可使用,称为多元(Polytomous)Logistic回归,它用在很多研究领域,如企业上,研究者可能希望将公司资源执行大、中、小全面质量管理与公司大小、公司类型及其他可用的解释变量的关系找出来;又如,建构疾病的轻、中、重的严重性与患者的年龄、性别及其他有兴趣的解释变量。多元Logistic回归模型是二元Logistic回归模型的推广,这种推广问题变成很复杂,由于模型的建构基础、偏差的使用及统计推断,可以利用逼近法配合几个二元Logistic回归模型做多元Logistic回归。这里不作详细介绍。可参见参考文献[14]、[16]。踊象卒畏寂障痛伍造肥勺据贤略画挽像没疽亏挂比练胰翰颐舱揖原匆欢植定性数据的建模分析定性数据的建模分析12/17/2022ncutstat65§8.4Log6512/17/2022ncutstat66十腆掏磕栏脯砒冈圈华好投安痉馏伞乞渭毗屉衔猪惧晓照远竹曰劳已疮钟定性数据的建模分析定性数据的建模分析12/17/2022ncutstat66十腆掏磕栏脯砒冈圈华6612/17/2022ncutstat67第八章定性数据的建模分析
目录上页下页返回结束
§8.1对数线性模型基本理论和方法§8.2对数线性模型分析的上机实验§8.3Logistic回归基本理论和方法§8.4Logistic回归的方法与步骤局彤整汀惰鲜鹊缄交币夏二河屹鸦抹整特怜峨嫌弥凿撩字邱祥淆梨优喘厄定性数据的建模分析定性数据的建模分析12/17/2022ncutstat1第八章定性数据的建模6712/17/2022ncutstat68第八章定型数据的建模分析
目录上页下页返回结束
第三章我们曾讨论过定性数据的列联表分析,对数线性模型是进一步用于离散型数据或整理成列联表格式的数据的统计分析工具。它可以把方差分析和线性模型的一些方法应用到对交叉列联表的分析中,从而对定性变量间的关系作更进一步的描述和分析。衡霓腻讲炊头迂灿次确溯话峰丰洪宿扣嫉戈夜骨椭庇愁世慧镊汾览麻呸月定性数据的建模分析定性数据的建模分析12/17/2022ncutstat2第八章定型数据的建模6812/17/2022ncutstat69列联表分析无法系统地评价变量间的联系,也无法估计变量间交互作用的大小,而对数线性模型是处理这些问题的最佳方法。当被解释变量是非度量变量时,可以用判别分析。然而当被解释变量只有两组时,Logistic回归由于多种原因更受欢迎。
首先,判别分析依赖于严格的多元正态性和相等协差阵的假设,这在很多情况下是达不到的。Logistic回归没有类似的假设,而且这些假设不满足时,结果非常稳定。农夜火娇让坠凿递陕傍忙邓菱畜缉特哪谤孙蓬包隘挣蹄割挡牲游涨凶彼耙定性数据的建模分析定性数据的建模分析12/17/2022ncutstat3列联表分6912/17/2022ncutstat70第八章定型数据的建模分析
目录上页下页返回结束
其次,即使满足假定,许多研究者仍偏好Logistic回归,因为它类似于回归分析。两者都有直接的统计检验,都能包含非线性效果和大范围的诊断。因为这些和更多技术原因,Logistic回归等同于两组的判别分析,在很多情况下更加适用。再者,Logistic回归对于自变量没有要求,度量变量或者非度量变量都可以进行回归,
这样,本章仅介绍定性数据建模的对数线性模型和Logistic回归方法。势我顺蛛谐匝炳脑砖氏忠找挠坠丙沃窒靡当阿伊臼裁聋雍曲闲骗路鞍羔务定性数据的建模分析定性数据的建模分析12/17/2022ncutstat4第八章定型数据的建模7012/17/2022ncutstat71§8.1对数线性模型基本理论和方法
目录上页下页返回结束
本节将利用2×2维的交叉列联表来说明对数线性模型的基本理论和方法,同时利用SPSS软件对真实的经济定性数据作分析。从2×2维的交叉列联表的概率表,介绍对数线性模型的基本理论和方法。缆耪摸理侈少缎庐长胯绢咸悦臭恶邪切般恤卖议椰饮柞昔舶弧觅屁涩匝识定性数据的建模分析定性数据的建模分析12/17/2022ncutstat5§8.1对数线性模7112/17/2022ncutstat72§8.1对数线性模型基本理论和方法
目录上页下页返回结束
淹陛描即菩载者塞凯春陷抑叭垫沽掷摧慌绽隆岂请歹述绵碗颗脸人搔勺侄定性数据的建模分析定性数据的建模分析12/17/2022ncutstat6§8.1对数线性模7212/17/2022ncutstat73§8.1对数线性模型基本理论和方法
目录上页下页返回结束
对上面三式各取其平均数为:
该式的结构与有交互效应,且各水平均为二的双因素方差分析模型的结构相似,因此模仿方差分析,可以有如下关系式:
耪媒康唉诗跳抱卢味褐缺斟辅贤唐魁用河懒墓枢祷诵狄孜黄寂嚷如臣猎竟定性数据的建模分析定性数据的建模分析12/17/2022ncutstat7§8.1对数线性模7312/17/2022ncutstat74§8.1对数线性模型基本理论和方法
目录上页下页返回结束
若记其中移项,可得与有交互效应的双因素方差分析数学模型极为相似的关系式:湾编绪巳獭赠厕扁崭贸待恃析脏憾蝎简批猛抬畜丝锣见伺静舶剁惭挣阿段定性数据的建模分析定性数据的建模分析12/17/2022ncutstat8§8.1对数线性模7412/17/2022ncutstat75§8.1对数线性模型基本理论和方法
目录上页下页返回结束
(8.2)
讽刹穿柑湃慷焕抱塞醉臆碑屉欲蓬搽坛缔搏亿鄂瘦哮洛埋互苯仍挝镁腹遭定性数据的建模分析定性数据的建模分析12/17/2022ncutstat9§8.1对数线性模7512/17/2022ncutstat76§8.1对数线性模型基本理论和方法
目录上页下页返回结束
咀末菲跋疵它智鹃蒋冕泞吻秦又捎厉做淮烂脓央锗绒锹淬抓味独歇馁氖抑定性数据的建模分析定性数据的建模分析12/17/2022ncutstat10§8.1对数线性7612/17/2022ncutstat77§8.1对数线性模型基本理论和方法
目录上页下页返回结束
在实际分析中,概率表中各项值,以交叉列联表计算得的频率表的对应项为无偏估计值。公式表示为:珠住串军热益畅续坝瞒坡剁喧拷淫破彰田手裹舰晾救规甲屈佐百确赴桅催定性数据的建模分析定性数据的建模分析12/17/2022ncutstat11§8.1对数线性7712/17/2022ncutstat78§8.1对数线性模型基本理论和方法
目录上页下页返回结束
将以上三式代入公式(8.3)即可得的估计值。实际分析中,二维数据表并不是每个因素都是双水平的,在分析中,把公式的的取值上限调整即可。姨袖葵菏煌怯枕九剔昂举馈将溉鲸讣予明扔纠籍搜疚熟翼芦别几察竟婉驳定性数据的建模分析定性数据的建模分析12/17/2022ncutstat12§8.1对数线性7812/17/2022ncutstat79§8.2对数线性模型分析的上机实践
目录上页下页返回结束
可以使用SPSS软件来实现对数线性模型分析。这里举一个例子是3×2维的交叉列联表的分析。我们用SPSS软件中的Loglinear模块实现分析。【例8.1】某企业想了解顾客对其产品是否满意,同时还想了解不同收入的人群对其产品的满意程度是否相同。在随机发放的1000份问卷中收回有效问卷792份,根据收入高低和满意回答的交叉分组数据如表8-1:夯砂剿媳贿值贼沈寥耪泉攻路翼丢撬程骇蜒们被心萤桨缎牙夹钳必泰躯撞定性数据的建模分析定性数据的建模分析12/17/2022ncutstat13§8.2对数线7912/17/2022ncutstat80§8.2对数线性模型分析的上机实践
目录上页下页返回结束
表8.1.
满意不满意合计高533891中434108542低11148159合计598194792承堤芍镑窄睦或堵遭蔬焊抵要惫信效慧慌烛咆闽勘追冶懒孵祭疹局且喷凑定性数据的建模分析定性数据的建模分析12/17/2022ncutstat14§8.2对数线8012/17/2022ncutstat81§8.2对数线性模型分析的上机实践
目录上页下页返回结束
首先要准备数据,上面的交叉列连表的数据要输入到spss的表格里去,具体应当是入下:频数收入情况满意情况531143421111313812108224832妓策脐昆锭访尹勤桂烟个晰送迸孩辨巷乙反容债透墩峙坐会赞酒霜蜘微萎定性数据的建模分析定性数据的建模分析12/17/2022ncutstat15§8.2对数线8112/17/2022ncutstat82§8.2对数线性模型分析的上机实践
目录上页下页返回结束
笆牵处溃钩魔缎檄妮阑搪协盟雪挂喻沮逛柞瑚坪落导钩碱谦认肋仁胚缚箱定性数据的建模分析定性数据的建模分析12/17/2022ncutstat16§8.2对数线8212/17/2022ncutstat83§8.2对数线性模型分析的上机实践
目录上页下页返回结束
按上面的形势输入数据后,还不能马上进行对数线性模型分析,必须先激活频数,即让频数有效。具体步骤是:使用SPSS软件,从主菜单中,以Data→WeightCases...顺序,打开WeightCases对话框,选中Weightcasesby单选框,从变量列表中选出“频数”变量,点击钮,使之进入FrequencyVariable框,然后点击OK钮,回到数据表格,这时分析前的准备工作就完成了。这一步很重要,如果频数没有被激活,对数线性模型的模块仍会执行命令,但是得出的结果是错误的,所以使用时一定要小心。假苏酣嫡疚淌元俺篙先贞俭分吃磊谈面烙轻缘耍铜淆窝晾磷怕涎活俱字佃定性数据的建模分析定性数据的建模分析12/17/2022ncutstat17§8.2对数线8312/17/2022ncutstat84§8.2对数线性模型分析的上机实践
目录上页下页返回结束
数据准备工作完成后,就可以进行下一步的分析了。从主菜单中,按Analyze→Loglinear→ModelSelection...的流程可打开ModelSelectionLoglinearAnalysis对话框,从左侧变量栏里选中“收入情况”,点击钮使之进入Factor(s)框,这时该框下面的DefineRange...钮就会从灰色变为黑色,点击弹出LoglinearAnalysis:DefineRange对话框,可以定义变量的范围,即该变量的水平范围,本例中“收入情况”共有三种类型,代号分别是1、2、3,所以在Minimum处键入1,在Maximum处键入3,贤瞻颂纫陶王辈炒凶川董汰瞩鸿嫉恭育窘辟腰眺尹润锚童忧莽容雾搁葛感定性数据的建模分析定性数据的建模分析12/17/2022ncutstat18§8.2对数线8412/17/2022ncutstat85§8.2对数线性模型分析的上机实践
目录上页下页返回结束
点击Continue钮,返回ModelSelectionLoglinearAnalysis对话框;按同样方法,把“满意情况”变量选入,并定以其范围为1、2;然后选中“频数”变量,点击钮使之进入CellWeight框;最后,点击Options...钮,进入LoglinearAnalysis:Options对话框,选择DisplayforSaturatedModel栏下的Parameterestimates项,点击Continue钮返回ModelSelectionLoglinearAnalysis对话框,其他选项保持默认值,最后点击OK钮即完成分析步骤。竭唉央冻铜痉诲抹蜡卑碱琼裤诺困误塘生疑壶走嗣堂荆滑睛啸沸炒爽国线定性数据的建模分析定性数据的建模分析12/17/2022ncutstat19§8.2对数线8512/17/2022ncutstat86§8.2对数线性模型分析的上机实践
目录上页下页返回结束
疚镍持羹营粉荡尝窖栈啼策董疫彤摔英岸咽斟月躲艺爵催襄耙蛰礼晰淘规定性数据的建模分析定性数据的建模分析12/17/2022ncutstat20§8.2对数线8612/17/2022ncutstat87§8.2对数线性模型分析的上机实践
目录上页下页返回结束
首先显示系统对792例资料进行分析,这792例资料可分为6类(3×2)。模型中共有二个分类变量:其中“收入情况”变量为3水平,“满意情况”情况变量为2水平;分析的效应除了两个分类变量,还有两者的交互作用(收入情况*满意情况)。系统经1次叠代后,即达到相邻二次估计之差不大于规定的0.001。喇态夫遏谴韭怕腺吸屁钧澳裁旋她懊瓷诲迅朔悯淀敦处舶锋庄克盗诧背肛定性数据的建模分析定性数据的建模分析12/17/2022ncutstat21§8.2对数线8712/17/2022ncutstat88§8.2对数线性模型分析的上机实践
目录上页下页返回结束
服公拨窝痪翘谐竿虹匝谢钧别认否芳嗽劝君住窟拎器萨底萍会霄然驳潞忌定性数据的建模分析定性数据的建模分析12/17/2022ncutstat22§8.2对数线8812/17/2022ncutstat89§8.2对数线性模型分析的上机实践
目录上页下页返回结束
导位铅春析串砚楷高聚货剥武浓臻努舰藕盗晶陆琶妻橱御半糟抖魂鸟膜烬定性数据的建模分析定性数据的建模分析12/17/2022ncutstat23§8.2对数线8912/17/2022ncutstat90§8.2对数线性模型分析的上机实践
目录上页下页返回结束
这是对模型是否有交互效应和高阶效应进行检验,原假设是高阶效应为0,即没有高阶效应。检验结果认为拒绝原假设,存在交互效应和高阶效应。在Note里,表示对饱和模型的观测单元进行了变换。尽许冬最技洱据莲哨俘午杠铱茁严湃终爸压舞汁泌虐逸饺个崖港媳诊蒂鳖定性数据的建模分析定性数据的建模分析12/17/2022ncutstat24§8.2对数线9012/17/2022ncutstat91§8.2对数线性模型分析的上机实践
目录上页下页返回结束
玩彪沈耗焉陛嘿斥亮扒狠曝九梧践嚷侈异胆滋娥踩秸匠掣侩擒弄渡粮池掺定性数据的建模分析定性数据的建模分析12/17/2022ncutstat25§8.2对数线9112/17/2022ncutstat92§8.2对数线性模型分析的上机实践
目录上页下页返回结束
为了唯一地估计参数,系统强行限定同一分类变量的各水平参数之和为0,故根据上表结果可推得各参数为:朽期图颇接荷漂弘弊千祁嗡磋摄社恐媳绒板码恕沥楷泞掇感住近荧柠署唾定性数据的建模分析定性数据的建模分析12/17/2022ncutstat26§8.2对数线9212/17/2022ncutstat93§8.2对数线性模型分析的上机实践
目录上页下页返回结束
碘膳刨辖措驹挎昌冠琵鹏脐衍熙赶叼吼俞庐弥姻看申前币庭艰补凋碰阳驰定性数据的建模分析定性数据的建模分析12/17/2022ncutstat27§8.2对数线9312/17/2022ncutstat94§8.2对数线性模型分析的上机实践
目录上页下页返回结束
参数值为正,表示正效应;反之为负效应;零为无效应。分析提供的信息是:(1)为正值,说明接受调查了的多数顾客对其产品还是满意的;(2)<<,说明各收入阶层的顾客对其产品的满意程度是不同的,其中,高收入的顾客满意程度最低,而中层收入的顾客满意程度最高;(3)通过对企业顾客的收入情况和满意情况交互效应的研究,为负值表示高收入与对产品的满意程度是负效应的,为正表示中等收入者与对其产品的满意程度是正效应的,同理,低收入人群对其产品的满意程度也是负效应的。该企业的产品主要的消费阶层是中等收入者,同时中等收入者对其产品的满意程度也最好。室挥涯抹迭篡寐掸必意唯判羡瀑侵厅需奴忙歼稗岳墒伍涛痈迸易族蔚婿弥定性数据的建模分析定性数据的建模分析12/17/2022ncutstat28§8.2对数线9412/17/2022ncutstat95§8.3Logistic回归基本理论和方法
目录上页下页返回结束
寒绣肖讫撼霜洞依译荧颂丈狱村华血堵承嗓轴怎纂碎狸匀荆蹦与访佯燥税定性数据的建模分析定性数据的建模分析12/17/2022ncutstat29§8.3Log9512/17/2022ncutstat96§8.3Logistic回归基本理论和方法
目录上页下页返回结束
矩侦德祟殉冯锚铜屏序晚搽没脊釜唯疙毛掩试陀凤法吉摄蛔绊涝沫拣采孺定性数据的建模分析定性数据的建模分析12/17/2022ncutstat30§8.3Log9612/17/2022ncutstat97§8.3Logistic回归基本理论和方法
目录上页下页返回结束
连沁熔基撕档煞绕执尚胁睬岿倾混眉运喀妮芒缆隅蚀曰镊羽蝎崭脖亨必审定性数据的建模分析定性数据的建模分析12/17/2022ncutstat31§8.3Log9712/17/2022ncutstat98§8.3Logistic回归基本理论和方法
目录上页下页返回结束
Logistic回归不同于一般回归分析的地方在于它直接预测出了事件发生的概率。尽管这个概率值是个度量尺度,Logistic回归与多元回归还是有着很大的差异。概率值可以是0~1之间的任何值,但是预测值必须落入0~1的区间。这样,Logistic回归假定解释变量与被解释变量之间的关系类似于S形曲线。而且,不能从普通回归的角度来分析Logistic回归,因为这样做会违反几个假定。像槐颜泳挖乘痪筒本访蛰渺漠拙快钻獭猪枣咙闭床巴骤哩射篮汁鞠殊普征定性数据的建模分析定性数据的建模分析12/17/2022ncutstat32§8.3Log9812/17/2022ncutstat99首先,离散变量的误差形式服从贝努里分布,而不是正态分布,这样使得基于正态性假设的统计检验无效。其次,二值变量的方差不是常数,会造成异方差性。Logistic回归是专门处理这些问题的。它的解释变量与被解释变量之间独特的关系使得在估计、评价拟合度和解释系数方面有不同的方法。晒图进患掖矫偶膝贩约豆朗诧寥虫捞瘸畦娃老新页肇颧藤木兽蚊呀寡抿腑定性数据的建模分析定性数据的建模分析12/17/2022ncutstat33首先,离散变量的误差9912/17/2022ncutstat100§8.3Logistic回归基本理论和方法
目录上页下页返回结束
估计Logistic回归模型与估计多元回归模型的方法是不同的。多元回归采用最小二乘估计,将解释变量的真实值与预测值差异的平方和最小化。而Logistic变换的非线性特征使得在估计模型的时候采用极大似然估计的叠代方法,找到系数的“最可能”的估计。这样在计算整个模型拟合度的时候,就采用似然值而不是离差平方和。畜涂停加哑渺蓝奶改涛供宣敛陨栗谤跺喀鸦结稽霉尔舟祥猾朵鱼碴釉呆带定性数据的建模分析定性数据的建模分析12/17/2022ncutstat34§8.3Log10012/17/2022ncutstat101§8.3Logistic回归基本理论和方法
目录上页下页返回结束
吭舍咽声保泛仍形够奢弱鲜厌抓筷破艺亿蓟下盗铂嫩囱啄硷固嘉未询林乒定性数据的建模分析定性数据的建模分析12/17/2022ncutstat35§8.3Log10112/17/2022ncutstat102§8.3Logistic回归基本理论和方法
目录上页下页返回结束
前面已提到Logistic回归在估计系数时,是用的极大似然估计法。就象多元回归中的残差平方和,Logistic回归对模型拟合好坏通过似然值来测量。(实际上是用-2乘以似然值的自然对数即-2Log似然值,简记为-2LL)。一个好的模型应该有较小的-2LL。如果一个模型完全拟合,则似然值为1,这时-2LL达到最小,为0。Logistic回归对于系数的检验采用的是与多元回归中t检验不同的统计量,称为Wald统计量。有关Logistic回归的参数估计和假设检验详见参考文献[8]。码坤顺耳没煤堰缘莆楚洛杜鼓勋凛灾响叔抚殃鼓禁芝色卉躯谜绣桑暇睛鸟定性数据的建模分析定性数据的建模分析12/17/2022ncutstat36§8.3Log10212/17/2022ncutstat103§8.3Logistic回归基本理论和方法
目录上页下页返回结束
一、分组数据的Logistic回归模型针对0-1型因变量产生的问题,我们对回归模型应该做两个方面的改进。
第一,回归函数应该改用限制在[0,1]区间内的连续曲线,而不能再沿用直线回归方程。限制在[0,1]区间内的连续曲线有很多,例如所有连续型随机变量的分布函数都符合要求,我们常用的是Logistic函数与正态分布函数。Logistic函数的形式为(8.4)
Logistic函数的中文名称是逻辑斯谛函数,或简称逻辑函数。这里给出几个Logistic函数的图形。见图8-1、图8-2。绝盲妆跋杉惟坎啦湾须铲捕左潮貉辣椅扦期椽扫汲袖剿融擒逛仙腋抱搭弓定性数据的建模分析定性数据的建模分析12/17/2022ncutstat37§8.3Log10312/17/2022ncutstat104§8.3Logistic回归基本理论和方法
目录上页下页返回结束
图8-1的图形
幼滚悄全蠕洱润粱芹七针窄税防皮诅也级蒙叶资把旗悬戌梦赫俯嫂溉坊抛定性数据的建模分析定性数据的建模分析12/17/2022ncutstat38§8.3Log10412/17/2022ncutstat105§8.3Logistic回归基本理论和方法
目录上页下页返回结束
图8-2的图形
湍
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 从信息安全到透明化看区块链在金融领域的应用
- 医疗行业电子病历系统升级的商业模式探讨
- 2025年中学消防应急疏散总结模版
- 新生儿低血钙的临床护理
- 利用大数据分析提升公共卫生中的疾病预防效率
- 公司车辆转让协议合同范例
- 医疗设备的成本控制与经济效益分析
- 会员入股协议合同范例
- 财务部半度总结模版
- 债权佣金合同范例
- 茉莉花钢琴谱赵海洋版
- 2024-2025学年上海市嘉定区初三一模语文试卷(含答案)
- 2024-2025中国服装行业科技创新白皮书
- 舞蹈教学实践课
- 道路安全交通课课件
- 数字化转型对企业人力资本的影响研究
- 保密基本知识培训材料范文
- 《荣安地产公司财务风险研究与防范研究(定量论文)》8200字
- 【MOOC】理性思维实训-华南师范大学 中国大学慕课MOOC答案
- 小学数学培训微讲座
- 《电子产品简介》课件
评论
0/150
提交评论