下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SPSS 乍业 8:二项 Logistic 回归分析为研究和预测某商品消费特点和趋势,收集到以往胡消费数据。数据项包括是否购买,性别,年龄和收入水平。这里采用 Logistic 回归的方法,是否购买作为被解释变量(0/1 二值变量),其余各变量为解释变量,且其中性别和收入水平为品质变量,年龄为定距变量。变量选择采用 Enter 方法,性别以男为参照类,收入以低收入为参照类。(一)基本操作:11)选择菜单 AnalyzeRegressionBinaryLogistic;(2)选择是否购买作为被解释变量到 Dependent 框中,选其余各变量为解释变量到 Covariates 框中,采用 Ent
2、er 方法,结果如下:消费的二项 Logistic 分析结果(一)(强制进入策略)CategoricalVariablesCodingsFrequencyParametercoding(1)(2)收入低收入132.000.000中收入1441.000.000高收入155.0001.000性别男191.000女2401.000分析:上表显示了对品质变量产生虚拟变量的情况,产生的虚拟变量命名为原变量名(编码)。可以看到,对收入生成了两个虚拟变量名为 Income(1)和 Income(2),分别表示是否中收入和是否高收入,两变量均为 0 时表示低收入;对性别生成了一个虚拟变量名为 Gedder(1
3、),表示是否女,取值为 0时表不为男。消费的二项 Logistic 分析结果(二)(强制进入策略)Block0:BeginningBlocka,bClassificationTablePredicted是否购买PercentageObserved不购买购买CorrectStep0 是否购买不购买2690100.0购买1620.0OverallPercentage62.4a.Constantisincludedinthemodel.b.Thecutvalueis.500分析:上表显示了 Logistic 分析初始阶段(第零步)方程中只有常数项时的错判矩阵。可以看到:269 人中实际没购买且模型预
4、测正确,正确率为 100%;162 人中实际购买了但模型均预测错误,正确率为 0%模型总的预测正确率为 62.4%。消费的二项 Logistic 分析结果(三)(强制进入策略)VariablesintheEquationBS.E.WalddfSig.Exp(B)VariablesintheEquationBS.E.WalddfSig.Exp(B)Step0Constant-.507.09926.0021.000.602分析:上表显示了方程中只有常数项时的回归系数方面的指标,各数据项的含义依次为回归系数,回归系数标准误差,度,Wald检验统计量的概率 p 值,发生比。由于此时模型中未包含任何解释
5、变量,因此该表没有实际意义。消费的二项 Logistic 分析结果(四)(强制进入策略)VariablesnotintheEquationScoredfSig.Step0Variablesage1.2681.260gender(1)4.6671.031income10.6402.005income(1)2.9351.087income(2)10.6401.001OverallStatistics18.2734.001分析:上表显示了待进入方程的各个变量的情况,各数据项的含义依次为 Score 检验统计量的观测值,自由度和概率进入方程,则 Score 检验统计量的观测值为 1.268,概率 p
6、值为 0.26。如果显著性水平 a 为 0.05,由于 Age 的概率入方程的。但在这里,由于解释变量的筛选策略为 Enter,所以这些变量也被强行进入方程。Wald 检验统计量的观测值,自由p 值。可以看到,如果下一步 Agep 值大于显著性水平 a,所以是不能进消费的二项 Logistic 分析结果(五)(强制进入策略)Block1:Method=EnterOmnibusTestsofModelCoefficientsChi-squaredfSig.Step1Step18.4414.001Block18.4414.001Model18.4414.001分析:上表显示了 Logistic 分
7、析第一步时回归方程显著性检验的总体情况,各数据项的含义依次为似然比卡方的观测值,自由度和概率 p 值。可以看到,在本步所选变量土纺 S 入方程(Method=Enter)。与前一步相比,似然比卡方检验的观测值 18.441,概率 p 值为 0.001。如果显著性水平 a 为 0.05,由于概率 p 值小于显著性水平 a,应拒绝零假设,认为所有回归系数不同时为 0,解释变量的全体与 LogitP 之间的线性关系显著,采用该模型是合理的。在这里分别输出了三行似然比卡方值。其中,Step 行是本步与前一步相比的似然卡方比;Block 行是本块(Block)与前一块相比的似然卡方比;Model行是本模
8、型与前一模型相比的似然卡方比。在本例中,由于没有设置解释变量块,且解释变量是一次性强制进入模型,所以三行结果都相同。消费的二项 Logistic 分析结果(六)(强制进入策略)ModelSummaryStep-2LoglikelihoodCox&SnellRSquareNagelkerkeRSquare1552.208a.042.057.a.Estimationterminatedatiterationnumber4becauseparameterestimateschangedbylessthan.001.分析:上表显示了当前模型拟合优度方面的指标,各数据项的含义依次为-2 倍的对数
9、似然函数值,Cox&SnellRA2。-2 倍的对数似然函数值越小则模型的拟合优度越高。这里该值较大,所以模型的拟合优度并不理想。从 NagelkerkeRA2 也可以看到其值接近零,因此拟合优度比较低。消费的二项 Logistic 分析结果(七)(强制进入策略)分析:上表显示了当前所得模型的错判矩阵。可以看到,脚注中的 TheCutvalueis.500 意味着:如果预测概率值大于 0.5,则认为被解释变量的分类预测值为 1,如果小于 0.5,则认为被解释变量的分类预测值为 0.;在实际没购买的 269 人中,模型正确识别了 236 人,识别错误了 131 人,正确率为 19.1%。
10、模型总的预测正确率为 61.9%。与前一步相比,对未购买的预测准确度下降了,对购买的预测准确度上升了,但总体预测精度仍下降了。因此模型预测效果并不十分理想。消费的二项 Logistic 分析结果(八)(强制进入策略)ObservedPredicted是否购买PercentageCorrect不购买购买Step1 是否购买不购买购买OverallPercentage236131333187.719.161.9aClassificationTablea.Thecutvalueis.500VariablesintheEquationBS.E.WalddfSig.Exp(B)Step1aage.025
11、.0181.9741.1601.026gender(1).511.2095.9541.0151.667income12.3052.002income(1).101.263.1461.7031.106income(2).787.2539.6761.0022.196Constant-2.112.7547.8431.005.121a.Variable(s)enteredonstep1:age,gender,income.分析:上表显示了当前所得模型中各个回归系数方面白指标。可以看出,如果显著性水平 a 为 0.05,由于 Age 的 Wald 检验 I率 p 值大于显著性水平 a,不应拒绝零假设,认
12、为该回归系数与 0 无显著差异,它与 LogitP 的线性关系是不显著的,不应保留在方程中。由于方程中包含了不显著的解释变量,因此该模型是不可用的,应重新建模。下面是对模型做进一步分析,解释变量的筛选采用基于极大似然估计的逐步筛选策略(Forward:LR),分析的具体操作以及结果如下:(二)基本操作:11)选择菜单 AnalyzeRegressionBinaryLogistic;(2)选择是否购买作为被解释变量到 Dependent 框中,选其余各变量为解释变量到 Covariates 框中,采用 Forward:LR 方法,在 Option 框中对模型做近一步分析,结果如下:消费的二项 L
13、ogistic 分析结果(一)(逐步筛选策略)Block1:Method=ForwardStepwise(LikelihoodRatio)OmnibusTestsofModelCoefficientsChi-squaredfSig.Step1Step10,5432.005Block10,5432.005Model10,5432.005Step2Step5.9171.015Block16,4593.001Model16,4593.001消费的二项 Logistic 分析结果(二)(逐步筛选策略)ModelifTermRemovedVariableModelLogLikelihoodChangei
14、n-2LogLikelihooddfSig.oftheChangeStep1income-285.32510,5432.005Step2gender-280.0535.9171.015income-282.97611,7612.003分析:上面第一个表显示了变量逐步筛选过程中对数似然比卡方检验的结果,用于回归方程的显著性检验。这里略去了第零步分析的结果。结果上面的两个表共同分析。在 Stepl 中,模型中包含常数项和 INCOME。如果此时剔除 INCOME 将使-2LL 减少 10.543,即 10,543 是 INCOME 进入模型引起的,-285.325 即为零模型的对数似然比;在 St
15、ep2 中,模型中包含常数项,INCOME,GENDER。此时易 U 除 GENDER,即-2LL 将减少 5.917,即 5.917 是在 Stepl基础上 GENDER 所引起的,-280.053 即为 Step1 模型的对数似然比,此时-2*285.325+2*280.053=10.543,即 INCOME 引起的。其他同理。可以看到,如果显著性水平 a为 0.05,由于各步的概率 p 值均小于显著性水平 a,因此此时模型中的解释变量全体与 LogitP 的线性关系是显著,模型合理。消费的二项 Logistic 分析结果(三)(逐步筛选策略)VariablesintheEquationB
16、S.E.WalddfSig.Exp(B)95.0%C.I.forEXP(B)LowerUpperStep1aincome10.5122.005income(1).006.259.0011.9821.006.6061.670income(2).672.2477.4241.0061.9581.2083.174Constant-.762.18716.6341.000.467Step2bgender(1).504.2095.8241.0161.6561.0992.493income11.6692.003income(1).096.263.1341.7141.101.6581.843income(2).
17、761.2519.1471.0022.1391.3073.502Constant-1.113.24021.4321.000.329a. Variable(s)enteredonstep1:income.b. Variable(s)enteredonstep2:gender.分析:上表显示了解释变量筛选的过程和各解释变量的回归系数检验结果。可以看到,最终的模型(第二步)中包含了性别和收入变量,各自回归系数显著性检验的 Wald 观测值对应的概率 p 值都小于显著性水平 a,因此均拒绝零假设,意味它们与 LogitP 的线性关系是显著,应保留在方程中。表中的第七,第八列分别是发生比的 95%的置信
18、区间。最终年龄变量没有引入方程,因为如果引入则相应的 Score 检验的概率 p 值大于显著性水平 a,不应拒绝零假设,它与 LogitP 的线性关系不显著,不应进入方程。具体结果如下:消费的二项 Logistic 分析结果(四)(逐步筛选策略)VariablesnotintheEquationScoredfSig.Step1Variablesage1.8481.174gender(1)5.8651.015OverallStatistics7.8242.020Step2Variablesage1.9841.159OverallStatistics1.9841.159消费的二项 Logistic
19、 分析结果(五)(逐步筛选策略)ModelSummaryStep-2LoglikelihoodCox&SnellRSquareNagelkerkeRSquare1560.107a.024.0332554.190b.037.051a. Estimationterminatedatiterationnumber3becauseparameterestimateschangedbylessthan.001.b. Estimationterminatedatiterationnumber4becauseparameterestimateschangedbylessthan.001.-2倍的对数
20、似然函数值为 554.190,仍然较高,说明模型的拟合优度不甚理想。同时,分析:上表显示了模型拟合优度方面的测度指标。最终模型的NagelkerkeRA2 距 1 较远,也说明了模型的拟合优度不高。消费的二项 Logistic 分析结果(六)(逐步筛选策略)HosmerandLemeshowTestStepChi-squaredfSig.1.00011.00028.9434.063消费的二项 Logistic 分析结果(七)(逐步筛选策略)ContingencyTableforHosmerandLemeshowTest是否贝买=不购买是否购买=购买TotalObservedExpectedOb
21、servedExpectedStep119090.0004242.00013229898.0004646.00014438181.0007474.000155Step213532.363810.6374325853.6021519.3987335557.6373431.3638944044.3983126.6027153744.0353830.96575ContingencyTableforHosmerandLemeshowTest是否贝买=不购买是否购买=购买TotalObservedExpectedObservedExpectedStep119090.0004242.00013229898
22、.0004646.00014438181.0007474.000155Step213532.363810.6374325853.6021519.3987335557.6373431.3638944044.3983126.6027153744.0353830.9657564436.9653643.03580分析:上面是 Hosmer-Lemeshow 检验的结果。最终模型中,Hosmer-Lemeshow 统计量的观测值为 8.943,概率 p 值为 0.063,大于显著性水平 a,因此不应拒绝零假设,认为该组的划分与被解释变量的取值不相关,说明模型的拟合优度较低。它与 NagelkerkeRA
23、2 分析的结果是一致的。消费的二项 Logistic 分析结果(八)(逐步筛选策略).,aClassificationTableObservedPredicted是否购买Percentage不购买购买CorrectStep1 是否购买不购买2690100.0购买1620.0OverallPercentage62.4Step2 是否购买不购买2254483.6购买1263622.2OverallPercentage60.6a.Thecutvalueis.500Stepnumber:2ObservedGroupsandPredictedProbabilities160+FR120+EQU1E80+
24、111N11111C00111Y0011140 十0000 00000000000000000000PredictedProb:0.1.2.3.4.5.6.7.8.91Group:0000000000000000000000000000000000000000000000000011111111111111111111111111111111111111111111111111PredictedProbabilityisofMembershipfor 购买TheCutValueis.50Symbols:0-不购买1 -购买EachSymbolRepresents10Cases.图:消费的二项
25、Logistic 分析预测分类图分析:上表显示了各模型的错判矩阵。第一个模型的总体正确率为 62.4%,对不购买人群预测的准确率极高,但对购买人群预测的准确率极低;第二个模型的总体正确率为 60.6%,对不购买人群预测的准确率下降了,但对购买人群预测的准确率提高了。从应用角度看第二个模型较第一个模型的应用性略强一些。在上图中,符号 0 表示实际未购买,1 表示实际购买,一个符号代表 10 个样本。预测概率值大于 0.5 的样本属于购买类,小于 0.5 的属于未购买类。可以看出:在模型预测出的购买类中,仍有 40 个左右(4 个 0,精确值为 44)实际未购买;同样,在模型预测出的未购买类中,仍
26、有 110 个左右(11 个 1,精确值为 126)实际购买了。模型的预测效果并不很理想。通过以上的分析知道,该模型的预测效果不很理想。也就是说,仅通过性别和收入来预测是否购买商品是不全面的,还应考虑其他因素。但是该模型仍可以用于分析是否购买和收入之间的关系。由上面的分析结果,可以写出 Logistic 回归方程:LogitP=-1.11+0.504gender(1)LogitP=-1.11+0.504gender(1)+0.096income(1)LogitP=-1.11+0.504gender(1)+0.761income(2)上面的第一个式子反映了女性与男性在购买上的差异。女性较男性使
27、LogitP 平均增长 0.504 个单位。结合发生比可知,女性的购买发生比是男性的1.656 倍,因此女性更倾向购买该商品。进一步分析,上面的第二个式子反映了女性顾客群中中等收入较低等收入在购买上的差异。对于女性顾客群,中等收入较低等收入使 LogitP 平均增长 0.096 个单位。结合发生比可知,女性顾客群中,中等收入的购买发生比是低等收入的 1.101 倍(有 95%的把握在0.658 至 1.67 之间),略高一些,但差异并不十分明显。而通过上面的第三个式子可知,对于女性顾客群,高等收入较低等收入使 LogitP 平均增长 0.761个单位。结合发生比可知,女性顾客群中,高等收入的购
28、买发生比是低等收入的 2.139 倍(有 95%的把握在 1.099 至 2.493 之间),显然高出较多。因此分析的结论是:年龄对是否购买该商品并无显著影响,较男性来说,女性成为现实客户的可能性大,且高收入阶层较其他收入阶层有较高的购买可能。原始数据:是否购买年龄性别收入149230141210146230472104123I412101402313921144230322101352 P301322101402303321037230452:11322 r30432114523040211292301392114123146211392303821026230382103023144211
29、382303921035230126210392304521024230402103223。13521046231302114023044210382311472114223135210432303621029110342 r10581 r1ll38210l401103821035110472 r10471 r1141210I33110452104011137210371r1ll38210137111292104011140210I361 r10352101321104421037110392114911I50210381114121136110412104211014021044111382
30、103811136210401113721041110392104011041210471111332113911151210381103121043110312 r10461 r113521d481104621138111392 r10351 r1147210I38110402103711156210321r1136210129110372114111036211I391r10442101401113621148110402103711I382104011035210421113521042110145210381104121046120422104512137210331205521034
31、12141211331211332104212136211471203321043120382 r10351 r2138210l431205521133120502 r10261 r2I31210I34121372104312137210411r2138210138120412102512042211I451r21I342101371213121034120282103912I352103212139220441203922039121134220301214522036120412204512。1422 P2039120462204412042220471201332 P204612147221341213922138120412 r20311 r2133220l341204322133121312 r20381 r2I43221I43120452204312148221471r2140220141121352213712033221I381r21342201381214322135120352203412I312203312048220401213622039120139220411203722144120
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 美好农家活动策划方案
- 小瓶饮料活动方案策划
- 宿舍表彰策划活动方案
- 象山年会活动策划方案
- 学校教研活动策划方案
- 门店温情活动策划方案
- 最强班组活动方案策划
- 软件施工方案书
- 钢筋施工方案格式
- 中小学师资培训课程设计
- JCT2460-2018 预制钢筋混凝土化粪池
- 芯片开发职业生涯规划与管理
- 认知行为疗法(CBT)实操讲座
- GB/T 3683-2023橡胶软管及软管组合件油基或水基流体适用的钢丝编织增强液压型规范
- 重说二十年前的作品亮出你的舌苔或空空荡荡
- 身份证前六位与省市县区对照表可直接存入数据库
- 内分泌专业临床路径大全
- 党建知识题库附答案
- 竖井施工方案
- 初中化学渗透“德育”教案
- 制梁场制存梁台座检测方案
评论
0/150
提交评论