用IBMSPSSStatistics22软件多元回归分析男装销售问题_第1页
用IBMSPSSStatistics22软件多元回归分析男装销售问题_第2页
用IBMSPSSStatistics22软件多元回归分析男装销售问题_第3页
用IBMSPSSStatistics22软件多元回归分析男装销售问题_第4页
用IBMSPSSStatistics22软件多元回归分析男装销售问题_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、A用IBM SPSS Statistics 22软件多元回归分析男装销售问题一、数据:IBM SPSS Statistics 22 软件中的数据Catalog.sav来实现男装销售的多元回归分析。二、多元回归模型为了研究某商场服装销售额与该商场商品服务质量之间的关系,以男装销售额men作为因变量,以商品目录邮寄数 mail、商品目录中的页数Page、用于订购的电话数phone、印刷 广告的费用print 以及客服代表数service作为自变量。三、制作散点图,观察 Men与mail、page、phone、print、service 是否具有线性关系。(1)men与mail的散点图o-30(BD

2、.ai-IOOODjM-jM-HDDmwlamNurnbr 时 Cjt-ilvfi M liltd(3) men与phone的散点图uminr-订NuhibtrLim Dptti1c -Q44lOCSKuOOIMIr TMHlfflNumber at Pjgta In Cvtalf(2) men与page的散点图.-,T i jnrwffifflWuOO-ZHxn(4) men与print 的散点图Amount p*rtn PrirrtAdvertiainglaXD n ZIODDOC ZmUK MKX. Qt SSOHOQ AOKt CD -UHQOCn-(5) men与service 的散

3、点图TCDT 03-ttHKiM-cirCirtBflHR4pi*#mrtv*a嵌0宅 Mu首&wjj*wh5席学a由以上5个散点图分析表明,men与service (R2=0.414) (R2=0.645)具有一定的线性关系。四、进行回归分析phone (R2=0.595)mail选择 men作为自变量,page、phone、print1.图-线性回归自变量、因变量选择service作为自变量,方法选择为进入。图-线性回归统计量参数设置Z 箱 事吟时勺UZ暫1*: 卢 *5单;* 呻*MiE EUrl* Tlrir E 尸平IT/Hi-tn ri Ifw I FTR l.pn Lkrtvi*

4、 JWiut EfWI ./险曲片刁6Afe啊I Zwrti Dtfr RtfHWiiwa,flHlSPjbtoa一 iSPb m li Si雀 06:mmMSV梏计V irkEw_ 水甲Pfci: flSDliIjilWJliuHUF仆子有林丿娅f畑也” R雄能)L.lSlitt时柏辭J)砂豹畑2.图-线性回归保存参数设置惡丿If.热曲 艸価PPpy刊朮L211&叫芒町J kb呼却卜$曲4;|F丄料跑于叱=1乂豆E胚*陣也 畳隘dM *(歧计小射al讲 斑劉匕LTWa:口 LKri|i| 命釧t Eryn 税冠比理1结果分析:对于输入/移去的变量,本次为输入法,也就是4个变量进入回归方程,见

5、下 图图输入/移去的变量。晞1 kNumb讪 Customer Seivfce Rspresenlatw Es. Mumhpr of Pag?5 in Cdtdioy, Amount Speimt Oh Print AdvGilising, NumberoT PhoneLnes Open for Qrderingb3 Sflips ofMiins Clotninoby汕语碣求旳世根据调整R2为0.657,可见,该方程性能较好(大于0.6,模型性能就是比较好的了)。如下图为模型汇总图林叱RR H谥*PR M上淮卄:;Id atHlR可也件FdflJf:日ig.th1日诃.5696573704.9

6、6107see5?.9&34115.000可 fu:-A(禽cfCuslofnr Sfrvice R即sTnhlkE工忖iirnhfff MPk疔甘 in CitBlog, AtriountSphl nnp nnt Adifrt sing, Nimtf r oi Ph dnLin旳 open icr ordering -b,固空就 al3sdMans ClolNm口Sig F为0,拒绝假设(假设所有变量对因变量存在显著影响),认为至少存在一个变量对 因变量存在显著影响。如下图为An ova图AiiovadfFSig1回1,2汁318235839315785WJ24760651013411511

7、9795514646.2137268SO6,G57 953乩由变愛:Sdlfes. iQT Wens Clothingb.预G-i). Number of CjEtoiTi jrSenic3 Repreaentathcs, Nirrber of Pdyyi ill GdLd bg, Ani ouii Sp 汕 I an Piiril Advrtbiny, Nun 山曰 of Phu mt Liihs Op en fo r Oroeiniing通过如下系数图可知,phone的sig为0, print 的sig为0.003 , service的sig为0.007, page的sig为0.03,都小

8、于0.05,认为这4个变量对因变量显著性影响,同时,常量的sig为 0,认为该模型存在此常量。由此得到回归方程:Men=p ages*58.237+pho ne*449.313+prin t*0.298+service*116.512-16791.609进一步可知,phone 对men影响最大,其次是 service 和pages,print 影响较小,Mail 则无。T: PM ,-H -1 :沪 M 9,Jf用z:円恒1s D1卜.1#VI卜1*1廿射上的7 .吐.QOO23Sfl5LS&7697.62(11件uTt? 3liin?37IMO ilftf030坤R11107010110Vh

9、uTti Jiriraiw Linet M创articling4+S* 313M257讪flIEl0003lflll.S4)Di55S.?fl75V13?tftrrouTlScentonHint Ad 胡 HElnuDpg1 Hh3 005*003HE4 bl 411 IHIliurrtm,31 CuitcrniiSenjite PepraenlantaTt.61;42Cflfl.2C32,T6e.007J3.H71 曲.E?7M41.刖E4 i; S Kni m 5 or Ui?P5 cioffiing由如上系数图可知VIF都小于5,说明各个变量不存在共线性。因此,不需要再看如下共 线性诊断

10、图。riiFiPi封厂肿;丨巧手M刃曲刊HuiTBartiTP 3 总 riCatabgMjmlipr oT Prone Linm?Opan tirOict4iing(VTiOiunt spent om Prim A 阴 rtMgNum her crCustcmer ssruice 砒pi缭 tt1 14 Sfi21 onotnnononoon2.0700.342.0105.02323.023M.559.0307.71.03ASA.01 U16.363.02.73.20.1?20OOfl:T 94尺95115OJ7102 1d 用雯虽.Snbs diTMiens C加ili砒由如下案例诊断图可

11、以发现第105个数据是异常数据,标准化残差为-4.876,绝对值大于3。捶惻数(=1k:蛊:Sales of MenC阳忻ing105-4,76324518213C7S47I deOSi.604653 冏婕顒 Sales 0- Mens Clothing比1自It Ml1:壷NRl:r;n1H14 J1?11dE1TJA171 mIMl:J.嘴 TI 电22&yOH)1 OjO1如氓11|祁也代3兰J5i 3t51站耳5討7鮎HHQTh1凶i4事刊MJIBnXMrnlOfAl F*?fli?n-IADP4 flMir5014如上l:z 妙M B7E2 565OK弼I2DaLdenlft*6恥芳

12、on1012I2D-IB)94iai4-a&4i luB.ZEflI 1JTflB 3:S7IZH&加m也已関比r叱#f51S7H叩1仍1刘H和补t!*UiV r iHj何11别CwKMJ吋血1U0l1如WM:I=6001fll303?IWa9a 9 cfHtns Cktting通过如下标准化残差直方图可知,标准化残差分布跟正态分布曲线接近, 态分布曲线,表明模型效果较好。认为残差服从正jet 7/1*14dHlik+ 030:h- e扫标狀羞的标jff p-p圈舰谓此JdUnK璃通过如上回归标准化残差的标准P-P图可知,回归标准化残差的累积概率的点基本上均 匀分布在直线两侧,认为标准化残差服

13、从正态分布曲线,表明模型效果较好。收点图通过上图标准化残差和标准化预测值散点图可知,数据点分布在y=0上下,表明预测结果 较好。根据回归模型可知,为了能够大幅度提高男装销售额men,需要对用于订购的电话数phone进行更好的优化,其次是客服代表数service和商品目录中的页数page,印刷广告的费 用print对销量的影响不大,可以酌情考虑调整,而商品目录邮寄数mail则无任何影响。丄 IBM SPSS Modeler14.1 软件分析C&RT决策树与贝叶斯网络分析(客户关系管理实验二)【项目内容】应用Modeler 14.1的决策树模型(C&RT与贝叶斯网络模型进行客户数据分析,获得客户

14、分类结果。【方案设计】a)应用exp2.xls数据,预测产生服务预订行为(是否预订本服务=1)的客户特征。 选择性别为女性的顾客,使用 C&RT莫型进行预测,设置好树的停止生长条件,生成 决策树,找出决策树中索引指数最高的两个节点,并分析这些最可能预订服务的客户特征;分析模型预测准确性。b)按照自己学号最后两位,随机抽取该比例加 30%勺数据记录(学号为1号,抽取31% 的数据记录),使用特征选择模型选取重要性等于 1的字段,使用贝叶斯网络模型获 得贝叶斯网络图;分析模型预测准确性。【实验a).使用C&RT莫型进行预测 构建流(实训)过程及结论】/i-ll-l JI I ixaiT)k 卜m:

15、iT exp2.xJsTypeSctM2O1673771- 朝讳iM201l673771+ 伟 IAnalysis1. 在作业文件夹中添加指向2. 将“Type”添加到“ exp2.xls ”源节点,并将“是否预定本服务” 将所有其他字段Role设置为Inputexp 2.xls“ Excel文件”源节点的 Role设置为Target, Typu毎JtPrewA*asaTypps Fwmat I innolationaLVFieldMeasurementSCZ Mbnsm叶 罕 J3IUUUut 魯as拥戶电视ContinuauES否tfl码录& Co*T(tinuou&燮 SS朋 CO机农

16、Co*T(tinuous 是 PDA 是否拥有个 是瘠ff. 呈S黑注m. 遴SSffl订本.事 CCHTDOUOUS 畲 Cofitlnuous d Conlinuaus g Continuaus E FlagValuesMissingChecKRolel|U.U, U| lllpUL10 0.1 D|Noria InputNone、Input10 0.1 DJNfMte知 inputID.0.1 01Ntme InputlO.O.l.DINone InputlO.O.l.DIhone InputIQ.O.l.DIhone Input0None醪 Target倉 讪已uu currervth

17、已叩5 O View uriu5拠力的 settings3. 单击Read Values按钮以填充 Values4. 为Type节点添加一个Select节点对于模型。请选择 Discard, 输入在Condition 中,按如下5.将C&R Tree节点附加到Select节点上,设置为:启动交互会话,其他设置见下图Q M 201672771+3QS)Objective: StandardrnDdeliFields guildOpllors 忖odllOptions AnnotationsSelect an item:Objective Usernt53eBasicsSlopping RuiMi

18、nirnum records in prenl bfancti(%Costs PriorsEnsemblesMinimum records in chiW branchCH): use a/oMte valuengAJvancedMinirnuni reMrdS in parenl bfanctiMinirntm records in child branch;fl h f6. 生成决策树,在“ Gains ”选项卡,选择如下3 File 二 Editviewer Gains. Risks AnnotatlDnsInteractive T叫 of M201673771-Ocentrala一|

19、2 | 謝GamsTafflal calsfloryJl.DTarQetvmnmhlG:是否fPVF制鳩 Target category: 1.0Nodes1 Node: nIhlode的Gain:nGain (%)iRespon.index (%3NodeshDd: n1 Nods(%)Galn;n|aain%)Rspori.| Index Ciu1S3 CO7 17162.007 9599 3911Q741445.004.844S.0D1OD DO1094121&.47145.007.15sg.3z110 572155.006.&151.00fi.Dti027313331 DO14.572

20、13.0015.3594 56105 371313S QDue2129 DOi5.ia94.35ins.zB1053.M0 DO2上5*+.J4105121020.4D2.1517.002.0005.0093.002213E.D0&.Q712e.OQ6 2392.75103 352251.005.4E4.00S.1190.20盟朋2J126.005.55iie.oo5 69號oe102 5455.005.91Si.OO&.?496.J6105.434335.00ie.9&353.0017.3191 69102.174172 00lajg1&D.D01B.293.021D1.7B2523.M1.

21、0120 000 93飾9egeeg514.001.5112.001 410571M7&3B4S.DaS7.37714.0035.0284 1003.713355.003E.17313.DO3良2B3.176.472323M10116000 74e&227267237 000757.000 62100 OO109412634.QD15022.001.D867172.102620.002.1517.QD2.CH3B6.0D93.DaTree Growing seiOverfit Pnevefi1ijn SetLUId具体树图: aom 1 mhkxta D w *w -2a an z amla

22、A jzrsrtj用4鼻耳霄biitfH JinF 占 bjbI 匕电乜 efl Bitt uUHR口 DtSfBI 丄 JIF音4骨*1干代卜40円*nYfti-BWl和节点 21 (110.67%)(110.74%)9.5年以下,拥有工作电脑,使用网络和传呼机7. 索引指数最高的两个节点分别是节点148. 节点21的客户具有以下特征:工作年限在 服务。9. 生成模型,将Analysis添加到生成模型上,运行得到如下Analysis of 是Ge订本服务* Hie 三 EditAnalysis I Annotations& Collapse AllI 中 Expand AJi曰Results

23、 for outputfield 否预订本服务Comparing $尺堤否预订本服务with是否预订本服务Correct Wrong2.88931390 22%(Total3.202结论:模型预测的正确性和错误率分别为 90.22%和9.79%,预测准确率高。b).贝叶斯网络模型 构建流hBBnat件Type 100.0%SelectTAWMarkovMarie ov-FSAlterAnalysis1. 在作业文件夹中添加指向exp2.xls的“ Excel文件”源节点2. 将“Type”添加到“ exp2.xls ”源节点,并将“是否预定本服务”的 将所有其他字段设置为Inp ut3. 单击

24、Read Values按钮以填充 ValuesRole 设置为 Target,7 EM1*7】771+手E*!nWliS昭毎应*匕-BU* Mb* Me应Ir:Alb E-il hsflrt-蚩 w TdaLi SupuNadb 世 iKbw HbC: M H S 几-1W b - f A C TjTW帀胭當 血MQi.Tffwa Foma . rvKLrtons气. $ GLaj4hffr5C:lgJlu3 口Fm 初讨Eu已于V#u#S014(*PnJe2 u. 1 w lllpuipn.101% InpLJlpnjfl% InpLilP 0.101 InpLJlP 0.101 InpLi

25、lP 0.101 InpLJl晌M InpulPO.Ifl Inpul1M)J9智如el4xid*ajrrHtl4ldb C VkwunubdriEM&tftinpc.4.为Type节点添加一个Sample节点,因学号最后两位为71,加30% 其设置如下图d im抽取100%勺数据记录,_Ei. QL J口1占 drT0l # Simple 1 ijqrr利e5tT4c BtfTtkMOdfl. hdudb bamplbODiscardsjrrvh-SsTiplp O Fvb11丨二O 刖叩二 Randan1 IM nn.UK-Hoddflhl lampIriD (n dalaba?E WJ

26、Mxarruni s-implD g匚 Ski溯EEtwdtR QK CUfittt一 a?Jl劈州! S#*jngs wMafipns5. 为Sample节点添加一个Select节点对于模型。请选择 Discard6. 在Condition中,按如下输入frPrwjSeHifrOt AnnfllaftianaO lfidud Di餡帕宜ILConchliDn-7.将贝叶斯网络节点附加到Select节点上8.对于“ Mode I”选项卡按如下设置Fielde- II Eifert AnaJrz AnnDdOonsMMlel name.3 AUlffftCuaKjm tanV Us panTti

27、qqe4dB4ad Builamfldgl 忖r 罚口 产J Continue naming bhhd nudel觀 TAN CUarkov BlafibelTn icled IdUi minud. chuH; Ui* otatan Mnm庐一 an the Ffcfcb LitSEicKirfl hfp Edu曲 iffahjrfl &?lctinn pprprBesingterParameter ileamlng ffKlhod:IlkeUiood O 目釦h曲孚maflcell ttunlaL匹仙I、erml9. 将第二个贝叶斯网络节点附加到Select节点上,并按如下设置、口iDjFi

28、cloi Wndel Expert 勵訓漣阳M4曲 nvftiEO MJ bo 義 us1arnX7 Uie partitioned dala7 Build rnwieHDF acti Epirl-7*0*丹味11*斑 为- *. ctiwn jat 仙皿鸟厂 nLnhoht*ap2否阿耦男 View current fields View unusedfield settingscancelRue如下图6.将Evaluation节点添加到Filter节点上,然后使用图形节点的缺省设置来 形显示,每个模型类型都生产相似的结果,但是只有Markov要稍微好一些。因 EvdludtiDn of T

29、AN Marlcov Wbrk1 File Edil O Gene rale View| itj l jGraph AonQlaliQQS陆聒再S.QQ-:BD- :ED-+Cr-1100PcrventileTAN =Uark&v Uark&FS*占衣7.将Analysis节点附加到Filter节点上,然后使用Analysis节点的缺省设置来Run。如下 图形说明Markov在预测正确性方面要稍微好一些;但Markov-FS仅落后Markov几个百分点, 这就意味着使用Markov更方便些。logistics 回归、神经网络与聚类分析(客户关系管理实验四)【项目内容】 应用Modeler 14

30、.0中的神经网络模型、logistics模型、聚类分析模型进行数据分析。【方案设计】 应用exp4.sav数据,应用以下模型进行分析:应用logistics模型,根据消费者个人基本信息(gender、agecat、distanee )和满意因素(price、(overall );a)numitems、org、service、quality )预测顾客总体满意度水平应用神经网络模型,根据消费者个人基本信息( 因素(Price 、numitems、org、service 、quality 应用聚类模型,进行客户分类,探索不同类别的客户具有哪些不同的特征,哪些类别 的客户有更高的总体满意度水平。(实

31、训)过程及结论】b)c)gender、agecat、distanee )和满意 )预测顾客总体满意度水平(overall );【实验a)、应用logistics 模型1. 在作业文件夹中添加指向 exp4.sav的“ Statistic file ”源节点2. 添加“Type”以定义字段,从而确保所有测量级别都已正确设置。 将个人基本信息(gender、 agecat、distanee )和满意因素(price、numitems、org、service、quality )的角色设置 为Input,其他角色设置为No neb烏 TypfrPrewewlAiOn i|Types Formal An

32、notations _尺&珅 value?gr 由lues Ciesi剛 bQlu洛Fiffid GENDER & AGECAT 蜜 REGULAR 佥 REA3ON1 $ REAS0N2 届 DEPT 魯 PURCHASE PAYMENT 屜 FOLLOWUP 後 DISTANCESTORE CONTACT PRICE 蜜 NUMfTtMS 唇QRG SERVICEQUALnV 魯 OVERALLMeasurement k Flag 0 Ordinal 站 Nominal F從.Nominal 11 Nominal I吳 Nominal 播S Nominal 赴 Nominal fit No

33、minal I川 Ofdinal 晨I Nominal 昂 Nominal Id OrdinalOfdinal 阿 Ofdinal Io Ofdinal 屈 Ofdinal U OrdinalValues m J 匚1 如 门 1 ;? H, 1.a.2.0.3.01 U二【1!【200,1 01 墜.的:H吐.1 /l.S.2.0.3.-10? 罰, 1.0.2.0.3.0. 1.0.:? Grnrrf |叵已rgi胡| jj lsJD)UocM 日JErroTY3已呻 AfinalaborSjTSrfuwRHIMCMSrAHCE5-10imJr9133MWHMarQinDlPErcEnb

34、VERAILSlTHiahr Negativr排IUKEDrTKWtiatNEaatiw-13flZm.TKMnilrDlU324.G%Swncwlul PDOrtivc1弼2S.4%Strotfv Pvwftn*HT14 3%CENHAUak20335 3*Fnak3T3E4 1%1B-M7 D%J5-J1JTSI B%35-?35 5%W机UT25 3*tt*M5科.WSIANCCr 1 mike7212 n22*30.5*S-tCnH133rCflKT*r)CHng Sunmofv121PfilCEHnjLTDlicmcMurl PuH&rtStrzngtV MeqatTiTSHTHvrtiari MeqaoveNUHITFMSHfiulralSerruwtud PqutmSdrong卑 PoumwOftCUeuLTfll32721,51401459Q73nn12S1E40?1DDliO124*1232H11.13j222%21 5%JanL Oh E亡artOK IfcanMijLLd,*Ale O CnalE I. Pfew 雪LTugfli 94砂那丨 wnetd Spflnqt 如卿何*iiIIaUftfiqryOhim*IJJzz.y4州 nnnrrheMLm1冃5miEWtinLHrpfllfw-1帕朋strnncLHfV11/AT*SDTTKWti

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论