




已阅读5页,还剩9页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第 四 章 交叉分析本章概要4.1EXCEL的交叉分析4.1.1数据透视表作交叉分析4.1.2区间分组4.1.3卡方分布CHIDIST()4.2 SPSS的交叉分析4.2.1简单交叉分析(CROSSTABS)4.2.2多重反应的交叉分析(MULTIPLE RESPONSE: CROSSTABS)例子编号品牌倾向所在地区性别101311102621103111104242105131106612107312108111109632请问在上面的例子中,如何实现地区差异和品牌倾向、性别、地区和品牌倾向三者之间的关联?即不同地区、不同性别的品牌倾向分布情况。4.1EXCEL的交叉分析4.1.1离散变量的交叉分析数据透视表作交叉分析4.1.2连续变量的交叉分析区间分组4.1.1.1两个变量间的交叉分析前一章中例子:求的品牌倾向与地区差别的交叉分析。 步骤: (1 )单击问卷数据任一单元格 (2 ) 执行数据/ 数据透视表和数据透视图,进入“ 数据透视表和枢纽分析图向导步骤3 之1” 对话框。(3)选择“Microsoft Office数据列表或数据库(M)”和“数据透视表”(4)单击“下一步”,进入“数据透视表和枢纽分析图向导步骤3之2”对话框,定义要处理的数据区域。(5)单击“下一步”,进入“数据透视表和枢纽分析图向导步骤3之3”对话框(6)单击“布局”,进入“数据透视表和枢纽分析图向导布局”对话框,以拖拽方式定义透视表内各部分的内容(即把“居住地区”拖拽到“列(C)”的位置;将“品牌倾向”拖拽到“行(R)”位置;将“性别”拖拽到“数据(D)”位置;将“性别”拖拽到“数据(D)”位置; )(7)双击“求和项:性别”,进入“数据透视表字段”对话框,在“汇总方式(S):“处将其改为”计数“计算出现频率,并将其“名称(M)“改为“人数”;(8)双击“求和项:性别2”,进入“数据透视表字段”对话框,在“汇总方式(S):“处将其改为”计数“计算频率,并将其“名称(M)“改为“百分比” ;(9)单击“选项”按钮,进入“数据显示方式(A)”对话框,选取使用“占同列数据总和的百分比”(10)连续两次单击 “确定”按钮,回到“数据透视表和枢纽分析图向导步骤3之3”对话框,定义数据透视表显示的位置。(10)单击“完成”,获得地区和品牌倾向的交叉分析表,见右表。所在地区品牌倾向数据华北华中华南华东总计1人数8543955228百分比18.89%21.50%31.67%10.00%22.80%2人数101375115204百分比22.44%18.50%17.00%30.00%20.40%3人数91455010196百分比20.22%22.50%16.67%20.00%19.60%4人数181321355百分比4.00%6.50%7.00%6.00%5.50%5人数1797336百分比3.78%4.50%2.33%6.00%3.60%6人数138537614281百分比30.67%26.50%25.33%28.00%28.10%人数汇总450200300501000百分比汇总100.00%100.00%100.00%100.00%100.00%4.1.1.2三个变量间的交叉分析例子:求上例中的品牌倾向与地区差别和性别之间的交叉分析。 步骤: (1 )单击问卷数据任一单元格 (2 ) 执行数据/ 数据透视表和数据透视图,进入“ 数据透视表和枢纽分析图向导步骤3 之1” 对话框。 (3)选择“Microsoft Office数据列表或数据库(M)”和“数据透视表”(4)单击“下一步”,进入“数据透视表和枢纽分析图向导步骤3之2”对话框,定义要处理的数据区域。性别(全部)所在地区品牌倾向数据华北华中华南华东总计1人数8543955228百分比18.89%21.50%31.67%10.00%22.80%2人数101375115204百分比22.44%18.50%17.00%30.00%20.40%3人数91455010196百分比20.22%22.50%16.67%20.00%19.60%4人数181321355百分比4.00%6.50%7.00%6.00%5.50%5人数1797336百分比3.78%4.50%2.33%6.00%3.60%6人数138537614281百分比30.67%26.50%25.33%28.00%28.10%人数汇总450200300501000百分比汇总100.00%100.00%100.00%100.00%100.00%(5)单击“下一步”,进入“数据透视表和枢纽分析图向导步骤3之3”对话框(6)单击“布局”,进入“数据透视表和枢纽分析图向导布局”对话框,以拖拽方式定义透视表内各部分的内容(即把“性别”拖拽到“页”(P)位置;把“居住地区”拖拽到“列(C)”的位置;将“品牌倾向”拖拽到“行(R)”位置;将“性别”拖拽到“数据(D)”位置;将“性别”拖拽到“数据(D)”位置; )(7)双击“求和项:性别”,进入“数据透视表字段”对话框,在“汇总方式(S):“处将其改为”计数“计算出现频率,并将其“名称(M)“改为“人数”;(8)双击“求和项:性别2”,进入“数据透视表字段”对话框,在“汇总方式(S):“处将其改为”计数“计算频率,并将其“名称(M)“改为“百分比” ;(9)单击“选项”按钮,进入“数据显示方式(A)”对话框,选取使用“占同列数据总和的百分比”(10)连续两次单击 “确定”按钮,回到“数据透视表和枢纽分析图向导步骤3之3”对话框,定义数据透视表显示的位置。(10)单击“完成”,获得地区和品牌倾向的交叉分析表。4.1.1.3用数据透视表进行交叉分析编辑1.建表新方式例子:求上例中的品牌倾向与地区差别和性别之间的交叉分析。 步骤: (1 )单击问卷数据任一单元格 (2 ) 执行数据/ 数据透视表和数据透视图,进入“ 数据透视表和枢纽分析图向导步骤3 之1” 对话框。 (3)选择“Microsoft Office数据列表或数据库(M)”和“数据透视表”(4)单击“下一步”,进入“数据透视表和枢纽分析图向导步骤3之2”对话框,定义要处理的数据区域。(5)单击“下一步”,进入“数据透视表和枢纽分析图向导步骤3之3”对话框(6)定义数据透视表显示的位置。(7)单击“完成”,获得空白数据透视表。(8)从“数据透视表字段列表”上,将“所在地区”拖拽到“将列字段拖至此处”;(9)从“数据透视表字段列表”上,将“品牌倾向”拖拽到“将行字段拖至此处”;(10)从“数据透视表字段列表”上,将“性别”拖拽到“请将数据字段拖至此处”,即可获得一个数据透视表。(11)由于默认是计算加总,所以选取数据内容的任一单元格,单击“字段设置”按钮,设置所需的统计指标(同前面的第6步骤)2.改变数据透视表的布局(1)在数据透视表和数据透视图向导中的“数据透视表和枢纽分析图向导布局”对话框,可以通过拖拽的方式改变布局;(2)直接在建立好的数据透视表上进行拖拽来改变布局。前面例子中的变量都是离散变量,如果是连续变量作交叉分析会这么样呢?同频数分析一样,都要首先对连续变量转换成离散变量之后,才作交叉分析4.1.2区间分组例子 人数性别每次运动时间/分男女总计03710101121512330291140114511 60178257011907916100111201813311261114411总计5956115区间分组 编号性别每次运动时间/分分组11120421101320142120451120461151711505823019201102011116021213011311204 未区间分组时的交叉分析表区间分组时的交叉分析表人数性别分组12总计0307192631601892761907101791120201535120以上7310总计5956115编号性别每次运动时间/分11120211032042120511206115711508230920102011160121301311204.2 SPSS的交叉分析4.2.1简单交叉分析(CROSSTABS):适用于由两个或两个以上变量进行交叉分类形成的列联表,对变量之间的关联性进行分析。菜单位置:Analyze,DescriptiveStatistics+Crosstabs交互分析又称为列联表分析(Contingency Table Analysis),用于检验作用于同一组样本的变量之间是否存在显著的联系。当被检验的变量只有两个时,称为两维列联表分析或两维交互分析,在市场研究领域中使用非常频繁。在两维交互分析中,每个变量(因素)都包括两个以上的水平(变量值)。SPSS输出的表格常称为rc表,r代表行数(Rows),c代表列数(Columns)。例如3 4列联表是指第一个变量有3个水平,第二个变量有4个水平,两变量各水平的交互形成12个单元格。在一项研究中,每个行单元格或列单元格的次数代表着属于行变量或列变量特定水平的个体(被试、受访者)数量。交互分析就是根据单元格的次数判断行变量与列变量的关系,并计算相应的百分数指标。数量变量与类别变量都可以用于交互分析。交互分析常用于检验两类假设,即变量间的独立性假设(1ndependence between variables)与比例一致性假设(Homogeneity Of pro-portions)。独立性假设检验同一群被试(样本)在两个变量上的反应,目的是判断在总体范围内两个变量之间的关系。比例一致性假设检验的过程通常分两步,首先从两个总体中分别抽样获得两个样本,也可以从同二总体中随机抽样形成两个样本,但两样本接受不同的实验处理;然后根据两个样本在同一变量上的反应推论两个总体是否相同。如果检验结果显示两变量不独立或者两总体存在差异,通常需要作进一步检验,包括了我们常用的X2检验、Kappa值,分层X2(X2M-H),找出具体差异所在。Crosstabs过程不能产生一维频数表(单变量频数表),该功能由Frequencies过程实现。1. Crosstabs一级界面说明(1)【Rows框】 用于选择行*列表中的行变量。(2)【Columns框】 用于选择行*列表中的列变量。(3)【Layer框】 Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。Layer在这里用的比较少,在多元回归中我们将进行详细的解释。(4)【Display clustered bar charts复选框】 显示重叠条图。(5)【Suppress table复选框】 禁止在结果中输出行*列表。2. Crosstabs:Statistics界面说明弹出Statistics对话框,用于定义所需计算的统计量。(1)Chi-square复选框:计算X2值。 (2)Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。 (3)Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。 Contingency coefficient复选框:即列联系数,其值界于01之间; Phi and Cramers V复选框:这两者也是基于X2值的,Phi在四格表X2检验中界于-11之间,在R*C表X2检验中界于01之间;Cramers V 则界于01之间; Lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差; Uncertainty coefficient复选框:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。(4)Ordinal复选框组:选择是否输出反映有序分类资料相关性的指标,很少使用。 Gamma复选框:界于01之间,所有观察实际数集中于左上角和右下角时,其值为1;Somersd复选框:为独立变量上不存在同分的偶对中,同序对子数超过异序对子数的比例;Kendalls tau-b复选框:界于-11之间;Kendalls tau-c复选框:界于-11之间;(5)Eta复选框:计算Eta值,其平方值可认为是应变量受不同因素影响所致方差的比例; (6)Kappa复选框:计算Kappa值,即内部一致性系数; (7)Risk复选框:计算比数比OR值; (8)McNemanr复选框:进行McNemanr检验(一种非参检验); (9)Cochrans and Mantel-Haenszel statistics复选框:计算X2M-H统计量(分层X2,也有写为X2CMH的),可在下方输出H0假设的OR值,默认为1。3.【Cells钮】界面说明弹出Cells对话框,用于定义列联表单元格中需要计算的指标:(1)Counts复选框组:是否输出实际观察数(Observed)和理论数(Expected); (2)Percentages复选框组:是否输出行百分数(Row)、列百分数(Column)以及合计百分数(Total); (3)Residuals复选框组:选择残差的显示方式,可以是实际数与理论数的差值(Unstandardized)、标化后的差值(Standardized,实际数与理论数的差值除理论数),或者由标准误确立的单元格残差(Adj. Standardized);4.【Format钮】界面说明用于选择行变量是升序还是降序排列。上机实例:在网民媒体接触习惯调查中,有一个问题是“您认为下列哪一种读物更适合在周末阅读?”,有三个选项供选择:日报的周末版、杂志、周报。研究者想知道不同性别网民的选择是否一致。这个问题是一个典型的比例一致性假设的检验问题。程序: (1)单击主菜单AhalyzeDescriptiveStatisticsCrosstabs打开主对话框,把变量d2“性别”选入ROW(s)框中作为行变量,把变量a6“你认为下列哪一种读物更适合周末阅读”,选入Column(s)框中作为列变量。 (2)单击Statistics按钮打开子对话框。选中ChiSquare,同时在Nominal中选中PhiandCramers V,目的是要求输出两项统计量。单击Continue返回主对话框。(3)单击Cells按钮打开子对话框。除了选中默认的Observed,同时还在Percentages中选中Row,目的在于要求输出各单元格的观测次数以及在行变量内的百分比。单击Continue返回主对话框。(4)单击OK运行程序。SPSS首先输出两个变量的交互分析表(见下表)。Count所在的行是各单元格的实际观测次数,其中在男性网民中,选择日报的周末版最多,达到379人,选择周报的最少,只有208人。在女性网民中,选择杂志的最多,为86人,选择周报的最少,为32人。性别 * 你认为下列哪一种读物更适合在周末阅读? Crosstabulation你认为下列哪一种读物更适合在周末阅读?Total日报的周末版杂志周报性别男Count379313208900% within 性别42.1%34.8%23.1%100.0%女Count788632196% within 性别39.8%43.9%16.3%100.0%TotalCount4573992401096% within 性别41.7%36.4%21.9%100.0%所在的行是各单元格的次数占每行次数和的百分比,所以各单元的百分比横行合计为100。从表68中可以看到,男性网民中选择日报周末版的比例达到421,高于对杂志或周报的选择率,可见多数男性网民对日报的周末版有较大阅读需求。女性网民中选择杂志的比例高达439,高出对日报周末版或周报的选择,可见女性网民与男性网民对周末读物的需求并不相同。Chi-Square TestsValuedfAsymp. Sig. (2-sided)Pearson Chi-Square7.251(a)2.027Likelihood Ratio7.3372.026Linear-by-Linear Association.5381.463N of Valid Cases1096a 0 cells (.0%) have expected count less than 5. The minimum expected count is 42.92.在卡方检验表中(见右表),皮尔逊卡方(Pearson ChiSquare)值为725,p00270.05),但表现了一定的趋势。上表输出了由值和CramersV值,同样数值较低,未达到显著水平。2比较日报周末版与周报在男女网民中的需求 单击主菜单DataSelect Cases打开对话框,通过条件表达式选择日报周末版与周报,然后进行交互分析。性别 * 你认为下列哪一种读物更适合在周末阅读? Crosstabulation你认为下列哪一种读物更适合在周末阅读?Total日报的周末版周报性别男Count379208587% within 性别64.6%35.4%100.0%女Count7832110% within 性别70.9%29.1%100.0%TotalCount457240697% within 性别65.6%34.4%100.0%Chi-Square TestsValuedfAsymp. Sig. (2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Pearson Chi-Square1.651(b)1.199Continuity Correction(a)1.3821.240Likelihood Ratio1.6891.194Fishers Exact Test.229.119Linear-by-Linear Association1.6491.199N of Valid Cases697a Computed only for a 2x2 tableb 0 cells (.0%) have expected count less than 5. The minimum expected count is 37.88.Symmetric MeasuresValueApprox. Sig.Nominal by NominalPhi-.049.199Cramers V.049.199N of Valid Cases697a Not assuming the null hypothesis.b Using the asymptotic standard error assuming the null hypothesis.3比较杂志与周报在男女网民中的需求 单击主菜单DataSelect Cases打开对话框,通过条件表达式选择杂志与周报,然后进行交互分析。性别 * 你认为下列哪一种读物更适合在周末阅读? Crosstabulation你认为下列哪一种读物更适合在周末阅读?Total杂志周报性别男Count313208521% within 性别60.1%39.9%100.0%女Count8632118% within 性别72.9%27.1%100.0%TotalCount399240639% within 性别62.4%37.6%100.0%Chi-Square Tests ValuedfAsymp. Sig. (2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Pearson Chi-Square6.726(b)1.010 Continuity Correction(a)6.1911.013 Likelihood Ratio6.9811.008 Fishers Exact Test .011.006Linear-by-Linear Association6.7161.010 N of Valid Cases639 a Computed only for a 2x2 tableb 0 cells (.0%) have expected count less than 5. The minimum expected count is 44.32.Symmetric MeasuresValueApprox. Sig.Nominal by NominalPhi-.103.010Cramers V.103.010N of Valid Cases639a Not assuming the null hypothesis.b Using the asymptotic standard error assuming the null hypothesis.上述的输出结果可以看出,不同性别与选择报刊之间的差异主要表现在杂志和周报上。总的看来,三次两两比较的结果表明,不同性别的网民对杂志与周报的阅读需求存在统计意义上的显著差异,X2=6.73,p.0100.05,V0.103。但是,由于V值非常小,连0.03的一般效应度都没有达到,表明性别变量与周末读物之间的关系比较弱。综
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论