版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
如何对市场调研问卷的数据进行预处理会使有问题的问卷进入后面的数据分析环节,对最终结果产生严重影响。一、信度检验信度分析简介的问卷分析通常会采用信度分析筛选部分数据。αα0.7,该批次问卷就应当剔除或是进行处理;如果大于0.90.7~0.9,则要根据具体情况进行判定。如表1α值意义α值意义>0.9信度非常好>0.8信度可以接受>0.7需要重大修订但是可以接受<0.7放弃操作过程信度分析示例操作过程10102SPSS结果解读单音数方差分析)是分析两个变量之间有无SPSS结果解读案例处理汇总后,SPSS输出的结果如图1所示。图1 信度分析结果1AlphaAlpha、题260.881,表明删除这三个题目后整个问卷的Alpha为了确保整个调查的严谨性,应当将这三个题目删除。二、剔除废卷删除废卷大致有三种方法:根据缺失值剔除、根据重复选项剔除、根据逻辑关系剔除。缺失值的成因根据缺失值剔除缺失值的成因缺失值的处理10%以上。之所以会缺失值的处理在处理缺失值时,有些人会选择在SPSS或Excel分信息。在实际操作中,缺失值的处理主要有以下方式,如图2所示。图2 缺失值的处理方式缺失值的处理——忽略。在处理缺失值时,可以在“选项”中直接忽略,这样可以保留其他数据进行之后的运算、建模和输出。缺失值处理示例缺失值的处理——填充。填充,指的是在缺失值的位置用各种技术手段和模型将值回“转换”模块中,替换缺失值;第二,在“分析”模块中,采用EM模型或者回归模型进行填充,这两种模型都可以有效地完成填充,相对来说EM缺失值处理示例填充值的回归。首先打开该文件,如图3所示,发现其中有三列数据,分别是体重组、年龄和胆固醇。可以看到,胆固醇的某些数据中有一些点,这就是SPSS设定的缺失值。对此第一种处理缺失值的方式是做一个回归,操作过程为:进入SPSS的“回归”,然3上方的表格所示。图3 缺失值的填充示例P0.05(5%)进行对比,如果小于0.05,说明这一模式的解释PPPP值=常量(﹣0.135)+0.895×体重+0.094×年龄这一函数公式表示的是体重和年龄对胆固醇的影响大小,可以看出体重对胆固醇的影响系数接近1,而年龄对胆固醇的影响系数则接近0.1。因此,可以得出结论:对胆固醇产生影响的最重要因素是体重,要想控制胆固醇水平,首先应当控制体重。这时再回到“回归”选项,选择“按照列表来排除个案”,该选项可以看出输出的结果中(图4下方的表格)常量是0.062,而体重组因为跳过缺失值,所以对1.1370.081。这就说明,直接跳过缺失值会对分析结果产生较大影响。缺失值的“转换”处理。由上述分析可知,当数据有缺失值时应当进行相应的处理,SPSSSPSS据专家的经验和建议,在进行销售预测时一般应选择“线性趋势”EM“分析”模块是SPSSEM模块,选择“保存完成的数据”,点击“继续”,然后点击“确定”,这时SPSS就会生成一列新数据,这就是采用EM模块填充缺失值后的数据。一个任意值,随机性很强。然后在保存数据里面选择“回归”,点击“确定”,这时就会完成一个回归填充。EM4EMEM填充方式的数值;蓝色的圆圈代表正常值,红色的圆圈表示缺失值。可以看出,右侧EM的填充值与原值的差距较小,也就是EM模型的缺失值填充效果比回归模型的填充效果更好一些。图4 EM和回归模型的填充效果对比EM567EM回归填充的回归效果,可以看出EM图5 原值图6 EM填充图7 回归填充二,在问卷数据量大,缺失数据较多时,用EM模型比回归模型处理起来更加精巧,可以直接使用EM要点提示缺失值处理的认识要点:要点提示①缺失值所在的数据行不能直接删除;②直接忽略缺失值会影响最终的分析结果;③缺失值一定要进行科学的填充处理;④缺失值较多时优先选用EM模型填充。根据重复选项剔除有重复值,这时可以运用SPSS例如,根据重复值删除个案示例,首先打开文件,在进入SPSS的“数据”模块后,双击“标识重复个案”,并将所有的选项一并选中将其放到里面。这时不需要进行任何操作,在稍后创建的变量中如果某个数据是唯一的就会显示“1”,如果有重复就是“0”,然后勾选将重复的个案移动到文件的最上端,点击“确定”,输出结果。27518.5%。5行选中,点击鼠标右键选择“剪切”将重复项删除即可。根据逻辑关系剔除根据逻辑关系可以剔除一些个案,例如年龄小于或等于23,而学历则选择为硕士或者根据逻辑关系剔除个案示例:首先打开文件,可以看到学历分为613(包括专科)45620,56600这时就可以用SPSSSPSS(205)”的公式,通过以上操作可以看出,SPSSExcel析人员应当注意SPSS三、数据管理和转换数据管理与转换主要包括分割与合并文件、重新编码、排序与分组、分类汇总、异常值检测等。如图8所示。图8 数据管理与转换分割与合并文件SPSSSPSS择“确定”,就可以将文件合并成功。重新编码重新编码是一项非常重要的功能,其中涉及一个“连续性变量的离散化”理论。100011000~20002、2000~3000为3等依此类推,然后将不同受访者归入相应的量级,也就是要将连续性的变然后做好饮
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生物标志物在药物临床试验中的临床转化研究
- 生物制剂失应答后IBD的联合治疗策略
- 生物3D打印皮肤在皮肤修复中的个性化方案
- 深度解析(2026)《GBT 19565-2017总辐射表》
- 考试题质量监督与检测技能测试
- 资产处置分析师考试题库
- 中广核设备制造商代表面试题库及解析
- 性能测试工程师岗位测试结果分析含答案
- 面试题集永辉超市收银主管岗位面试要点
- 深度解析(2026)《GBT 19155-2017高处作业吊篮》
- 2025年云南省人民检察院聘用制书记员招聘(22人)备考笔试题库及答案解析
- 2026届四川凉山州高三高考一模数学试卷试题(含答案详解)
- 银行党支部书记2025年抓基层党建工作述职报告
- 肿瘤标志物的分类
- 2025山西忻州市原平市招聘社区专职工作人员50人考试历年真题汇编附答案解析
- 中药煎煮知识与服用方法
- 2026东莞银行秋季校园招聘备考题库及答案详解(基础+提升)
- 消防水泵房管理制度及操作规程
- GB/T 14364-1993船舶轴系滑动式中间轴承
- 肺炎教学查房课件
- 仪表设备管路脱脂方案(中英)
评论
0/150
提交评论